Tại sao Poker vẫn là trở ngại lớn cho trí tuệ nhân tạo?

Updated: 25/04/2018 at 16:00

Chơi poker liên quan đến việc xử lý thông tin không hoàn hảo, điều này làm cho trò chơi trở nên rất phức tạp và giống như nhiều tình huống trong thế giới thực hơn.

Như Kenny Rogers đã từng nói rằng người ta nên “biết khi nào nắm giữ họ, biết khi nào cần đánh ra trong bản “hit” The Gambler” năm 1978 tại Casino Rivers ở Pittsburgh tuần này, một chương trình máy tính được gọi là Libratus cuối cùng có thể chứng minh rằng máy tính có thể làm điều này tốt hơn so với bất kỳ người chơi bài nào.

Libratus đang chơi hàng ngàn trò chơi khác nhau ở Texas với một số người chơi poker chuyên nghiệp. Sau khoảng hơn một nửa cuộc hành trình trong 20 ngày, Libratus đã lãi 800.000 đô la so với các đối thủ của con người. Chiến thắng dành cho Libratus cũng chưa chắc đã được đảm bảo.

Một chiến thắng cho Libratus sẽ là một thành tựu to lớn trong công nghệ trí tuệ nhân tạo. Poker yêu cầu lý luận và trí thông minh, rất khó cho các máy móc bắt chước. Về cơ bản, nó khác với cờ đam, cờ vua hoặc Go, bởi vì đối thủ vẫn là một ẩn số trong khi chơi. Trong các trò chơi “thông tin không hoàn hảo”, sẽ vô cùng phức tạp để tìm ra chiến lược lý tưởng cho mọi cách tiếp cận mà đối thủ của bạn có thể đang dùng. Và với thể lệ không giới hạn ở Texas thì trò chơi càng trở nên đặc biệt khó khăn bởi vì một đối thủ về cơ bản có thể đặt cược bao nhiêu cũng được.

Andrew Ng, nhà khoa học tại Baidu nói:

“Poker là một trong những trò chơi khó khăn nhất cho AI để chiến thắng. Không có con đường tối ưu duy nhất, mà thay vào đó AI phải ngẫu nhiên các hành động của mình để làm cho các đối thủ không chắc chắn liệu nó có đang đánh lừa hay không”.

Libratus được tạo ra bởi Tuomas Sandholm, một giáo sư trong ngành khoa khoa học máy tính tại CMU và là sinh viên tốt nghiệp Noam Brown. Sandholm, một chuyên gia về lý thuyết trò chơi và AI nói rằng thật đáng kinh ngạc khi con người đã có thể chiến thắng máy tính quá lâu. Trong tất cả các trò chơi mà AI đã giải quyết, poker là trò duy nhất mà AI đã không đạt được hiệu suất siêu nhân”.

Các nhà nghiên cứu AI sử dụng lý thuyết trò chơi hoặc toán học để tìm ra chiến lược tốt nhất với những bất ổn khác nhau, được gọi là trạng thái cân bằng. Bởi vì các khả năng rất rộng lớn nên kết quả thường cho ra một số dạng xấp xỉ.

Vincent Conitzer, giáo sư tại Đại học Duke nói:

“Một nước đi là tốt hay không phụ thuộc vào những điều mà bạn không thể quan sát. Điều này khiến cho các diễn biến không thể đoán trước được. Nếu bạn không bao giờ lừa, bạn không phải là người chơi giỏi. Nếu bạn luôn luôn lừa, bạn cũng không phải là người chơi giỏi. Lý thuyết trò chơi cho bạn biết cách ngẫu nhiên hóa cách chơi của bạn theo cách tối ưu”.

Năm ngoái, Sandholm đã phát triển một chương trình chơi bài poker được gọi là Claudico. Chương trình này đã bị đánh bại trong các trận đấu với một số người chơi poker chuyên nghiệp. Ông giải thích rằng Libratus sử dụng một số tiến bộ mới để đạt được mức độ chơi cao như vậy. Điều này bao gồm một kỹ thuật tính toán xấp xỉ điểm cân bằng mới cũng như một số phương pháp mới để phân tích các kết quả có thể xảy ra khi các lá bài được tiết lộ ở các giai đoạn sau của trò chơi. Phân tích kết thúc trò chơi rất khó khăn và được thực hiện trong mỗi trận đấu tại Trung tâm Supercomputing Pittsburgh, một cơ sở được điều hành bởi CMU và Đại học Pittsburgh.

Những tiến bộ trong machine learning và AI đã cho ra một số chương trình chơi game siêu phàm xuất hiện gần đây. Năm ngoái, các nhà nghiên cứu tại DeepMind, một công ty con của Alphabet, đã phát triển một chương trình có khả năng đánh bại một trong những người chơi Go tốt nhất thế giới. Thành tích này rất ngoạn mục bởi vì Go cực kỳ phức tạp và bởi vì thật khó để đánh giá diễn biến trong trò chơi.

Một vài nhóm nghiên cứu khác nhau tập trung vào giải quyết bài poker. Một nhóm nghiên cứu khác, từ Đại học Alberta ở Canada, Đại học Charles và Đại học Kỹ thuật tại Cộng hòa Séc, gần đây đã phát triển một chương trình, gọi là DeepStack. Chương trình này đã đánh bại một số người chơi chuyên nghiệp trong thể lệ không giới hạn của Texas. Tuy nhiên, Sandholm cho biết, những người chơi tham gia vào trận đấu với Libratus mạnh hơn rất nhiều, điều này sẽ mang lại ý nghĩa thống kê lớn hơn cho kết quả.

Sam Ganzfried, người đã tham gia phát triển Claudico và hiện là trợ lý giáo sư tại Đại học Quốc tế Florida ở Miami cho biết:

“Các kỹ thuật được sử dụng để xây dựng một cỗ máy chơi poker thông minh hơn có thể có nhiều ứng dụng trong thế giới thực. Lý thuyết trò chơi đã được áp dụng cho nghiên cứu về các cuộc tấn công gây nhiễu và an ninh mạng, hướng dẫn tự động cho dịch vụ taxi và robot lập kế hoạch”.

Tuy nhiên, ngay cả khi Libratus chiến thắng trong tuần này, điều đó không có nghĩa là con người không còn xứng đáng có chỗ tại bàn chơi bài nữa. Libratus sẽ chưa thể trở thành “siêu nhân” trong phiên bản nhiều người chơi và số tiền cược không giới hạn ở Texas bằng cách sử dụng các kỹ thuật hiện tại.

Theo TapChiBitcoin.vn/technologyreview

Xem thêm:

Được đề cập trong bài viết
Bình luận
Đang tải
Mới cập nhật

Với mức tăng 6,4% trong 24 giờ qua, các dấu hiệu kỹ thuật hiện tại cho thấy rằng vận may của Cardano (ADA) đang đến. Các trader đang chú ý đến một tín hiệu rất hiếm trên biểu đồ ADA/USD: Golden cross hàng tuần, một chỉ báo mạnh mẽ, thường... ...

Giá Solana (SOL) đã breakout khỏi vùng tích lũy trong tháng 7 trước thềm công bố biên bản cuộc họp của Ủy ban Thị trường Mở Liên bang Mỹ (FOMC). Mặc dù điều này có thể là tín hiệu cho một đợt tăng mạnh 5% lên mức 160 đô la,... ...

Token PUMP của dự án Pump.fun đang thu hút sự chú ý đặc biệt từ các nhà đầu tư cá voi, những người đang tích cực thực hiện các giao dịch Short trên nền tảng Hyperliquid. Với việc PUMP dự kiến chính thức ra mắt vào ngày 15 tháng 7... ...

Các đồng meme coin Dogecoin (DOGE), Shiba Inu (SHIB) và Pepe (PEPE) tiếp tục duy trì đà tăng mạnh mẽ khi thị trường chứng kiến sự phục hồi của Bitcoin (BTC) lên mức cao kỷ lục mới. Triển vọng kỹ thuật của các đồng meme này vẫn rất lạc quan,... ...

Ethereum (ETH) đang thu hút sự chú ý mạnh mẽ từ Phố Wall, khi công ty quản lý tài sản Fidelity hiện đã xem altcoin này như một phương tiện lưu trữ giá trị (SoV) và là lựa chọn thay thế để bảo toàn tài sản. Trong báo cáo mới... ...

Tổng thống El Salvador Nayib Bukele đã lên tiếng bảo vệ các chính sách thân thiện với tiền điện tử của đất nước mình và một lần nữa chế nhạo các nhà lãnh đạo nước ngoài trên nền tảng X trong tuần này, với các thượng nghị sĩ Dân chủ... ...

Tổng vốn hóa thị trường crypto (TOTAL) đã tăng thêm 94 tỷ đô la, được thúc đẩy bởi đà tăng mạnh của cổ phiếu công nghệ. Giá Bitcoin cũng vừa thiết lập mức cao nhất mọi thời đại (ATH) mới tại 111.999 đô la, chỉ cách mốc 112.000 đô la... ...

Giá Ripple (XRP) vừa hoàn tất giai đoạn hợp nhất kéo dài suốt 32 tuần — một mô hình khiến giới phân tích liên tưởng đến những đợt breakout mạnh mẽ vào năm 2017. Khi các chỉ báo kỹ thuật dần nghiêng về xu hướng tăng, kỳ vọng về việc... ...

Một “cá voi” lớn trên thị trường tiền điện tử đã âm thầm tích lũy tới 625.765 token Official Trump (TRUMP) — trị giá khoảng 5,33 triệu USD — chỉ trong vòng 40 ngày. Mới đây, địa chỉ ví này tiếp tục gây chú ý khi rút 1,7 triệu USD... ...

Tổng nợ quốc gia của Mỹ đã tăng thêm 367 tỷ đô la chỉ trong ngày thứ 2, nâng nợ lên mức cao nhất mọi thời đại 36,6 nghìn tỷ đô la. Đợt tăng đột biến này diễn ra sau khi Tổng thống Donald Trump phê duyệt dự luật “One... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode