Robot Kecerdasaan Hancurkan Beberapa Pemain Poker Elite

Bot kecerdasan buatan (AI) lain dengan kekuatan “manusia super” telah menempatkan nasib pemain poker di mana-mana dalam bahaya.

Mengikuti perkembangan selama dua dekade, perangkat lunak AI poker sekarang dapat mengalahkan game multipemain No Limit Hold.

Dipuji oleh pengembang utama Tuomas Sandholm sebagai terobosan besar, kinerja Pluribus baru-baru ini melihatnya mengalahkan sekelompok pemain kelas dunia.

AI vs Beberapa Pro Top

Menguraikan pertempuran pria vs mesin terbaru di Science Mag, Sandholm dan Noam Brown menyusun dua skenario.

Kelompok gergaji pertama yang terdiri dari lima pro mengambil satu versi superkomputer. Yang lain melihat dua pro mengambil meja bot poker AI secara individual.

Di antara 13 pro memilih untuk bermain dalam pertandingan lima-manusia / satu-komputer adalah Greg Merson. Dengan penghasilan langsung lebih dari $ 11 juta dan Acara Utama WSOP 2012 atas namanya, Merson adalah ujian berat bagi siapa pun.

Namun, setelah 10.000 tangan dan 12 hari beraksi, bahkan keterampilan orang Amerika tidak dapat mengalahkan Pluribus. Menurut hasil, perangkat lunak AI mencapai tingkat kemenangan rata-rata 48 juta blinds besar per game (mbb / game).

Dengan satu kemenangan di kantong, Chris Ferguson alias Yesus dan Darren Elias melangkah ke pelanggaran. Setiap duduk melawan lima versi bot poker, pro melakukan apa yang mereka bisa selama 10.000 tangan.

Sayangnya untuk umat manusia, bahkan upaya ilahi Ferguson tidak bisa mendapatkan kemenangan. Meskipun pasangan bernasib lebih baik, Pluribus masih mencapai tingkat kemenangan keseluruhan 32 mbb / game.

Lima Fakta Menakutkan: Apa yang Kami Pelajari dari Pria vs. Pluribus

  1. Pada 2017, Libratus ditenagai oleh 100 CPU. Pada 2019, Pluribus hanya membutuhkan dua.

  2. Pluribus menggunakan memori kurang dari 128 GB yang berarti dapat berjalan di server cloud dengan biaya kurang dari $ 150.

  3. Pluribus membutuhkan rata-rata 20 detik per tangan dalam pengaturan multipemain atau dua kali lebih cepat dari rata-rata pemain manusia.

  4. Pluribus sepenuhnya otodidak. Setelah memprogram dalam aturan Texas Hold’em No Limit, para pengembang membiarkannya mempelajari dan menyusun strategi sendiri.

  5. Meskipun Pluribus memiliki cetak biru untuk permainan optimal pada awal permainan, Pluribus melakukan pencarian real-time dari basis datanya dan dapat menyesuaikan berdasarkan pergerakan lawan-lawannya.

Bot Self-Taught Poker

Sebelum menghadapi beberapa pemain sekaligus, program AI memainkan triliunan tangan melawan dirinya sendiri. Menggunakan teknik yang dikenal sebagai “penguatan pembelajaran,” itu mencapai tingkat kelas dunia hanya dalam 20 jam.

Sementara fakta itu cukup mengesankan, Sandholm mengatakan kemampuan perangkat lunak untuk mengalahkan banyak pemain sekaligus di luar dugaan.

Meskipun proyek sebelumnya, Libratus membuktikan bahwa satu bot dapat mengalahkan satu pemain, tugas mengalahkan lima otak poker teratas secara signifikan lebih sulit.

Namun, setelah 12 hari bertaruh dan menggertak, pengembang sekarang yakin AI tidak hanya bisa berkembang di poker tetapi juga di dunia nyata.

Menurut pendapat mereka, mampu menyusun strategi melawan banyak lawan dapat membantu di bidang-bidang seperti keamanan dunia maya, kesehatan, dan keuangan.

Pluribus Menyediakan Beberapa Hal Positif untuk Pemain

Untuk pemain poker, kekalahan terbaru adalah tanda yang berpotensi tidak menyenangkan. Namun, ada beberapa hal positif.

Dari perspektif strategi, taktik Pluribus dapat menghidupkan kembali taruhan donk. Sering difitnah oleh para ahli, tindakan memanggil kenaikan gaji dan bertaruh ke penggalangan di jalan berikutnya mungkin lebih efektif daripada yang dipikirkan sebelumnya.

Mengapa bot sampai pada kesimpulan ini tidak jelas. Namun, itu membuat langkah “jauh lebih sering” selama pertandingan daripada profesional.

Pluribus juga menegaskan kembali bahwa pincang adalah strategi yang buruk. Meskipun awalnya bereksperimen dengan gerakan selama fase pembelajarannya, program akhirnya menentukan bahwa menaikkan atau melipat adalah optimal.

Meskipun kita mungkin tidak berada di ambang pengambilalihan AI, waktu bisa habis. Pada 2017, penelitian yang dilakukan oleh MatchPoker menyarankan bahwa No Limit Hold’em masih terlalu rumit untuk diselesaikan AI.

Maju cepat dua tahun dan Pluribus membuktikan bahwa teori itu salah. Terlebih lagi, perangkat lunak ini beroperasi pada server cloud yang harganya hanya $ 144 untuk dijalankan.

Dalam meringkas hasil terbaru, Sandholm dan Brown mengakui bahwa AI masih jauh dari sempurna. Namun, bahkan dalam pengaturan informasi yang kompleks dan tidak sempurna, teknologi saat ini dapat menghasilkan strategi “manusia super”.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *