搜索

繼人工智能攻陷圍棋，德州撲克也淪陷了

韓璐 9年前 (2017-01-11)

相對于圍棋，德州撲克的非完美信息給了人工智能更大的壓力。

繼AlphaGo披著(zhù)“Master”在中韓圍棋界大獲全勝后，德州撲克也不幸淪陷，只不過(guò)這次的主角并不是AlphaGo。

繼人工智能攻陷圍棋，德州撲克也淪陷了

近日，來(lái)自加拿大Alberta大學(xué)、捷克Charles大學(xué)、布拉格捷克理工大學(xué)的10位研究員在arXiv網(wǎng)站（一個(gè)收集物理學(xué)、數學(xué)、計算機科學(xué)與生物學(xué)論文預印本的網(wǎng)站）上傳了一篇題為《DeepStack：無(wú)限注德?lián)涞膶?zhuān)業(yè)級人工智能玩家》的論文，介紹了一種能在一對一無(wú)限注德州撲克中擊敗人類(lèi)玩家的新算法“DeepStack”。

在圍棋等棋類(lèi)游戲中，玩家能夠獲得的確定性信息是對稱(chēng)的，而德州撲克不同，這是一種包含了欺騙、推測的非完美信息游戲。在德州撲克的游戲中，玩家只能掌握自己手上的牌，通過(guò)推理非對稱(chēng)的信息，從而與對手進(jìn)行博弈。而這里就是該論文的意義所在，論文中提到“DeepStack是一種通用算法，可用于一大類(lèi)非完整信息的序列博弈 ”。

不同于過(guò)去研究人員所采用的一種壓縮型的策略，這個(gè)加拿大和捷克的合作團隊在開(kāi)發(fā)新算法“DeepStack”過(guò)程中更注重培養人工智能出牌時(shí)的“直覺(jué)”。在運用深度學(xué)習，反復自我博弈之后，“DeepStack”學(xué)會(huì )了在每一個(gè)具體情境出現時(shí)進(jìn)行推理，這種做法非常接近于人類(lèi)玩家的習慣。

去年年末，該團隊邀請了33名專(zhuān)業(yè)撲克選手與“DeepStack”進(jìn)行了44852次博弈。在最后的結果中，DeepStack成為了首個(gè)在一對一無(wú)限注德?lián)渲袘饎偃祟?lèi)玩家的人工智能，并且平均勝率達到了492mbb/g（milli-big-blinds per game，用于衡量撲克玩家表現的指數，一般職業(yè)玩家認為50mbb/g是個(gè)門(mén)檻，750mbb/g就是對手每局都棄牌的贏(yíng)率）。

最后，記得關(guān)注微信公眾號：鎂客網(wǎng)（im2maker），更多干貨在等你！

鎂客網(wǎng)

科技 | 人文 | 行業(yè)

微信ID：im2maker

長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

韓璐作者

韓璐作者

3016篇

文章總數

最新文章

因為臺積電3nm代工價(jià)格高，傳iPhone 15系列最高售價(jià)2萬(wàn)元

聯(lián)發(fā)科“天璣9200+”官宣5月10日發(fā)布，跑分刷新安卓機最高紀錄

30年來(lái)首次連續虧損！英特爾最新財報，創(chuàng )下迄今13年最低季度收入

億萬(wàn)克柳星：“雙碳目標”下，如何應對AI大模型帶來(lái)的算力需求？

英國監管機構出手！微軟收購動(dòng)視暴雪要“涼涼”？

janpanese日本护士tube_色欲久久久天天天_国产精品国产三级区别第一集_一色屋任你精品亚洲香蕉