Alphago(中文名稱爲阿爾法圍棋或阿爾法狗)是由英國倫敦Google DeepMind開發的人工智能圍棋程序,成爲第一個不借助讓子,在全尺寸19×19的棋盤上擊敗職業圍棋棋手的電腦圍棋程序,也是人工智能與人類智慧的一大挑戰。
2016年3月在一場五番棋圍棋比賽中,AlphaGo於前三局均擊敗職業圍棋棋手李世乭,成爲第一個不借助讓子而擊敗職業九段圍棋棋手的電腦圍棋程序。
專業術語上來說:AlphaGo其做法是使用了蒙地卡羅樹狀搜索與兩個深度神經網絡相結合方法,其中一個是以估值網絡來評估大量的選點,而以走棋網絡來選擇落子。在這種設計下,電腦可以結合樹狀圖的長遠推斷,又可像人類的大腦一樣自發學習進行直覺訓練,以提高下棋實力。
AlphaGo和之前的圍棋程序相比表現出顯著提升。在和Crazy Stone和Zen等其他圍棋程序的500局比賽中,AlphaGo(運行於一臺電腦上)僅輸一局。而在其後的對局中,AlphaGo(可運行於多臺電腦上)在500局比賽中全部獲勝,且對抗運行在單機上的 AlphaGo 有 77% 的勝率。2015年10月的分佈式運算版本AlphaGo使用1,202塊CPU及176塊GPU。
然而 Google 並沒有公開解釋從2015十月到2016三月間的實力增強有什麼硬件或軟件的改進,所以在三月進行的競賽中可能進一步運用更多的硬件。
AlphaGo使用蒙特卡洛樹搜索,藉助估值網絡與走棋網絡這兩種深度神經網絡,通過估值網絡來評估大量選點,並通過走棋網絡選擇落點。AlphaGo最初通過模仿人類玩家,嘗試匹配職業棋手的過往棋局,其數據庫中約含3000萬步棋着。一旦它達到了一定的熟練程度,它開始和自己對弈大量棋局,使用強化學習進一步改善它。圍棋無法僅通過尋找最佳步來解決;遊戲一盤平均有150步,每一步平均有200種可選的下法,意味着有太多需要解決的可能性。
本站免費添加網址收錄,如有興趣,歡迎投稿! 聯絡郵箱:[email protected] ‖ 聯絡我們
Copyright © 2018-2023 世界網站大全 www.sitegaga.com All Rights Reserved.