谷歌阿爾法圍棋官網-網絡安全-世界網站大全-網址導航,我看行

谷歌阿爾法圍棋官網

赞助商链接

::::::::::::::: 网站详细信息 ::::::::::::::::

返回首页

网站名称

谷歌阿爾法圍棋官網

网站地址

http://deepmind.com/alpha-go.html

所属类别

國家分類 > 歐洲 > 英國 > 網絡安全 >

简介

Alphago(中文名稱爲阿爾法圍棋或阿爾法狗)是由英國倫敦Google DeepMind開發的人工智能圍棋程序，成爲第一個不借助讓子，在全尺寸19×19的棋盤上擊敗職業圍棋棋手的電腦圍棋程序，也是人工智能與人類智慧的一大挑戰。

2016年3月在一場五番棋圍棋比賽中，AlphaGo於前三局均擊敗職業圍棋棋手李世乭，成爲第一個不借助讓子而擊敗職業九段圍棋棋手的電腦圍棋程序。

專業術語上來說：AlphaGo其做法是使用了蒙地卡羅樹狀搜索與兩個深度神經網絡相結合方法，其中一個是以估值網絡來評估大量的選點，而以走棋網絡來選擇落子。在這種設計下，電腦可以結合樹狀圖的長遠推斷，又可像人類的大腦一樣自發學習進行直覺訓練，以提高下棋實力。

AlphaGo和之前的圍棋程序相比表現出顯著提升。在和Crazy Stone和Zen等其他圍棋程序的500局比賽中，AlphaGo(運行於一臺電腦上)僅輸一局。而在其後的對局中，AlphaGo(可運行於多臺電腦上)在500局比賽中全部獲勝，且對抗運行在單機上的 AlphaGo 有 77% 的勝率。2015年10月的分佈式運算版本AlphaGo使用1,202塊CPU及176塊GPU。

然而 Google 並沒有公開解釋從2015十月到2016三月間的實力增強有什麼硬件或軟件的改進，所以在三月進行的競賽中可能進一步運用更多的硬件。

AlphaGo使用蒙特卡洛樹搜索，藉助估值網絡與走棋網絡這兩種深度神經網絡，通過估值網絡來評估大量選點，並通過走棋網絡選擇落點。AlphaGo最初通過模仿人類玩家，嘗試匹配職業棋手的過往棋局，其數據庫中約含3000萬步棋着。一旦它達到了一定的熟練程度，它開始和自己對弈大量棋局，使用強化學習進一步改善它。圍棋無法僅通過尋找最佳步來解決;遊戲一盤平均有150步，每一步平均有200種可選的下法，意味着有太多需要解決的可能性。

谷歌阿爾法圍棋官網

更多 相關熱搜

word簡體轉繁體

電腦ip地址怎麼查？

快壓幫助 - 自解壓

菲律宾超实用app，外賣、出行等等

電腦實用軟件工具推薦

本站免費添加網址收錄，如有興趣，歡迎投稿! 聯絡郵箱：[email protected] ‖ 聯絡我們