<th id="b9jdx"></th>
<var id="b9jdx"></var><listing id="b9jdx"></listing>
<ins id="b9jdx"></ins> <ins id="b9jdx"></ins>
<progress id="b9jdx"></progress>
<ins id="b9jdx"></ins><noframes id="b9jdx">
<th id="b9jdx"></th>
博文公告
當前位置: 首頁 > 博文公告 >內容

阿爾法狗再進化:100:0碾壓舊版
創建日期:2017-10-20


熱點背景

導讀經過3天的訓練后,這套系統已經可以擊敗AlphaGo Lee,也就是去年擊敗韓國頂尖棋手李世石的那套系統,而且比分高達100比0。經過40天訓練后,它總計運行了大約2900萬次自我對弈,使得AlphaGo Zero得以擊敗AlphaGo Master(今年早些時候擊敗世界冠軍柯潔的系統),比分為89比11。

“阿爾法狗”再進化:“自學”3天高分贏過舊版             

10月19日消息,谷歌旗下人工智能研究部門DeepMind發布了新版AlphaGo(阿爾法狗)軟件,它可以完全靠自己學習圍棋。這款名為AlphaGo Zero的系統可以通過自我對弈進行學習,它利用了一種名為強化學習的技術。在不斷訓練的過程中,這套系統開始靠自己的能力學會圍棋中的一些高級概念。


經過3天的訓練后,這套系統已經可以擊敗AlphaGo Lee,也就是去年擊敗韓國頂尖棋手李世石的那套系統,而且比分高達100比0。經過40天訓練后,它總計運行了大約2900萬次自我對弈,使得AlphaGo Zero得以擊敗AlphaGo Master(今年早些時候擊敗世界冠軍柯潔的系統),比分為89比11。

結果表明,具體到不同技術的效果,人工智能在這一領域仍有很多學習的空間。AlphaGo Master使用了很多與AlphaGo Zero相同的開發技術,但它需要首先利用人類的數據進行訓練,隨后才切換成自我對弈。

值得注意的是,雖然AlphaGo Zero在幾周的訓練期間學會了一些關鍵概念,但該系統學習的方法與人類有所不同。另外,AlphaGo Zero也比前幾代系統更加節能,AlphaGo Lee需要使用幾臺機器和48個谷歌TPU機器學習加速芯片。其上一代AlphaGo Fan則要用到176個GPU芯片。AlphaGo Zero只需要使用一臺配有4個TPU的機器即可。



欧美综合吧,欧美在线A免费线上,97超碰caoporen公开人人爽
<th id="b9jdx"></th>
<var id="b9jdx"></var><listing id="b9jdx"></listing>
<ins id="b9jdx"></ins> <ins id="b9jdx"></ins>
<progress id="b9jdx"></progress>
<ins id="b9jdx"></ins><noframes id="b9jdx">
<th id="b9jdx"></th>