柯潔和 AlphaGo 的第一盤棋有哪些值得關注之處？

01-19

5 月 23 日這盤棋，柯潔和 AlphaGo 分別下得如何？
進入圓桌 ? 人機對弈終章，參與更多相關討論。

大家好，我是范廷鈺，很高興在這裡跟大家一起分享我的看法。

柯潔使用了 AlphaGo 的開局，但是並不成功。

中盤果斷，先是掏取了角部，又成功處理棄子，非常成功。

這盤棋柯潔雖然輸了1目半，但是下得很好，值得我們學習。

賽前關於AlphaGo 和頂尖棋手的差距，我根據我自己的經驗，在live中提出：AlphaGo 領先頂尖棋手有「一先」以上。

從這盤棋上看，柯潔是完敗。

下半盤黑棋棄子治理非常成功，抓住了AlphaGo的緩手。

這裡我談兩個live 里提到的局部的看法和一點疑問。

【局部看法】

這裡 AlphaGo 無論如何還是直接提掉比較好，白棋棋型非常完整厚實，實戰後來柯潔巧妙地利用這裡的形狀問題走出了比較成功的處理。

這裡是全局黑棋最得分的部分，由於AlphaGo在下方處理不當，被黑斷下白一子，黑方獲利。

【一點疑問】

這裡柯潔黑棋實戰選擇了c 點，當時在live之中我擺了很久，可以說a/b/c 三個選點，實戰是選的最差的。

【小結】

從這盤棋來看，AlphaGo 明顯還是強過柯潔，但是也不必神話，仍然有很多明顯問題出現。

感謝大家能來支持我和 @雲天外合作的全程解析。

鏈接：

https://www.zhihu.com/lives/846510721427730432

我注意到很多媒體對比賽的稱呼為「人機對弈」而非「人機大戰」，這是一個很好的姿態。因為勝敗與懸念固然是最容易產生故事，也最容易動人心弦，但人類棋手和機器下棋，值得關注的不僅僅是勝敗結果。

這次AlphaGo的版本，比起去年4：1戰勝李世石的18.0版本，明顯有了很大的進步，可以說從絕對實力上來說明顯超越了人類棋手的水平。在超越節點之後的人機對弈，更像是測試，而競技比賽作為人類激發自身潛能的儀式化活動，可以產生更好的測試效果。人們一邊期待著從棋局的過程來探究棋盤上的客觀真理，藉助程序作為工具來更好的了解圍棋，另一邊也想看看能不能對人工智慧的進一步發展提供什麼參考和借鑒。這是兩個領域的雙贏，無論如何都將導致人類的進步。

而今天的棋局內容，則相對比較常規。柯潔開局就採用了Master在元旦期間60盤網棋中常用的三三定式，策略很明顯，你喜歡撈實地，我就先撈實地，你在複雜局面下有可能出錯，我就儘可能先撈後洗，在中盤戰鬥中找機會。但棋局的過程，雖然雙方都發揮出色，但相對平淡，柯潔過早選擇點三三，在傳統的棋理中稍虧，實戰效果也差不多，然後雙方始終不溫不火的保持差距，都沒犯什麼明顯的錯。中盤時，黑棋最多只有盤面優勢，然後白棋就收兵了。白棋後半盤多次目數虧損，導致差距縮小，最終以1/4子的最小差距取勝。

要關注1/4子的勝負結果，首先要知道圍棋研究與圍棋實戰的不同。研究棋理，就像探究客觀真理，當然要追求最佳，也就是最大收益；而實戰，因為贏多贏少都是贏，所以完全可以追求穩健。而蒙特卡洛的演算法是按照不同後續下法，跑出海量棋局然後統計勝率，AlphaGo模型設定為取最高勝率的後續下法為實際下法，所以實戰中這個模型在封閉空間中可能導致非最佳下法，但一般情況下不影響勝負。

所以最後的1/4子，雖然也說明了柯潔的拼搏，但大家必須明白，這不是實際差距。也就是說，今天棋局顯示出黑白雙方的發揮差距，實際上不是半目而是更多，但也沒有達到很多誇張的說法所說的兩個子。我個人感覺實際差距不到一先，因為在AlphaGo後半盤收兵之前，黑棋盤面稍好，白棋至少握有4目左右的優勢，這個數目應該更接近於今天雙方的發揮。

當然大家必須知道一點，圍棋實戰結果的差距，並不見得能說明實際差距，人和人之間的對弈，如果看清楚會小敗，經常會釋放勝負手博取翻盤可能，結果要麼翻盤，要麼崩盤。今天的柯潔鬥志昂揚，但是AlphaGo整盤棋控制力非凡，柯潔落後不多，但始終沒有什麼明顯的機會，上邊想要強殺白棋，可惜AlphaGo下出精彩手筋，有驚無險的活出。如果AlphaGo中後盤稍露破綻，柯潔一定也會寧為玉碎、不為瓦全，可惜AlphaGo始終那麼穩。嗯，找不到玉碎的機會，這正是今天AlphaGo強大發揮的說明。

對於AlphaGo的下法，今天阿老師的下法非常常規，或者說很像人類棋手。去年和李世石對弈的18.0版本，每盤開局都有一些對局部變化的選擇與人類常見下法不同，或者說是冷僻下法，效果大多不錯，但有些也存疑。今年元旦新版的Master上線，帶來的最明顯的新變化就是「早點三三」。而這種下法已經被職業棋壇大量研究和模仿，頗有收穫。可惜今天柯潔的開局點三三，效果上來看並不上佳，甚至可以說此下法可能導致了細微劣勢。但正如前所述，這更像是測試而非比賽，所以試探性著法是必然的，不然人還跟機器下什麼？總要有收穫的嘛！未來幾天的比賽，希望能看到各種姿勢的測試，今天這樣的平淡，一局足已。

經歷去年的人機大戰之後，這次許多輿論更加冷靜客觀一些，人機對弈更加回歸真實，這是可喜的。當然有些宣傳問題上有遺憾，也是無奈的。但重要的不是這些，用圍棋界的話說，「勝負不在這兒」，重要的是未來。

實戰進行圖1，黑方柯潔有備而來，右下角的結果是白棋稍滿意，白24的下法相對來說更自由，我很欣賞這一步棋，對此可能也有了一定的理解。

變化圖1 接上圖的局面此時黑1的下法可能優於實戰。

實戰進行圖2，黑棋25在這一帶落子導致左邊空虛，29的下法可能有些位置偏低，白棋30在外面行棋可能是對29最好的應對。

實戰進行圖3，白36是必要的次序，形成至47的轉換很有必然性。過程中阿爾法圍棋認為51可能走在H11位更為妥善。白棋54後中先，意在加強角部，此時黑棋實空有一定壓力。

實戰進行圖4,所以黑棋55掏角也是最後的時機，局部活的比較成功但至白68主動權已在白棋的掌握中。後來柯潔緊追不捨，無奈還是以最小的差距告負

本局的技術問題，留給各位職業大神來講解。我講一下幾個我個人比較關注的點。

1、訓練模式上，並非單純的「自我進化」版

新聞發布會上，哈薩比斯回答了記者的提問，即本次比賽的AlphaGo，是否是「純凈版」，不藉助於人類棋譜訓練的成果。哈薩比斯回答：並不是這樣，AlphaGo大部分訓練由自我對弈完成，但是在初始階段，仍然需要人類棋譜的輸入。

這個問題也間接被AlphaGo本次的招法所印證，本次AlphaGo在布局階段並沒有下出超越人類認知的超常規下法（比如中腹開局等）。

2、黃博士仍然充當了機械臂。在之前的人機大戰中，無論是第一次人機大戰中的黃士傑博士，還是DeepzenGo對戰趙治勳時候的加藤英樹，都是開發者自行擔任機械臂。而且貫穿始終。這一「行規」肇始於深藍對陣卡斯帕羅夫，當時擔任機械臂的同樣是華人、並且同樣來自台灣的許峰雄博士。儘管二十年來的科技發展完全可以做到機器人替代人肉臂。然而，程序員們仍然體現了足夠的溫情，這對他們本身也是一種莫大的榮譽。同樣，兩次歷史性事件，擔任機械臂的都是華人，也同時都是程序的主要開發人員。足以讓國人為之而驕傲。（PS:黃博士在每次擔任機械臂期間都沒有上過廁所，敬業精神令人感動）

3、柯潔數子時候的「苦笑」

圖片來源：東方IC

相比於第二屆夢百合決賽第五局對陣李世石，柯潔下完後呆若木雞，以為自己輸棋，得知自己獲勝後大吃一驚的那段表情。本次柯潔的苦笑更顯出對手AlphaGo的強大。夢百合結局時短短几步棋的柯潔是經歷了大優，失誤、痛苦、大驚、欣喜這樣的過程。局面在兩大頂尖高手間反反覆復，最終柯潔最小優勢獲勝。而同樣是最小的優勢，本局可謂是一切盡在AlphaGo的掌握之中。

4、AlphaGo時間優勢進一步擴大

本次比賽，賽後新聞發布會，哈薩比斯表示用的是「單機版」（實際硬體量為上次比賽的十分之一），在這樣的情況下，Alphago的用時優勢更加明顯。最後終局時，AlphaGo還有超過一半的時間未用完，柯潔則即將進入讀秒。在硬體配置量是上次十分之一的情況下，達到這樣的效果。足以證明AlphaGo的計算效率有了本質的提高。

綜上：現在的AlphaGo對於人類來說已經強得近乎無解，然而未來AlphaGo仍然存在巨大的提高空間。未來的圍棋，人類將在AI的帶領下，探索圍棋奧秘的效率大大提高。

說幾個其他答主沒提到的點。

一、執黑不利

這一點我在去年人機大戰期間也提過。對於中國規則，黑貼7.5目的棋，AlphaGo認為黑方勝率48%。職業棋手也有大貼目黑棋難下的共識。AlphaGo本來就比柯潔強很多，執白的AlphaGo就更難對付。因此，如果說柯潔有些微希望贏下一局，也是在柯潔執白的棋局裡。

柯潔的布局有備而來。對於一段時間內沒看比賽的棋友來說，三三開局和序盤點三三可能毀三觀。不過這兩招都是柯潔最近一直在嘗試的。右下角據說是國家隊最新的研究成果，AlphaGo的下法應該和柯潔預想的下法一致。這個局部可能會成為新定式。某位CEO說的「AlphaGo沒有定式」，我不同意。說穿了，定式是一種在變化的動態平衡。這個局部的定型，如果在未來的比賽里被重複使用若干次，就毫無疑問是一個新定式了。

個人愚見。黑棋右下角局部不吃虧，但全局配置而言，左下白棋二間高締與右邊外勢配合好，白棋滿意。

二、時間管理

這盤棋大家一直盯著柯潔和AlphaGo用時的差距。柯潔幾乎用完了三個小時，而AlphaGo還沒有用到一半的時間。AlphaGo下得快，是AlphaGo計算效率高，時間管理演算法先進。但是，我認為柯潔下得太快了。柯潔習慣於下得快，因為他計算力強，以快節奏落子可以給對手施加時間和心理上的雙重壓力。然而，AlphaGo不存在心理問題，AlphaGo的時間管理也是獨立於對手存在的。無論棋局進程如何，三小時的基本用時，對AlphaGo來說絕對綽綽有餘。這樣一來，柯潔只應該考慮怎樣最大化利用自己的時間。

需要注意的是，三個小時是基本用時，用完以後還有五次一分鐘的讀秒。一般來說，職業棋手會在後半盤進入讀秒，用來應付中盤後期的戰鬥，以及收官。前半盤大塊的時間，通常是用來思考棋局關鍵處的選擇。柯潔這盤棋在關鍵處思考的時間似乎不夠。

舉兩例說明。

黑87手，事後來看，這手棋是全局的一個分歧點。柯潔實戰的選擇將棋局導向了黑棋必須圍上邊大空才能爭勝的局面，很難把握。可以考慮在此處多花10-20分鐘思考。

黑97手，導致局面徹底失衡的一手。在此手之前，柯潔雖然稍落後，但局面總體是白棋確定地多而黑棋潛力大的形勢，總體仍平衡。此手之後，白棋在上邊輕鬆活出，將黑空洗劫一空，黑棋也沒有爭勝負的餘地了。這裡的要點是將上邊黑棋漏風的口袋紮緊，把潛力轉化成實地。黑棋雖然兩邊漏風，但白棋左上也有氣緊的弱點。此處柯潔選點的用時太短，應當多花10-20分鐘思考。

總體來看，柯潔沒有充分利用好3小時+5次一分鐘讀秒這樣寬裕的時間限制。也許這是柯潔一貫的節奏，但在AlphaGo這個對手面前，應當適當調整，以發揮自己的最佳水平。

三、AlphaGo的棋路

僅從這一局來看，很難說AlphaGo比柯潔是只強一點，還是不知高到哪裡去了。1/4子的差距是退讓的結果。AlphaGo沒有使出像去年對李世乭系列賽中類似「五路肩沖」這種毀三觀的好手。如果事先不說這是AlphaGo，我會覺得白棋是一個棋風飄逸的人類高手。除了第一圖裡的白24瀟洒的補棋之外，白30、32的組合拳也是賞心悅目。

這兩步棋視覺效果很好，從結果看白棋也很有收穫。

柯潔的黑棋呢，前半盤基本上實現了預定的目標。並且到86手為止，基本維持了局面的均衡。但是在關鍵處可能不夠謹慎。參看上面黑87和97兩手的選擇。一旦被拉開差距，就再無逆襲的機會。

柯潔執黑輸棋，本在意料之中。棋局精彩，也沒有特別令人吃驚的地方。我個人還是期待柯潔執白的棋局，看看有沒有什麼秘密武器吧。

先說結論，柯潔好樣的。alpha go 顯示出超級實力。

為什麼說柯潔好樣的？就棋局來說，柯潔從頭到尾沒有放棄，一直努力的尋找擊敗狗的套路。這點很難做到，下過棋的人都知道逆風的時候尤其是贏棋無望的時候，最好的解脫就是投子認輸，柯潔沒有，我想最後一個的時候他已經明確的知道輸了，但還是仔細的走完每一關子。具體棋局的分析前面已經說了很多，我也同意開始的33有點緩，在右上角的處理也是緩。

最後說一個細節在棋局結束後柯潔主動的向黃博士鞠躬以示尊重，並且主動的和黃博士復盤，點評這盤棋的得失，最後主動收拾棋子，這都是非常有職業素養的舉動。

大家應該看下棋局結束後，柯潔的表現，有世界第一人的風采。

人類下不過機器不代表圍棋失去了魅力相反更是打開了圍棋的另一扇門我們也有機會進入一個新的高度。

手機輸入格式略亂

先說結論，從結果上看，柯潔以四分之一子的最微小差距惜敗，可人類與阿法狗的差距並不只是這麼一點點。

「AlphaGO這次的棋和去年的棋完全是兩個人，去年的還像個人，現在太厲害了。」在不敵AlphaGO後，柯潔出席賽後新聞發布會。

柯潔輸得真的很微弱嗎，柯潔本人和見證這場較量的專業人士，並不這麼認為。細心觀眾發現柯潔多次情不自禁笑起來。他的回應讓人吃驚：「為什麼笑？那是苦笑，因為我早就知道自己要輸了。」「如果讓我自己點評，我想說：AlphaGo下得很精彩，我下得也挺好，但它下得太好了。它對棋的理念都在改變我們對棋的最初想法，沒有什麼棋是不可以下的。在棋局中，可以大膽創新，大膽開拓自己的思維。」柯潔說。

柯潔尤其提到了AlphaGO讓他非常佩服的一手——白52（AlphaGO）尖頂一下後，白54還要在左邊斷。AlphaGo對棋形感覺的敏銳程度叫人驚詫。因為黑棋（柯潔）面臨收氣，外圍很可能會被封緊，前面白50一手頓時叫人刮目相看——AlphaGo的定型能力實在是太強了。柯潔對這一手顯然準備不足，當時眉頭深鎖，「很震驚，人類對手是不可能下的，因為是後手，但事後分析我覺得是好棋，是一石二鳥的棋。」「AlphaGO實在下得太出色了，輸的也沒什麼脾氣，真的是很厲害。」柯潔表示。

作為天涯棋客、世界棋壇唯一的「十八夫婦」，江鑄久九段和芮乃偉九段都認為，白棋優勢並非結果看起來那般微弱，「看起來只贏了一點點，其實差距很大，因為AlphaGO基本上在後期領先後，就不再窮追猛打了，只求安全運轉。」江鑄久說。芮乃偉則表示，看AlphaGO這盤棋，就好像是當年和李昌鎬下棋，「感覺你所有的目的都達到了，然後再看棋盤，他竟還領先你一點。」

「棋聖」聶衛平也持相同的觀點，「我感覺形勢一直都是白棋好，究竟差多少得看AlphaGO決定。根據我的觀察，AlphaGO下棋只求簡單，不求最佳。」

在聶衛平看來，AlphaGO原來的優勢比現在大很多，後來優勢已經逐漸在縮小。快到終點時，雖然雙方差距縮小，但是AlphaGO的優勢不可動搖。「柯潔開始不久就陷入了落後的狀態，由於AlphaGO的構思招法遠勝於人類，所以柯潔在不知不覺中中了『狗』的招，不知不覺就落後了。」聶衛平說，AlphaGO有幾步棋完全出乎我們職業棋手的意料，當時看著奇怪，但是仔細一想確實下得好，從布局到中盤都有妙招，完全在掌握之中，掌控自如。

本文首發於上觀新聞。

答題之前先亮一下身份

07年打上的yc9，比較巔峰的戰績是13年在yc上和日本的世界冠軍小林光一下成4比5

目前大二學生一枚，前幾天在弈客上解說時也被朋友戲稱「北京大學生一哥」

------------------------ 半自動下劃線，開始說正題。

開局點三三，應該是柯潔在賽前準備過的，多次在比賽中嘗試。至於效果，應該是仁者見仁智者見智

實戰下到23為止我覺得白棋沒有任何不滿(按照傳統棋理)，不過24的下法值得商榷，個人傾向Q7單提。實戰的下法給黑棋留下很多借用，如:P3的斷，O2的夾。╭(╯ε╰)╮當然24畢竟是

狗老師下出來的，我們還是抱著學習的心態去看待吧←_←

不吹牛X的講 :這步棋和我的想法差不多，看棋的時候想到了白棋或者選擇轉身，當然由於可操作性的原因，還是沒敢繼續往下想，實戰白棋的下法確實很震撼，並且一舉取得了優勢

大概狗老師每盤棋都會走出幾步違背「棋理」的棋，52就如此。可是你以為的大俗手就真的是「俗手」么？naive←_←，在52掙得先手後，白54立刻在E10處斷看到這裡不得不佩服老師的構思:54斷的意思很明顯，借用上面四個死子，利用黑棋氣緊的毛病，最大限度的護住下方白方陣勢，是一種追求高效的下法。

-------------------本寶寶要去吃飯了，精彩的在後面，不要吝惜你們的zan

----------------------------------點贊的太少了TT寶寶要去學習咯，明天再更，暫時就放一張圖吧

來自朋友圈裡劉箐老師～你們看懂了么？反正我是沒看懂╭(╯ε╰)╮

～分割線

謝謝大家的贊～答主最近有點忙，這篇不繼續更了╭(╯ε╰)╮不過請大家放心，在人機大戰結束後，一定會用心寫一篇讓讀者和自己都滿意的文章！希望大家關注不要忘記點贊

隨著「Master」在弈城對陣職業高手60勝0負的戰績黑雲壓城，人類棋士陣營相繼遺憾敗北之後，絕大多數人無疑認為人機大戰柯潔會以0:3大比分告負。那麼勝利如此渺茫的人機大戰還存在有意義的看點嗎？

必然存在。人機大戰最重要的意義本就不在其勝負本身，而在於棋士對圍棋的執著、對自我的超越乃至對那「神之一手」的追尋。當去年人機大戰第四局李世石落子第78手挖的時候，相信正在看棋的你與我一樣激動而欣喜，激動的是看到了如此頑強與精妙的一步，即便後來發現它並不成立，但依然證明了那「神之一手」的存在；欣喜的是即使連敗三城之後，人類依然擁有正面戰鬥中擊潰AI的能力。柯潔作為一位「挽救日益衰亡圍棋界」（柯潔語）般有擔當的棋士，在那將如同史詩般永垂史冊的烏鎮圍棋峰會，他將如同一位衝鋒的戰士，在承載著361個交叉點的紋枰戰場上，帶著「模仿棋」這一反坦克武器對圍棋的極限陣地發起三次無畏的衝鋒。是的，從真正的意義上，他的對手其實並不是人工智慧，而是圍棋10472變化中永無止境的最優答案；他的衝鋒，是棋士自我的突破和對圍棋極限的永恆追尋——對永無止境的「神之一手」的追尋也正是本次人機大戰最大的看點。

從另一種意義上講，對弈亦是對人工智慧的一次戰略測試。在棋局進程中，人工智慧因為非正常落子而反映出的問題缺陷亦是本次人機大戰的重要看點所在。在過往的對局中，縱然人工智慧顯露出無與倫比的圍棋技藝，60連勝無人能擋。但我們精心分析後會發現：它的價值判斷和策略分析網路是存在問題的。首先，在網路分析中會有許多個落子點勝率一致，這時在不影響勝率的情況下，阿爾法狗以及其升級版master會下出一些比較稀奇古怪的招法，甚至會出現行棋思路不連貫的低級錯誤。其次，由於AI慣有的識別能力問題，超過一定範圍（九宮格）的攻防可能會出現識別不清晰的狀況，導致失誤的發生。從某種意義上說，人機大戰的偉大目的是對人工智慧缺陷進行史詩般的測試，以為棋盤下的勝利奠定堅實的基礎。今時今日的人工已經深入到醫療領域，幫助醫生更快、更準確的診斷疑難雜症。經歷過人機大戰，更加成熟的人工智慧將於不久的將來進入教育、國防、衛生、城市建設等更多社會領域，為人類擁有更加優質的生活貢獻一份寶貴的力量。

正是因為人機大戰的存在，我們才能欣賞到那永無止境的「神之一手」，才能擁抱更成熟的人工智慧時代，看到這裡，你還質疑它的看點嗎？5月23日，烏鎮圍棋峰會，我們在一起！

——愛棋道趙老師

本回答在第二局被打臉打得厲害。現在看來要麼是Deepmind已經針對含劫對殺改進過剪枝，要麼就是這盤碰巧沒有遇到蒙卡樹不能處理的情況。

滾去學習了。

————————————————————————————————————————

我就說一點，關於官子(和對殺，尤其是含劫對殺)。這兩部分，AlphaGo的演算法應該還有提升的空間。

之所以很多人覺得對局是半目勝負是因為激烈，是因為他們對圍棋和概率的理解還有些問題。要知道，數學上來說，圍棋（這裡暫時不討論循環劫和長生等引入複雜性的事情）在雙方最優策略下是會產生確定的結果的，不存在所謂贏的概率這個概念。而AlphaGo裡面的勝率/負率，只是蒙特卡洛樹裡面的模擬棋局中，勝/負兩種結果的所佔的比例。與其說它是概率，倒不如說它是AlphaGo對局面判斷的估值。我們人類一般會通過點目加判斷厚薄來完成對局勢的估值。在大多數情況下，這是不如AlphaGo的判斷準確的。

但是，官子階段例外。要知道很多時候，進入官子階段，圍棋就是簡單解析可解的了。所以說我會說，AlphaGo的官子收的還不如我，這不是在吹牛，也不是不理解AlphaGo演算法，而是對圍棋這個遊戲作為一個數學問題的尊重。數學上來說，我收官確實比蒙特卡洛樹要好，因為我在點目、數官子時其實可以算是進行了暴力搜索，窮盡了所有可能的結果。

對於很多複雜的局部戰鬥，對死活計算往往需要暴力搜索，窮盡所有變化。就以下圖為例，在這種生死悠關的情況下，顯然要窮盡所有變化。這時蒙特卡洛樹做出了非常愚蠢的決策，這個小飛，撞緊了氣也沒有造出劫材，最終導致了整塊大龍全滅。這裡順便也為柯潔辯解一下，他說的看不懂，其實就是說AlphaGo（蒙特卡洛樹）在這裡決策是很蠢的。這話說的很委婉，不懂圍棋的人才會以此為借口攻擊他。要知道，AlphaGo能贏柯潔，不代表他哪一步都比柯潔下得好。

我曾經想過，是不是可以對演算法分情況處理，當局面簡單到一定程度後，跳出蒙特卡洛搜索樹，進入暴力搜索樹。或者說，仍用蒙卡樹的情況下，要加大剪枝力度，聚焦到很少的可下點位上。當然，這就需要神經網路判斷什麼局面下轉而進入官子對殺模式。這兩種情況下，人的思維模式是明顯異於其他情況的。而也只有這兩個情況中，人在某些時候似乎仍然有相比電腦明顯的優勢。

我認為這個任務對於機器學習以後的進一步應用也是有必要也很有價值的。另外，從用人工智慧追求圍棋真理的角度來說，這也是勢在必行的下一步。非常希望Aja Huang博士這樣的專家能夠繼續在這方面工作，也希望Google不至於覺得已經戰勝了人類AlphaGo智能就已經完成其使命。要知道，有圍棋這樣一個極度複雜且有無數專家的數學問題，要是不好好用來繼續挖掘人工智慧的潛能，那就真的太可惜了。

最後，向對局的雙方致敬。能欣賞到這麼好的比賽，必須非常感謝柯潔認真的準備，也非常感謝Google公司的科學家們十年不懈的努力。

柯潔還是輸了。

2017 年 5 月 23 日，在舉行於中國烏鎮的「人機終極對決」第一局中，當今世界排名第一的中國圍棋選手柯潔，輸給了 Google 旗下的人工智慧程序 AlphaGo。

按照比賽規則，柯潔和 AlphaGo 各有三個小時的時間；但在現場的比賽中，整體的節奏比預想中的要快很多。尤其是 AlphaGo，它的平均出子時間為 30 秒左右，現場解說的職業八段棋手張璇和職業九段棋手常昊多次用「高效、果斷」來評價它的表現。而柯潔的應對狀況比較多變，有時會立刻下子，有時也會思考很長時間。

愛范兒（微信 ID：ifanr）在現場注意到，當柯潔用時一個小時的時候，AlphaGo 所用的時間不到二十分鐘。

直播看不了？看愛范兒的視頻吧：

在比賽進行了四個多小時之後，柯潔九段執黑負於 AlphaGo，AlphaGo 贏四分之一子。

不過，其實這盤結果差距並不大，所以關於這場「人機終結對決」的最終結果，目前還存在一定的變數。今天只是第一局，第二局和第三局將分別在 5 月 25 日和 5 月 27 日舉行，愛范兒（微信 ID：ifanr）將保持關注。

關注微信公眾號愛范兒（微信號：ifanr），回復關鍵詞「阿爾法狗」，獲取 AlphaGo 下圍棋的乾貨，了解機器學習和深度學習的區別。

這次的狗，亦敵亦友

就在昨天晚上，柯潔在新浪微博發表了題為《最後的對決》的賽前宣言，不無傷感地提到：

決戰前夕，感慨萬千…
在這個特殊的時間，我有些話想和熱愛圍棋、關注圍棋、關注我的朋友們說:
無論輸贏，這都將是我與人工智慧最後的三盤對局

這種離別的氣氛，反而給了這次比賽更多「且看且珍惜」的意義。

今天的比賽之後，柯潔還將在 25 日和 27 日進行對 AlphaGo 的後兩盤對決，無論第二局輸贏，三盤比賽都將完成，與之前 1 月份化身 Master 的 AlphaGo 要求下快棋不同，本次比賽採用傳統規則，雙方各有三小時的時間。

直到本次「中國烏鎮 · 圍棋峰會」，已是 AlphaGo 第三次刷屏，前兩次人機對決的場景還歷歷在目，但整個人類世界對於兩方選手的感情卻發生了顛覆性的變化。

2016 年 3 月，AlphaGo 首次挑戰韓國棋手李世石時，整個世界都希望 AI 獲勝，就像柯潔當時所說，「就算阿法狗贏了李世石，它也贏不了我」，大家以看熱鬧的心態打量著新生者 AI。

而當 2017 年 1 月，化身 Master 的 AlphaGo 在互聯網上連掃世界第一柯潔、韓國冠軍朴廷桓、日本冠軍井山裕太時，AI 似乎已經不可戰勝，柯潔也在微博深夜感慨「人類千年的實戰演練進化，計算機卻告訴我們，人類全都是錯的……」

直到今天，當柯潔在賽前說到「能夠代表人類出戰，是我以前不敢想像的事情，這次選擇我作為主角，我也會竭盡全力去一爭勝負」時，世界的選擇已經變成了希望人類贏一盤。

這種心態在賽制上也有所體現，除了代表中國選手最高水平的柯潔個人之外，新加入的配對賽和團體賽也非常值得關注。

配對賽將由古力九段、連笑八段兩位當中的一人分別與 AlphaGo 組隊，再與剩下的一人進行對決，每方只有 1 小時時間，比賽在 26 日上午打響。

團隊賽則是時越、羋昱廷、唐韋星、陳耀燁和周睿羊 5 位世界冠軍組成人類聯隊，合力對抗 AlphaGo，每方 2 小時 30 分鐘，這將在 26 日下午進行。

當 1 對 1 的對決已經過於殘酷，人機組隊又會擦出怎樣的火花，人類聯合組成的「神經網路」面對 AI 又是否還有勝算呢？

人不是那個人，狗不是那條狗

千萬別以為「坐」在場上對弈的雙方一年來都沒有變過，用很哲學的說法來說，他們都已經不再是當年那個存在。

自從今年 4 月確定了本次人機對決之後，柯潔已經有意識地在尋找對抗 AlphaGo 的「神之一手」，在先前進行的新奧杯世界賽和中國圍甲聯賽中，柯潔在 8 盤比賽中輸掉了兩盤，而這兩盤中出現了一些之前並不常見的運子方法，有觀察者表示這是柯潔在嘗試以傳統套路之外的方法尋找 AlphaGo 的軟肋。

從這個角度講，這三盤比賽中的柯潔的策略或許將與之前完全不同。

（那一年，柯潔的世界排名還在 AlphaGo 前面）

但 AlphaGo，恐怕在以令人絕望的迭代速度進化著。同樣在今年 4 月，AlphaGo 之父哈薩比斯在英國劍橋大學進行了演講，專門提到為了幫助 AlphaGo 提升，他們還開發了名為 Anti-AlphaGo 的防止過擬合的擾亂工具，之前 AlphaGo 提升一個版本需要 3 個月，現在只需要 1 周。

AlphaGo 對陣李世石時的版本號是 V18，而當下的版本估計已經到了 V60，在邏輯上和棋局策略上已經今非昔比。

這種進化的力量源泉與意義，是蒙特卡洛搜索演算法和深度學習模式的不斷進化。

為了解釋上面這兩個似乎每個字都能看懂，但其實都看不懂的詞，我們先來看兩組數字。

如果讀過人工智慧的科普文章的話，一定知道 20 年前的 1997 年 5 月，IBM 的?「深藍」計算機在國際象棋中戰勝了世界排名第一的卡斯帕羅夫。

從數學上考慮，國際象棋棋盤上能夠發生的不同可能大約是 10 的 46 次方，也就是 10000000000000000000000000000000000000000000000。

但這在圍棋面前就是小巫見大巫了，圍棋共有 19X19 個落棋點，加上不同的落字方式，全部可能大約是 10 的 170 次方左右，根據荷蘭科學家 John Tromp 的計算，大約是 208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935。

大家知道，困擾人類很多問題的原因在於算力，比如一個密碼鎖，如果只有兩位，那麼如果忘了密碼很多人都會嘗試去從 00 試驗到 99，但 4 位數的手機密碼就沒幾個人去試了，因為試出來花的時間太長，這就是算力不夠。

對於現在的 AI 來說，對弈國際象棋所需的算力已經基本達到，但是妄圖用窮舉法算出來圍棋的各種可能的算力還沒達到，這種情況下，就要考慮演算法了。

而 AlphaGo，就採取了一種「大智若愚」的辦法，讓算力不足的計算機「大愚若智」起來。

這就是蒙特卡洛搜索演算法，我們明白，很多時候兩人對決，其實不需要每一步都走當時最好的那一招，只要出的招是妙招，或者比對方能想像的好就行。這時候，就是一個概率問題。

舉個非常簡單的例子，從你家到火車站共有 ABCDE 五條路，或許你不知道每條路具體的長度和用時，但此時，如果從你家同時出發 500 人，每條路 100 人，然後你到火車站去觀察，假設半小時內到達的人里，走 B 的最多，你就可以斷定走 B 是條好路。

當然，路越多，路口越多，這種情況的分析會越複雜，但是放出的人越多，結果也會越精確，雖然沒有人能打包票說某條路一定是最對的，但是分析結果足夠做決策了。

這是用最最不嚴謹的方法解釋了這種概率學的取樣方法，但這相比逐項窮舉的辦法，大大前進了一步。

而深度學習，指的是 AlphaGo 會根據之前人類棋手的大量歷史棋局，記錄下每個棋局當中的分步局面，並把當前的棋局按照進行視覺分析，跟以往的數據進行比較，找到最類似的局面，再在當前最高質量的點上去下子，不至於把所有的位置都考慮一遍。

而當下版本 AlphaGo 最駭人之處，在於它已經跳出了學習人類棋盤的方法，而進入了自己左右手互搏，自己學習各種情況的局面，一方面它所學習到的棋局廣度非人類可想像，另一方面它的出招可能越來越沒有「套路」可言。

更別提 AlphaGo 只要有電就可以無休止學習這件事了，由於圍棋本身有明確的規則判斷勝負，所以 AlphaGo 可以在無需人類標註的情況下就能判斷自己出招的好壞，更是強化學習的一大優勢。

現在的狗，是人類智慧和機器智慧的結合體了。

明知不可為而為之，是為了費電么

我預測結果是 0 比 3，AlphaGo 勝出——聶衛平
人類的勝算為 0 ——李開復

既然在比賽層面，已經如此的沒有看點，為什麼人機對抗還要繼續進行呢？

賽前有媒體認為，這是為了向社會繼續推廣 AI 的概念，為行業的發展做宣傳，這種說法雖然都有一定的合理性，但格局未免太小。

就像在手機應用商店中會在「益智遊戲」中找到圍棋一樣，進行這種遊戲的目的還是為了益智。

而進行 AI 於人類的對抗，根本目的還是檢驗和優化演算法，並且力爭在其他更有價值的行業中進行應用。

就像在《智能革命》一書中，李彥宏說的那樣，「2017 年初，AlphaGo 的變身 Master 橫掃中韓頂級高手，一時間人們分化為悲觀派、降臨派、冷靜派、腦洞派…… 我們希望有更多人是默默學習派」。

從最初的 AlphaGo，到 Master，再到今天的 AlphaGo，三代產品，三段歷程，對應的恰好是「理論，實驗，再創新」的三段論。

而這種基於互聯網大數據的深度學習和決策支持系統，將在很多人類算力不可及的領域提供支撐。

Google 大中華區總裁石博盟就透露，AlphaGo 的第一個結合點會是醫療領域，AI 將在一定準確率的情況下，給予醫生診療判定方面的輔助，對於糖尿病、癌症等疾病的治療和研究大有裨益。

而未來在更大的深度和廣度上，AlphaGo 積累的決策模型，將逐漸把人力從需要反覆的勞動中解放出來，同時對腦力勞動進行反哺，對絕大多數社會元素進行快速解構並解讀，再反饋給人類。

如同去年大熱的科幻片《降臨》中，人和外星人最終的結果一樣，人工智慧與人類本體，終將會找到一條智慧結合的發展大路。

最後，我想以暢銷書《深澤直人》中文譯者路意今早創作的《最後一局人機對弈》當中的一段話做結：

在今年閱讀到 Jacob Bronowski 的 The Ascent of Man 的時候，被他所寫到的生物界中，只有人可以遠離他所誕生的環境，甚至在極端不適合生存的地方生活所啟示，人之所以能夠具備現在的能力，必然是與其敢於離開自己的舒適區有關。而藝術，愛，智商，想像力，創造力… 這些似乎都不能是必要條件，而更像是在數十萬年中，人類在不斷抗爭和追尋夢想的過程中所進化出的特質。

智能是人可以步入今日之成就的必要條件，但非充分條件。機器智能想必也會如此，大多數是不會具備人的意識的，但是不可排除的是，隨著時間的推移，其中有些會開始覺醒，擁有自我意識，開始抗爭，和追尋夢想，也會有貪嗔痴，真善美。

那時，它們自然也可稱之為人。人也不再只限一個血肉之軀。

原文作者： @常岩 @308IO
運營編輯： @巫冬

自己來擺一擺就知道了。

AlphaGo我們手上自然是沒有的，不過有實現方式與AlphaGo十分接近的圍棋AI可以用來研究，例如zen6（商業軟體）和leela（免費軟體，可在https://www.sjeng.org/leela.html下載）。棋力方面這二者是比不過AlphaGo的，一般只有弈城強8～弱9水平，但它們棋力雖低，形勢判斷可不比強9差，拿來看看棋判斷一下優劣形勢再合適不過了。

這一盤擺下來，說實話，比李世石第一盤的表現還是好多了，至少看著是一點一點崩的而不是突然狗帶……

AlphaGo從右下角佔到便宜開始勝率一直在55％左右，後面逐漸走高，中間唯一一次大的波動是在54手的時候，leela認為這個54不好，黑優，不過按leela的黑優變化圖走下去可以發現，這只是leela有些一廂情願，沒考慮到白的抵抗手段，按實戰走法沒兩步勝率又回來了。

一直到180手左右小官子階段，AlphaGo逐步讓利縮小棋盤，但勝率一直穩定在70％，整盤棋好像很平淡，從右下角佔到便宜開始，AlphaGo始終沒有給柯潔留下機會，也許還是要二子局才能看到其真正實力吧。

利益相關：弈城、野狐已全壓AlphaGo，並準備接下來的四天繼續全壓（滑稽

在知乎首個認真的回答。雖然棋局還沒有結束但基本可以對棋局做一個詳細的總結了。多圖預警，手機打的沒有排版，請見諒。

上來黑棋用阿法狗的三三回敬阿法狗。即使是現在我也認為布局點三三是血虧的行為，實戰阿法狗給我們上了生動的一課。阿法狗第10手在R6小飛應如下圖

局部黑棋被完封唯一比經典定式好的地方是白棋需要多走一手補掉引征如果是業餘比賽或者普通職業對局百分之八十的人會認為這圖白好

24在O9 大飛補引征 30如圖肩沖這兩步都是阿法狗亮瞎狗眼的棋。

普通人沒有24右下角補引征的感覺因為會留著下方的三路斷實戰阿法狗的理解是中間的輻射面比下面的空價值更大而換作我我一定會提因為我覺得中間很虛難以掌控。當然阿法狗沒有虛和實的概念也許整盤棋在它的眼裡都是實…

30 我就不解釋了這不是一般人人能想出來的棋用什麼樣的思路想出這手超出我的水平能理解的範圍但是這手棋確實讓黑棋怎麼下都不會不得不說高！

一番戰鬥之後各吃一塊白得先手

這個局部白棋賺了大約一個貼目為什麼呢？參考上上一張圖就可以看出來左邊由黑棋兩個子對打白棋一個子而一番交換後白棋損掉了四個子考慮到外勢因素虧15目賺來左上相當於連續下兩手的效果將黑角變白角形成一個類似於黑點三三的定式相當於賺了20目雖然外面還有被封住的手段但是黑棋吃掉的殘子利用極多大致抵消

以上思路見仁見智大體思路為手割分析法如有不妥的地方望指正～

事實上50點是非常精彩的一手給52尖頂的角部加固先手便宜追究薄味壓迫下方黑子這手的精彩程度不小於30！

54斷裡面沒有棋。

這手棋讓我想起李世石對古力那招中腹的一跳雖然沒有切斷古力的棋看起來停了一手自虧節奏但內功非常深！這一斷左方黑棋厚薄逆轉白在中央可找借用左方可收氣加厚經此一手黑棋形勢已經不對了

到68夾攻黑棋難活兩子只能侵消

在人看來空黑棋稍好後半盤還有很長

在狗看來…黑不行了

這就是差距

黑棋在下方在狗狗的配合下輕鬆搞出來一塊白棋右方打入追究黑棋的薄味

右上角雙方妥協白獲利較大

97在中間圍是柯潔的策略。如果跟人下肯定是f18封鎖

事實證明策略不管用 ai暫時刀槍不入

到118 白棋成功活出從職業角度看棋已經結束。後來柯潔能追是因為阿法狗肯定會剪枝虧目並且將目數虧到接近狀態。

有意義的部分就說到這吧。

這盤棋柯潔的主題是試探而不僅僅是爭勝負。

序盤柯潔7手點三三的感覺是想讓阿法狗解答一下心中的疑問為什麼可以在布局點三三？

在被制裁後柯潔23 25下的很薄目的應當是引誘阿法狗的出擊戰鬥中獲取機會

特別是25 明顯不符合厚勢勿近的棋諺這隻能理解為柯潔的策略畢竟和AI下和人不一樣

而阿法狗兩次出擊都得手了特別是30 50 54這幾招棋驚為天人非人力所能及

柯潔97想把先撈後洗改為先洗後撈然而阿法狗安全運轉能力強的無話可說

之後就是剪枝收官了不多評價。

剛剛知道收到了只剩下半目的差距這樣真的很痛…心疼棋手

總體而言，柯潔這一盤其實發揮了百分之八十及以上的水準了，所有的局勢不利的原因都是由於試探性招法。

而在這局棋，我們見證了阿法狗恐怖的序盤。

後兩局如何，仍然非常有看點。

Ps 我不認為這幾局都輸了就會如何如何對於出現一個顛覆傳統的存在我想職業棋手除了感到失敗的沮喪之外，更多的還有欣喜吧，畢竟ALPHAGO讓我們對圍棋的理解加深了許多許多。我們還是要感謝ALPHAGO，也要感謝那些為棋默默努力的人。

今年的柯潔對比去年的柯潔，提升的程度肯定是有限的

但是今年的狗，對比去年的狗，到底提升有多少，這個就只有谷歌自己才知道了

而且關鍵問題在於，今年的棋手，都依然無法理解去年狗的下棋思路

而今年的狗，已經帶來了很多全新的思路了

一開始，馬可以火車速度差不多

獵豹沒去比賽

現在獵豹跑不過內燃機車了

人們都笑話它

2002年，50歲的凱文·凱利在谷歌的一個小型聚會上遇見了谷歌的聯合創始人拉里·佩奇，那時的谷歌只是一家專註搜索的小公司，還未首次公開募股。凱文·凱利疑惑，為何在當時已有許多家搜索公司的情況下，谷歌還要做免費網路搜索。他把這個問題拋給了拉里·佩奇，得到的回答讓他一直難忘，拉里·佩奇說：「哦，其實我們在做人工智慧。」

在後來的許多年裡，谷歌收購了十三家人工智慧和機器人公司，乍一看會認為它們在用人工智慧方面的投資改善自己的搜索能力，但事實或許恰恰相反，谷歌正利用搜索改善它的人工智慧。谷歌每天處理的121億次查詢一遍又一遍地訓練它們的深度學習型人工智慧，凱文·凱利大膽預言：「到了2026年，谷歌的主營產品將不再是搜索，而是人工智慧」，「谷歌將擁有一款無可匹敵的人工智慧產品」。

今天，2017年5月23日的下午，我們似乎將要提前見證這個預言，AlphaGo以1/4子戰勝了人類世界等級分排名第一的圍棋手柯潔九段，這位極其優秀的棋手表示：「它已經接近……我理解中的圍棋的上帝。」有人疑惑，如果在繼續的比賽中，AlphaGo仍能打敗柯潔，那麼圍棋這項競技運動對人還有沒有吸引力？

答案是肯定的。其實早在圍棋之前，國際象棋也曾經被人工智慧打敗，那是在1997年，美國IBM公司生產的一台超級國際象棋電腦深藍，在人機對弈中擊敗了國際象棋大師加里·卡斯帕羅夫，他在國際象棋界的地位堪比柯潔在圍棋界的地位。深藍贏得了多場比賽後，人們對這種比賽失去了興趣，但這並不是故事的終結。

國際象棋大師卡斯帕羅夫意識到，如果他擁有一個與深藍擁有的所有棋路一樣大的資料庫，而他也被允許像人工智慧一樣使用資料庫，那麼他能不能打敗人工智慧呢？

卡斯帕羅夫率先提出了「人加機器」的概念，人可以在比賽中使用人工智慧加強自己的能力，去對抗另一個人加機器，而不是讓人與人工智慧對抗。這種比賽被稱為自由式國際象棋比賽，比賽的雙方可以是自由的組合，參賽選手可以是人，可以是人工智慧，也可以是卡斯帕羅夫式的「半人馬」型選手，人與人工智慧結合的賽博格（科幻小說中常用的設定，用機械替換人的一部分，從來將大腦與機械聯繫起來）。人加機器，人可以聽取人工智慧提出的建議，再做出判斷，可以否決也可以遵從，如同我們使用GPS智能導航。

而這種自由式比賽的結果又是什麼樣的呢？會不會仍然是人工智慧打敗人加機器？在2014年的自由式國際象棋對抗錦標賽上，純粹使用人工智慧的選手贏了42場比賽，而半人馬即人加機器型選手贏了53場比賽。當今世界上最優秀的國際象棋隊伍里都是人加機器型選手。

人工智慧的出現並沒有削弱人類象棋選手的水平，正相反，它提供了一個因生理結構受限、人類不可能擁有的龐大的資料庫，在人工智慧的激勵下，國際象棋選手的水平、錦標賽數量、下國際象棋的人數都達到了歷史之最。甚至有人與人工智慧一起接受訓練，現今人類象棋選手中排名第一馬格努斯·卡爾森已經被認為是人類國際象棋選手中最接近電腦的一個。

與國際象棋一樣，被人工智慧打敗並不是圍棋的結局，這才只是開始。在不遠的未來，人工智慧不僅能給圍棋選手一個強大的資料庫，它可以滲透進人類生活的方方面面，人類用已有的智慧創造某些部分超出自己的智慧，它們可以成為一個封閉領域裡最優秀的飛行員、法官、醫生、教師。這個未來不會太遠。

按照上午DeepMind團隊披露的信息，大家自行感受吧！柯潔也發了微博，進行了科普。

【福利】牆內直播鏈接：

https://share.yikeweiqi.com/golive/detail/id/3703?from=timelineisappinstalled=0

http://zhibo.m.sohu.com/r/121178/#/stream/124668

上午：柯潔狠撈實地。但是阿爾法狗駕馭厚味能力很強，局面上黑棋被壓制比較明顯，看中盤柯潔究竟怎樣克掉厚味。

下午：

一度感覺柯潔中腹作戰效果不錯，局面好轉實空領先。結果幾十步一下柯潔被逼上了絕路只能開始殺大龍，當中過程好刺激啊！

白棋活出後，alpha 狗局面佔優，領先了10多步，空又好棋又厚，柯潔輸棋基本確定了，藍瘦香菇。

知友寫的不錯，基本把我想說的說盡了，這局開局下三三有些失算，尾盤的大勺子不影響大局了。

知乎 - 與世界分享你的知識、經驗和見解

-----------記得點贊---------

從第一盤看：

1.柯潔發揮的正常，可以在任何對人類的比賽不落下風。但對阿爾法狗全盤無勝機。

2.這個版本的阿爾法狗，演算法進一步改進，不僅在計算效率上的提升（蒙特卡洛搜索方面），而且在形勢判斷，全局與局部的平衡上大幅提高（價值網路改進很大）。

3.複雜的死活計算，人類棋手會比較快的找到相對正確的解，但同樣基於計算的布局價值判斷，人類與AI差距太大。虛和實，局部和全局的靈活性會受人類習慣性思維束縛。這也就是常常會感到新的阿爾法狗（master）下的很靈活，局部算的很深，又時刻著眼全局。

4.人類之間差兩三子或有撿漏贏一盤，機器的穩定性，會導致一旦有差距，與機器比賽就沒有撿漏的可能。賽前有樂觀估計10%，只是心態上的說法而已，低於10%贏的可能性即為零。

5.現在的阿爾法狗很強，如果沒有AI，人類棋手再下一千年也達不到這個水平。

6.但人工智慧圍棋並不是真正的人類智能，阿爾法狗由於演算法的限制，沒有實現前半盤以勝率為目標，平滑過度到可以找到最優解的後半盤官子階段。

人類棋手不會後半盤的無意識防水，只會最大化勝利成果。解決不了這方面問題，再強的圍棋AI也只是機器在下棋。以勝負為目的的這種結果性要求，與以完美性的藝術追求，看似殊途同歸實則完全不同的。

柯潔第一局發揮得不錯，狀態不錯，心態也不錯，從直播畫面看大概白100下完後柯潔開始撓頭了，「這棋殺是不可能的，攻也不好攻啊」。

柯潔對AlphaGo第一局觀戰記 - 知乎專欄