2014年全球資訊網25週年紀念晚宴上,WWW之父首度結識DeepMind創辦人、後來的諾貝爾獎得主哈薩比斯。隨著神經網路技術在機器學習上取得驚人突破,兩人深談了AI不僅能預測蛋白質結構,卻也伴隨著中美爭奪訓練數據、引發地緣政治與網路軍事化攻擊的風險。WWW之父指出,無論AI如何發展,透過語意網建構完善的結構化資料,將是訓練可靠AI不可或缺的強大後盾。
WWW之父與DeepMind創辦人哈薩比斯的初次相遇
機器學習:AI 時代的機遇與風險
2014 年春天,全球資訊網迎來25週年紀念日。當年我在CERN 首次提交資訊管理提案的確切日期已不可考,因為那份最早的文件只寫著「1989 年3 月」。不過,大家總是希望有個明確的日期可以慶祝,於是我選定3 月12 日,這一天其實是我母親的生日。經過這麼多年,我愈來愈喜歡這個微小的關聯。不是每一個人都知道這件事,但現在你知道了。
在全球資訊網「正式」滿25週年的幾週後,Google在色彩繽紛的倫敦辦公室,為全球資訊網基金會舉辦慶祝晚宴。我和利斯抵達時,首先映入眼簾的是牆上一幅接一幅的巨大英國國旗。我們穿越活潑風格的休息區和豪華自助餐廳,來到員工餐廳,那裡被特別劃分出來作為晚宴場地。這是典型的Google 風格:輕鬆愉快、玩心十足。我很感激他們願意主辦這場活動。這場聚會別具意義,理由不只一個,因為就在這一天,我第一次見到傑米斯・哈薩比斯( Demis Hassabis ),他不只是AI 新創企業DeepMind 的傑出電腦科學先驅,後來更成為諾貝爾獎得主。
幾個月前,Google 以四億美元收購DeepMind。當時,這在AI 領域是前所未有的高價,然而時間證明,這其實是一筆相當划算的投資。在那晚的慶祝活動中,Google 安排我先上台演講,再由哈薩比斯作結。在一頓簡單而美味的晚餐之後,我簡短的講述全球資訊網的過去、現在與未來。接著,我坐下來,專心聽哈薩比斯概述DeepMind 團隊取得的重大突破。哈薩比斯平易近人,才智超群,說起話來輕聲細語、不疾不徐,表達清晰易懂,但最令我佩服的是,他總能深入淺出的講解複雜的觀念。我發現,愈聰明的人往往愈容易溝通。哈薩比斯生於倫敦,母親是新加坡華人,父親則是塞浦路斯希臘裔。他年少時的學業成績出色,曾擔任英格蘭青少年國家西洋棋隊隊長。20出頭時,他曾開發電子遊戲,但覺得這樣的工作挑戰性不足。後來他在倫敦大學學院(University College London)取得博士學位,朝向更宏偉的目標邁進。
2010 年,他與謝恩・萊格( Shane Legg)及穆斯塔法・蘇萊曼( Mustafa Suleyman)共同創立DeepMind,想要打造全球第一個「通用型AI」,這種AI 不僅能玩遊戲與破解西洋棋難題,甚至能勝任人類能做的任何任務。
在那場晚宴上,哈薩比斯講述DeepMind 團隊在短短四年間的驚人進展。哈薩比斯不是像語意網社群那樣,在事實層之上建構邏輯,而是使用神經網路,這種軟體能模仿生物的大腦結構。DeepMind 團隊建立一個人工訓練環境,讓神經網路能「自行學習」。第一個挑戰是簡單的電子遊戲《乓》(Pong)。神經網路可以控制球拍,也能看到遊戲畫面,它接收到的唯一資訊是:得分就對了。一開始神經網路的表現很糟,之後慢慢進步,經過數百萬場遊戲後,終於能像高手那樣玩《乓》。不久,同一個神經網路又學會其他多款經典大型電玩機台遊戲,除了盡量衝高分數,沒有其他任何指示。
我津津有味的聽哈薩比斯演講。雖然我一直對AI 很感興趣,但從未接觸過神經網路方面的研究。在1980 至1990 年代那場漫長而殘酷的「AI 寒冬」,神經網路研究幾乎很難得到資金。我有自己的研究路線,也認識機器學習領域的人。神經網路固然有趣,卻一直乏善可陳,遇見哈薩比斯後,我才見識到這種不依賴明確邏輯層次、能夠自我學習的系統真的能解決難題。哈薩比斯在演講中提到,這種神經網路未來或許可以應用在許多娛樂與科學領域。最後,他也提出一個警訊:DeepMind 在AI 領域進步神速,繼續這樣發展下去,這種系統或許有一天會超出人類掌控的範圍。
在場的每一個人莫不聽得目瞪口呆。即使有人好不容易擠出一個字,通常也只是「哇」一聲,不過利斯記得,有幾個人低聲說出「天啊」。哈薩比斯的這場演講,帶領聽眾領略現代神經網路的奧秘。毫無疑問,AI 已經達成革命性、前所未有的突破,尤其是機器學習。後來,我們與哈薩比斯在倫敦私下約吃飯。他小心翼翼的把手機關機,對我們吐露他的憂慮:世界正分化成兩個對立的AI 陣營,分別以西方和中國為中心。
研究社群正把個人資料源源不絕的提供給AI。由於政府法規限制,Google 必須經過繁瑣的程序,才能把這些資料提供給AI,但中國則不受此限。他擔心這可能讓中國搶得先機。我也憂慮,AI 可能淪為戰略軍事角力的焦點。在大多數的情況下,網路技術有利於建構眾人協作、共享平台,然而AI 已有許多軍事級的應用,可能引發軍備競賽。中國早就架設網路防火長城,封鎖大量境外網站。( 當然,中國不是實施類似網路管制的唯一國家。)與哈薩比斯談過之後,我發覺AI可能帶來更多攻擊性威脅,它能製造武器、研發網路安全探測工具,甚至能突破其他國家的防禦體系。事實證明,這些憂慮並非杞人憂天。
儘管有這些擔憂,但也有理由保持樂觀。當時我對AI 的潛力極度興奮,至今仍然不變。多年來,哈薩比斯率領團隊不斷提升神經網路的能力,從攻克簡單的大型電玩機台遊戲開始,逐步進展到繁複的策略博弈領域。2016 年,搭載神經網路技術的AlphaGo 立下里程碑,首次在圍棋對弈中擊敗人類頂尖棋手李世乭。2017 年,AlphaGo 的升級版AlphaZero 登場,成為有史以來最強的西洋棋電腦。
與此同時,哈薩比斯還訓練機器去挑戰棘手的「蛋白質摺疊」( protein folding),也就是胺基酸長鏈折疊形成立體形狀的過程。生化學家想模擬這種分子摺疊以加速開發新藥,但電腦一直無法解決這個問題。哈薩比斯的團隊以先前在西洋棋與圍棋上的洞見為基礎,研發出AlphaFold 神經網路,這個系統以史無前例的精準度預測蛋白質的形狀。以前,一個研究生可能要窮盡整個博士研究期間,才能解析單一蛋白質結構,但AlphaFold 只需幾分鐘就能完成。因為這項成就,哈薩比斯在2024 年榮獲諾貝爾化學獎。十年前,他在全球資訊網週年紀念日為我們祝賀、演講,如今我們再次受邀參加Google 舉辦的慶祝晚宴,這一次輪到我們親自向他道賀!
哈薩比斯的成功讓我反思自己做的研究。所謂「事實與邏輯」路線的AI 研究,確實開發出不少實用的工具,例如蘋果的智慧語音助理Siri,IBM 的華生系統(Watson)則內建大量醫療數據與智力競賽節目《危險邊緣》( Jeopardy!)的題庫資訊。史蒂芬・沃爾夫勒姆(Stephen Wolfram)開發的工具「Wolfram Alpha」對數學作業來說超級好用,如果問它高等數學的一般問題,不僅能給出合乎邏輯的答案,還會生成漂亮的圖形。這些系統都是透過明確的知識庫與規則精心建構而成,內含機器能回答的題目清單。有人把這條發展路線稱為「老派AI」( Good Old-Fashioned AI),簡稱GOFAI。
機器學習的運作方式與老派路線不同,它依賴三個支柱:軟體、硬體與資料。軟體是神經網路及其訓練方法;硬體則是稱為「圖形處理器」(GPU)的特殊晶片,能以驚人的速度進行運算,製造GPU 的輝達(Nvidia)如今是全球市值最高的公司;資料作為第三個支柱,往往才是拼圖中缺少的那一塊。因此,我認為語意網,也就是「資料的網路」,能與哈薩比斯的研究相輔相成。無論採取哪一種AI 發展方法,擁有結構完善的資料世界都能帶來巨大助益。例如在解決蛋白質摺疊問題時,哈薩比斯以大量已知的胺基酸序列與蛋白質結構資料來訓練AlphaFold,就像是用題庫和答案本讓AI 練習。
世界上仍有浩瀚無垠的資料之海可供AI 學習。特別是網路資料,更像是一片尚待開拓的疆域。哈薩比斯2014 年在Google 演講,幾年後OpenAI 團隊開始訓練強大的語言新模型,幾乎以整個網路的資料作為訓練素材( 這部分稍後會再詳述)。個人資料也可能用在各種新的AI 工具中,但前提是我們信任使用這些資料的系統。