減重焦慮不是你的錯!減重名醫蕭捷健《碳水循環》:你不是意志力不夠,而是選錯了方法
蕭捷健醫師在《碳水循環》中溫柔呼籲:體重焦慮不是你的錯,你只是選錯了方法。本書針對常見減重迷思,提出與身體合作、非極端的科學方法,幫助你改善代謝、找回健康與快樂。無需禁澱粉、不必自我折磨,讓瘦身成為自然且可持續的生活節奏。
蕭捷健醫師在《碳水循環》中溫柔呼籲:體重焦慮不是你的錯,你只是選錯了方法。本書針對常見減重迷思,提出與身體合作、非極端的科學方法,幫助你改善代謝、找回健康與快樂。無需禁澱粉、不必自我折磨,讓瘦身成為自然且可持續的生活節奏。
《善意與信任》揭示了網路時代中人際關係的變化,探討在市場思維與社群媒體滲透下,傳統的「共享關係」如何被「交換關係」取代,導致信任感下降與人際疏離。從心理學觀點出發,作者指出數位量化與社會比較讓我們愈來愈難真誠互動,也讓自我價值感受到衝擊...
人工智慧(Artificial Intelligence,AI)是什麼?人工智慧的定義歷經多次轉變直到今日,被廣泛接受的定義仍然有很多種,具體要使用哪一種定義,通常取決於我們討論問題的語境和關注的焦點。
圖片來源:pexels
歷史上,人工智慧的定義歷經多次轉變,一些膚淺、未能揭示內在規律的定義,很早就被研究者拋棄。直到今日,被廣泛接受的定義仍然有很多種,具體要使用哪一種定義,通常取決於我們討論問題的語境和關注的焦點。
在此,簡要列舉幾種歷史上有影響力,或是目前仍然流行的人工智慧定義。對這些定義的分析、討論,是一件相當有趣的事,有點像古代哲學家圍坐一起探討「人何以為人」,或是像科幻迷對艾西莫夫(Isaac Asimov)的「機器人三定律」(Three Laws of Robotics)展開辯論。其實,很多實用主義者反對形而上的討論,會大聲說:「管他什麼是人工智慧呢!只要機器能夠幫助人類解決問題,不就行了?」
「人工智慧就是機器可以完成人們不認為機器能夠勝任的事」,這個定義非常主觀,但也非常有趣。一個電腦程式是不是人工智慧,完全由這個程式的所作所為,是不是能夠令人目瞪口呆來界定。這種唯經驗論的定義顯然缺乏一致性,會因時代不同、背景不同、評判者的經驗不同,而套用不同的標準。但是,這個定義往往反映的是,一個時代裡最大多數的普通人對人工智慧的認知方式:每當一個新的人工智慧熱點出現,新聞媒體和社會大眾總是用自己的經驗,來判定人工智慧技術的價值高低,而不管這種技術在本質上究竟有沒有「智慧」。電腦下棋的歷史,就非常清楚地揭示了這個定義的反諷之處。
早期,礙於運算速度和儲存空間的限制,電腦只能用來解決相對簡單的棋類博弈問題,例如西洋跳棋,但這毫不妨礙當時的人們將一台會下棋的電腦稱作「智慧型機器」,因為那時的普通電腦在大多數人的心中,不過是一台能用飛快速度做算術題的機器罷了。1951年,英國曼徹斯特大學的克里斯多夫•斯特拉齊(Christopher Strachey),編寫了第一個會下西洋跳棋的電腦程式。1950年代中期,IBM的亞瑟•薩繆爾(Arthur Samuel)開發的西洋跳棋程式,可以和業餘選手對抗。1962年,薩繆爾的程式戰勝了一位盲人跳棋高手,一時間成了不小的新聞事件,19絕大多數的媒體和社會大眾都認為類似的西洋跳棋程式,是不折不扣的人工智慧。
可是,沒過多久,不少粗通程式設計的人就發現,電腦基本上是用搜尋或優化搜尋的方式,來解決博弈問題。雖然其中有各種避免窮舉的演算法技巧,但在公眾眼中,程式只不過是按事先編寫的搜尋策略,一步步找到最佳走棋步驟而已。隨著PC普及,每台個人電腦都可以運行一個水準相當高的西洋跳棋程式,於是會下棋的電腦逐漸褪去神祕光環。人們開始懷疑西洋跳棋程式的智慧程度,不少人會用國際象棋作為例子,挑釁說道:「下西洋跳棋有什麼了不起?哪天在國際象棋棋盤上贏得世界冠軍,那才叫人工智慧。」
後頭的事情大家都很熟悉了。1996年,IBM研究團隊傾力打造的超級電腦深藍,挑戰了世界棋王卡斯帕洛夫(Garry Kimovich Kasparov)。當年,雖然深藍遺憾敗北,但人們已經看到電腦戰勝人類的希望。1997年,深藍捲土重來,在六局棋的對抗賽中,戰勝了卡斯帕洛夫之後,聲譽大振。當時,幾乎全世界的人都在討論深藍的強大與可怕,沒有人懷疑深藍就是人工智慧的代表,至少公眾願意相信在深藍巨大的黑色主機殼內,擁有一顆在棋類博弈領域不輸給人類的特殊「大腦」。
可惜,好景不長,和西洋跳棋相似的歷史,很快就再次上演了。當國際象棋、中國象棋已經被電腦玩得滾瓜爛熟,連一部手機、一台平板電腦上的象棋程式,都能與人類高手分庭抗禮,公眾立刻就開始懷疑這樣的博弈程式,是不是還稱得上是人工智慧。事實上,和下棋類似的事情,也發生在OCR(光學字元識別*1)等已經失去新鮮感的電腦演算法上。道理很簡單,公眾總是樂於證明人類在智慧層面的獨一無二,不管是不是真的懂演算法的細節,人們總會說,電腦只不過是在程式控制下,機械性地完成搜尋或窮舉罷了。
在拒絕承認象棋程式是人工智慧之後,公眾找到維護人類智慧尊嚴的最後陣地—圍棋。直到2016年年初,除了一個名叫樊麾的職業圍棋選手,以及谷歌DeepMind一支規模不大的研發團隊之外,幾乎所有地球人,包括圍棋高手和不少電腦專家,都經常會這樣說:「下象棋有什麼了不起的?真有『智慧』的話,就來跟世界冠軍下盤圍棋試試?圍棋可是一項無法窮盡搜尋,需要倚靠人類大局觀的智力運動,是電腦唯一無法戰勝人類的棋類比賽。」
很不幸,人類的自以為是,再次被快速發展的人工智慧演算法給無情嘲笑了。2016年3月9日,圍棋世界冠軍李世石,端坐在AlphaGo的面前,宿命再一次降臨。隨著AlphaGo在五番棋中以4:1大勝,有關人工智慧的熱情和恐慌情緒,同時間在全世界蔓延開來,也因此引發了一波人工智慧的宣傳熱潮。
2017年元旦前後,升級版的AlphaGo更是以Master的網名悄然復出,在中韓對弈的平台上,與包括中日韓最高水準棋手在內的數十位人類頂尖棋手過招,弈出了60:0的絕對優勢戰績,真可謂「笑傲棋壇,但求一敗。」
今天,沒有人會懷疑AlphaGo的核心演算法是人工智慧,但想想以前的西洋跳棋和國際象棋,當時的人們不是一樣對戰勝人類世界冠軍的程式敬若神明嗎?再過兩、三年,當手機上的圍棋程式可以輕鬆戰勝職業棋手,當所有圍棋比賽都要嚴查手機作弊時,大家還會認為電腦下圍棋,是一件不可思議的事嗎?人們還會將圍棋程式,視為人工智慧的代表嗎?
這是人工智慧發展早期非常流行的一種定義方式,另一種同樣從思考方式本源出發的類似定義是:AI就是能夠遵照思維裡的邏輯規律進行思考的電腦程式。
從根本上來說,這是一種類似仿生學的直觀思路。既然稱為「人工智慧」,那麼用程式來類比人類的智慧,就是最直截了當的做法。但歷史經驗證明,仿生學的思路在科技發展中不一定可行。一個最好、也是最著名的例子,就是飛機的發明。人類在幾千年的時間裡,一直夢想著按照鳥類撲打翅膀的方式飛上天空;但反諷的是,真正帶著人類在長空翱翔,並且打破鳥類飛行速度與飛行高度紀錄的,是飛行原理與鳥類差別極大的固定翼飛機。
人類的思考方式?人類究竟是怎樣思考的?這本身就是一個複雜的技術和哲學問題。要了解人類自身的思考方式,哲學家們試圖透過反省與思辨,找到人類思維的邏輯法則;科學家們則透過心理學和生物學實驗,了解人類在思考時的身心變化規律。這兩條道路都在人工智慧的發展歷史上,發揮了極為重要的作用。
思維法則,或是邏輯學,是一個人的思考過程是不是理性的最高判定標準。從古希臘的先賢們開始,形式邏輯、數理邏輯、語言邏輯、認知邏輯等分支,在數千年的積累和發展過程中,總結出大量規律性的法則,成功為幾乎所有科學研究提供方法論層面的指導。讓電腦中的人工智慧程式遵循邏輯學的基本規律,進行運算、歸納或推演,是許多早期人工智慧研究者的最大追求。
世界上第一個專家系統程式Dendral,是一個成功運用人類專家知識和邏輯推理規則解決特定領域問題的例子。這是一個由史丹佛大學的研究者,使用Lisp語言寫成,幫助有機化學家根據物質光譜推斷未知有機分子結構的程式。Dendral專案在1960年代中期,取得令人矚目的成功,衍生出一大批根據物質光譜推斷物質結構的智慧程式。21 Dendral之所以能夠在特定領域解決問題,一是依賴化學家累積的關於何種分子結構可能產生何種光譜的經驗知識,一是依賴符合人類邏輯推理規律的大量判定規則。Dendral的成功,事實上帶動專家系統在人工智慧各相關領域的廣泛應用,從機器翻譯到語音辨識,從軍事決策到資源勘探;一時間,「專家系統」似乎就是「人工智慧」的代名詞,熱度不亞於今天的「深度學習」。
不過,人們很快就發現,基於人類知識庫和邏輯學規則構建人工智慧系統的局限。一個解決特定、狹小領域問題的專家系統,很難被擴展到稍微寬廣一點的知識領域中,更別提擴展到基於世界知識的日常生活裡了。一個著名的例子就是:早期人們使用語法規則與詞彙對照表,來實現機器翻譯時的窘境。1957年,蘇聯發射世界第一顆人造衛星之後,美國政府和軍方急於使用機器翻譯系統,來了解蘇聯的科技發展動態。
然而,使用語法規則和詞彙對照表,來實現的俄翻英機器翻譯系統笑話百出,曾把「心有餘而力不足」(the spirit is willing, but the flesh is weak),譯成「伏特加不錯,但肉都爛掉了」(the vodka is good, but the meat is rotten),完全無法處理自然語言中的歧義和豐富多樣的表達方式。22在後起的統計模型、深度學習等技術面前,專家系統毫無優勢可言,從1990年代開始就備受冷落。科研機構甚至不得不解雇過時的語言學家,以跟上技術發展的腳步。
另一方面,科學家從心理學和生物學出發,試圖釐清人類大腦到底是如何運作的,並且希望按照大腦的運作原理構建電腦程式,落實「真正」的人工智慧。在這條道路上,同樣荊棘滿布;最跌宕起伏的例子,非神經網路莫屬。
生物學家和心理學家,很早就開始研究人類大腦的運作方式;其中,最重要的一環,就是大腦神經元對資訊 (刺激)的處理和傳播過程。早在通用電子電腦出現之前,科學家就已經提出有關神經元處理資訊的假想模型,即人類大腦中為數龐大的神經元,共同組成一個相互協作的網路結構,資訊(刺激)透過若干層神經元的增強、衰減或遮罩處理之後,作為系統的輸出信號,控制人體對環境刺激的反應(動作)。1950年代,早期人工智慧研究者將神經網路用於模式識別,用電腦演算法類比神經元對輸入信號的處理過程,並且根據信號經過多層神經元後得到的輸出結果,對演算法參數進行修正。
早期神經網路技術沒有發展太久就陷入低谷,主要有兩個原因。一、當時的人工神經網路演算法,在處理某些特定問題時有先天局限,亟待理論突破;二、當時的電腦運算能力,無法滿足人工神經網路的需要。1970年代到1980年代,人工神經網路的理論難題得到解決。從1990年代開始,隨著電腦運算能力的飛速發展,神經網路在人工智慧領域,重新變成研究的熱點。但是,直到2010年前後,支援深度神經網路的電腦集群,才開始獲得廣泛應用,而提供深度學習系統訓練使用的大規模資料集,也愈來愈多。神經網路這一仿生學概念,在人工智慧新一輪的復興中,真正扮演了至關重要的核心角色。
客觀說來,神經網路到底在多大程度上,精確反映出人類大腦的運作方式?這個問題仍然存在爭議。在仿生學的道路上,最本質的問題是:人類至今對大腦如何學習、記憶、歸納、推理等思維過程的機理還缺乏認識,況且我們並不知道,到底要在哪個層面—大腦各功能區相互作用的層面?細胞之間交換化學物質和電信號的層面?還是分子和原子運動的層面?—真實類比人腦運作,才能製造出可與人類智慧匹敵的智慧型機器。
和仿生學派強調對人腦的研究與模仿不同,實用主義者從不覺得人工智慧的實現,必須遵循什麼規則或理論框架。「不管黑貓、白貓,會抓老鼠的,就是好貓。」在人工智慧的語境下,這句話可以被改造成:「不管簡單程式、複雜程式,只要是聰明、管用的,就是好程式。」
也就是說,無論電腦以何種方式實現某一功能,只要該功能表現得和人在類似環境下的行為相似,就可以說這個電腦程式擁有該領域的人工智慧。這個定義從近似於人類行為的最終結果出發,忽視了達到此一結果的手段。另一種對人工智慧的近似定義,則是更強調人工智慧的實用色彩:AI就是可以解決問題,並且獲致最大效益的電腦程式。
略懂一點程式設計的人都知道,幾乎所有的程式設計語言,都會提供類似if... else...的分支結構,即如果程式發現某項條件已經滿足,就會執行if之後的指令,否則就會執行else之後的指令。那麼,與if... else...相關的一個哲學問題是,程式在根據某項條件進行判斷,並且完成相應的操作時,這項「判斷」及隨後的「決定」,是由電腦自己做出的,還是由編寫程式的人做出的?如果是由電腦自己做出的,那能不能說所有執行if... else...語句的電腦程式,都是人工智慧?如果是相反的話,那麼電腦根據運作情況做決策時,人類又在哪裡呢?
哲學思辨很容易陷入這樣的兩難境地,但實用主義者根本不把這當一回事—執行if... else...的程式是否有智慧,完全要看那個程式是不是做了和人相似、有智慧的事。像Dendral這樣的專家系統,就是靠大量的if... else...來模仿人類專家的判定規則,這當然屬於人工智慧的範疇,而普通的數值計算程式即便用了if... else...,也不能被稱作「智慧」。
實用主義者推崇備至的一個例子,就是麻省理工學院於1964年到1966年間開發的「智慧」聊天程式—ELIZA。那個程式彷彿一個有著無窮耐心的心理醫師,可以和無聊的人或需要談話治療的精神病人,你一句我一句永不停歇地聊下去。當年,ELIZA的聊天紀錄,讓許多人不敢相信自己的眼睛。可事實上,ELIZA所做的,不過是在用戶輸入的句子裡,找到一些預先定義好的關鍵字,然後根據關鍵字,從預定的回答中選擇一句,或是簡單將用戶的輸入做了人稱替換後,再次輸出,就像心理醫師重複病人的話那樣。ELIZA心裡只有詞表和映射規則,才不懂用戶說的話是什麼意思。
這種實用主義的思想,在今天仍然具有很強的現實意義。舉例來說,今天的深度學習模型,在處理機器翻譯、語音辨識、主題抽取等自然語言相關問題時,基本上都是將輸入的文句,看成由音素、音節、字或詞語所組成的信號序列,然後將這些信號一股腦兒塞進深度神經網路進行訓練。
在深度神經網路的內部,每層神經元的輸出信號可能相當複雜,複雜到程式設計者並不一定清楚這些中間信號在自然語言中的真實含義。但是,這沒有關係,只要整個模型的最終輸出滿足要求,這樣的深度學習演算法,就可以運作得很好。在研究者看來,深度學習模型是不是真的跟人類大腦神經元理解自然語言的過程類似,這一點都不重要;重要的是,整個模型可以聰明運作,最終結果看起來就像人做的一樣就好。
沒有哪個完美主義者會喜歡這個定義,因為這個定義幾乎將「人工智慧」與「機器學習」畫上等號。然而,這的確是最近這波人工智慧熱潮裡,「人工智慧」在許多人眼裡的真實模樣。那麼,是誰讓深度學習一枝獨秀,幾乎壟斷人工智慧領域裡所有流行的技術方向呢?
從1980年代到1990年代,人們還在專家系統和統計模型之間搖擺不定,機器學習固守著自己在資料探勘領域的牢固陣地遠遠觀望。短短十幾年過去,從2000年到2010年,機器學習開始逐漸爆發出驚人的威力,最早在電腦視覺領域擁有驚人的突破。從2010年至今,使用深度學習模型的圖像演算法,在ImageNet競賽中明顯降低了物件識別、定位的錯誤率;到了2015年,在ImageNet競賽中領先的演算法,已經達到比人眼更高的識別準確率。23就在同一年,語音辨識依靠深度學習,獲得大約49%的性能提升。24機器翻譯、機器寫作等領域,也在同一時期逐漸被深度學習滲透,因此獲得大幅改善。
「無學習,不AI」,這句話幾乎成了人工智慧研究在今天的核心指導思想。許多研究者更願意將自己稱為機器學習專家,而非泛泛的人工智慧專家。谷歌的AlphaGo因為學習了大量專業棋手的棋譜,又從自我對弈中持續學習、提升能力,才擁有戰勝人類世界冠軍的本錢。微軟小冰因為學習了大量互聯網上的流行語料,才能用既時尚、又活潑的聊天方式與使用者交流。媒體方面,被宣傳為人工智慧的典型應用,大多擁有深度學習的技術基礎,是電腦從大量數據資料中,透過自我學習掌握經驗模型的結果。
這個定義似乎也符合人類認知的特點,畢竟沒有哪個人是不需要學習,從小就懂得所有事情的。人的智慧離不開成長過程裡的不間斷學習,因此今天最典型的人工智慧系統,透過學習大量數據訓練經驗模型的方法,其實可以被視為模擬人類學習和成長的全過程。如果說,人工智慧未來可以突破到強人工智慧,甚至超人工智慧的層次,那麼從邏輯上說來,在所有人工智慧技術中,機器學習最有可能扮演核心推動者的角色。
當然,機器目前的主流學習方法,和人類的學習方法還存在著很大的差別。舉個最簡單的例子,目前的電腦視覺系統,在看過數百萬張或更多自行車的照片之後,很容易辨別出什麼是自行車、什麼不是自行車,這種需要大量訓練照片的學習方式,看上去還比較笨拙。反觀人類,給一個三、四歲的小孩子看過一輛自行車之後,如果再見到的哪怕是外觀完全不同的自行車,十之八九也能做出「那是一輛自行車」的判斷。
也就是說,人類的學習過程,往往不需要大規模的訓練資料。這項差別給人類帶來的優勢是全方位的,面對繁紛複雜的世界知識,人類可以用自己卓越的抽象能力,僅憑少數個例,就歸納出可舉一反三的規則或原理,甚至更高層次的思維模式或哲學內涵等。最近,儘管研究者提出了遷移學習等新的解決方案,但從總體上說來,電腦的學習水準還遠遠達不到人類的境界。如果人工智慧是一種會學習的機器,那麼未來需要著重提升的,就是讓機器在學習時的抽象或歸納能力向人類看齊。
針對人工智慧,不同定義將人們導向不同的研究或認知方向,不同的理解分別適用於不同人群和語境。如果非要折衷調和所有看上去合理的定義,我們得到的,也許就只是一個全面但過於籠統、模糊的概念。
維基百科的人工智慧詞條,採用的是斯圖亞特•羅素(Stuart Russell)與彼得•諾維格(Peter Norvig)在《人工智慧:一種現代的方法》(Artificial Intelligence: A Modern Approach)25一書中的定義。他們認為:
人工智慧是有關「智慧主體(Intelligent agent)研究與設計」的學問,而「智慧主體是指一個可以觀察周遭環境,並且採取行動以達成目標的系統。」26
基本上,這個定義涵蓋前述幾個實用主義的定義,既強調人工智慧可以根據環境感知做出主動反應,又強調人工智慧所做出的反應必須達成目標,同時不再強調人工智慧對人類思維方式,或人類總結的思維法則(邏輯學規律)的模仿。
前述總共列舉了五種常見的「人工智慧」的定義,其中第二種「與人類思考方式相似」特別不可取。人們對大腦工作機理的認識尚淺,而電腦走的是幾乎完全不同的技術道路。正如深度學習「三巨頭」之一的揚•勒丘恩(Yann LeCun)所說的,對於深度神經網路:「我最不喜歡的描述是,『它像大腦一樣工作。』我不喜歡人們這樣說,原因是雖然深度學習從生命的生物機理中獲得靈感,但它與大腦的實際工作原理,差別非常、非常巨大。將它與大腦進行類比,賦予它一些神奇光環,而這種描述是危險的。這將會導致天花亂墜的宣傳,大家會要求一些不切實際的事情。人工智慧之前經歷過幾次寒冬,就是因為人們要求一些人工智慧無法給予的東西。」27
中國著名的機器學習專家,南京大學計算機系教授周志華則說:「現在有很多媒體,常說深度學習是『模擬人腦』,其實這個說法不大對。我們可以說最早的神經網路受到一點點啟發,但完全不能說是『模擬人腦』之類的。」28
至於第一種定義「令人覺得不可思議的電腦程式」,則顯示出大眾看待人工智慧的視角,直觀、易懂,但是主觀性太強,不利於科學討論。第三種定義「與人類行為相似的電腦程式」,是電腦科學界的主流觀點,也是一種從實用主義出發,簡潔、明瞭的定義,但缺乏周密的邏輯。第四種定義「會學習的電腦程式」,反映的是機器學習,特別是從深度學習流行之後,人工智慧世界的技術趨勢,雖然有失狹隘,但最具有時代精神。第五種定義,也是維基百科使用的綜合定義,是學術界的教科書式定義,全面均衡,偏重實證。
基本上,偏重實證是近年來人工智慧研究者的主流傾向。在今天這個結果至上的時代裡,沒有多少人願意花心思去推敲人工智慧到底該如何定義。如果有那個時間,倒不如去跑幾個深度學習的新模型,或是發表幾篇深度學習新演算法的論文要來得合算。
*1光學字元識別(Optical Character Recognition, OCR),對文字資料的圖像檔案掃描後,進行分析、識別。