政治立場不過是群體認同的延伸?《善惡》深度解析脆弱的意識型態如何被操控
你是否相信自己的政治立場是經過深思熟慮後的選擇?根據《善惡》所引用的心理實驗,事實可能恰好相反。研究顯示,我們的政治信念其實非常容易被操弄與扭曲,甚至能在不知情的情況下為完全相反的立場辯護...
第三波人工智慧熱潮源於深度學習的復興,那麼究竟什麼是深度學習?為什麼深度學習能讓電腦一下子變得聰明起來?為什麼深度學習比其他機器學習技術,能夠在機器視覺、語音辨識、自然語言處理、機器翻譯、資料探勘、自動駕駛等方面,獲得好得多的效果?
從根本上來說,深度學習和所有機器學習的方法一樣,是一種用數學模型對真實世界的特定問題進行建模,以解決該領域內相似問題的過程。好了,好了,我知道一提「數學」兩字,讀者就會跑掉一半,更別提讓非理工科專業的人完全摸不著頭緒的「建模」一詞了。有沒有可能用非理工科專業的人也聽得懂的術語,來解釋一下現今在人工智慧領域如日中天的深度學習演算法呢?
首先,深度學習是一種機器學習,既然名為「學習」,自然與我們人類的學習過程,有某種程度的相似。請各位回想一下,小朋友是如何學習的呢?
很多父母都會讓小朋友用識字卡來學習認字,從古時人們用的「上大人、孔乙己」之類的習字本,到今天在手機或平板電腦上教小朋友認字的識字卡APP,最基本的思路就是按照從簡單到複雜的順序,讓小朋友反覆觀看每個字的各種寫法(大一點的甚至要學著認識不同書法字體),看多了,自然就會記住了。等到下次再看到同一個字,很容易就能夠認出來。
這種有趣的識字過程看似簡單,實則奧妙無窮。認字時,小朋友的大腦一定是在接受過許多次相似圖像的刺激後,為每個字總結出某種規律,下次大腦再看到符合這種規律的圖案,就會知道是什麼字。其實,要教電腦認字,也差不多是這個道理。電腦也要先把每個字的圖案,反覆看過很多很多遍,然後在電腦的大腦(處理器+記憶體)裡,總結出一個規律,這樣往後再看到類似圖案,只要符合先前總結的規律,電腦就能知道這個圖案到底是什麼字了。
用專業術語來說,電腦用來學習、反覆觀看的圖片叫做「訓練數據集」。在「訓練數據集」中,一類數據與另一類數據不同的屬性或特質,稱為「特徵」;電腦運用「大腦」總結規律的過程,叫做「建模」;電腦運用「大腦」總結出來的規律,就是我們常說的「模型」;而電腦透過反覆看圖,總結出規律、學會認字的過程,就是「機器學習」(Machine Learning)。
到底電腦是如何學習的?總結出的規律,又是什麼樣的呢?這取決於我們使用什麼樣的機器學習演算法。
有一種演算法非常簡單,模仿的是小朋友學識字的思路。家長和老師可能都有過這樣的經驗:小朋友開始學識字,比方說,在教小朋友分辨「一」、「二」、「三」時,我們會告訴小朋友,一筆寫成的字是「一」,兩筆寫成的字是「二」,三筆寫成的字是「三」。這個規律好記又好用,但在開始學寫新字時,就未必奏效了。例如,「口」也是三畫,卻不是「三」。此時,我們通常會告訴小朋友,圍成方框的是「口」,寫成橫排的是「三」。所以,這個識字規律又豐富了一層,但仍舊比不上識字數量的增長。
小朋友可能也很快就會發現,「田」也是方框,卻不是「口」。此時,我們會告訴小朋友,方框裡有個「十」字的是「田」。再往後,我們多半就要告訴小朋友,「田」上面出頭的是「由」字,下面出頭的是「甲」字,上下都出頭的是「申」字。很多小朋友就是這樣,一步步豐富了特徵規律,慢慢自己學會總結規律,記住新的漢字,進而學會幾千個漢字的。
有一種名為「決策樹」(decision tree)的機器學習方法(參見圖24),就和前述根據特徵規律來識字的過程非常相似。當電腦只需要認識「一」、「二」、「三」這三個字時,電腦只要數一下要識別的漢字筆畫數量,就可以分辨出來了。當我們為待識別漢字集(訓練數據集)增加「口」和「田」時,電腦之前的判定方法失敗,就必須引入其他的判定條件。由此,一步步推進,電腦就能夠認識愈來愈多的字。