
想讓孩子認識「貓」這個字的話,你每次看到貓時就說貓。教機器學習也一樣。
文/阿杰・艾格拉瓦、約書亞‧格恩斯、阿維・高德法布;譯/林奕伶
更多數據、更好的模型,以及性能更強的電腦,使得近年來機器學習的進展得以改善預測能力。蒐集和儲存大數據的進步也提供新的機器學習演算法原料。
在更適合的處理器發明下,新的機器學習模式明顯比以往的統計方法更有彈性,也產生更好的預測結果,好到有些人又重新稱資訊工程這個分支為「人工智慧」。
迴歸分析
在機器學習之前,資訊處理的核心方法是一種統計技術,稱為「迴歸分析」。
迴歸分析是做什麼用的?它是根據過去情況的平均值找出預測值。舉例來說,如果你只看上一週每天的天氣情況來判斷明天是否會下雨,最理想的推測大概是平均值。如果前7 天有2 天下雨,你大概會預測明天下雨的機率是七分之二左右,或是說29%。我們對預測的認識,大多就是藉著建立可納入更多背景數據的模型,讓我們計算出的平均值更好。
我們的作法是利用所謂的「條件平均」。舉例來說,如果你住在北加州,對過去的認識大概就是下雨的機率視季節而定:夏天低,而且冬天高。如果你觀察冬天在任何一天下雨的機率是25%,夏天則是5%,大概不會評估明天下雨的機率是平均值15%。為什麼?因為你知道明天不是冬天,就是夏天,所以你會根據條件來調整自己的評估。
後來,多變數迴歸分析(multivariate regression)提供一種有效率的方法,在不需要計算數十、數百或數千個條件平均的情況下考量多種條件。迴歸分析是取得數據,並努力找出能將預測錯誤降到最低的結果,使所謂的「適合度」(goodness of fit)達到最大。
機器學習
機器學習和迴歸分析的一個重要差異,就是開發新技巧的方法。
機器學習將重心放在實務運作,讓創新者有更多的空間去實驗,即使它們使用的方法所產生的估計值平均下來會不正確,或有偏差。在利用豐富的數據與過去十年出現快速電腦的情況下,這種實驗的自由空間使進展突飛猛進。
所以什麼原因讓機器學習成為革命性的運算科技,甚至能貼上「人工智慧」的標籤?有些情況下,預測好到可以直接取代以規則為主的邏輯。
有效的預測會改變電腦程式設定的方式。無論是傳統的統計方法還是「若則」的演算法,在複雜的環境下都無法良好運作。
深度學習
想要從一堆照片中找出一隻貓?先要具體說明貓有很多的顏色和特徵。牠們可能站著、坐著、躺著、跳躍,或一臉暴躁;可能在室內,或是在室外。情況很快就會變得很複雜。因此,即使有辦法預測,也需要小心謹慎。而這還只是辨識貓而已。如果想要描述一張照片裡的所有物體呢?我們就需要個別具體說明每個物體。
支援最新進展的關鍵科技稱為「深度學習」,這是仰賴一種名為「反向傳播」(back propagation)的方法。這是以類似自然人腦的運作方式,藉由透過實例學習,避開上面提到的作法。
如果想讓一個孩子認識「貓」這個字,你會在每次看到貓時就說這個字。機器學習基本上也一樣。你輸入一些有「貓」標籤的貓照片,以及一些沒有「貓」標籤、也沒有貓的照片。機器就可以學會辨別與「貓」標籤有關的像素模式。
如果你有一系列貓與狗的照片,貓與四隻腳的物體連結性就會強化,但是同樣也會強化與狗的連結性。如果沒有更具體指明,一旦你給機器幾百萬張各式各樣的照片與標籤(其中一些沒有狗),機器就會發展出更多關聯性,並學會區分貓與狗。
許多問題是從演算法問題(「貓的特徵是什麼?」)轉換成預測問題(「這個缺少標籤的圖像,跟以前看過的貓有相同的特徵嗎?」)。機器學習是利用機率模型來解決問題。
那麼為何許多科技專家稱機器學習為「人工智慧」?因為機器學習的輸出,也就是預測,是智慧的關鍵成分,預測的準確度會藉由學習改善,而高預測準確度通常可以讓機器執行一些直到現在都與人類智慧相關的任務,例如物體辨識。
傑夫.霍金斯(Jeff Hawkins)在《創智慧》(On Intelligence)中首先主張預測是人類智慧的基礎。他的理論基本要點是,人類智慧是創意與生產力增進的核心,這是因為大腦會利用記憶來做出預測:「我們的各種感官持續在同個時間做低層次的預測。但不只如此,我提出更強烈的主張。預測並非只是大腦做的其中一件事。這是新皮質的主要功能,也是智慧的基礎。皮質是預測的器官。」
霍金斯認為,大腦不斷在針對我們即將體驗到的事情做出預測,包括我們即將看到、感覺到與聽到的事。隨著我們發育成熟,大腦的預測日益準確,而那些預測通常會實現。不過,當預測未能準確預言未來時,我們會注意到有異常,而這個資訊又會回饋到大腦,讓大腦更新演算法,藉此學習,並進一步使模型加強。
先不管基礎模型是否適當,他強調預測是智慧的基礎這一點,卻有助於理解AI 最新變化的影響。我們在這裡要強調預測科技大幅進步的重要性。1956 年達特茅斯會議上眾多學者的願望現在已經近在咫尺。從許多方面來說,預測機器可以「使用語言,形成抽象的概念與思想,解決各種現在留給人類的問題,並自行改進。」
我們不去推測這樣的進步是否預告會出現通用人工智慧、「奇點」(the Singularity)或天網。不過,就像你會看到的情況,這樣狹隘地集中在預測上,依然暗示未來幾年會有驚人改變。就像電腦造就便宜的運算,已經證實會強力引發商業與個人生活的急劇變化,類似的轉變也會因為便宜的預測而出現。
本文介紹:
《AI經濟的策略思維:善用人工智慧的預測威力,做出最佳商業決策》。本書作者/阿杰・艾格拉瓦、約書亞‧格恩斯、阿維・高德法布;譯者/林奕伶;出版社/天下雜誌