【
中國智能制造網(wǎng) 學(xué)術(shù)論文】現(xiàn)在“機(jī)器問題”又卷土重來,雖然它偽裝成了另外一副樣子——人工智能(AI)技術(shù)正突飛猛進(jìn),機(jī)器得以執(zhí)行曾經(jīng)只有人才能勝任的各種任務(wù)??茖W(xué)家,經(jīng)濟(jì)學(xué)家和哲學(xué)家正在熱議人工智能技術(shù)的潛在影響。
AI或?qū)⒃庥?ldquo;艱難轉(zhuǎn)型” 解決“機(jī)器問題”是關(guān)鍵
很多人表達(dá)過這類擔(dān)憂,比如物理學(xué)家史蒂芬·霍金。更讓人驚訝的是,伊隆·馬斯克,火箭公司SpaceX和 電動汽車制造商Tesla的創(chuàng)始人,也有同樣的想法。與Carlyle相似,馬斯克警告人類:“我們正在用人工智能召喚惡魔。”他的特斯拉汽車可以利用新的人工智能技術(shù)實現(xiàn)自動行駛,但馬斯克卻擔(dān)心未來的人工智能霸主可能會太過強(qiáng)大,失去人類的控制。
1.機(jī)器問題重現(xiàn)
從初的屢屢失敗,到現(xiàn)在的朝氣蓬勃,人工智能會導(dǎo)致大面積失業(yè)甚至讓人類滅絕嗎?或許歷史會給我們一些有用的線索。
有些人害怕機(jī)器會搶走所有人的工作,而只是有選擇地讓少數(shù)人受益,并終徹底顛覆社會。然而在歷史上,類似的一幕曾出現(xiàn)過。兩個世紀(jì)前,工業(yè)化的浪潮席卷英國,與今天同樣的擔(dān)憂曾引發(fā)了激烈的爭論。那個時候,人們不說“工業(yè)革命”而大談“機(jī)器問題(machinery question)”。1821年,經(jīng)濟(jì)學(xué)家David Ricardo個表達(dá)了這種看法,他重點關(guān)注“機(jī)器對于不同社會階層的利益的影響”,特別是“勞動階級懷有的意見,他們認(rèn)為使用機(jī)器通常會不利于他們的利益”。1839年,Thomas Carlyle (蘇格蘭哲學(xué)家,被看作是那個時代重要的社會評論員)對所謂“機(jī)械惡魔(demon of mechanism)”予以了抨擊 ,他寫道,“機(jī)械惡魔”破壞性的能力將會擾亂整個工人團(tuán)體。
現(xiàn)在,這個“機(jī)器問題”卷土重來,雖然它偽裝成了另外一副樣子——人工智能(AI)技術(shù)正突飛猛進(jìn),機(jī)器得以執(zhí)行曾經(jīng)只有人才能勝任的各種任務(wù)??茖W(xué)家,經(jīng)濟(jì)學(xué)家和哲學(xué)家正在熱議人工智能技術(shù)的潛在影響。這種影響可能是非常深刻的。因為人工智能技術(shù),之前看起來不可能自動化的工作——從放射科到法律工作——現(xiàn)在也同樣面臨著危機(jī)。
2013年, 牛津大學(xué)的Carl Benedikt Frey和Michael Osborne進(jìn)行了一次調(diào)查研究,其結(jié)果后來被人們廣泛引用,該研究發(fā)現(xiàn)美國有47% 的工作有很高的可能性會在不久后被“計算機(jī)資本取代”。更近的一個報告是:美國美林銀行預(yù)測,2025年以前,人工智能的“每年產(chǎn)生的創(chuàng)造性破壞的影響”可能會達(dá)到14到33萬億美元,其中包括因人工智能實現(xiàn)了知識工作自動化,導(dǎo)致雇傭成本減少的9萬億美元,制造業(yè)和醫(yī)療護(hù)理開銷減少的8萬億美元,以及部署無人駕駛汽車和無人機(jī)后因效率提升增加的兩萬億美元。智囊機(jī)構(gòu)麥肯錫研究院(McKinsey Global Institute)說,人工智能正在促進(jìn)社會發(fā)生轉(zhuǎn)變,這種轉(zhuǎn)變比工業(yè)革命“發(fā)生的速度快10倍,規(guī)模大300倍,影響幾乎大3000倍”。
跟兩個世紀(jì)前的人們一樣,很多人擔(dān)心機(jī)器會讓幾百萬人下崗,引發(fā)不平等問題和社會動亂。Martin Ford曾寫過兩本關(guān)于自動化威脅的書,他擔(dān)心中產(chǎn)階級的工作將會消失,經(jīng)濟(jì)流動性將(即個人,家庭或團(tuán)體提高經(jīng)濟(jì)水平的難易程度)停止,財閥們會“將自己關(guān)在封閉式小區(qū)或精英城市里,還可能有自動化軍事機(jī)器人和無人機(jī)在旁保護(hù)。”還有人則擔(dān)心,人工智能會威脅人類的生存,因為超級智能計算機(jī)可能不會認(rèn)同人類的目標(biāo),轉(zhuǎn)而攻擊創(chuàng)造它們的人類。
很多人表達(dá)過這類擔(dān)憂,比如物理學(xué)家史蒂芬·霍金。更讓人驚訝的是,伊隆·馬斯克,火箭公司SpaceX和 電動汽車制造商Tesla的創(chuàng)始人,也有同樣的想法。與Carlyle相似,馬斯克警告人類:“我們正在用人工智能召喚惡魔。”他的特斯拉汽車可以利用新的人工智能技術(shù)實現(xiàn)自動行駛,但馬斯克卻擔(dān)心未來的人工智能霸主可能會太過強(qiáng)大,失去人類的控制。他說:“馬可·奧勒留(羅馬帝國賢君)當(dāng)國王挺好的,但如果國王是卡利古拉(羅馬帝國早期的典型暴君)情況就不太樂觀了。”
有人看到風(fēng)險,有人洞見機(jī)遇。投資者正在不斷涌入這個領(lǐng)域,科技巨頭們則在不斷收購人工智能創(chuàng)業(yè)公司,并爭先吸引學(xué)術(shù)界的研究人才。根據(jù)數(shù)據(jù)分析公司Quid的研究數(shù)據(jù),在2015年,人工智能企業(yè)的成本創(chuàng)下85億美元的記錄,幾乎為2010年的四倍。投資公司Playfair Capital的Nathan Benaich說,2015年人工智能企業(yè)的投資輪數(shù)比上一年多16%,而與此同時科技產(chǎn)業(yè)整體投資輪數(shù)減少了3%。Playfair Capital是一家基金管理機(jī)構(gòu),該公司在人工智能的投資組合達(dá)到25%。“XX+人工智能”取代了“XX行業(yè)的Uber ”,成為創(chuàng)業(yè)公司默認(rèn)的商業(yè)模式。
谷歌,F(xiàn)acebook,IBM,亞馬遜和微軟都想方設(shè)法在云端建立人工智能服務(wù)的生態(tài)系統(tǒng)。“這項技術(shù)將會用在各行各業(yè)中,只要這個行業(yè)有任意種類的數(shù)據(jù),圖像,語言等數(shù)據(jù)類型都可以。”MetaMind的創(chuàng)始人Richard Socher說,“人工智能將遍地開花。”MetaMind是一家人工智能創(chuàng)業(yè)公司,近被云計算巨頭Salesforce收購。
這意味什么?本篇特別報道將會審視這項新科技的崛起,探索它對工作,教育,政策的潛在影響,思考它在道德和監(jiān)管方面的作用。同時,本文還思考了能從機(jī)器問題初的答案中學(xué)到的東西。AI引發(fā)的擔(dān)憂和熱情不相上下,同時帶來了很多問題,然而值得記住的是,其中的很多問題我們在以前都曾問過,并已經(jīng)有了答案。
2.技術(shù):從無法工作到神經(jīng)網(wǎng)絡(luò)
人工智能的繁榮基于傳統(tǒng)與現(xiàn)代想法的結(jié)合。
人工智能如何從剛開始的傲慢與失望,突然成為科技界熱門的領(lǐng)域呢?人工智能(artificial intelligence)這個術(shù)語早被寫在1956年的一份研究計劃中,該計劃聲稱“如果一個精心挑選的科學(xué)家小組花一個夏天一起研究,就能使機(jī)器解決各種人類無法解決的問題……”,從而實現(xiàn)重大的進(jìn)步。那被證明只是過度地樂觀,人工智能雖然偶有突破,但其承諾的遠(yuǎn)比其所能提供的多得多。終,大多研究者都避免使用這個術(shù)語,而更喜歡用“專家系統(tǒng)”或“神經(jīng)網(wǎng)絡(luò)”?,F(xiàn)在“人工智能”的名譽(yù)恢復(fù)和重新興起要追溯到2012年被稱為ImageNet挑戰(zhàn)賽的在線競賽。
ImageNet是一個擁有數(shù)百萬張圖片的在線數(shù)據(jù)庫,所有圖片都有人工做的標(biāo)簽。對于任何給定詞,例如“氣球”或“草莓”,ImageNet里都能找到上百張對應(yīng)的圖片。每年的ImageNet競賽鼓勵該領(lǐng)域的人在計算機(jī)識別和自動標(biāo)記圖片上進(jìn)行比賽,并衡量他們的進(jìn)展。這些系統(tǒng)首先使用被正確標(biāo)記的圖片集進(jìn)行訓(xùn)練,然后挑戰(zhàn)標(biāo)記之前沒見過的測試圖片。在后續(xù)的研討會上,優(yōu)勝者會分享并討論他們的技術(shù)。2010年獲勝的系統(tǒng)可以正確標(biāo)記72% 的圖片(人類平均有95% 的準(zhǔn)確率)。2012年,多倫多大學(xué)的Geoff Hinton帶領(lǐng)的團(tuán)隊實現(xiàn)了85% 的準(zhǔn)確率,這要歸功于一項叫“深度學(xué)習(xí)”的新技術(shù)。這帶來了一種長遠(yuǎn)快速的改進(jìn),在2015年的ImageNet競賽上,一個深度學(xué)習(xí)系統(tǒng)以96% 的準(zhǔn)確率次超過了人類。
2012年的成果被認(rèn)為是一項突破,但Yoshua Bengio說,他們依靠的是“結(jié)合以前已經(jīng)有了的東西。”Yoshua Bengio是蒙特利爾大學(xué)的計算機(jī)科學(xué)家,他與Hinto 以及另外幾個人被稱為深度學(xué)習(xí)的。大體上,這項技術(shù)使用了大量的計算和訓(xùn)練數(shù)據(jù),對來自人工智能發(fā)展初期的一個舊思路進(jìn)行改進(jìn),這個舊思路也就是人工神經(jīng)網(wǎng)絡(luò)(ANN)——這是生物學(xué)啟發(fā)的人工神經(jīng)元(腦細(xì)胞)網(wǎng)絡(luò)。
在生物大腦中,每個神經(jīng)元都能被其它神經(jīng)元觸發(fā),將輸出的信號饋送給另一個神經(jīng)元,而且此神經(jīng)元的輸出也能繼續(xù)觸發(fā)其它神經(jīng)元。一個簡單的ANN 網(wǎng)絡(luò)有一個輸入神經(jīng)元層,在這里數(shù)據(jù)被饋送進(jìn)網(wǎng)絡(luò)中;還有一個輸出層輸出結(jié)果,中間可能還會有三兩個隱藏層對信息進(jìn)行處理。(實際中,ANN 網(wǎng)絡(luò)全部在軟件中模擬。)網(wǎng)絡(luò)中的每一個神經(jīng)元都有一系列的“權(quán)重”和一個“激活函數(shù)”控制著輸出的信號發(fā)射。訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)涉及到對神經(jīng)元權(quán)重的調(diào)整,以便一個給定的輸入產(chǎn)生期望的輸出。ANN 在20世紀(jì)90年代早些時候就已經(jīng)實現(xiàn)了一些有用的結(jié)果,例如識別手寫數(shù)字。但在完成更為復(fù)雜的任務(wù)上,ANN 陷入了困境。
在過去的十幾年中,新技術(shù)的出現(xiàn)和對激活函數(shù)的一種簡單調(diào)整使得訓(xùn)練深度網(wǎng)絡(luò)變得可行。同時,互聯(lián)網(wǎng)的興起產(chǎn)生了數(shù)十億可用于目標(biāo)訓(xùn)練的文檔、圖片、視頻數(shù)據(jù)。這所有的一切都需要大量的數(shù)字操作能力,而2009年左右當(dāng)幾個人工智能研究團(tuán)體意識到個人計算機(jī)和視頻游戲機(jī)上用于生成精致畫面的GPU 也同樣適用于運行深度學(xué)習(xí)算法之后,計算能力也不再是個問題了。斯坦福大學(xué)由吳恩達(dá)帶領(lǐng)的一個人工智能團(tuán)隊發(fā)現(xiàn)GPU 能夠幾百倍地加速深度學(xué)習(xí)系統(tǒng)。然后,訓(xùn)練一個四層的神經(jīng)網(wǎng)絡(luò)突然就變得很快了,由之前需要花費幾周的時間變成了不到一天時間。GPU 生產(chǎn)商N(yùn)VIDIA 的老總黃仁勛說這是一個令人高興的對稱:GPU 這一游戲工作者用于為游戲玩家構(gòu)建幻想世界的芯片也能用于幫助計算機(jī)通過深度學(xué)習(xí)理解真實世界。
ImageNet 的結(jié)果顯示了深度學(xué)習(xí)的能力。突然間,深度學(xué)習(xí)就獲得了關(guān)注——不只是在人工智能界,而是在整個科技產(chǎn)業(yè)界內(nèi)!深度學(xué)習(xí)系統(tǒng)因此變得更加的強(qiáng)大:20或30層的網(wǎng)絡(luò)變得很常見,微軟的研究人員曾建立過152層的網(wǎng)絡(luò)。更深層的網(wǎng)絡(luò)能進(jìn)行更高水平的抽象并產(chǎn)生更好的結(jié)果,事實證明這些網(wǎng)絡(luò)擅長解決眾多領(lǐng)域的難題。
“讓人們激動的是這一領(lǐng)域的一種學(xué)習(xí)方法:深度學(xué)習(xí),能夠應(yīng)用于眾多不同的領(lǐng)域,”谷歌機(jī)器智能研究部門負(fù)責(zé)人、如今負(fù)責(zé)搜索引擎的John Giannandrea 表示,谷歌正在使用深度學(xué)習(xí)提升其網(wǎng)頁搜索結(jié)果的質(zhì)量、理解智能手機(jī)端的口語指令、幫助人們在他們的照片中搜索特定的圖片、推薦電子郵件的自動回復(fù)、改善網(wǎng)頁的翻譯服務(wù),并且?guī)椭鼈兊淖詣玉{駛汽車?yán)斫庵車h(huán)境。
學(xué)習(xí)如何學(xué)習(xí)
深度學(xué)習(xí)有很多不同的方式。普遍使用的是“監(jiān)督學(xué)習(xí)(supervised learning)”,這項技術(shù)能使用標(biāo)記樣本集訓(xùn)練系統(tǒng)。例如,過濾垃圾郵件:收集出郵件信息樣本的大數(shù)據(jù)集,每一個都標(biāo)上“垃圾郵件”或者“非垃圾郵件”。一個深度學(xué)習(xí)系統(tǒng)能夠使用這些數(shù)據(jù)集進(jìn)行訓(xùn)練,重復(fù)的進(jìn)行樣本訓(xùn)練進(jìn)而調(diào)整神經(jīng)網(wǎng)絡(luò)內(nèi)的權(quán)重,提高評定垃圾郵件的準(zhǔn)確率。這一方法的巨大優(yōu)點是不需要人類專家寫出規(guī)則列表,也不需要程序員用代碼編寫這些規(guī)則,系統(tǒng)能直接從有標(biāo)簽的數(shù)據(jù)中進(jìn)行學(xué)習(xí)。
使用有標(biāo)簽數(shù)據(jù)訓(xùn)練系統(tǒng)也被用于圖片分類、語音識別、信用卡交易欺詐偵測、垃圾和惡意軟件識別以及廣告定位,所有這些應(yīng)用領(lǐng)域中的正確答案都可通過之前的大量案例獲得。Facebook 能在你上傳一張照片后識別、標(biāo)記照片里你的朋友和家人,它們近期還發(fā)布了一個能夠為盲人描述照片中的內(nèi)容(比如兩個人、微笑、太陽眼鏡、戶外、水等)的系統(tǒng)。有大量的數(shù)據(jù)可用于監(jiān)督學(xué)習(xí),吳恩達(dá)先生說,這一科技的應(yīng)用已經(jīng)使現(xiàn)在的金融服務(wù)領(lǐng)域、計算安全領(lǐng)域和銷售領(lǐng)域的公司將自己重新標(biāo)記為了人工智能公司。
另一項技術(shù)是無監(jiān)督學(xué)習(xí)(unsupervised learning),其通過將網(wǎng)絡(luò)暴露在大量樣本中來對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,但不會告訴它要尋求什么模式。相反,該網(wǎng)絡(luò)學(xué)習(xí)識別相似樣本的特征和聚類,從而揭示數(shù)據(jù)中的隱藏分組、連接和模式。
無監(jiān)督學(xué)習(xí)能在你不知道會是什么樣的情況下被用于事物搜索:例如,監(jiān)控網(wǎng)絡(luò)中反常的通信模式,那可能代表著網(wǎng)絡(luò)攻擊;或檢查大量的保險聲明以檢測新類型的詐騙方式。一個經(jīng)典的案例:2011年當(dāng)吳恩達(dá)在谷歌工作時,他領(lǐng)導(dǎo)的一個名為谷歌大腦(Google Brain)項目中的一個大型的無監(jiān)督學(xué)習(xí)系統(tǒng)本是用于在千部無標(biāo)記YouTube 視頻中發(fā)現(xiàn)共同模式。一天,吳恩達(dá)的一個博士生給了他一個驚喜。吳恩達(dá)回憶說“我記得他把我叫道他的電腦前說,‘看這個’”,電腦屏幕上是一個毛茸茸的面孔,從數(shù)千的樣本中發(fā)現(xiàn)的模式。系統(tǒng)發(fā)現(xiàn)了貓。
強(qiáng)化學(xué)習(xí)位于監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)之間,它涉及到訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)與只以獎勵作為偶然的反饋的環(huán)境進(jìn)行交互。本質(zhì)上,訓(xùn)練涉及到調(diào)整網(wǎng)絡(luò)的權(quán)重,從而獲得能帶來更高獎勵的搜索策略。DeepMind 是這個領(lǐng)域的專家。2015年2月,它們在Nature 上發(fā)表的一篇論文描述了一個能夠?qū)W習(xí)玩49種經(jīng)典的 Atari 視頻游戲的強(qiáng)化學(xué)習(xí)系統(tǒng),它只使用屏幕上的像素和游戲分?jǐn)?shù)作為輸入,輸出則連接到一個虛擬的控制器上。這個系統(tǒng)從頭學(xué)起玩游戲,終在其中29種游戲中達(dá)到或超過了人類水平。
把系統(tǒng)游戲化
電子游戲是人工智能研究的理想訓(xùn)練場,DeepMind 的 Demis Hassabis 說,因為“它們是真實世界的縮影,但更純凈和約束化。”
游戲引擎也可以輕松生成大量訓(xùn)練數(shù)據(jù)。Hassabis 先生以前從事過電子游戲行業(yè)的工作,后來取得了認(rèn)知神經(jīng)學(xué)的博士學(xué)位并創(chuàng)立了 DeepMind。這家公司現(xiàn)位于倫敦國王十字車站附近,相當(dāng)于谷歌的人工智能研究分部。
今年三月,AlphaGo 于首爾的五輪比賽中打敗了世界圍棋選手李世石,作為開發(fā)公司的 DeepMind 因此登上頭條。AlphaGo 是一個有著獨特特性的強(qiáng)化學(xué)習(xí)系統(tǒng)。它由幾個相互連通的模塊組成,包括兩個深度神經(jīng)網(wǎng)絡(luò),它們各有所長——像人腦中模塊一樣。其中一個通過大量的棋局分析訓(xùn)練提出一些可能的走法,另一個網(wǎng)絡(luò)則負(fù)責(zé)根據(jù)隨機(jī)采樣技術(shù)來評估這些走法。這個系統(tǒng)把生物啟發(fā)的技術(shù)與純機(jī)器化的技術(shù)結(jié)合了起來。人工智能研究者們就哪種技術(shù)更優(yōu)越這個問題已經(jīng)爭論了幾十年,而 AlphaGo 卻另辟蹊徑兩者都用。“這是一個復(fù)合型系統(tǒng),因為我們認(rèn)為解決智能問題只有深度學(xué)習(xí)是不夠的”,Hassabis說。
他和其他研究者們已經(jīng)開始探尋一種叫做遷移學(xué)習(xí)(transfer learning)的新技術(shù)了。這種技術(shù)能讓強(qiáng)化學(xué)習(xí)系統(tǒng)把基礎(chǔ)建立在已習(xí)得的知識上,而不用每一次都從頭開始訓(xùn)練。Hassabis 先生解釋道,人類可以毫不費力地做到這一點。Giannandrea 先生回憶起他四歲的女兒已經(jīng)能辨別出 penny-farthing(一種前輪大后輪小的腳踏車)就是一種自行車,即使她之前從沒見過這樣的東西。“但計算機(jī)無法做到,”他說。
一家近被 Salesforce 收購的初創(chuàng)公司 MetaMind 也在研發(fā)一種相關(guān)的技術(shù)——多任務(wù)學(xué)習(xí)(multitask learning),這種系統(tǒng)用同樣的神經(jīng)網(wǎng)絡(luò)架構(gòu)解決多種不同的問題,在一件事情上獲得的經(jīng)驗?zāi)苡脕砀玫亟鉀Q其它事情。跟 DeepMind 類似,它也在探尋模塊化的架構(gòu);其中一個被稱為“動態(tài)記憶網(wǎng)絡(luò)(dynamic memory network)”的系統(tǒng)能消化一系列述,然后回答相關(guān)問題,并且推斷出其中的邏輯聯(lián)系(Kermit 是一只青蛙;青蛙是綠色的;所以 Kermit 是綠色的)。MetaMind 還把自然語言網(wǎng)絡(luò)和圖像識別網(wǎng)絡(luò)融合到一個系統(tǒng)中,它可以回答有關(guān)圖像的問題(“這里面的汽車是什么顏色的?”)。這種技術(shù)可以用到智能客服聊天機(jī)器人中,或者用于 Salesforce 的客戶呼叫中心。
過去,很多有前景的人工智能技術(shù)發(fā)展都會逐漸疲軟。但深度學(xué)習(xí)卻不同。“這東西真的能起作用,” MetaMind 的 Richard Socher 說。人們每天都會用到它,雖然他們并未意識到。Hassabis、Socher和其他人的長遠(yuǎn)目標(biāo)是開發(fā)出“通用人工智能(AGI )”—一種能完成各種各樣任務(wù)的系統(tǒng),有了它就不必再為每個特定問題都專門開發(fā)出一個系統(tǒng)了。人工智能多年來的研究方向都集中在解決專業(yè)化的特定問題上,Socher先生說,但現(xiàn)在研究人員們“正努力用更先進(jìn)的樂高積木塊拼出不一樣的東西”。即使他們中樂觀的人也認(rèn)為還需至少十年才能做出人類智力水平的 AGI 。但 Hassabis 說,“我們認(rèn)為我們已經(jīng)知道實現(xiàn)接近 AGI 的系統(tǒng)所需的幾十種關(guān)鍵元素了”。
同時人工智能已經(jīng)在發(fā)揮作用了,而且很快會更有用。例如谷歌的智能回復(fù)系統(tǒng),它通過兩個神經(jīng)網(wǎng)絡(luò)推薦郵件回復(fù),從研究項目到產(chǎn)品上線只用了四個月(雖然剛開始它因為對每條信息建議回復(fù)的“我愛你”而令人失望)。“在科研期刊上發(fā)表文章剛一個月,就有某個公司正確使用你的系統(tǒng)了,”Socher 說。人工智能公司,不論規(guī)模大小都能都能定期發(fā)表學(xué)術(shù)文章;人工智能研究者即使在轉(zhuǎn)行進(jìn)入公司后也能繼續(xù)在同行評議期刊上發(fā)表研究成果。很多人都是邊為公司工作邊發(fā)表科研文章。“如果你不允許他們發(fā)表,他們就不會為你工作了,”Andreessen Horowitz 的 Chris Dixon 解釋說。