撰文 佩德羅·多明戈斯(Pedro Domingos) 翻譯 崔迪瀟
我們對于未來化場景的大多想象都是基于高度的自動化,但是每個人的生活習慣不同,所以每個人需要的自動化程序都不一樣。那么,美好的未來生活怎么才能讓每個人的自動化程序都合你的心意呢?
也許,你需要的僅僅是一個數字替身,它是“電子化”的你,了解你的一切生活習慣。這個替身會成為你的助手和管家,把你的工作和生活中按部就班的部分安排得井井有條。
事實上,人工智能最可能導致的情景就是“數字替身”的大量出現!皵底痔嫔怼笔俏覀冏陨淼奶摂M模型,這些模型可以在各種各樣的模擬中互動,幫助我們在日常生活中做出更快速、更全面的決策。如今的各種語音助手音箱已經是這個替身的雛形。人工智能將服務于人類,而不是控制人類。
光明圖片/視覺中國
1.從制造機器到機器學習
人類是唯一可以制造機器的動物。通過這種方法,我們擴展了自身的能力,超越了我們的生物極限。工具使我們的雙手變得萬能。汽車讓我們行進得更快,飛機給了我們翱翔的翅膀。計算機賦予我們更強大的智力和記憶力,智能手機為我們安排日常生活。而現在,我們正在創造一項全新的技術,用代碼賦予它通過數據和練習進行學習的能力,使其可以實現自我進化。它會最終取代我們嗎?還是將以史無前例的方式提升我們的能力,增強我們的人性?
機器學習源于20世紀50年代部分科學家的開創性工作,如弗蘭克·羅森布拉特(Frank Rosenblatt)設計了一種能夠識別數字的電子神經元,阿瑟·塞繆爾(Arthur Samuel)開發了一種跳棋程序,可以通過和自己對弈來學習,并最終擊敗人類選手。但也僅僅是在過去十年,機器學習領域才開始真正騰飛,為我們帶來了自動駕駛汽車、能(在一定程度上)理解我們指令的虛擬助手等各式各樣的應用。
每年,我們都會開發數以千計的新算法。所謂的算法,就是用來指導計算機完成某些操作的指令序列。而自我學習機器的核心特點是,我們不需要為它們編寫具體的程序,只需要給它們一個諸如“學習如何玩跳棋”的寬泛目標,接下來,機器就可以像人類一樣,通過積累經驗而不斷優化。
對人工智能的追求可以看作是人類自我進化的一部分。自動化技術發展的下一階段是發明出所謂的主算法,將把當前的5種機器學習方法整合為統一的框架。技術只是人類能力的拓展。除了達成我們給予的任務目標,機器并沒有自由意志。我們應該擔心的是人類對技術的濫用,而非被機器奪走了控制權。
現在機器學習算法大致可以分為5個大類,每一類都是從不同的學科領域獲得了靈感。并不讓人意外的是,有一種機器學習方法就是在模擬自然選擇,我們稱這樣的算法為進化算法。例如,在哥倫比亞大學的創新機器實驗室(Creative Machines Lab)中,有許多雛形機器人在嘗試爬行或飛行,其中表現最優異的結構將定期融合和變異,產生新一代的3D打印樣機。一開始這種隨機組裝的機器人幾乎無法運動,但經歷了數千次的迭代后,這種方法已經產生了類似蜘蛛或蜻蜓的機器人。
但這種進化是低效的。當前應用最廣泛的機器學習方法是深度學習,它的靈感來自大腦。這種方法從模擬單個神經元功能的高度簡化的數學模型出發,構建出包含數千個神經元的網絡,并通過學習不斷調整不同神經元之間的連接。如果兩個神經元在處理數據時同時放電,它們之間的連接就會加強。這樣的神經網絡能以極高的準確度識別人臉、理解語音和翻譯語言。機器學習也會借鑒心理學。與人類相似,這種以類比為基礎的算法通過在已有的數據中尋找近似的問題來解決新的問題。這種特性可以實現自動化的客戶服務,也可以讓電商網站基于用戶個人習慣推薦商品。
光明圖片/視覺中國
2.努力創造一個主算法
通過自動執行科學方法,機器也可以實現學習。為了引入新的假設,所謂的符號學習會進行逆向推理演繹:如果我知道蘇格拉底是人類,要推斷出他會死,我還需要知道什么信息?知道人會死或許就足夠了,而且這個假設可以通過檢查樣本中其他人類是否會死來進行確認。英國曼切斯特大學的生物機器人Eve便是通過這種方法發現了一種有可能治療瘧疾的新藥物。根據瘧疾的相關數據和基本的分子生物學知識,Eve提出了什么樣的藥物可能具有療效的假設,還設計了實驗并在機器人實驗室進行測試,然后修改或放棄一些假設,不斷重復上述過程直到取得滿意的效果。
最終,機器學習可以完全構建于數學原理之上,其中最重要的是貝葉斯定理。按照這個定理,我們可以基于現有知識,先給不同假設指定初始概率,然后提升與數據相符的假設的概率,并降低與數據不符的假設的概率,最后計算所有假設的加權平均值,就可以作出預測:概率越高的假設,權重也越高;谪惾~斯定理的機器在某些醫療診斷中的準確率要高于人類醫生,也是很多垃圾郵件過濾系和谷歌個性化廣告推薦系統的核心技術。
這5類機器學習算法,每一種都既有優勢,也有不足。例如,深度學習在解決視覺或語音識別等感知任務上性能卓越,但無法處理常識的獲取和推理等認知任務。而符號學習則與之相反。盡管相比于神經網絡,進化算法可以解決更為困難的問題,但解決這些問題要耗費大量的時間。類比方法可以從少量的數據實例中學習,但面對過多信息時卻容易陷入混亂。貝葉斯學習是處理少量數據的最有效方法,但處理海量數據時卻代價高昂。
因為不同的方法各有利弊,所以機器學習研究者一直致力于把各種方法的優勢結合起來。就如同一把能打開所有鎖的萬能鑰匙,我們也在努力創造一個所謂的主算法(master algorithm)——這個算法可以從數據中學習到一切特征,提取出所有可能得到的知識。
當前,機器學習領域面臨的挑戰和物理學家面臨的挑戰類似:量子力學可以在微觀尺度上很好地描述宇宙,廣義相對論則適用于宏觀尺度,但這兩個理論卻是不相容的,有待調和。在粒子物理學的標準模型建立起來之前,詹姆斯·克拉克·麥克斯韋(James Clerk Maxwell)首先統一了光、電和磁;與此類似,包括我和華盛頓大學的同事在內,很多研究團隊都提出了將兩種或多種機器學習方法統一到一起的思路。但科學進步是斷斷續續、非線性發展的,因此很難預測這個大一統的主算法什么時候才能實現。不管怎樣,這一目標的實現并不會導致一個全新的、強大的機器種族出現,相反,它會促進人類的進步。
光明圖片/視覺中國
3.人工智能與自由意志
一旦我們獲得主算法,并輸入由每個人產生的大量數據,人工智能系統就可能通過學習得出每個個體的非常準確和詳細的模型:我們的口味和習慣、優點和缺點、記憶和愿望、信仰和個性、我們在乎的人和事,以及任何特定場景下我們會如何回應。我們的模型實質上能夠預測我們將做出的選擇,這既令人興奮又令人不安。
許多人擔心,擁有這些能力的機器會利用它們新獲得的知識來奪走我們所有的工作,奴役我們,甚至消滅我們。但這是不可能發生的,因為它們沒有自己的意志;旧,所有的人工智能算法都是由我們設計的目標驅動的,比如“找到從酒店到機場的最短路線”。這些算法與普通算法的區別在于,它們可以靈活地決定如何實現我們為它們設定的目標,而不是需要執行預先定義的一系列步驟。即使通過不斷執行任務而得到優化,它們的目標仍然沒有改變。不能更好地實現目標的方案會被自動放棄。此外,人類會核查機器的成果是否符合我們的目標。我們還可以驗證機器有沒有違反我們對它們施加的限制,比如“遵守交通規則”。
然而,當我們想象人工智能時,我們傾向于將人類的特質,如意志和意識投射其上。我們中的大多數人也更熟悉家用機器人這樣的類人人工智能,而不是無數工作在幕后的其他類型的人工智能。好萊塢將機器人和人工智能描繪成人類的形象,也促使我們產生了這種印象。當然,好萊塢采取這樣的策略可以理解,這能讓故事變得更有吸引力。人工智能只是一種解決難題的能力,而這一任務并不需要自由意志。它與人類作對的可能性,并不比你的手突然不聽使喚,扇自己耳光更大。和其他技術一樣,人工智能技術將永遠是我們自身的擴展。我們所設計的人工智能系統越強大,人類也就受益越多。
那么,人工智能會讓我們的未來變成什么樣子呢?智能機器確實會取代許多工作,但對社會的影響可能類似于以前的自動化機器。200年前大多數美國人都是農民,如今機器已經取代了幾乎所有的農民,卻沒有造成大規模的失業。末日論者認為,這一次是不同的,因為機器正在取代的不僅僅是我們的肌肉,更是我們的大腦,這將讓人類無事可做。但是,人工智能距離承擔我們的所有任務仍然非常遙遠。在可預見的未來,人工智能和人類將擅長不同的事情。機器學習的主要作用將是大大降低智力成本。這種普及進程將讓人工智能在更多的領域變得經濟可行,創造新的就業機會,并改造舊的工作,讓相同數量的人力能完成更多工作。
然后,還有未來學家雷·庫茲韋爾(Ray Kurzweil)宣揚的“奇點”。他設想,技術進步會永遠不斷加速:機器學會制造更好的機器,而新的機器又能制造出比它還要好的機器。但我們知道這是不可能的,即便是量子計算機——它的計算能力也受到物理定律的嚴格限制,而且在某些方面,我們距離這樣的極限已經不遠了。人工智能的進步,就像其他一切的進步一樣,最終會趨于平穩。
另一個在未來學家中流行的觀點是,我們自身的計算機模型將變得非常完善,以至于與真實的我們沒有區別。在這種情況下,我們可以把自己上傳到云端,永遠作為軟件的一部分存在,不受現實世界的惱人的約束。不過這面臨著一個問題:它在生物學上可能行不通。為了上傳你自己,你需要一個精確的模型來描述你的每一個神經元,以及它們儲存的記憶。你必須非常可靠地采集這些信息,使得模型的預測結果盡可能地符合真正神經元的行為——這確實是一個艱巨的任務。但即使這是一個可行的選擇,如果你有機會,你真的會上傳自己嗎?你怎么能確定你的模型并沒有丟失你的一些必要記憶——或者,這個模型真的擁有意識嗎?如果一個小偷以最為絕對和完整的方式偷走了你的身份呢?我相信,只要人們可以,都會選擇死守他們那黏黏的、以碳為基礎、計算機科學家戲謔地稱之為“濕件”(wetware)的本體——直到堅持不下去為止。
4.人工智能警察抓捕人工智能罪犯
人工智能,尤其是機器學習,事實上只是人類進化的延續。在《延伸表型》(Extended Phenotype)一書中,英國科學家理查德·道金斯(Richard Dawkins)談到,動物基因控制的不只是它們的身體,還有環境,而且這種現象相當普遍——從杜鵑產蛋到河貍筑壩,都是如此。技術就是人類表型的延伸,我們今天所構建的是我們的另一層技術外骨骼。未來人類會如何運用人工智能?我認為最可能出現的情景要比通常的推測更有趣。
在十年內,我們中的每一個人都可能擁有一個“數字替身”,這個人工智能助手將比我們今天的智能手機更加不可或缺。你的數字替身不需要和你一起移動,它很可能存在于云中的某個地方,就像你現有的個人數據一樣。我們可以在Siri、Alexa和Google助手等虛擬助手中看到它的雛形。數字替身的核心是一個你自身的模型,該模型將從你與數字世界互動時產生的一切數據中學習,包括桌面電腦、網站、可穿戴設備以及智能揚聲器、恒溫器、手機信號發射塔和攝像機等環境傳感設備。
我們的學習算法越好,我們給數字替身提供的個人數據越多,它們就會變得越精確。一旦我們有了主算法,就可以通過增強現實設備和其他個人傳感器連續捕捉你的感覺和運動信息,這樣一來,數字替身會比你最好的朋友都更了解你。
你的數字模型和數據將由一個“數據銀行”來維護,這與你用來儲蓄和投資的傳統銀行不同。許多現有的公司肯定愿意為你提供這種服務。谷歌創始人謝爾蓋·布林(Sergey Brin)表示,谷歌想成為“你的大腦的第三個半球”,但如果你大腦的一部分要通過向你展示廣告來維持它的存在,你可能不愿意。最好是由利益沖突更少的新型公司或由與你志趣相投的人形成的數字聯盟來給你提供更好的服務。
畢竟,人工智能最值得擔心的地方不是它會自發地變邪惡,而是控制它的人會濫用它(用法國人的話說,cherchez l’humain——“看,問題根源總是在人類身上”)。因此,你的數據銀行的首要任務是確保你的模型永遠不會被用來損害你的利益。你和數據銀行都必須保持警惕,時刻監控人工智能犯罪,因為這項技術同樣也能增強壞人的能力。我們將會需要人工智能警察來抓捕人工智能罪犯?苹米骷彝ぜ忌╓illiam Gibson)在1984年出版的小說《神經漫游者》(Neuromancer)中就描寫了這樣的警察,他稱其為圖靈警察。
當然,這也給某些機構提供了機會,讓它們更容易監視和約束你?紤]到機器學習的發展速度,電影《少數派報告》(Minority Report)中的情景也可能出現——人們在即將犯罪時被提前逮捕。還有,在我們所有人都能獲得一個數字替身前,世界已經適應了部分擁有數字替身的人的生活節奏,這對那些尚未獲得數字替身的人也意味著不平等。
5.虛擬空間的無數種人生
作為個人,我們的首要任務是不要自滿,不要盲目信任我們的數字替身,忽略它們才剛誕生沒多久的事實。人們很容易忘記,人工智能就像具備某些超常能力的自閉癥患者,而且在可預見的未來仍將如此。從外表看,人工智能似乎是客觀,甚至完美的,但在內里,它們同我們一樣有諸多缺陷,甚至更多,只是方式不同而已。例如,人工智能缺乏常識,很容易犯一個人永遠不會犯的錯誤,比如把橫穿馬路的人誤認成被風吹起的塑料袋。它們往往只能理解我們指令的字面意思,精確給出我們要求的東西,但那不是我們真正想要的。(所以,在告訴自動駕駛汽車不惜一切代價把你準時送到機場前,要三思。)
實際上,你的數字替身和你如此相似,以至于它可以在各種虛擬互動中替代你。它的工作不是像你一樣生活,而是要幫助你選擇那些你沒有時間、耐心或知識親自去選的東西。它會閱讀亞馬遜上的每一本書,推薦一些你最可能想要閱讀的書。如果你需要一輛車,它會研究各種選項,并與汽車經銷商的替身討價還價。如果你在找工作,它會尋找所有符合你需要的職位,然后為你安排最有可能通過的真人面試。如果你被診斷出了癌癥,它會嘗試所有可能的治療方法并推薦最有效的治療方法。(讓你的數字替身參與醫學研究使得更多人受益也是你的道德責任。)如果你正在尋找愛侶,你的數字替身將會與所有符合條件的數字替身進行數百萬次的虛擬約會。在虛擬空間中擦出愛情火花的情侶們則可以在現實生活中約會。
從本質上說,你的數字替身會在虛擬空間中度過無數種可能人生,這樣活在真實物質世界中的你就可能選出其中最好的一個版本。你的模擬生活是否真實,你的數字化身是否有某種自我意識,就像英劇《黑鏡》( Black Mirror)中的一些故事那樣,都是有趣的哲學問題。
一些人擔心,這意味著我們將把自己生活的控制權交給計算機。但它實際上給了我們更多的控制權,而不是更少。你的模型還將從每次虛擬體驗的結果中學習(你享受這次約會嗎?你喜歡你的新工作嗎?)所以隨著時間的推移,它給出的建議會越來越接近你本人的選擇。
事實上,我們已經習慣了在潛意識的干預下做出我們的大多數決策,因為這就是我們大腦的運作機制。你的數字替身就像是大幅擴展了的潛意識,但它們之間有一個關鍵的區別:當你的潛意識在你的身體里獨自生活時,你的數字替身將會不斷地與他人和組織進行互動。每個人的數字替身都將繼續努力學習其他人的模型,構成一個基于模型的社會,它們會以計算機的速度生活,探索所有的可能性,猜測我們在當下可能做出的選擇。我們的機器將是我們的偵察兵,為獨立個體和整個人類物種開辟一條通往未來的道路。它們將帶領我們去往哪里?我們將選擇奔赴何處?
本文由《環球科學》雜志社供稿
作者簡介:
佩德羅·多明戈斯是華盛頓大學的計算機科學教授。
本文譯者:
崔迪瀟是西安交通大學人工智能與機器人研究所講師,主要研究方向是人工智能和無人駕駛技術。
《光明日報》( 2018年10月17日 14版)