2023年,AI領(lǐng)域最令人矚目的亮點之一是大模型。在今年7月于上海舉辦的世界人工智能大會(WAIC)上,有30余個大模型平臺對外發(fā)布和亮相。大模型正在引領(lǐng)新一輪全球AI技術(shù)發(fā)展浪潮。
大模型被稱為新一代AI生態(tài)的核心。這是一個把智力賦予各種應(yīng)用的基礎(chǔ)性共性模型,能夠從海量大數(shù)據(jù)中學到知識和規(guī)律,為各種通用智能任務(wù)提供服務(wù),可應(yīng)用于自然語言處理、圖像識別、語音識別等領(lǐng)域。
北京智源人工智能研究院(BAAI,以下簡稱智源)是國內(nèi)最早從事大模型研究的機構(gòu)之一。今年4月,微軟副董事長兼總裁布拉德·史密斯在接受采訪時稱:“我們認為(全球)有3家機構(gòu)處于領(lǐng)先位置,一是與微軟合作的Open AI,二是谷歌,三是北京智源。”
2023年12月,黃鐵軍在北京接受本刊記者采訪。(本刊記者 侯欣穎 / 攝)
北京大學計算機學院教授、博士生導師黃鐵軍是這所研發(fā)機構(gòu)的掌舵者。他是“70后”,在AI領(lǐng)域耕耘了30余年。2018年,黃鐵軍和伙伴們共同討論出“智源”這個名字,意為“智慧的源頭”。除每年給本科生講授兩門基礎(chǔ)性課程和指導研究生外,他的大部分時間在智源的辦公樓——這幢位于北京五道口、未來感十足的紅房子里度過。
萬物的奧秘令他著迷。1988年,為了“搞清楚奧秘”,黃鐵軍報考了北京大學物理系,可“差幾分,沒考上”。他在武漢工業(yè)大學(今武漢理工大學前身)計算機應(yīng)用專業(yè)度過了本科和碩士生涯,在華中理工大學(今華中科技大學前身)圖像識別與人工智能研究所取得博士學位。
12月的一個上午,《環(huán)球人物》記者在智源的辦公室里見到了黃鐵軍。他中等身材,衣著樸素,戴無框眼鏡。同樣是在這個月,他出現(xiàn)在中國科協(xié)主辦的“對話科學家”系列活動的現(xiàn)場。他對未來圖景充滿期待,同時也在審慎地看待可能出現(xiàn)的風險。以下是《環(huán)球人物》記者與他的對話。
把AI作為“年度人物”是令人激動的
《環(huán)球人物》:您如何看待本刊將AI推選為年度人物?
黃鐵軍:AI和人有可比性。其實AI這個概念被提出之初就被比作“人”,有其合理性,但也不全面。目前學科上已經(jīng)有基本共識,即AI就是智能體。人也是智能體。智能體首先是一個物理存在的主體,然后具備智能。AI這么多方向,最后總要在一個載體上實現(xiàn)。目前AI的一個重要目標是模擬人的智能、超越人的表現(xiàn)。
把AI評選為“年度人物”,令人激動,也恰如其分。2023年在AI發(fā)展史上將會是一個分水嶺,在全世界范圍內(nèi)都是如此。今年AI領(lǐng)域最大的突破不僅是技術(shù)層面的,更是它的“破圈”,從一個技術(shù)話題成為社會話題。從某種意義上來說,這比技術(shù)上的突破更重要,大量非技術(shù)的社會資源的投入會加速技術(shù)進步。
之前10多年,AI一直在迭代、積蓄,發(fā)展得很快,但大家心里始終不踏實,擔心這種勢能會不會再落下去,畢竟此前有過“三起兩落”的歷史覆轍。1956年“達特茅斯會議”推動全球第一次AI浪潮出現(xiàn),直至1974年前后經(jīng)歷第一次寒冬,受限于性能和算法,那時AI能做的事情十分有限。上世紀80年代,“知識工程”成為AI研究的主要方向,帶來第二輪熱潮。但由于專家系統(tǒng)應(yīng)用領(lǐng)域狹窄、知識獲取困難,AI研究第二次陷入低谷。2006年,以計算機科學家杰弗里·辛頓在《科學》(Science)雜志上發(fā)表的一篇深度學習文章為顯著標志,AI迎來新一輪發(fā)展高潮。
今年,我想大家都意識到,社會資源在AI領(lǐng)域的投入量已經(jīng)達到了不可能再消失的程度。當然,因為熱,投入不一定都是理性的,但總的來說,無論是人的資源、技術(shù)的資源還是數(shù)據(jù)的資源,等等,我認為最終都會發(fā)揮實實在在的作用。
《環(huán)球人物》:從科學上您如何定義“AI”?
黃鐵軍:AI就是制造有智能的機器,或制造有智能的系統(tǒng)——我說的系統(tǒng)是偏實體化的——這就是AI。
《環(huán)球人物》:目前常見的AI可以分為哪幾類?其中,哪些是已經(jīng)應(yīng)用成熟的?哪些是可以期待的?
黃鐵軍:那就從“實”一點的角度來說吧。依據(jù)它們對產(chǎn)業(yè)、對社會發(fā)生作用的方式不同,我們可以把AI大致分為這么幾類——
一種我們姑且稱它為信息類的智能,如通過云、網(wǎng)、手機等各種方式提供智能服務(wù),聊天機器人、圖像生成軟件等都屬于這一類。這是目前應(yīng)用比較成熟的,也是投入最多的。
另一種我們稱其為具身智能,即智能落到一個特定的物理實體上,如自動駕駛、機器人等。
有人可能會問:今天的自動駕駛和以前我們常說的自動駕駛有什么區(qū)別?簡單來說,以前的自動駕駛主要是模仿駕校教學過程——司機看見什么,就要執(zhí)行哪些具體操作;而現(xiàn)在的自動駕駛是要具備司機進駕校之前就有的那些能力——不是左轉(zhuǎn)右轉(zhuǎn)、開快開慢那樣的技能,而是對世界的認知。這樣在行駛過程中遇到各種情況時,駕駛者才能做出合理的行動。再直白一點講,人接受50個小時駕駛培訓之后就能上路開車,牛就不行。
這也是如今AI賦予自動駕駛的能力,有了對世界的認知能力,才談得上具身智能。機器人也是一樣的道理。我在“對話科學家”系列活動上也說過,機器人如果將來想要走入大眾生活中,想讓老人、孩子都很滿意,那它就不能只會端茶倒水掃掃地,還得能識別情緒變化和一些微表情,這對感知能力的要求是很高的。目前具身智能應(yīng)用尚不成熟,但技術(shù)道路已經(jīng)打開了,可能性已經(jīng)沒問題了。
還有一類智能,或許現(xiàn)在和我們的直接關(guān)系不是很大,但長遠來說會產(chǎn)生極大影響——AI賦能科學(AI for science)。我們常說科技是推動世界發(fā)展的重要力量,現(xiàn)在不少學科的研究范式比較傳統(tǒng),AI會帶來新的范式,從而加速科學技術(shù)的進步,這種進步是躍進式而非漸進式的。
1995年5月,黃鐵軍(左)碩士論文答辯時與導師胡家忠教授的合影。
比如數(shù)學領(lǐng)域。之前,一個數(shù)學猜想或是一個定理的證明,需要等待某位天才數(shù)學家的智力,因此重大突破往往歷經(jīng)數(shù)十年甚至幾百年才實現(xiàn)。AI出現(xiàn)之后,很可能會改變這種局面。為什么?因為AI所掌握的數(shù)據(jù)的廣度比人類數(shù)學家都要寬,它能把所有數(shù)學分支融會貫通,而許多定理證明恰恰需要把諸多分支串聯(lián)在一起,形成一個很長的證明鏈。數(shù)學領(lǐng)域一旦有這樣的事情發(fā)生,就是一個重大數(shù)學問題被AI解決了,之后重大突破就紛至沓來。
再比如物質(zhì)科學領(lǐng)域。以前做工程材料要做很多實驗,大海撈針般地尋找有用的分子結(jié)構(gòu)。而現(xiàn)在可以通過AI直接預(yù)測——準確率往往還很高。鄂維南院士領(lǐng)銜的北京科學智能研究院(AISI)就在做這么一件事:在數(shù)字空間構(gòu)建出高精度原子模型,然后用不同原子相互組合成分子,分子功能可以模擬出來,大大提高了實驗效率。
還有生命科學領(lǐng)域,智源正在做兩個未來可能有大突破的方向。一個是做蛋白質(zhì),用AI加速對蛋白質(zhì)的建模和理解。一個是做神經(jīng)系統(tǒng)和人的器官——目前是心臟,都在利用AI做高精度模擬。
做這些有什么用?以心臟房顫治療為例,醫(yī)生采用的一種方法是通過能量燒灼異常放電的心肌細胞,來達到清除異常放電灶或者隔離錯誤信號的目的。燒灼的準確與否與醫(yī)生本人經(jīng)驗息息相關(guān)。
如果做出與患者心臟一模一樣的數(shù)字孿生心臟,醫(yī)生就可以先在數(shù)字心臟上預(yù)演手術(shù),尋找最佳的燒灼位置,確定后再用到患者身上,手術(shù)成功率一下就提高了很多。所以這樣的建模和模擬既可以幫助我們理解復雜對象,也能發(fā)揮實際作用,解決具體問題。
“理解智能”與“制造智能”
《環(huán)球人物》:在我國的AI發(fā)展史中,科學家們的研究思路發(fā)生過怎樣的轉(zhuǎn)變?
黃鐵軍:拿我個人的經(jīng)歷來說吧。我是懷著對大腦和智能奧秘的好奇進入這一行的。
1991年,讀大學三年級時,我恰好有個機會可以跟著導師做“863計劃”(國家高技術(shù)研究發(fā)展計劃)智能計算機主題的項目,具體是做手寫印刷體漢字識別,研究一些算法,使得手寫漢字的識別率達到一定程度。那是要解決實際問題的,也取得了一些成績。但是相比之下,我對人腦的奧秘、智能的奧秘更感興趣,我的好奇心并沒有得到滿足,它們始終困擾著我。
直到2010年前后,在參加“973計劃”(國家重點基礎(chǔ)研究發(fā)展計劃)期間,我和腦科學家一起工作了三四年,才終于“轉(zhuǎn)過彎了”。我發(fā)現(xiàn)之前自己一直致力于“理解智能”,試圖搞清楚大腦是怎么回事、智能是怎么回事,其實是不現(xiàn)實的。這是科學的思維方式。我轉(zhuǎn)換到了技術(shù)的思維方式——“制造智能”,即不以理解為前提,先造一個東西出來,讓其具備某種特定功能。
這種思維方式在人類科技史中一直廣泛存在。比如我國古代四大發(fā)明之一的指南針,最早的指南針司南在戰(zhàn)國時期就有了,可電磁場理論直到近代才出現(xiàn)。
再比如漢朝先民就知道用鹵水點豆腐,但他們并不理解背后的化學反應(yīng)機理。美國的萊特兄弟在1903年實現(xiàn)了人類歷史上第一次駕機動力飛行,但空氣動力學理論的建立也是后來的事情。所以我意識到,必須先做出來,再試圖理解它。事實上,理解大腦、理解智能確實要比制造一個具有智能的機器難得多。
《環(huán)球人物》:促使您發(fā)生轉(zhuǎn)變的契機是什么?
黃鐵軍:主要是一種緊迫感的驅(qū)使。那時我已經(jīng)40多歲了,還有夢想,希望能在AI領(lǐng)域取得重大突破。在和腦科學家、神經(jīng)科學家的合作過程中,我發(fā)現(xiàn),他們面對的人腦是極其龐大復雜的神經(jīng)系統(tǒng),他們只能一點點去摸索。有人問過,腦科學什么時候能把智能的奧秘揭示出來?再樂觀的腦科學家也只會告訴你,300年后能完成就不錯了??葾I不能等300年后再做,這就必須轉(zhuǎn)換思維方式——不告訴你為什么,能不能做?
人類發(fā)展依靠的是雙輪——科學和技術(shù),不能簡單地認為科學是第一性的,技術(shù)是第二性的。就像有人說中國古代的四大發(fā)明不是科學,只是技術(shù),是第二性的。這話既對也不對。科學確實是我們?nèi)笔У囊徊糠?,我們要加強科學,要問為什么、找背后的原理,但是也不能抹煞了技術(shù)的偉大。在理解科學原理之前的技術(shù)發(fā)明更偉大。技術(shù)發(fā)明和科學發(fā)現(xiàn)一樣,都是從0到1的原始創(chuàng)新。
《環(huán)球人物》:轉(zhuǎn)變后,您在實踐上會有什么變化?
黃鐵軍:就不束手束腳了。
科學的目標是探索事物或現(xiàn)象背后的規(guī)律,努力回答“為什么”;技術(shù)的目標是創(chuàng)造新的事物或現(xiàn)象,核心是“怎么做”,是方法論問題。
以制作指南針為例,需要解決的是用什么材料、打磨到什么程度它就指南這類問題。制造者并不懂“磁場”,甚至沒有“磁”的概念,但這并不意味著他做不出可以指南的裝置。
AI也是這樣,需要你做一個有智能的裝置,并不以理解智能機理為前提,而是要探索怎么訓練它效率高,這些事情是可以嘗試、優(yōu)化的。
我并不是反對大家去理解它背后的原理,但是“物有本末,事有終始,知所先后,則近道矣”??萍紝嵺`過程中,既有科學發(fā)現(xiàn)在先、技術(shù)實現(xiàn)在后的例子,也有技術(shù)發(fā)明在先、科學發(fā)現(xiàn)在后的例子??茖W和技術(shù)相互促進,迭代發(fā)展。
就AI而言,人類智能對人類來說可能永遠無法理解,但不等于我們做不出來類人甚至超人的智能。這就是技術(shù)思維和科學思維的區(qū)別。
“智力時代”
《環(huán)球人物》:目前我國的AI行業(yè)在全球版圖中處于什么位置?
黃鐵軍:回到AI本身,它首先是一門技術(shù)。技術(shù)發(fā)展到一定程度之后就是大工程,也就是做大系統(tǒng)。從這個意義上來說,AI領(lǐng)域已經(jīng)進入到一個白熱化的工程競爭期,有些開放,也有些不開放,這就很難比較誰快誰慢。
必須強調(diào)的是,在工程技術(shù)的探索過程中,資源的投入、人的投入將會起到?jīng)Q定性作用。在信息類智能、實體類智能以及AI對科學的賦能上,我們都還有很多機會?,F(xiàn)在只是一場馬拉松開跑了,大家都在拼命地往前跑。
黃鐵軍正在調(diào)試一臺視覺研究領(lǐng)域的設(shè)備。
AI是通用型技術(shù),就像電力技術(shù)等所有通用技術(shù)一樣,不會被某一家企業(yè)壟斷,也不會被某個國家或地區(qū)壟斷。它基本的方法論大家都知道,只是具體到解決某個特定問題時,有的會快一點,有的會慢一點而已。
這不是誰勝誰負的問題,這是一個時代——我把它稱之為“智力時代”,全世界都在往這個方向發(fā)展。這個時代至少會持續(xù)幾十年,甚至上百年,未來也不會消失,它將是社會運行所需的重要基礎(chǔ)設(shè)施。
《環(huán)球人物》:為什么發(fā)展AI這么重要?
黃鐵軍:我認為,人類進化史、地球演化史歸根結(jié)底都是智能的進化史,本質(zhì)是智力水平的不斷提高。
幾年前,我全程參加了我國《新一代人工智能發(fā)展規(guī)劃》的建議、起草和實施?!兑?guī)劃》的第一句話就是“人工智能的迅速發(fā)展將深刻改變?nèi)祟惿鐣?、改變世?rdquo;。我非常幸運地趕上了這個時代,能在智能進化史中發(fā)揮一點作用。
《環(huán)球人物》:目前有哪些風險需要提前考慮?
黃鐵軍:我們現(xiàn)在重視發(fā)展的是通用人工智能(General Artificial Intelligence,GAI),也就是具有通用性的AI,它不以超越人類為目標。
但我們也應(yīng)該注意到,世界正處于由通用人工智能向人工通用智能(Artificial General Intelligence,AGI)邁進的歷史時期。這里的AGI就是所謂的“超級AI”,也就是全面超越人類的AI系統(tǒng)?,F(xiàn)在我們就要考慮這個問題:AGI如果出現(xiàn),我們怎么辦?也許有人認為這是杞人憂天,但我認為這是個很現(xiàn)實的問題,可能性是存在的——我認為這個時間會在2045年左右,還有人認為是在10年內(nèi)甚至更短。我們要迎接這個重大挑戰(zhàn)。
“人工智能之父”艾倫·圖靈在1950年那篇劃時代的論文《計算機器與智能》里寫過這樣一句話:“我們能做到的,比我們能看到的要多得多。”我很贊同。
要去預(yù)測科技的進步是很難的,真正的科技進步主要是通過嘗試和實踐得來的,這個過程中會出現(xiàn)很多意想不到的新東西。2015年我在《人類能制造出“超級大腦”嗎?》這篇文章中還引用了圖靈這句話,我把它翻譯為:“吾等目力短亦淺,能見百事待踐行。”(本文圖片除特別標注外,皆為受訪者提供)