2023年,AI領(lǐng)域最令人矚目的亮點(diǎn)之一是大模型。在今年7月于上海舉辦的世界人工智能大會(huì)(WAIC)上,有30余個(gè)大模型平臺(tái)對(duì)外發(fā)布和亮相。大模型正在引領(lǐng)新一輪全球AI技術(shù)發(fā)展浪潮。
大模型被稱為新一代AI生態(tài)的核心。這是一個(gè)把智力賦予各種應(yīng)用的基礎(chǔ)性共性模型,能夠從海量大數(shù)據(jù)中學(xué)到知識(shí)和規(guī)律,為各種通用智能任務(wù)提供服務(wù),可應(yīng)用于自然語(yǔ)言處理、圖像識(shí)別、語(yǔ)音識(shí)別等領(lǐng)域。
北京智源人工智能研究院(BAAI,以下簡(jiǎn)稱智源)是國(guó)內(nèi)最早從事大模型研究的機(jī)構(gòu)之一。今年4月,微軟副董事長(zhǎng)兼總裁布拉德·史密斯在接受采訪時(shí)稱:“我們認(rèn)為(全球)有3家機(jī)構(gòu)處于領(lǐng)先位置,一是與微軟合作的Open AI,二是谷歌,三是北京智源。”
2023年12月5日,黃鐵軍在北京接受本刊記者采訪。(本刊記者 侯欣穎 / 攝)
北京大學(xué)計(jì)算機(jī)學(xué)院教授、博士生導(dǎo)師黃鐵軍是這所研發(fā)機(jī)構(gòu)的掌舵者。他是“70后”,在AI領(lǐng)域耕耘了30余年。2018年,黃鐵軍和伙伴們共同討論出“智源”這個(gè)名字,意為“智慧的源頭”。除每年給本科生講授兩門基礎(chǔ)性課程和指導(dǎo)研究生外,他的大部分時(shí)間在智源的辦公樓——這幢位于北京五道口、未來(lái)感十足的紅房子里度過。
萬(wàn)物的奧秘令他著迷。1988年,為了“搞清楚奧秘”,黃鐵軍報(bào)考了北京大學(xué)物理系,可“差幾分,沒考上”。他在武漢工業(yè)大學(xué)(今武漢理工大學(xué)前身)計(jì)算機(jī)應(yīng)用專業(yè)度過了本科和碩士生涯,在華中理工大學(xué)(今華中科技大學(xué)前身)圖像識(shí)別與人工智能研究所取得博士學(xué)位。
12月上旬的一個(gè)上午,《環(huán)球人物》記者在智源的辦公室里見到了黃鐵軍。他中等身材,衣著樸素,戴無(wú)框眼鏡。他對(duì)未來(lái)圖景充滿期待,同時(shí)也在審慎地看待可能出現(xiàn)的風(fēng)險(xiǎn)。以下是《環(huán)球人物》記者與他的對(duì)話。
把AI作為“年度人物”是令人激動(dòng)的
《環(huán)球人物》:您如何看待本刊將AI推選為年度人物?
黃鐵軍:AI和人有可比性。其實(shí)AI這個(gè)概念被提出之初就被比作“人”,有其合理性,但也不全面。目前學(xué)科上已經(jīng)有基本共識(shí),即AI就是智能體。人也是智能體。智能體首先是一個(gè)物理存在的主體,然后具備智能。AI這么多方向,最后總要在一個(gè)載體上實(shí)現(xiàn)。目前AI的一個(gè)重要目標(biāo)是模擬人的智能、超越人的表現(xiàn)。
把AI評(píng)選為“年度人物”,令人激動(dòng),也恰如其分。2023年在AI發(fā)展史上將會(huì)是一個(gè)分水嶺,在全世界范圍內(nèi)都是如此。今年AI領(lǐng)域最大的突破不僅是技術(shù)層面的,更是它的“破圈”,從一個(gè)技術(shù)話題成為社會(huì)話題。從某種意義上來(lái)說(shuō),這比技術(shù)上的突破更重要,大量非技術(shù)的社會(huì)資源的投入會(huì)加速技術(shù)進(jìn)步。
之前10多年,AI一直在迭代、積蓄,發(fā)展得很快,但大家心里始終不踏實(shí),擔(dān)心這種勢(shì)能會(huì)不會(huì)再落下去,畢竟此前有過“三起兩落”的歷史覆轍。1956年“達(dá)特茅斯會(huì)議”推動(dòng)全球第一次AI浪潮出現(xiàn),直至1974年前后經(jīng)歷第一次寒冬,受限于性能和算法,那時(shí)AI能做的事情十分有限。上世紀(jì)80年代,“知識(shí)工程”成為AI研究的主要方向,帶來(lái)第二輪熱潮。但由于專家系統(tǒng)應(yīng)用領(lǐng)域狹窄、知識(shí)獲取困難,AI研究第二次陷入低谷。2006年,以計(jì)算機(jī)科學(xué)家杰弗里·辛頓在《科學(xué)》(Science)雜志上發(fā)表的一篇深度學(xué)習(xí)文章為顯著標(biāo)志,AI迎來(lái)新一輪發(fā)展高潮。
今年,我想大家都意識(shí)到,社會(huì)資源在AI領(lǐng)域的投入量已經(jīng)達(dá)到了不可能再消失的程度。當(dāng)然,因?yàn)闊?,投入不一定都是理性的,但總的?lái)說(shuō),無(wú)論是人的資源、技術(shù)的資源還是數(shù)據(jù)的資源,等等,我認(rèn)為最終都會(huì)發(fā)揮實(shí)實(shí)在在的作用。
《環(huán)球人物》:從科學(xué)上您如何定義“AI”?
黃鐵軍:AI就是制造有智能的機(jī)器,或制造有智能的系統(tǒng)——我說(shuō)的系統(tǒng)是偏實(shí)體化的——這就是AI。
《環(huán)球人物》:目前常見的AI可以分為哪幾類?其中,哪些是已經(jīng)應(yīng)用成熟的?哪些是可以期待的?
黃鐵軍:那就從“實(shí)”一點(diǎn)的角度來(lái)說(shuō)吧。依據(jù)它們對(duì)產(chǎn)業(yè)、對(duì)社會(huì)發(fā)生作用的方式不同,我們可以把AI大致分為這么幾類——
一種我們姑且稱它為信息類的智能,如通過云、網(wǎng)、手機(jī)等各種方式提供智能服務(wù),聊天機(jī)器人、圖像生成軟件等都屬于這一類。這是目前應(yīng)用比較成熟的,也是投入最多的。
另一種我們稱其為具身智能,即智能落到一個(gè)特定的物理實(shí)體上,如自動(dòng)駕駛、機(jī)器人等。
有人可能會(huì)問:今天的自動(dòng)駕駛和以前我們常說(shuō)的自動(dòng)駕駛有什么區(qū)別?簡(jiǎn)單來(lái)說(shuō),以前的自動(dòng)駕駛主要是模仿駕校教學(xué)過程——司機(jī)看見什么,就要執(zhí)行哪些具體操作;而現(xiàn)在的自動(dòng)駕駛是要具備司機(jī)進(jìn)駕校之前就有的那些能力——不是左轉(zhuǎn)右轉(zhuǎn)、開快開慢那樣的技能,而是對(duì)世界的認(rèn)知。這樣在行駛過程中遇到各種情況時(shí),駕駛者才能做出合理的行動(dòng)。再直白一點(diǎn)講,人接受50個(gè)小時(shí)駕駛培訓(xùn)之后就能上路開車,牛就不行。
這也是如今AI賦予自動(dòng)駕駛的能力,有了對(duì)世界的認(rèn)知能力,才談得上具身智能。機(jī)器人也是一樣的道理。目前具身智能應(yīng)用尚不成熟,但技術(shù)道路已經(jīng)打開了,可能性已經(jīng)沒問題了。
還有一類智能,或許現(xiàn)在和我們的直接關(guān)系不是很大,但長(zhǎng)遠(yuǎn)來(lái)說(shuō)會(huì)產(chǎn)生極大影響——AI賦能科學(xué)(AI for science)。我們常說(shuō)科技是推動(dòng)世界發(fā)展的重要力量,現(xiàn)在不少學(xué)科的研究范式比較傳統(tǒng),AI會(huì)帶來(lái)新的范式,從而加速科學(xué)技術(shù)的進(jìn)步,這種進(jìn)步是躍進(jìn)式而非漸進(jìn)式的。
比如數(shù)學(xué)領(lǐng)域。之前,一個(gè)數(shù)學(xué)猜想或是一個(gè)定理的證明,需要等待某位天才數(shù)學(xué)家的智力,因此重大突破往往歷經(jīng)數(shù)十年甚至幾百年才實(shí)現(xiàn)。AI出現(xiàn)之后,很可能會(huì)改變這種局面。為什么?因?yàn)锳I所掌握的數(shù)據(jù)的廣度比人類數(shù)學(xué)家都要寬,它能把所有數(shù)學(xué)分支融會(huì)貫通,而許多定理證明恰恰需要把諸多分支串聯(lián)在一起,形成一個(gè)很長(zhǎng)的證明鏈。數(shù)學(xué)領(lǐng)域一旦有這樣的事情發(fā)生,就是一個(gè)重大數(shù)學(xué)問題被AI解決了,之后重大突破就紛至沓來(lái)。
再比如物質(zhì)科學(xué)領(lǐng)域。以前做工程材料要做很多實(shí)驗(yàn),大海撈針般地尋找有用的分子結(jié)構(gòu)。而現(xiàn)在可以通過AI直接預(yù)測(cè)——準(zhǔn)確率往往還很高。鄂維南院士領(lǐng)銜的北京科學(xué)智能研究院(AISI)就在做這么一件事:在數(shù)字空間構(gòu)建出高精度原子模型,然后用不同原子相互組合成分子,分子功能可以模擬出來(lái),大大提高了實(shí)驗(yàn)效率。
還有生命科學(xué)領(lǐng)域,智源正在做兩個(gè)未來(lái)可能有大突破的方向。一個(gè)是做蛋白質(zhì),用AI加速對(duì)蛋白質(zhì)的建模和理解。一個(gè)是做神經(jīng)系統(tǒng)和人的器官——目前是心臟,都在利用AI做高精度模擬。
做這些有什么用?以心臟房顫治療為例,醫(yī)生采用的一種方法是通過能量燒灼異常放電的心肌細(xì)胞,來(lái)達(dá)到清除異常放電灶或者隔離錯(cuò)誤信號(hào)的目的。燒灼的準(zhǔn)確與否與醫(yī)生本人經(jīng)驗(yàn)息息相關(guān)。
如果做出與患者心臟一模一樣的數(shù)字孿生心臟,醫(yī)生就可以先在數(shù)字心臟上預(yù)演手術(shù),尋找最佳的燒灼位置,確定后再用到患者身上,手術(shù)成功率一下就提高了很多。所以這樣的建模和模擬既可以幫助我們理解復(fù)雜對(duì)象,也能發(fā)揮實(shí)際作用,解決具體問題。
“理解智能”與“制造智能”
《環(huán)球人物》:在我國(guó)的AI發(fā)展史中,科學(xué)家們的研究思路發(fā)生過怎樣的轉(zhuǎn)變?
黃鐵軍:拿我個(gè)人的經(jīng)歷來(lái)說(shuō)吧。我是懷著對(duì)大腦和智能奧秘的好奇進(jìn)入這一行的。
1991年,讀大學(xué)三年級(jí)時(shí),我恰好有個(gè)機(jī)會(huì)可以跟著導(dǎo)師做“863計(jì)劃”(國(guó)家高技術(shù)研究發(fā)展計(jì)劃)智能計(jì)算機(jī)主題的項(xiàng)目,具體是做手寫印刷體漢字識(shí)別,研究一些算法,使得手寫漢字的識(shí)別率達(dá)到一定程度。那是要解決實(shí)際問題的,也取得了一些成績(jī)。但是相比之下,我對(duì)人腦的奧秘、智能的奧秘更感興趣,我的好奇心并沒有得到滿足,它們始終困擾著我。
1995年5月,黃鐵軍(左)碩士論文答辯時(shí)與導(dǎo)師胡家忠教授的合影。
直到2010年前后,在參加“973計(jì)劃”(國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃)期間,我和腦科學(xué)家一起工作了三四年,才終于“轉(zhuǎn)過彎了”。我發(fā)現(xiàn)之前自己一直致力于“理解智能”,試圖搞清楚大腦是怎么回事、智能是怎么回事,其實(shí)是不現(xiàn)實(shí)的。這是科學(xué)的思維方式。我轉(zhuǎn)換到了技術(shù)的思維方式——“制造智能”,即不以理解為前提,先造一個(gè)東西出來(lái),讓其具備某種特定功能。
這種思維方式在人類科技史中一直廣泛存在。比如我國(guó)古代四大發(fā)明之一的指南針,最早的指南針?biāo)灸显趹?zhàn)國(guó)時(shí)期就有了,可電磁場(chǎng)理論直到近代才出現(xiàn)。
再比如漢朝先民就知道用鹵水點(diǎn)豆腐,但他們并不理解背后的化學(xué)反應(yīng)機(jī)理。美國(guó)的萊特兄弟在1903年實(shí)現(xiàn)了人類歷史上第一次駕機(jī)動(dòng)力飛行,但空氣動(dòng)力學(xué)理論的建立也是后來(lái)的事情。所以我意識(shí)到,必須先做出來(lái),再試圖理解它。事實(shí)上,理解大腦、理解智能確實(shí)要比制造一個(gè)具有智能的機(jī)器難得多。
《環(huán)球人物》:促使您發(fā)生轉(zhuǎn)變的契機(jī)是什么?
黃鐵軍:主要是一種緊迫感的驅(qū)使。那時(shí)我已經(jīng)40多歲了,還有夢(mèng)想,希望能在AI領(lǐng)域取得重大突破。在和腦科學(xué)家、神經(jīng)科學(xué)家的合作過程中,我發(fā)現(xiàn),他們面對(duì)的人腦是極其龐大復(fù)雜的神經(jīng)系統(tǒng),他們只能一點(diǎn)點(diǎn)去摸索。有人問過,腦科學(xué)什么時(shí)候能把智能的奧秘揭示出來(lái)?再樂觀的腦科學(xué)家也只會(huì)告訴你,300年后能完成就不錯(cuò)了??葾I不能等300年后再做,這就必須轉(zhuǎn)換思維方式——不告訴你為什么,能不能做?
人類發(fā)展依靠的是雙輪——科學(xué)和技術(shù),不能簡(jiǎn)單地認(rèn)為科學(xué)是第一性的,技術(shù)是第二性的。就像有人說(shuō)中國(guó)古代的四大發(fā)明不是科學(xué),只是技術(shù),是第二性的。這話既對(duì)也不對(duì)。科學(xué)確實(shí)是我們?nèi)笔У囊徊糠?,我們要加?qiáng)科學(xué),要問為什么、找背后的原理,但是也不能抹煞了技術(shù)的偉大。在理解科學(xué)原理之前的技術(shù)發(fā)明更偉大。技術(shù)發(fā)明和科學(xué)發(fā)現(xiàn)一樣,都是從0到1的原始創(chuàng)新。
《環(huán)球人物》:轉(zhuǎn)變后,您在實(shí)踐上會(huì)有什么變化?
黃鐵軍:就不束手束腳了。
科學(xué)的目標(biāo)是探索事物或現(xiàn)象背后的規(guī)律,努力回答“為什么”;技術(shù)的目標(biāo)是創(chuàng)造新的事物或現(xiàn)象,核心是“怎么做”,是方法論問題。
以制作指南針為例,需要解決的是用什么材料、打磨到什么程度它就指南這類問題。制造者并不懂“磁場(chǎng)”,甚至沒有“磁”的概念,但這并不意味著他做不出可以指南的裝置。
AI也是這樣,需要你做一個(gè)有智能的裝置,并不以理解智能機(jī)理為前提,而是要探索怎么訓(xùn)練它效率高,這些事情是可以嘗試、優(yōu)化的。
我并不是反對(duì)大家去理解它背后的原理,但是“物有本末,事有終始,知所先后,則近道矣”??萍紝?shí)踐過程中,既有科學(xué)發(fā)現(xiàn)在先、技術(shù)實(shí)現(xiàn)在后的例子,也有技術(shù)發(fā)明在先、科學(xué)發(fā)現(xiàn)在后的例子??茖W(xué)和技術(shù)相互促進(jìn),迭代發(fā)展。
就AI而言,人類智能對(duì)人類來(lái)說(shuō)可能永遠(yuǎn)無(wú)法理解,但不等于我們做不出來(lái)類人甚至超人的智能。這就是技術(shù)思維和科學(xué)思維的區(qū)別。
“智力時(shí)代”
《環(huán)球人物》:目前我國(guó)的AI行業(yè)在全球版圖中處于什么位置?
黃鐵軍:回到AI本身,它首先是一門技術(shù)。技術(shù)發(fā)展到一定程度之后就是大工程,也就是做大系統(tǒng)。從這個(gè)意義上來(lái)說(shuō),AI領(lǐng)域已經(jīng)進(jìn)入到一個(gè)白熱化的工程競(jìng)爭(zhēng)期,有些開放,也有些不開放,這就很難比較誰(shuí)快誰(shuí)慢。
必須強(qiáng)調(diào)的是,在工程技術(shù)的探索過程中,資源的投入、人的投入將會(huì)起到?jīng)Q定性作用。在信息類智能、實(shí)體類智能以及AI對(duì)科學(xué)的賦能上,我們都還有很多機(jī)會(huì)?,F(xiàn)在只是一場(chǎng)馬拉松開跑了,大家都在拼命地往前跑。
黃鐵軍正在調(diào)試一臺(tái)視覺研究領(lǐng)域的設(shè)備。
AI是通用型技術(shù),就像電力技術(shù)等所有通用技術(shù)一樣,不會(huì)被某一家企業(yè)壟斷,也不會(huì)被某個(gè)國(guó)家或地區(qū)壟斷。它基本的方法論大家都知道,只是具體到解決某個(gè)特定問題時(shí),有的會(huì)快一點(diǎn),有的會(huì)慢一點(diǎn)而已。
這不是誰(shuí)勝誰(shuí)負(fù)的問題,這是一個(gè)時(shí)代——我把它稱之為“智力時(shí)代”,全世界都在往這個(gè)方向發(fā)展。這個(gè)時(shí)代至少會(huì)持續(xù)幾十年,甚至上百年,未來(lái)也不會(huì)消失,它將是社會(huì)運(yùn)行所需的重要基礎(chǔ)設(shè)施。
《環(huán)球人物》:為什么發(fā)展AI這么重要?
黃鐵軍:我認(rèn)為,人類進(jìn)化史、地球演化史歸根結(jié)底都是智能的進(jìn)化史,本質(zhì)是智力水平的不斷提高。
幾年前,我全程參加了我國(guó)《新一代人工智能發(fā)展規(guī)劃》的建議、起草和實(shí)施?!兑?guī)劃》的第一句話就是“人工智能的迅速發(fā)展將深刻改變?nèi)祟惿鐣?huì)生活、改變世界”。我非常幸運(yùn)地趕上了這個(gè)時(shí)代,能在智能進(jìn)化史中發(fā)揮一點(diǎn)作用。
《環(huán)球人物》:目前有哪些風(fēng)險(xiǎn)需要提前考慮?
黃鐵軍:我們現(xiàn)在重視發(fā)展的是通用人工智能(General Artificial Intelligence,GAI),也就是具有通用性的AI,它不以超越人類為目標(biāo)。
但我們也應(yīng)該注意到,世界正處于由通用人工智能向人工通用智能(Artificial General Intelligence,AGI)邁進(jìn)的歷史時(shí)期。這里的AGI就是所謂的“超級(jí)AI”,也就是全面超越人類的AI系統(tǒng)?,F(xiàn)在我們就要考慮這個(gè)問題:AGI如果出現(xiàn),我們?cè)趺崔k?也許有人認(rèn)為這是杞人憂天,但我認(rèn)為這是個(gè)很現(xiàn)實(shí)的問題,可能性是存在的——我認(rèn)為這個(gè)時(shí)間會(huì)在2045年左右,還有人認(rèn)為是在10年內(nèi)甚至更短。我們要迎接這個(gè)重大挑戰(zhàn)。
“人工智能之父”艾倫·圖靈在1950年那篇?jiǎng)潟r(shí)代的論文《計(jì)算機(jī)器與智能》里寫過這樣一句話:“我們能做到的,比我們能看到的要多得多。”我很贊同。
要去預(yù)測(cè)科技的進(jìn)步是很難的,真正的科技進(jìn)步主要是通過嘗試和實(shí)踐得來(lái)的,這個(gè)過程中會(huì)出現(xiàn)很多意想不到的新東西。2015年我在《人類能制造出“超級(jí)大腦”嗎?》這篇文章中還引用了圖靈這句話,我把它翻譯為:“吾等目力短亦淺,能見百事待踐行。”(本文圖片除特別標(biāo)注外,皆為受訪者提供)