當前位置: 首頁 > 專題 > “對話科學家”系列活動

專訪北京智源人工智能研究院院長黃鐵軍：“今年是AI發(fā)展的分水嶺”

2023-12-19 14:40:58 來源：環(huán)球人物網(wǎng)-《環(huán)球人物》雜志作者：劉舒揚

小號中號大號

　　2023年，AI領(lǐng)域最令人矚目的亮點之一是大模型。在今年7月于上海舉辦的世界人工智能大會（WAIC）上，有30余個大模型平臺對外發(fā)布和亮相。大模型正在引領(lǐng)新一輪全球AI技術(shù)發(fā)展浪潮。

　　大模型被稱為新一代AI生態(tài)的核心。這是一個把智力賦予各種應用的基礎(chǔ)性共性模型，能夠從海量大數(shù)據(jù)中學到知識和規(guī)律，為各種通用智能任務(wù)提供服務(wù)，可應用于自然語言處理、圖像識別、語音識別等領(lǐng)域。

　　北京智源人工智能研究院（BAAI，以下簡稱智源）是國內(nèi)最早從事大模型研究的機構(gòu)之一。今年4月，微軟副董事長兼總裁布拉德·史密斯在接受采訪時稱：“我們認為（全球）有3家機構(gòu)處于領(lǐng)先位置，一是與微軟合作的Open AI，二是谷歌，三是北京智源。”

2023年12月，黃鐵軍在北京接受本刊記者采訪。（本刊記者侯欣穎 / 攝）

　　北京大學計算機學院教授、博士生導師黃鐵軍是這所研發(fā)機構(gòu)的掌舵者。他是“70后”，在AI領(lǐng)域耕耘了30余年。2018年，黃鐵軍和伙伴們共同討論出“智源”這個名字，意為“智慧的源頭”。除每年給本科生講授兩門基礎(chǔ)性課程和指導研究生外，他的大部分時間在智源的辦公樓——這幢位于北京五道口、未來感十足的紅房子里度過。

　　萬物的奧秘令他著迷。1988年，為了“搞清楚奧秘”，黃鐵軍報考了北京大學物理系，可“差幾分，沒考上”。他在武漢工業(yè)大學（今武漢理工大學前身）計算機應用專業(yè)度過了本科和碩士生涯，在華中理工大學（今華中科技大學前身）圖像識別與人工智能研究所取得博士學位。

　　12月的一個上午，《環(huán)球人物》記者在智源的辦公室里見到了黃鐵軍。他中等身材，衣著樸素，戴無框眼鏡。同樣是在這個月，他出現(xiàn)在中國科協(xié)主辦的“對話科學家”系列活動的現(xiàn)場。他對未來圖景充滿期待，同時也在審慎地看待可能出現(xiàn)的風險。以下是《環(huán)球人物》記者與他的對話。

　　把AI作為“年度人物”是令人激動的

　　《環(huán)球人物》：您如何看待本刊將AI推選為年度人物？

　　黃鐵軍：AI和人有可比性。其實AI這個概念被提出之初就被比作“人”，有其合理性，但也不全面。目前學科上已經(jīng)有基本共識，即AI就是智能體。人也是智能體。智能體首先是一個物理存在的主體，然后具備智能。AI這么多方向，最后總要在一個載體上實現(xiàn)。目前AI的一個重要目標是模擬人的智能、超越人的表現(xiàn)。

　　把AI評選為“年度人物”，令人激動，也恰如其分。2023年在AI發(fā)展史上將會是一個分水嶺，在全世界范圍內(nèi)都是如此。今年AI領(lǐng)域最大的突破不僅是技術(shù)層面的，更是它的“破圈”，從一個技術(shù)話題成為社會話題。從某種意義上來說，這比技術(shù)上的突破更重要，大量非技術(shù)的社會資源的投入會加速技術(shù)進步。

　　之前10多年，AI一直在迭代、積蓄，發(fā)展得很快，但大家心里始終不踏實，擔心這種勢能會不會再落下去，畢竟此前有過“三起兩落”的歷史覆轍。1956年“達特茅斯會議”推動全球第一次AI浪潮出現(xiàn)，直至1974年前后經(jīng)歷第一次寒冬，受限于性能和算法，那時AI能做的事情十分有限。上世紀80年代，“知識工程”成為AI研究的主要方向，帶來第二輪熱潮。但由于專家系統(tǒng)應用領(lǐng)域狹窄、知識獲取困難，AI研究第二次陷入低谷。2006年，以計算機科學家杰弗里·辛頓在《科學》（Science）雜志上發(fā)表的一篇深度學習文章為顯著標志，AI迎來新一輪發(fā)展高潮。

　　今年，我想大家都意識到，社會資源在AI領(lǐng)域的投入量已經(jīng)達到了不可能再消失的程度。當然，因為熱，投入不一定都是理性的，但總的來說，無論是人的資源、技術(shù)的資源還是數(shù)據(jù)的資源，等等，我認為最終都會發(fā)揮實實在在的作用。

　　《環(huán)球人物》：從科學上您如何定義“AI”？

　　黃鐵軍：AI就是制造有智能的機器，或制造有智能的系統(tǒng)——我說的系統(tǒng)是偏實體化的——這就是AI。

　　《環(huán)球人物》：目前常見的AI可以分為哪幾類？其中，哪些是已經(jīng)應用成熟的？哪些是可以期待的？

　　黃鐵軍：那就從“實”一點的角度來說吧。依據(jù)它們對產(chǎn)業(yè)、對社會發(fā)生作用的方式不同，我們可以把AI大致分為這么幾類——

　　一種我們姑且稱它為信息類的智能，如通過云、網(wǎng)、手機等各種方式提供智能服務(wù)，聊天機器人、圖像生成軟件等都屬于這一類。這是目前應用比較成熟的，也是投入最多的。

　　另一種我們稱其為具身智能，即智能落到一個特定的物理實體上，如自動駕駛、機器人等。

　　有人可能會問：今天的自動駕駛和以前我們常說的自動駕駛有什么區(qū)別？簡單來說，以前的自動駕駛主要是模仿駕校教學過程——司機看見什么，就要執(zhí)行哪些具體操作；而現(xiàn)在的自動駕駛是要具備司機進駕校之前就有的那些能力——不是左轉(zhuǎn)右轉(zhuǎn)、開快開慢那樣的技能，而是對世界的認知。這樣在行駛過程中遇到各種情況時，駕駛者才能做出合理的行動。再直白一點講，人接受50個小時駕駛培訓之后就能上路開車，牛就不行。

　　這也是如今AI賦予自動駕駛的能力，有了對世界的認知能力，才談得上具身智能。機器人也是一樣的道理。我在“對話科學家”系列活動上也說過，機器人如果將來想要走入大眾生活中，想讓老人、孩子都很滿意，那它就不能只會端茶倒水掃掃地，還得能識別情緒變化和一些微表情，這對感知能力的要求是很高的。目前具身智能應用尚不成熟，但技術(shù)道路已經(jīng)打開了，可能性已經(jīng)沒問題了。

　　還有一類智能，或許現(xiàn)在和我們的直接關(guān)系不是很大，但長遠來說會產(chǎn)生極大影響——AI賦能科學（AI for science）。我們常說科技是推動世界發(fā)展的重要力量，現(xiàn)在不少學科的研究范式比較傳統(tǒng)，AI會帶來新的范式，從而加速科學技術(shù)的進步，這種進步是躍進式而非漸進式的。

1995年5月，黃鐵軍（左）碩士論文答辯時與導師胡家忠教授的合影。

　　比如數(shù)學領(lǐng)域。之前，一個數(shù)學猜想或是一個定理的證明，需要等待某位天才數(shù)學家的智力，因此重大突破往往歷經(jīng)數(shù)十年甚至幾百年才實現(xiàn)。AI出現(xiàn)之后，很可能會改變這種局面。為什么？因為AI所掌握的數(shù)據(jù)的廣度比人類數(shù)學家都要寬，它能把所有數(shù)學分支融會貫通，而許多定理證明恰恰需要把諸多分支串聯(lián)在一起，形成一個很長的證明鏈。數(shù)學領(lǐng)域一旦有這樣的事情發(fā)生，就是一個重大數(shù)學問題被AI解決了，之后重大突破就紛至沓來。

　　再比如物質(zhì)科學領(lǐng)域。以前做工程材料要做很多實驗，大海撈針般地尋找有用的分子結(jié)構(gòu)。而現(xiàn)在可以通過AI直接預測——準確率往往還很高。鄂維南院士領(lǐng)銜的北京科學智能研究院（AISI）就在做這么一件事：在數(shù)字空間構(gòu)建出高精度原子模型，然后用不同原子相互組合成分子，分子功能可以模擬出來，大大提高了實驗效率。

　　還有生命科學領(lǐng)域，智源正在做兩個未來可能有大突破的方向。一個是做蛋白質(zhì)，用AI加速對蛋白質(zhì)的建模和理解。一個是做神經(jīng)系統(tǒng)和人的器官——目前是心臟，都在利用AI做高精度模擬。

　　做這些有什么用？以心臟房顫治療為例，醫(yī)生采用的一種方法是通過能量燒灼異常放電的心肌細胞，來達到清除異常放電灶或者隔離錯誤信號的目的。燒灼的準確與否與醫(yī)生本人經(jīng)驗息息相關(guān)。

　　如果做出與患者心臟一模一樣的數(shù)字孿生心臟，醫(yī)生就可以先在數(shù)字心臟上預演手術(shù)，尋找最佳的燒灼位置，確定后再用到患者身上，手術(shù)成功率一下就提高了很多。所以這樣的建模和模擬既可以幫助我們理解復雜對象，也能發(fā)揮實際作用，解決具體問題。

　　“理解智能”與“制造智能”

　　《環(huán)球人物》：在我國的AI發(fā)展史中，科學家們的研究思路發(fā)生過怎樣的轉(zhuǎn)變？

　　黃鐵軍：拿我個人的經(jīng)歷來說吧。我是懷著對大腦和智能奧秘的好奇進入這一行的。

　　1991年，讀大學三年級時，我恰好有個機會可以跟著導師做“863計劃”（國家高技術(shù)研究發(fā)展計劃）智能計算機主題的項目，具體是做手寫印刷體漢字識別，研究一些算法，使得手寫漢字的識別率達到一定程度。那是要解決實際問題的，也取得了一些成績。但是相比之下，我對人腦的奧秘、智能的奧秘更感興趣，我的好奇心并沒有得到滿足，它們始終困擾著我。

　　直到2010年前后，在參加“973計劃”（國家重點基礎(chǔ)研究發(fā)展計劃）期間，我和腦科學家一起工作了三四年，才終于“轉(zhuǎn)過彎了”。我發(fā)現(xiàn)之前自己一直致力于“理解智能”，試圖搞清楚大腦是怎么回事、智能是怎么回事，其實是不現(xiàn)實的。這是科學的思維方式。我轉(zhuǎn)換到了技術(shù)的思維方式——“制造智能”，即不以理解為前提，先造一個東西出來，讓其具備某種特定功能。

　　這種思維方式在人類科技史中一直廣泛存在。比如我國古代四大發(fā)明之一的指南針，最早的指南針司南在戰(zhàn)國時期就有了，可電磁場理論直到近代才出現(xiàn)。

　　再比如漢朝先民就知道用鹵水點豆腐，但他們并不理解背后的化學反應機理。美國的萊特兄弟在1903年實現(xiàn)了人類歷史上第一次駕機動力飛行，但空氣動力學理論的建立也是后來的事情。所以我意識到，必須先做出來，再試圖理解它。事實上，理解大腦、理解智能確實要比制造一個具有智能的機器難得多。

　　《環(huán)球人物》：促使您發(fā)生轉(zhuǎn)變的契機是什么？

　　黃鐵軍：主要是一種緊迫感的驅(qū)使。那時我已經(jīng)40多歲了，還有夢想，希望能在AI領(lǐng)域取得重大突破。在和腦科學家、神經(jīng)科學家的合作過程中，我發(fā)現(xiàn)，他們面對的人腦是極其龐大復雜的神經(jīng)系統(tǒng)，他們只能一點點去摸索。有人問過，腦科學什么時候能把智能的奧秘揭示出來？再樂觀的腦科學家也只會告訴你，300年后能完成就不錯了?？葾I不能等300年后再做，這就必須轉(zhuǎn)換思維方式——不告訴你為什么，能不能做？

　　人類發(fā)展依靠的是雙輪——科學和技術(shù)，不能簡單地認為科學是第一性的，技術(shù)是第二性的。就像有人說中國古代的四大發(fā)明不是科學，只是技術(shù)，是第二性的。這話既對也不對?？茖W確實是我們?nèi)笔У囊徊糠?，我們要加強科學，要問為什么、找背后的原理，但是也不能抹煞了技術(shù)的偉大。在理解科學原理之前的技術(shù)發(fā)明更偉大。技術(shù)發(fā)明和科學發(fā)現(xiàn)一樣，都是從0到1的原始創(chuàng)新。

　　《環(huán)球人物》：轉(zhuǎn)變后，您在實踐上會有什么變化？

　　黃鐵軍：就不束手束腳了。

　　科學的目標是探索事物或現(xiàn)象背后的規(guī)律，努力回答“為什么”；技術(shù)的目標是創(chuàng)造新的事物或現(xiàn)象，核心是“怎么做”，是方法論問題。

　　以制作指南針為例，需要解決的是用什么材料、打磨到什么程度它就指南這類問題。制造者并不懂“磁場”，甚至沒有“磁”的概念，但這并不意味著他做不出可以指南的裝置。

　　AI也是這樣，需要你做一個有智能的裝置，并不以理解智能機理為前提，而是要探索怎么訓練它效率高，這些事情是可以嘗試、優(yōu)化的。

　　我并不是反對大家去理解它背后的原理，但是“物有本末，事有終始，知所先后，則近道矣”?？萍紝嵺`過程中，既有科學發(fā)現(xiàn)在先、技術(shù)實現(xiàn)在后的例子，也有技術(shù)發(fā)明在先、科學發(fā)現(xiàn)在后的例子?？茖W和技術(shù)相互促進，迭代發(fā)展。

　　就AI而言，人類智能對人類來說可能永遠無法理解，但不等于我們做不出來類人甚至超人的智能。這就是技術(shù)思維和科學思維的區(qū)別。

　　“智力時代”

　　《環(huán)球人物》：目前我國的AI行業(yè)在全球版圖中處于什么位置？

　　黃鐵軍：回到AI本身，它首先是一門技術(shù)。技術(shù)發(fā)展到一定程度之后就是大工程，也就是做大系統(tǒng)。從這個意義上來說，AI領(lǐng)域已經(jīng)進入到一個白熱化的工程競爭期，有些開放，也有些不開放，這就很難比較誰快誰慢。

　　必須強調(diào)的是，在工程技術(shù)的探索過程中，資源的投入、人的投入將會起到?jīng)Q定性作用。在信息類智能、實體類智能以及AI對科學的賦能上，我們都還有很多機會?，F(xiàn)在只是一場馬拉松開跑了，大家都在拼命地往前跑。

黃鐵軍正在調(diào)試一臺視覺研究領(lǐng)域的設(shè)備。

　　AI是通用型技術(shù)，就像電力技術(shù)等所有通用技術(shù)一樣，不會被某一家企業(yè)壟斷，也不會被某個國家或地區(qū)壟斷。它基本的方法論大家都知道，只是具體到解決某個特定問題時，有的會快一點，有的會慢一點而已。

　　這不是誰勝誰負的問題，這是一個時代——我把它稱之為“智力時代”，全世界都在往這個方向發(fā)展。這個時代至少會持續(xù)幾十年，甚至上百年，未來也不會消失，它將是社會運行所需的重要基礎(chǔ)設(shè)施。

　　《環(huán)球人物》：為什么發(fā)展AI這么重要？

　　黃鐵軍：我認為，人類進化史、地球演化史歸根結(jié)底都是智能的進化史，本質(zhì)是智力水平的不斷提高。

　　幾年前，我全程參加了我國《新一代人工智能發(fā)展規(guī)劃》的建議、起草和實施。《規(guī)劃》的第一句話就是“人工智能的迅速發(fā)展將深刻改變?nèi)祟惿鐣?、改變世?rdquo;。我非常幸運地趕上了這個時代，能在智能進化史中發(fā)揮一點作用。

　　《環(huán)球人物》：目前有哪些風險需要提前考慮？

　　黃鐵軍：我們現(xiàn)在重視發(fā)展的是通用人工智能（General Artificial Intelligence，GAI），也就是具有通用性的AI，它不以超越人類為目標。

　　但我們也應該注意到，世界正處于由通用人工智能向人工通用智能（Artificial General Intelligence，AGI）邁進的歷史時期。這里的AGI就是所謂的“超級AI”，也就是全面超越人類的AI系統(tǒng)?，F(xiàn)在我們就要考慮這個問題：AGI如果出現(xiàn)，我們怎么辦？也許有人認為這是杞人憂天，但我認為這是個很現(xiàn)實的問題，可能性是存在的——我認為這個時間會在2045年左右，還有人認為是在10年內(nèi)甚至更短。我們要迎接這個重大挑戰(zhàn)。

　　“人工智能之父”艾倫·圖靈在1950年那篇劃時代的論文《計算機器與智能》里寫過這樣一句話：“我們能做到的，比我們能看到的要多得多。”我很贊同。

　　要去預測科技的進步是很難的，真正的科技進步主要是通過嘗試和實踐得來的，這個過程中會出現(xiàn)很多意想不到的新東西。2015年我在《人類能制造出“超級大腦”嗎？》這篇文章中還引用了圖靈這句話，我把它翻譯為：“吾等目力短亦淺，能見百事待踐行。”（本文圖片除特別標注外，皆為受訪者提供）

我要糾錯