從1979年到2023年,44年的進程中,我國的AI事業(yè)從發(fā)展理論到實踐、從科技到產(chǎn)業(yè)、從前沿到熱門。《環(huán)球人物》記者尋訪了2023年活躍于AI領域的各種從業(yè)者,包括頭部企業(yè)的核心研發(fā)人員、“雙一流”高校人工智能專業(yè)的青年學子、因AI而生的新興崗位員工,并向他們提出同一個問題:為什么進入AI行業(yè)?
回答很多,但繞不過那么一條路徑:被震撼、被吸引,自動入局。他們相信:AI將以不可思議的速度,重塑我們的生活,比如,今年AI領域最前沿的成果——大模型。
2023年7月,世界人工智能大會上大模型應用火爆,觀眾拍攝展區(qū)AI生成的繪畫作品。
三四秒內(nèi)輸出極為生動的AI畫作,自主生成可以運行的標準代碼,模仿魯迅語氣寫成一篇小說……大模型讓他們發(fā)現(xiàn),AI不僅可以輔助人,還可以像人一樣??拼笥嶏w副總裁、研究院院長劉聰是星火認知大模型誕生的關鍵人物,他告訴《環(huán)球人物》記者:“大模型在AI技術和應用上的歷史意義,或許不亞于互聯(lián)網(wǎng)和個人電腦的誕生。”
如果要形容這些AI從業(yè)者,那就是:他們像一群嗅覺高度靈敏的“AI獵人”,聞到一絲未來的氣息,便孜孜不倦緊追獵物的蹤跡。他們生機勃勃,充滿野心,不愿錯過“智力時代”的快車。
研究院院長:大模型的“智能涌現(xiàn)”
在科大訊飛研究院,從院長劉聰、副院長劉權(quán),到研究院首席科學家魏思,都愿意把2023年這場研究風暴的起點向前延伸幾個星期,放到2022年的12月7日。
那一天,在合肥高新區(qū)望江西路666號科大訊飛A4樓5層北側(cè)的會議室里,投影上播放著劉權(quán)花了一周時間調(diào)研寫的分析報告,PPT整整有100頁,提出一個鄭重的建議:借鑒國際上的思路,在重要認知智能任務中開始研究,并研制一個中等大規(guī)模預訓練模型。
劉聰支持這個結(jié)論。這場會議結(jié)束了研究院內(nèi)部此前的激辯:大模型究竟意味著什么?科大訊飛要不要跟進?
當然要跟進。此前人們已經(jīng)熟悉的AI,都是把算法內(nèi)嵌在音箱、新聞推薦、翻譯客戶端等各種已有的產(chǎn)品和功能里;大模型則第一次把大數(shù)據(jù)、大算力和大算法成功地結(jié)合起來,從而實現(xiàn)了在人與AI的互動中,AI能夠“跨界”執(zhí)行各種任務,即使那是專業(yè)領域的任務。
究其背后的邏輯,劉聰稱之為大模型的“智能涌現(xiàn)”。對此,獵豹移動董事長傅盛有一個特別形象的說法,在他看來,AI的語義理解有兩種技術路線:一種是學外語模式,“教你什么是主謂賓、定狀從等,給它輸入知識圖譜,把整個世界的認知整理成各種枝節(jié)告訴計算機”。一種是學母語模式,“一個小孩子,不用教他語法規(guī)則,只要跟他說話就行,說著說著他就開口了”。大模型就是后者。當研發(fā)者使用更大的模型(參數(shù)規(guī)模從上億提升到上百億甚至上千億)、給到更多的數(shù)據(jù)時,“它的邏輯能力一下就上來了”,傅盛說,這就像接龍一樣,輸入一些字,就能蹦出接下來的詞。
“大模型的‘智能涌現(xiàn)’實際上推動了通用人工智能的技術階躍,讓大家看到了當前由弱人工智能邁向通用人工智能最有希望的路徑。”劉聰向《環(huán)球人物》記者解釋道,“我們已經(jīng)經(jīng)歷了計算機生態(tài)系統(tǒng)、移動互聯(lián)生態(tài)系統(tǒng)和搜索生態(tài)系統(tǒng),推動了從硬件到軟件、應用的一體化發(fā)展。大模型也將為海量應用賦能,反過來又促進自身的迭代,即將建立全新的產(chǎn)業(yè)生態(tài)。”
劉聰?shù)贸鼋Y(jié)論:“這一輪的新浪潮已來。”
2023年10月,劉聰在第二十五屆中國科協(xié)年會上發(fā)言。(受訪者供圖)
劉聰是一個務實的人。乍看上去,他的經(jīng)歷如他所說,“很像一場說走就走的旅行”。2001年他進入中國科學技術大學學習,專業(yè)是電子信息工程。很多人記住了這個戴著眼鏡、臉方方正正的青年,他不愛上課,也不愛上自習,但是很會考試,他的作業(yè)也一直是供全班同學參考的版本之一。2004年他進入中國科學技術大學的語音與語言信息處理國家工程實驗室,后來有一天,他被叫到科大訊飛研究院面試實習生崗位,“結(jié)果稀里糊涂地闖入了AI的世界”。
劉聰很快發(fā)現(xiàn),自己還是對做應用于實際的系統(tǒng)更感興趣。由劉聰主導完成的業(yè)界首個中文語音識別系統(tǒng),發(fā)展到如今,其系列產(chǎn)品已成為律師、記者等的必備工具。每當科研人員提出一個新構(gòu)思時,劉聰喜歡給他們加個框,“你做出來我才說你牛”。
這種務實也延續(xù)到這次大模型的攻關研發(fā)中。2022年12月15日,在那場會議后一周,科大訊飛正式啟動了“1+N”的大模型攻關。
“1就是通用認知智能大模型,N就是大模型在教育、辦公、汽車、人機交互等各個領域的落地。研發(fā)通用大模型需要的投入很大,隨著時間的拉長,投入還會更大,甚至投入了也不一定立刻變現(xiàn)。但對于科大訊飛來說,我們必須抓住那個1,從第一天開始,就是對標通用人工智能去做的。”劉聰形容2023年是把科大訊飛的資源“壓上去”,因為“慢一步,錯過的就是整個浪潮”。
對這場攻關的前景,劉聰有信心:“普通人會覺得,大模型是在2022年橫空出世的,但其實,它背后是深度學習和自然語言理解技術的長期積淀。”
劉聰主導的中文語音識別系統(tǒng)是在2011年上線的,當時就是走深度學習的技術路線。同年,科大訊飛研究院開啟了語義理解相關研究。“目前,我們在核心算法、行業(yè)數(shù)據(jù)、算力支撐方面都有深厚的基礎。”劉聰告訴《環(huán)球人物》記者,以核心算法為例,變壓器網(wǎng)絡(Transformer)這種基于自注意力機制的深度學習算法,奠定了大模型預訓練算法架構(gòu)的基礎,已經(jīng)在科大訊飛的語音識別、機器翻譯等任務中有了深入的應用。
不只是科大訊飛,中國AI技術和產(chǎn)業(yè)的迅速發(fā)展,離不開國家的大力支持和前瞻布局。早在2017年7月,國務院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,是首部國家層面的AI發(fā)展規(guī)劃。同年11月,《新一代人工智能發(fā)展規(guī)劃》暨重大科技項目在京啟動,公布了首批國家新一代人工智能開放創(chuàng)新平臺名單:依托百度公司、阿里云公司、騰訊公司和科大訊飛公司,分別建設自動駕駛、城市大腦、醫(yī)療影像、智能語音國家新一代人工智能開放創(chuàng)新平臺。由此,這四家平臺被稱為“中國AI發(fā)展的四小龍”。
大學生:追著潮頭跑
也是在2017年,21歲的梅朗在中國人民大學(以下簡稱人大)計算機科學與技術系讀研。時代的風吹來,他能明顯地感受到湖面的波動。“起初,深度學習算法的效果還比不上傳統(tǒng)的機器學習,但到了2017年左右,它逐漸在很多傳統(tǒng)任務上完成了追趕和超越,在搜索引擎、推薦系統(tǒng)、分類預測、文本挖掘等小模型的落地上做得很好、很新,特別多新的創(chuàng)意一直在冒出來。”
2023年12月,梅朗接受本刊記者采訪。(本刊記者 侯欣穎 / 攝)
這種“新”帶給梅朗巨大的興奮,他至今懷念那段時光。同宿舍4名男生一聊起AI的發(fā)展,都是天馬行空、滔滔不絕。“我們有一個共識,不管是工業(yè)界還是學術界,AI可供探索的方向、機會太多了。我們當時討論了特別多問題,像什么樣的AI發(fā)展模式是合理的,AI跟哪些行業(yè)結(jié)合更重要,什么模型類別更好用,等等。越討論,越對這個方向感興趣。”
機會來了。2019年3月,人工智能專業(yè)被列入新增審批本科專業(yè)名單,共有35所中國高校獲得首批建設資格。翌年3月,獲批高校增加180家,人大即在此名單里。
碩士畢業(yè)后,梅朗沒有猶豫,選擇在人大高瓴人工智能學院讀博,研究方向是預訓練語言模型與信息檢索——其中,預訓練語言模型成為主流方向不超過5年,卻已經(jīng)成為大模型開發(fā)的關鍵,其作用相當于給一座房子打地基。“基座大模型就像一個剛出生的孩子一樣,已經(jīng)被喂了一大堆語料庫,但還需要復雜指令的引導、判別和獎勵等機制,才能生成正確的、盡可能優(yōu)質(zhì)的內(nèi)容。難點是讓它理解語義層面的關聯(lián)性,就像你要完成一個‘完形填空’,你問它《三國演義》中有什么樣的斗智斗勇的情節(jié),它可以給出‘數(shù)不勝數(shù)’,而不是‘不慌不忙’。這說明它的計算能力比較強了。”梅朗用盡可能通俗的語言解釋道。
梅朗的室友們也都選擇了讀AI方向的博士,“有研究數(shù)據(jù)庫系統(tǒng)的,有研究AI與多智能體博弈論的,還有研究AI與計算生物大模型的”。當年在宿舍里暢談的年輕人,已經(jīng)成為未來中國AI發(fā)展的后備軍。
就讀后,“開放”成了人工智能專業(yè)帶給梅朗最深刻的感受。
人工智能專業(yè)注重理論,但也強調(diào)實踐,而這意味著巨額的成本投入。“硬件投入是大頭,而電費、購買數(shù)據(jù)、人工標注的費用也都不能小覷。”梅朗給《環(huán)球人物》記者確認了一組數(shù)據(jù),以訓練210億參數(shù)規(guī)模的模型為例,約需450G的顯卡存量,1張80G的A100顯卡是10萬多元,加上內(nèi)存、計算機處理器等的花費,那硬件就要100萬元。A100顯卡的額定功率近500瓦,一個月的電費至少是5000元。業(yè)界甚至有一個真實的段子,搞AI的從不回家加班,因為家里的設備干不了“高級活”。
因此,在深度學習算法剛開始深入推進時,“大家想的是能不能先做一些有效的專用任務小模型”。梅朗說,隨著越來越多不同行業(yè)有效的小模型的運行、高性能計算軟件生態(tài)的建設、硬件設備算力的升級、預訓練效果在下游任務的證實,到2019年,大模型就闖入國內(nèi)一些前瞻人士的關注視野,像華商AI、智譜AI等。
也因此,國內(nèi)高校人工智能專業(yè)基本上采用的是“校企合作”“產(chǎn)學結(jié)合”的模式。“我們得利用企業(yè)財大氣粗的計算資源。”梅朗開玩笑道。他所在學院的人工智能聯(lián)合實驗室就是和中國聯(lián)通合作成立的,未來媒體智能聯(lián)合實驗室則是和快手一起成立的,還有很多研究課題在騰訊、阿里、京東、字節(jié)等企業(yè)落地應用。
很少能在哪個行業(yè)看到,學界和業(yè)界的聯(lián)系如此緊密。以往,理工科發(fā)表論文,最主要的渠道是投稿給學術期刊。“線上跟審稿人打交道,等發(fā)出來,半年、一年就過去了。”對于緊跟前沿技術、瞬息萬變的AI學科來說,這簡直無法想象。怎么辦?梅朗指了指學院的會議室,半個月前,這里剛剛聯(lián)合小米舉辦了“大模型:前沿技術與未來應用”學術論壇。“學術網(wǎng)站和院校,每年都會集中學界、業(yè)界現(xiàn)場開會,坐下來談。很開放,會議不光分享研究類論文,還有工業(yè)類論文。”
在一些頂級會議的審稿機制上,組委會開放了整個評審過程?!董h(huán)球人物》記者打開梅朗發(fā)來的網(wǎng)頁鏈接,那是一個充滿了專業(yè)術語的頁面,一個接一個的陌生詞——循環(huán)碼、卷積網(wǎng)絡、貝葉斯誤差、神經(jīng)云……普通人看不懂這些術語,但能看到頁面里匯聚了各種意見,評審團的征詢、作者的回復、其他人的評論,討論具體到每一個數(shù)據(jù)的來源、每一道工序的合理性,很少有修飾詞。梅朗也常常登錄這個網(wǎng)頁,看一看領域內(nèi)的最新研究。
這種感覺就像是大家都在追著潮頭跑,都擔心落在了后面。“甚至很多最新成果不是發(fā)表在學術會議上。畢竟學術會議有時也會經(jīng)過三四個月的審稿,我們好多老師是直接把數(shù)據(jù)、技術代碼往業(yè)內(nèi)的公開社區(qū)一丟,大家也會引用。有的組嘛,跟前沿跟得很快,會吐槽說:怎么今天這個方向全球又釋放了十幾篇文章?!”梅朗說。
對本科生而言,人工智能專業(yè)的開放性還體現(xiàn)在不同學科間的深度交叉上。因為涵蓋多個學科的知識和技術,四川大學(以下簡稱川大)人工智能專業(yè)學生史笑涵要學習三大類課程:微積分、高數(shù)、概率統(tǒng)計、矩陣優(yōu)化等數(shù)學類課程;操作系統(tǒng)、計算機組成原理、數(shù)據(jù)庫、編程語言等傳統(tǒng)的計算機類課程;以及神經(jīng)網(wǎng)絡、深度學習等與人工智能相關的課程。
川大是國內(nèi)首批新增人工智能專業(yè)的高校之一,專業(yè)被設置在計算機學院下。史笑涵是第二批2020級新生。
根據(jù)史笑涵的觀察,川大人工智能專業(yè)對高考的數(shù)學和英語成績要求較高,“以我們省生源為例,數(shù)學至少得168分(滿分200分)且英語至少是108分(滿分120分),我的數(shù)學和英語成績分別是170分和109分”。同時,學生還得通過學院的選拔考試。史笑涵聽說,第一屆招收40名學生,有100多人報名。但因為AI交叉學科的特點,學習難度高,到了她們這屆,報名人數(shù)少了一大半。之后,AI在業(yè)界越來越熱,報名人數(shù)才又多了起來。
作為早早踏入人工智能專業(yè)的本科生,有時,史笑涵也忍不住吐槽:“本科有些基礎課程很像。像手寫數(shù)字識別的實驗,我在3門課上都做過。”但更多時候,她有機會結(jié)合自己對醫(yī)學的興趣,接觸到AI在醫(yī)療領域最前沿的應用。她就參加了和醫(yī)學院同學合作的學術項目,利用AI識別病灶、輔助診療。“醫(yī)學圖像處理在實驗室里做得比較好,落實到醫(yī)院里,還是有很多小問題,比如數(shù)據(jù)格式不匹配,導致模型識別準確率低甚至無法使用。”
梅朗也說,AI將賦能到各行各業(yè),人工智能專業(yè)作為交叉學科,這種交叉性還遠遠沒有體現(xiàn)出來。它未來可以和各種科學問題結(jié)合,“比如,全球氣象災難預測模型,芯片電路的設計模型,可以讓AI決定怎么布線,怎么節(jié)省能源”,這些更需要既懂人工智能,又有相關領域背景知識的新生代人才。
AIGC產(chǎn)品經(jīng)理:崗位噴發(fā)
人們都覺得AI行業(yè)迎來了春天,但《環(huán)球人物》記者采訪到的業(yè)內(nèi)人士則說,這個行業(yè)正在尋找春天。
北歌(化名)2020年碩士畢業(yè),學的是建筑專業(yè)。在校時,她就做過考研培訓類的相關創(chuàng)業(yè),經(jīng)歷了本專業(yè)的培訓咨詢從暴漲到無人問津的尷尬。這對她的沖擊很大,“個人的努力還要跟得上時代的變化,變化已經(jīng)來了,就要找一個杠桿,撬進去”。畢業(yè)后,她先是在一家服務于政府部門的公司做智慧城市的產(chǎn)品,比其他人更早意識到AI的發(fā)展趨勢,后來轉(zhuǎn)型為計算機視覺產(chǎn)品經(jīng)理,推動AI視覺技術的產(chǎn)品化。
今年,隨著各家企業(yè)紛紛入局,招聘網(wǎng)站上開始出現(xiàn)專注于人工智能生成內(nèi)容(AIGC)的產(chǎn)品經(jīng)理、提示詞工程師、AIGC算法工程師等新興崗位。“之前都是籠統(tǒng)地叫AI產(chǎn)品經(jīng)理,這些崗位的出現(xiàn)不會早于4月。”北歌觀望了一陣,從6月開始,就嘗試著向這些新興AI崗位投放簡歷。
新興AI崗位招聘缺口大,簡歷投出去都有聲響,但面試完就沒有回音了。有一位面試官和她聊了快一個小時,最后建議她:不要把之前的經(jīng)歷寫得那么好,即使你已經(jīng)做出了不錯的產(chǎn)品,也不要把重點篇幅放在這上面,你要用他們想了解的、跟招聘相關的東西來聊。北歌一下子被點醒了,“我感覺到,我說的小模型和他們講的不是一個東西”?;丶液螅J真學習了大模型的開發(fā)框架、開發(fā)原理等內(nèi)容。
兩個月間,北歌面試了十幾家公司。除了對她過往產(chǎn)品經(jīng)歷的考察外,面試官基本上都重點問了她對于AIGC的認知和場景的洞察,還有對于大模型能力的技術理解與認知。“問我AIGC的創(chuàng)業(yè)方向,有哪些落地場景和應用,落地過程中,產(chǎn)品經(jīng)理的核心職責是什么,等等。”北歌有一種強烈的感受:“不光是我在學習,面試官也在學習,我們是互相學習的一個狀態(tài)。”
北歌最終得到3個入職機會,她在8月入職了一家專注于大模型技術研發(fā)的公司。公司屬于行業(yè)內(nèi)的一級梯隊,北歌充滿了干勁。“每家招聘的AIGC產(chǎn)品經(jīng)理工作內(nèi)容都不一樣,有純做大模型迭代的,也有專做垂類應用的。我主要是對接甲方需求,把需求轉(zhuǎn)化為功能點,給不同行業(yè)賦能。”北歌解釋道,“經(jīng)過了預訓練的基座大模型,就像一個孩子已經(jīng)上完學,從大學畢業(yè)了,畢業(yè)后,他要去哪個行業(yè),具體做什么,怎么適應行業(yè)需求,還要再微調(diào)。”
和甲方談下來,北歌常常遇到兩種極端情況。“一種情況是,約了客戶提需求,對方想了半天,一個需求也提不出來。另一種是把大模型當許愿池,以為它什么都能做,但其實,它是有能力邊界的,這個邊界在哪兒,現(xiàn)在還是黑盒狀態(tài)。客戶說了,我們再去嘗試看能不能做,包括其他家能不能做、怎么做的,我們也都不知道。不是技術有隔閡,而是認知有隔閡。”
這跟她當計算機視覺產(chǎn)品經(jīng)理時完全不一樣,她將那個時期稱為“AI1.0時代”,盡管計算機視覺產(chǎn)品經(jīng)理崗位也不過出現(xiàn)于2019年左右。“在AI1.0時代,是一個模型解決一個事兒,用無數(shù)個小模型解決行業(yè)問題,已經(jīng)形成了一套通用標準。比如,為餐飲行業(yè)賦能,標準是‘明廚亮灶’,AI檢測桌子整不整潔,有沒有老鼠,人穿沒穿工服,垃圾桶蓋沒蓋。”
大模型到底怎么落地?做到現(xiàn)在,似乎也沒有標準答案。北歌經(jīng)常做的場景有三類:一類是搭建行業(yè)的知識手冊,把對方的數(shù)據(jù)源和應用程序編程接口交互,就能回答專業(yè)問題;一類是助力內(nèi)容創(chuàng)作。用戶輸入需求要點,大模型就可以自動生成發(fā)言稿、匯報材料等;還有一類是虛擬助手。“大家期待它最終進化為AI代理人(AI agent)的形態(tài),給它一個目標,它就能完成剩下的全部工作。讓AI點外賣,它不只是跟你推薦這個、推薦那個,未來就是它理解了你的需求,鎖定了你的喜好,自動調(diào)出外賣平臺下單,如果這家店關門了,它還會搜索類似的店重新點”。
這就是商業(yè)世界,當所有人看到不確定性時,往往也意味著巨大的可能。北歌的同事大多和她有著類似的經(jīng)歷,一群“90后”“95后”,有人甚至沒有做過AI產(chǎn)品,來自傳統(tǒng)的計算機行業(yè),平薪或是降薪,甚至換了工作的城市,來到大模型行業(yè)。“大家都很有熱情。”北歌說。一些印證是,采訪那天是一個周末,她正和幾位朋友約了吃火鍋,大家都剛轉(zhuǎn)到這個行業(yè),席間的話題全圍繞著工作內(nèi)容。平日里上下班途中,她也會抓緊時間,把行業(yè)動態(tài)和個人心得及時更新到社交平臺上。
計算機視覺、語音技術等AI技術已經(jīng)在人們的日常生活中廣泛應用。圖為2023年杭州亞殘運會上,通過3D虛擬人技術、計算機視覺、機器翻譯、語音技術打造的智能AI手語翻譯官“小莫”。
在AI的新浪潮面前,何止北歌這一桌人,誰也不敢放松。劉聰就說過:因為錯一個東西,3個月就過去了。2023年10月24日,科大訊飛發(fā)布了星火認知大模型V3.0版本。“搭載星火認知大模型,科大訊飛在不同領域都進行了產(chǎn)品升級和發(fā)布新的應用,此次發(fā)布了訊飛曉醫(yī)、星火科研助手、AI心理伙伴等。”劉聰說。V3.0版本發(fā)布那一天,在場的觀眾們看到,劉聰上傳了和女兒的日常聊天記錄后,請AI給女兒寫一封道歉信,很快,對話框中就彈出了信的內(nèi)容,用的是劉聰?shù)目谖?mdash;—這或許是大模型的下一個方向:讓AI更有個性和人設。
除了科大訊飛,今年4月以來,小米、商湯、360、毫末智行、昆侖萬維等,幾乎每周都有一場科技公司的發(fā)布會,宣告大模型的出世或預告大模型的出世。北歌覺得,這就像星星之火,大家都在期待著這把火可以燎原,那將是人類邁向通用人工智能的未來。