中國經濟體制改革研究會

　　美國OpenAI公司最近發布“文生視頻”大模型Sora，又一次引起各方對人工智能問題的廣泛關注和熱烈討論。筆者也談點看法。

　　客觀理性看待人工智能技術。近些年，生成式人工智能以超乎人類想象的速度和規模迅速發展。以生成式人工智能為代表的科技革命正在加速演進。對人類文明的影響堪比火的發現和使用、青銅器發明和使用、蒸汽機發明和使用、互聯網發明和運用。如果說火的出現使人類結束了茹毛飲血的原始狀態，青銅器的出現使人類農業文明得到了空前的發展，蒸汽機的出現使人類進入了工業文明時代，互聯網的出現使人類進入了數字經濟時代，那么人工智能的革命，特別是生成式人工智能的出現，將把人類社會帶入到一個更新更高層次的時代，這個時代或許可以稱作為“硅基”經濟時代。如果說第四次產業革命已經到來，那標志性的技術就是人工智能，特別是生成式人工智能。過去三十年發生了三個一百萬倍，計算機的算力增強了約一百萬倍，存儲容量增加了約一百萬倍，通信速度增加了約一百萬倍。海量數據采集、“硅基”超強算力、算法，讓人類社會的工作、生活、學習都發生了天翻地覆的變化。人工智能為代表的科技革命已經和正在顛覆人類傳統的認知。在我們剛剛熟悉互聯網、大數據、云計算，還沒怎么完全弄明白區塊鏈、元宇宙的時候，ChatGPT(聊天生成預訓練轉換器)，GPT4橫空出世了。美國OpenAI人工智能公司推出的ChatGPT不僅是人工智能領域的一個巨大的飛躍，“硅基生命”將會取代“碳基生命”的奇點會不會出現?何時出現，出現后會發生什么，目前是仁者見仁，智者見智。OpenAI正在開發一款比GPT4更強大的GPT5。據悉，該系統已經完成了對人類網絡上所有視頻的學習，可以瞬間標記出所有它看過的視頻中的一切聲光信息，并且能夠準確預測任何一個人的未來行為和壽命。這一動態引發了人們對于AI的恐懼和擔憂，有人甚至認為，GPT5將是人類智慧的終結者，最終無生命的“硅基生命”取代“碳基生命”的人類在這個世界上的地位和作用。就連號稱“AI教父”的辛頓也認為，面對“失控AI”，拔電源就好，恐怕你做不到!恐懼歸恐懼，擔憂歸擔憂。但不可否認，GPT5令人驚嘆地展示了AI技術的巨大潛力。以至于以辛頓、馬斯克、比爾·蓋茨等一大批科學家聯名建議，對GPT5開發或許應放慢腳步，認真研究一下可能會對人類社會的危害。

　　當人們的注意力剛剛開始集中在GPT5的時候，2023年12月7日，谷歌公司推出的多模態人工智能大模型Gemini一夜爆紅，再次引起全球轟動，成為人工智能領域又一項重大突破。其多模態推理能力，理解文本、圖像、音頻等內容的能力和高級編碼能力，不僅有助于理解復雜的書面和視覺信息，在大規模的數據提取中識別微小的差異點，通過閱讀、過濾和理解信息，從成千上萬的文檔中提取獨到的信息和見解，有利于未來在從科學到金融等眾多領域以數字化的速度實現新的突破，而且經過訓練，Gemini可以同時識別和理解文本、圖像、音頻及更多內容，更好地理解細微信息，回答與復雜主題相關的問題，并擅長解釋數學和物理等復雜學科的推理。同時，還可以理解、解釋和生成主流的編程語言(如Python、Java、C++和Go)的高質量代碼，能夠跨語言工作并推理復雜的信息。這種人工智能引領的日新月異的科技革命，確實正在刷新人類的認知。其催生的生產力的革命性變革及由此對社會生產關系調整的巨大推動是大勢所趨。

　　前不久OpenAI又推出了一款“文生視頻”Sora，使關于人工智能的討論再次成為熱門話題。關注度主要集中在Sora可以按照文字指令生成長達1分鐘視頻的強大能力。有的認為Sora創新的模型架構為大模型的發展開辟了新道路，也有的認為Sora的推出讓通用人工智能(AGI)到來的日期大大提前。360創始人周鴻祎就聲稱，Sora的誕生意味著AGI實現時間可能從10年縮短至一兩年。當然也有種看法認為Sora只是OpenAI的一種營銷炒作。其實“文生視頻”早已有之并不新鮮。業內已經存在Runway和Pika等功能相似的AI視頻生成、視頻編輯模型。這些模型可以基于文本提示、2D圖片等生成短視頻，由靜態圖像衍生出動畫，修復、替換或插入新的視覺元素，以及將鏡頭擴展到原始幀之外，填充上下文相關內容的“畫外畫”等。Runway去年8月推出的第二代模型，每次就可生成最高18秒的視頻。相比之下，Sora的升級和突破之處在于，可以一次性生成一分鐘的視頻。視頻的質量和逼真度更高，更像真實世界，還實現了“時空一致性”，也就是即便對視頻進行擴展，它也能夠賦予模型“前瞻性”，確保視頻主題在畫幅外也能保持不變。Sora發布的“時尚女性走在繁華街頭”的視頻示例，就很像是一部廣告短片或電影片段，人物和場景基本上挑不出明顯問題，身體的運動、頭發的細節、霓虹燈反光顯得尤其逼真，這是“碾壓”吊打Pika和Runway等其他早期模型的地方，也是在過去不可想象的。

　　毫無疑問，Sora將促使人工智能進一步引領新一輪行業變革。擁有強大功能的Sora已然具備了通過AI創建電影的可能性，令IT界、藝術界、廣告界、影視界和普通愛好者興奮不已，特別是對影視、視頻、廣告等行業或將帶來不小的沖擊。與此相關的產業感到擔心是很自然的。這些輸出的視頻可以作為“鏡頭”縫合成一部電影。這也是人們對于Sora功能的預測感到“惶恐”的地方。畢竟與之前的同類工具相比，Sora似乎帶來了巨大的飛躍。的確，由文生文本、文生圖像到文生視頻，又由秒視頻到分甚至更長時間的視頻，確實是個飛躍。單純從目前的視頻輸出樣本來看，Sora是迄今為止最令人印象深刻的視頻生成模型，其“現實主義效果”將有望在高端娛樂中發揮作用。從而改變行業的業態，催生出新業態、新賽道，甚至對某些行業產生顛覆性的影響。

　　但對Sora影響也不能談虎色變。人工智能還是有他的自身局限性。這種局限性使其不可能無所不能取代人腦智能。像電影制作，無論規模還是技術，這種使用文本提示和條件參數生成的視頻，要保持角色和場景的連續性是個難題。除了連續性不足，Sora模型還會“誤解”現實世界里的造型和行為，在圖像和視頻輸出中出現肉眼可見的“物理性失敗”。近日網絡上也在熱傳一個Sora模型的“失敗案例”。鏡頭中的椅子仿佛有了生命般走動，完全超出真實世界的物理可能，畫面中還有人甚至“憑空消失”，此類“失誤”除了讓人啞然失笑，也說明Sora想要創作出類似電影的東西從而顛覆影視業還有很多問題要解決。此外，版權等法律方面問題也直接影響Sora的使用。在實際運用中，如果Sora快速生成概念圖、角色造型和分鏡動畫，幫助創作者挑選方向也許還可以，但如果某個有趣的概念角色、場景真的被選中用于實拍，無論是電影、電視還是游戲制作，依然面臨侵權索賠和版權保護追溯的風險。因此要客觀看待Sora及其影響。今年1月谷歌發布AI視頻模型Lumiere時，就坦承“使用這一技術時，的確有創建虛假或有害內容并被濫用的風險”。

　　除了Sora，對其他技術路線的人工智能也引起高度重視?，F在的包括Sora在內的GPT，Gemini，Neuralink三條技術路線。谷歌DeepMind推出Gemini擁有「視覺」和「聽覺」，還有學習和推理能力。最大亮點之一就是原生多模態大模型，具有處理不同形式數據(語言+聽力+視覺)的能力;一開始就在不同模態上進行預訓練，利用額外的多模態數據進行微調?，F在最值得關注的是馬斯克弄的腦機接口(Neuralink)技術。目前已開始人體試驗，這將打破人機界限。Neuralink恐怕才是繼OpenAI的GPT、Sora和谷歌的Gemin之后，新的全球關注熱點。人類患者已經接受了大腦植入芯片，為未來的神經科技應用開啟了無限可能。芯片與大腦的無縫對接，重塑因神經系統疾病或損傷而失去的功能，將使人類社會正步入一個嶄新的科技紀元，人與機器的界限在這一刻變得模糊不清。

　　認為Sora只是OpenAI的一種營銷炒作也有一定道理。SamAltman前不久表示，自己需要7萬億美元建起全球的芯片帝國，他已經在全球搜羅金主，包括中東土豪。7萬億，7后12個0,這是什么概念?2023年全球芯片的銷售額達到了5270億美元，預計到2030年會增至每年1萬億美元。根據行業組織SEMI的估計，去年全球半導體制造設備的銷售額約為1000億美元。據說OpenAI早已陷入芯片荒。訓練GPT-4，用了大約25000塊A100GPU。而訓練GPT-5，還需要5萬張H100。如今，英偉達的H100售價為2.5萬至3萬美元。7萬億美元的巨額投資，已經遠遠超出當前全球半導體產業的規模。根據證券行業和金融市場協會的統計，去年美國公司總共發行了1.44萬億美元的債務。而美國市值高技術產業TOP2的兩家公司微軟和蘋果，市場總值也不過6萬億。在缺芯片缺投資的情況下，適時的推出Sora，對于融資來講，也許不失為一種非常高明的營銷策略。

　　我國人工智能發展的機遇和挑戰。對我國而言，生成式人工智能將革命性地推動科技創新和產業創新，特別是以顛覆性技術和前沿技術催生新產業、新模式、新動能，促進新質生產力發展。2024年1月22日國務院常務會議，研究部署推動人工智能賦能新型工業化有關工作。強調要以人工智能和制造業深度融合為主線，以智能制造為主攻方向，以場景應用為牽引，加快重點行業智能升級，大力發展智能產品，高水平賦能工業制造體系，加快形成新質生產力，為制造強國、網絡強國和數字中國建設提供有力支撐。我國已經成為人工智能領域的大國之一。黨的十八大以來，我們國家在基礎研究方面的投入巨大，人工智能的發展有了非常好的沉淀。一些關鍵核心技術，中國已經走在了世界前列，比如說人臉和語音識別技術。中國人工智能的發展與各行各業的結合和滲透是非常高的，其應用和推廣也不亞于其他國家。我國人工智能發展的創新生態環境已經初步形成。如百度的無人駕駛、阿里的城市大腦、騰訊的智能醫療、科大訊飛的語音識別、云知聲的物聯網、商湯的圖像與視頻處理等開放平臺以及華為、寒武紀、?？低暤葘嶓w經濟領域平臺已經創建。全球人工智能指數排名，中國屬于第一梯隊，緊隨美國，在人才、教育、專利產出等方面均有所進步。中美兩國引領、呈梯次分布的全球人工智能發展總格局保持不變。四大優勢護航中國人工智能發展。第一個是政策優勢，人工智能已被列為國家優先發展事項。第二個是海量數據資源優勢，中國人口是美國的四倍多，手機群體和手機消費、支付量也是最大的，擁有龐大的消費、出行、醫療、旅游、物流等數據資源。第三個是應用場景優勢，我國是發展中國家，很多基礎設施還不夠完善，這恰恰給人工智能的應用提供了一些深度場景。比如城鄉的基礎設施、醫療、教育、民生服務等領域的問題，人工智能系統的介入，問題可以快速得到解決。第四個是青年人才優勢，我國高等教育毛入學率已達59.6%，而且學理工科的學生比例很高，這是一個非常大的人才儲備庫。國家自然科學基金委員會專門設立人工智能一級學科代碼，資助相關基礎研究、前瞻性探索和應用研究。當前，我國在載人航天、探月探火、深海深地探測、超級計算機、衛星導航、量子信息、核電技術、大飛機制造、生物醫藥等領域取得一系列重大創新成果。我國新能源汽車生產累計突破2000萬輛、工業機器人新增裝機總量全球占比超50%、超高清視頻產業規模超過3萬億元、第一批國家級戰略性新興產業集群已達到66家，彰顯產業基礎好、市場需求大的獨特優勢。此外，備受關注的鋰電池、光伏、新能源汽車等“新三樣”行業近年來發展比較快，在國際市場上形成較強競爭力。2023年，我國出口機電產品13.92萬億元，增長2.9%，占出口總值的58.6%。其中，電動載人汽車、鋰離子蓄電池和太陽能電池等“新三樣”產品合計出口1.06萬億元，首次突破萬億大關，增長29.9%。人工智能推動的戰略性新興產業和未來產業不斷發展壯大，已經為新質生產力的發展奠定了良好的基礎，并展示出廣闊的發展前景。

　　當然既要看到生成是人工智能帶來的推動科技創新、產業結構優化升級，新質生產力發展的巨大機遇。也要清醒認識其挑戰。這種挑戰有技術的，有倫理的，也有社會政治的。百年變局中，最大的變局是人工智能為代表的科技革命引發的世界范圍內的經濟社會系統性變革。人工智能引發的科技革命之變是比世界之變、時代之變、歷史之變更大更深刻的變。縱觀人類歷史，每一次重大科技革命，都給社會生產力發展帶來空前的提升和進步，也由此對經濟社會發展產生巨大的變革。要高度重視科技革命特別是人工智能突破性變革的影響和沖擊。進入21世紀以來，全球科技創新超乎人類想象，空前密集活躍，科技革命對世界格局、國與國關系、對一國經濟社會發展和百姓生活的影響范圍之大、程度之深前所未有。

　　人工智能引起全世界科技領域空前激烈的競爭。從2013年起，世界許多國家政府，尤其是發達國家紛紛調研人工智能對社會、經濟可能帶來的顛覆性影響，相繼發布符合自身國情的人工智能戰略。這兩年我們很關注烏克蘭局勢和哈以加沙地帶沖突的炮火連天，或許忽視了以大模型開發利用為特征的人工智能領域“你死我活”硝煙彌漫的競爭。我們很擔心地緣政治沖突會不會引發世界大戰，但科技領域的“世界大戰”事實上已經打響。剛才提到，ChatGPT與Gemini的競爭已經白熱化。這種競爭外溢，會引發人工智能領域，科技革命領域的前所未有的“世界大戰”。受ChatGPT的刺激，我國各大科技公司也開發出了自己特有的人工智能模型，大大小小已經有幾十個了。但不可否認也令人難過的是，目前在人工智能方面，無論從數據量的收集采納、算力和算法，還沒有哪一個可以與ChatGPT比肩，甚至毫不夸張地說，所有這些模型加起來，跟ChatGPT還有相當大的差距，更不要說Gemini。雖然在個別領域我們在國際上領先，但就整體水平而言，我們落后國際先進水平至少還有1-2年的時間。美英等西方國家還是領跑者，我們只是跟跑者。這種差距將很快成為生產力的差距，經濟實力的差距。這種狀況不僅決定當下經濟實力的比拼，而且會決定一國發展的走向和未來的前途與命運。對此我們必須高度重視，萬萬不可掉以輕心。

　　推動我國人工智能快速發展的對策。和國際一流企業相比，我們存在的短板主要表現為四個薄弱環節。一是技術研發水平較弱?，F有技術雖能滿足部分商業化需求，但仍缺乏一定的革命性產品，更多的是利用人工智能技術對傳統行業產品的改良，過多專注于某一細分領域的技術和應用研究，各應用場景之間的技術相關度存在一定的差異，基礎理論、原創算法和高端器件研發能力弱，比如做深度神經網絡訓練的GPU(圖形處理器)等還乏力。二是缺乏相應的高端人才。以深度學習為代表的機器學習算法研究領域的人才供應相對緊缺，流通性較弱，因此也導致了高端研究人才的超高成本，迫使有的公司選擇在美國建立研究院或實驗室，人才尤其是具有基礎性原創性研究的高端人才需求缺口大，我國最頂級的人工智能高端人才數只有美國的20%，特別有諷刺意味、值得深思、也需要引起高度重視的是，美國人工智能領域的頂尖高端人才不少是我國高等院校培養的“流失人才”。三是缺乏有影響的商業化開源開放平臺。雖然當下一些人工智能企業已將部分相對成熟的技術應用到社會生活中，但相應的商業化程度不夠，大部分公司的業務主要以B端解決方案和服務為主，C端產品需求開發不夠，更多應用場景有待挖掘與構建，目前一些人工智能應用確實起到了代替人類工作的作用，有些甚至已高于人類的工作效率，但現有的應用場景并不能滿足社會生活的需求，近幾年應用場景雖開始面向大眾普及，但是距離全面的應用仍較遠，圍繞人的行為軌跡，如可穿戴、車載、家居等應用場景，打造面向大眾的，有自主品牌的軟硬結合的人工智能產品，并形成一定的規模，還有待繼續努力。四是除了計算能力差外，數據量也是一個短板。我們的數據絕大部分以漢語為載體，這和以英語為載體的海量數據相比，存在著很大的差距，漢語數據量占世界數字量的比重大概也就百分之幾的樣子，數據采集、清洗、標簽、存儲、管理與交易，數據源公共基礎設施與垂直領域知識庫不足都是薄弱環節。

　　為了縮短差距，推動我國生成式人工智能產業快速發展，要做的工作很多。關鍵是深化科技體制機制改革創新。一是強化企業科技創新主體地位。這是深化科技體制改革、推動實現高水平科技自立自強的關鍵舉措。黨的二十大報告提出，必須堅持科技是第一生產力、人才是第一資源、創新是第一動力，深入實施科教興國戰略、人才強國戰略、創新驅動發展戰略，開辟發展新領域新賽道，不斷塑造發展新動能新優勢。習近平總書記高度重視科技體制改革，多次作出重要講話和指示、批示。中央高層也開過不少重要會議進行具體部署。2023年第一次中央深改委會議審議通過了《關于強化企業科技創新主體地位的意見》。要抓好這個意見的落實。二是堅持系統觀念激發創新活力。圍繞“為誰創新、誰來創新、創新什么、如何創新”，從制度建設著眼，對技術創新決策、研發投入、科研組織、成果轉化全鏈條整體部署，對政策、資金、項目、平臺、人才等關鍵創新資源系統布局，一體推進科技創新、產業創新和體制機制創新，推動形成企業為主體、產學研高效協同深度融合的創新體系。三是聚焦國家戰略和產業發展重大需求，加大企業創新支持力度。積極鼓勵、有效引導民營企業參與國家重大創新，推動企業在關鍵核心技術創新和重大原創技術突破中發揮作用。四是加大薪酬分配制度改革。鼓勵和激發科教人才創新動能。把2023年中央深改委第二次會議審議通過《關于高等學校、科研院所薪酬制度改革試點的意見》真正落到實處。建立起激發創新活力、知識價值導向、管理規范有效、保障激勵兼顧的薪酬制度，進一步激發高等學校、科研院所創新創造活力。五是充分發揮市場配置資源的決定性作用。數據收集處理、開源平臺構建、應用場景拓展，都要盡可能地向市場要活力，要動能。六是更好地發揮政府的作用。對于政府而言，提供公平競爭的良好創新環境，特別是法治環境，平等競爭的法治環境要勝于任何優惠政策，只有法治成為真正的法治，才能從根本上掃清束縛人工智能發展的體制機制障礙，打造充滿生機和活力的人工智能產業。七是激發企業家的活力，充分發揮企業家在人工智能發展方面的積極推動作用。八是深化國際開放合作，穩步推進規則、規制、管理、標準的制度型開放，主動融入全球人工智能發展，搶抓主動權，搶占制高點，在以人工智能為代表的第四次產業革命中，立于不敗之地。在以人工智能為特征的新質生產力的發展中，推進中國式現代化。

趙艾：以人工智能為特征的新質生產力發展前瞻

中國經濟體制改革研究會

聚焦改革

科研成果

熱點專題

相關單位