首頁 >快訊 >

2023年中國AIGC產業全景報告

AIGC丨研究報告

核心摘要:


(資料圖)

古人有云:日就月將,學有緝熙于光明。人類對人工智能學的潛心鉆研終于再度獲得重大突破,大模型的涌現能力與AIGC的應用普及為那不一定是AGI但一定更AI的未來提供了確定性的加速度。AI2.0時代的加速到來,不僅是把AI能力融入到現有應用中,更是未來產業范式的再塑造。AI正跳躍式地加速滲透進各行各業,推動一場新的生產力與創造力革命。AI產業鏈各環節參與者的角色功能、產品服務和應用生態可能將發生變化。

對此,艾瑞發布《AIGC系列報告——中國AIGC產業全景報告》,作為AIGC系列首發,報告將展開對AIGC產業的全景洞察、探究生成式AI技術對數字產業的影響變化、繪制“中國AIGC產業全景圖譜”、分析主流參與廠商類型與格局策略、各類型廠商發展路徑和能力要求變化等,為市場辨析產業發展價值與空間。

報告研究范圍 - AIGC

AIGC與大模型將引領“AI產業”與“產業AI”發展

AIGC(AI-Generated Content)指利用人工智能技術(生成式AI路徑)來生成內容的新型內容生產方式。2022年11月上線的AIGC應用ChatGPT,憑借其在語義理解、文本創作、代碼編寫、邏輯推理、知識問答等領域的卓越表現,以及自然語言對話的低門檻交互方式,迅速獲得大量用戶,于23年1月突破1億月活,打破前消費級應用的增速記錄。微軟稱其在GPT-4(ChatGPT Plus背后運行的大模型)中看到了AGI(通用人工智能)的雛形。大眾的生活工作日常出現了Midjourney等新形態的各類AIGC應用,各行業的智能化升級也看到了新的可能性,“AI產業”與“產業AI”的想象空間進一步拓展。AIGC應用創新的技術支撐為“生成對抗網絡(GAN)/擴散模型(Diffusion)”與Transformer預訓練大模型”的兩類大模型分支。在國外AIGC應用展示出大模型的能量的同時,我國企業也加強了相關產品技術布局,云廠商、AI大廠、創企、各行業公司及技術服務商等產業各領域玩家紛紛發布大模型或基于大模型的應用產品及各類技術服務。相較于一般AI應用,大模型應用的訓練及推理需要更強的算力支持。綜上,本報告將圍繞模型、應用、算力三個角度對AIGC產業的發展進行探討,試圖在討論開源閉源、垂直通用、知識幻覺等大模型未來發展的各種不確定性的同時,為AIGC應用的迭代升級、產業的智能化應用,提供盡可能多的研究輔助,為那個不一定是AGI但一定更AI的未來提供確定性的加速度。

中國AIGC產業市場規模

市場規模呈指數級增長,突破規模化臨界點攫取萬億產業價值

根據第50次《中國互聯網絡發展狀況統計報告》,截至2022年6月,中國互聯網普及率已高達74.4%。在網民規模持續提升、網絡接入環境日益多元、企業數字化進程不斷加速的宏觀環境下,AIGC技術作為新型內容生產方式,有望滲透人類生產生活,為千行百業帶來顛覆變革,開辟人類生產交互新紀元。艾瑞咨詢預測,2023年中國AIGC產業規模約為143億元,隨后進入大模型生態培育期,持續打造與完善底層算力基建、大模型商店平臺等新型基礎設施,以此孕育成熟技術與產品形態的對外輸出。2028年,中國AIGC產業規模預計將達到7202億元,中國AIGC產業生態日益穩固,完成重點領域、關鍵場景的技術價值兌現,逐步建立完善模型即服務產業生態,2030年中國AIGC產業規模有望突破萬億元,達到11441億元。

中國AIGC產業投融資情況

模型創業初抬頭,多模態、跨模態備受青睞,資本扎堆優質項目

2021年至2023年7月期間AIGC賽道共發生280筆投融資,展現了其高熱度與高成長性。從產業細分維度,應用層創業機會最多,模型層創業受到ChatGPT影響,在2023年集中涌現;在獲投的應用與模型層創業項目中,文本、影像、語音平分秋色,但相比單一模態,多模態和跨模態的應用前景更加為資本所看好。從投融資輪次維度,70%左右的項目仍處于A輪及以前階段,同時有高達14.6%的比例屬于股權、戰略融資,說明賽道雖然處于起步期,但其戰略價值已被公認。在全部獲投的170家公司中,獲投3次及以上公司約占17%。同一標的的高頻融資,從企業需求側反映AIGC前期創業所需大量資金支持,從資方供給側表明優質創業項目仍非常稀缺。

中國AIGC產業圖譜全景圖

預訓練大模型分類與介紹

基于兩大類基礎架構衍生出各類大模型;多模態已成趨勢

預訓練大模型按照模態可以分為文本、圖像、視頻、代碼、音樂生成等多種,但從底層架構上都分屬兩類。Transformer是一種編解碼模型框架,適用于處理文本、代碼這類強連續性生成任務;Diffusion、GAN、NeRF等框架善于處理圖像生成類任務。疊加文-圖轉換技術可以形成文生圖模型。由單模態模型在實際訓練時融合其他模態技術,可形成多模態、跨模態大模型,如GPT-4、文心一言、 Mid journey等,由于多模態模型可接受文本、圖像等不同輸入輸出形式,對應用場景能夠更廣泛適配,著力發展多模態模型成為產研兩界共同趨勢。

預訓練大模型的路徑探討

了解人工智能時代的“iOS”與“安卓”,閉源與開源市場將并存互補

在以OpenAI為代表的閉源模型廠商開放對外技術服務后,開源模型廠商也在加緊發力,以Meta的Llama模型為代表陸續開源迭代,意圖進一步實現生態層面的跑馬圈地,2023年上半年LLM與數據集迎來開源季。大模型的開源可根據開源程度分為“可研究”與“可商用”級別。2023年2月,Meta發布了開源大模型LLM的第一個版本Llama,授予“可研究”用途。2023年7月進一步發布“可商用”的Llama2版本,雖然有日活超過7億產品需額外申請、不能服務于其他模型調優等的商用限制,但海外很多中小企業已可用Llama2的模型來做私有化部署,基于Llama2開源模型訓練出定制化的可控模型。由于Llama2基本不支持中文,對中國的大模型商用生態暫時不會產生實質性變化,中國仍需開發培育適配于中文數據土壤的開源生態。閉源LLM可為B端用戶和C端消費者持續提供優質的模型開發及應用服務;開源LLM可從研究角度促進廣大開發者和研究者的探索創新,從商用角度加速大模型的商業化進程與落地效果。未來,開源和閉源的LLM會并存和互補,為大模型發展共同創造出多元協作的繁榮生態。

著力打造中國AIGC開源社區生態

輕量級模型陸續開源,助力開源生態建設,千億級模型暫以閉源路徑開展

AIGC開源社區的建設可以吸納更多的開發者及擁有定義用戶的主導權,以AI開源創新平臺為杠桿,帶動支撐底層AI芯片、智算中心及云服務等基礎設施發展。從供給側邏輯來看,大模型開源早期由高校和機構推動,如清華大學的ChatGLM-6B、復旦大學的MOSS,陸續有頭部云廠商加入,如百度的文心系列與阿里的通義系列,共同為中國AIGC開源社區的建設“增磚添瓦”,以阿里云魔塔社區、百度云飛槳社區為代表的開源社區建設成果初現,而千億級模型暫以閉源路徑開展,憑借穩定、優質效、完整工具鏈等產品特點定位應用市場;從商業化路徑來看,參考海外明星開源社區Hugging Face的商業模式,中國AI開源社區同樣會先免費提供基礎算力,為客戶提供免費的社區體驗、demo部署及測試,并進一步通過付費服務推送輕量級遷移的微調推理服務或深度開發的訓練調優平臺,提升模型產品性能,通過開源社區吸引開發者、企業客戶完成更多部署應用資源的引流變現。

大模型落地將帶來新一輪AI產業化擴散

大模型的落地將提速AI工業化生產,并充分釋放AI產業潛在市場空間

大模型類似于一個能力全面且突出的“完全體”,不僅通用性強,且能力相比小模型有較大提升。因此,用大模型做應用開發,可以采用“預訓練+微調”開發范式,只需要針對具體任務,對大模型進行二次開發、微調甚至只是單純以領域知識庫做輔助,就可以快速賦能應用。相比獨立分散的小模型開發,標準化、流程化程度更高,在開發效率和運維成本上都有較大改善,有效促進了AI的工業化生產。同時,模型能力的提升使得更多AI服務可以落地,有效擴展了AI的應用范圍,這些共同促進AI供需兩側潛力釋放。

MaaS是大模型能力落地輸出的新業態

打造大模型商店,為下游提供低門檻、低成本的模型使用與開發支持

MaaS(Model-as-a-Service),模型即服務,是指以云計算為基礎,將大模型作為一項服務提供給用戶使用的新業態。如今,MaaS模式已成為各家云巨頭廠商發展第一戰略優先級,把模型作為重要的生產元素,依托于既有IaaS設施與PaaS平臺架構,為下游客戶提供以大模型為核心的數據處理、特征工程、模型訓練、模型調優、推理部署等服務。未來,順應大模型開源趨勢,MaaS服務商將著力打造大模型商店平臺,發力大模型生態建設,納入更多允許商用的開源模型,提升平臺的基模類型及能力,并豐富工具鏈產品服務,通過業務積累、數據回流、模型迭代逐步形成壁壘,在拉高云服務營收天花板的同時進一步塑造廠商的核心競爭力。

大模型成為AI應用開發的操作系統

模型即服務(MaaS)構建新型AI基礎設施,重構AI開發部署范式

隨著企業上云進程中智能化轉型需求的逐步增多和傳統行業領域數據的不斷積累,AI應用開發過程中逐漸面臨大量細分領域的深耕、非典型客戶需求,對算法的通用性和延展性提出了較高要求。傳統“小模型”范式的AI應用開發流程一般針對單一場景,獨立完成模型選擇-數據處理-模型優化-模型迭代等一系列開發環節。因此,AI應用在定制化需求、長尾需求下的開發效率較低,且模型精度、性能、可擴展性等指標質量也會受到影響。隨著AI產業深入及智能化需求增加,AI在研發門檻及開發效率的問題日益凸顯。“預訓練大模型”應運而生,其將數據中蘊含的知識通過無監督或者自監督學習方式提取出來,存儲在具有大量參數的神經網絡模型中。AI應用開發流程轉變為,調用通用流程-結合行業經驗-解決實際問題。未來,大模型將成為AI產業的操作系統,其基礎設施特性可為AI應用開發做好底座,將AI模型變得可維護、可擴展、可迭代,極大降低AI應用的開發門檻。從需求側來看,客戶能通過更低成本、高效率的MaaS(Model As a Service)路徑獲得AI能力,完成AIGC應用的個性化開發、優化及部署,持續兌現大模型的技術紅利,將AI能力應用滲透到各行各業的場景業務中。

市場需評估基礎通用大模型產品服務能力

艾瑞提出EPS-EPD評估體系,定位大模型產品的基模性能與商業能力

大模型能力評測意義重大,評測結果可讓供需兩側了解各家大模型能力的優勢與不足,做出更好的產品調優與應用選擇。隨著大模型產業的發展迭代,評測基準體系也在不斷完善。艾瑞判斷,未來大模型的產品服務能力評測將作為一項工具包,打包在大模型平臺中為客戶提供產品服務。對此,艾瑞提出EPS-EPD評估體系,以其為核心構建一系列評測集,對市面公開大模型能力展開測評,全維度定位大模型產品的基模性能與商業能力,為業內各界對模型評估有結果需求的客戶提供信息參考。

基模落地因需求差異展開產業路徑分化

大模型需以行業級、企業級大模型方式支撐上層應用

基礎大模型落地面臨兩大難題,一是終端客戶對算力成本的接受能力,二是大模型雖擅長通用領域問題,但往往在垂直行業任務中表現欠佳。因此,基礎大模型會通過領域數據或專屬知識庫進行訓練和調優,形成垂直領域的行業大模型或業務大模型;此外,部分企業還具有深度定制、私有化部署的需求,需要在行業大模型基礎上,進一步加入企業專有數據進行訓練或微調,形成企業級大模型。從商業化布局角度來看,如今基礎大模型廠商可分為三類參與者,分別為云巨頭廠商、人工智能公司、學術研究機構及創業公司,在定位有通用能力基座的同時打通向上商業化路徑。其中,云巨頭廠商將借助云服務及數據庫資源,更強調MaaS能力輸出。AI公司或創業公司將借助業務積累或生態資源錨定幾個典型行業或業務場景展開商業占領。從開閉源角度來看,基模廠商普遍采用前文所述的“輕量級開源、千億級閉源”的發展路徑,而向上分化的垂直領域廠商將基于開源模型或基模平臺開發部署細分領域模型產品,廠商優勢在垂類數據與業務理解。若客戶,如金融行業,對模型的開源性及私有化部署有明確要求,則開源路徑會是該類需求的典型落地形態。

如何連接模型能力與應用需求是落地關鍵

數據準備、ROI衡量、 Prompt工程是連接模型層與應用層的落地三要素

在本輪大模型推動的技術浪潮下,如何連接模型能力與上層應用,完成商業化變現,構建人工智能應用主導的生態系統是AIGC各層廠商重點關注的課題。艾瑞認為,數據準備,ROI衡量與Prompt工程能力是連接模型層與應用層落地的核心三要素。由于AI研究進展緩于國外、中文數據集論文發表難度高、NLP算法改進驗證與數據集語言類型關聯度低等歷史性原因,目前中文NLP數據集語料庫在數量與質量方面仍有較大差距。從可行性、性價比與時間角度出發,追趕期間同步發展典型行業應用數據集是彌補中文NLP數據集短板的有效策略;從需求側角度出發,大模型能力應用化需結合業務場景與成本效益選擇大模型的應用方式及調用形式,若基于安全隱私性需求要求私有化部署則投入成本更高,客戶端的ROI衡量是決定其能力商業化進程的關鍵;提示(prompt)是觸發AI 模型生成內容的寬泛指令,提示工程則可進一步開發和優化提示,從指令拆解到調用能力多維度融合大模型LLM來處理各類需求,是未來影響影響交互效果與應用體驗的關鍵。

廠商合作關系演化及周邊工具服務發展

模型層與應用層邊界漸弱,帶動數據層、開發平臺等工具服務高效發展

伴隨大模型通用性的提升,模型開發廠商可能因其模型被廣泛使用調用匯聚多維場景數據、積累行業場景認知并集成部分垂類功能特性,進而向上延伸拓展至完整功能應用;原有垂類應用,為鞏固市場地位,可能探索開源甚至自研模型,憑借既有資源、經驗積淀及領域聚焦,同樣打造模型開發及應用服務的閉環迭代,因此模型層、應用層有交錯發展之勢。此外,企業客戶參差的數字化基礎及個性化的軟件、流程需求依然需要解決方案廠商定制優化并部署實施,而AI開發平臺也將與大模型合力,通過“稀疏、蒸餾、剪裁”等手段助力大模型解決訓練、推理部署困難問題,進一步實現“低門檻、低成本、高效率”的開發部署與應用。數據標注、 安全合規等周邊工具服務亦是促進AIGC產品高效開發、產業有序發展的可觀商機。

工具層成為AIGC產業新熱點

工具層的AI Agent與模型服務平臺可以更好匹配應用需求與模型能力

艾瑞認為,大模型的中間層-工具層構成可分為AI代理-Agent角色與AI微調-大模型服務兩類。AI Agent是繼大模型、AIGC后進一步火爆的中間層產品,可看作能感知環境及需求、進行決策和執行動作的智能體。如代表性產品,AutoGPT即是利用GPT-4編寫自身代碼并執行Python自動化腳本,持續完成GPT對問題的自我迭代與完善。目前代理角色產品仍處于初代階段,未來將與實際場景、垂類數據結合,更加作為調度中心完成對應用層需求指令的規劃、記憶及工具調用(引用自OpenAI的Lilian Weng論文觀點)。大模型服務平臺則是為企業提供模型訓練、推理、評測、精調等全方位平臺服務,并基于供給側能力與需求側要求進行B端私有化部署(創業公司切入點)或平臺資源調用(云廠商切入點),模型與用戶將呈現明顯雙邊效應。總體來看,作為模型能力與應用需求的鏈接,中間層價值前景廣袤,或作為另一核心入口建設起工具生態,但從另一角度出發,中間層仍嫁接于模型層之上,受限于模型層能力,“合格”的大模型能力底座將為中間層發展開拓提供更優渥土壤。

AI Agent更廣闊的角色價值與發展空間

進入AI智能體文明,讓生產力大幅提升,沉淀垂類數據與業務理解是關鍵

早在20世紀80年代,計算機科學家已著手探索開發一個能與人類交互的智能軟件,類似于AI Agent的雛形應用一直在被構思討論。當下大模型的涌現能力成功賦予AI Agent更多想象與落地空間。一方面,大模型的語料資源包含了大量的人類行為數據,填補了AI Agent可行性與合理性的關鍵要素。另一方面,大模型涌現出優秀的上下文學習能力、復雜推理能力,在接受目標及設定后,可自發性將其拆解成簡單細化的子任務,無需人類干預去完成剩下的全部工作。目前AI Agent已成為繼大模型之后,更有想象空間卻也更貼近應用的下一爆點。海外亞馬遜、OpenAI及國內高校、云巨頭廠商都熱情滿滿,陸續發布AI Agent的學術研究成果及產品應用。未來,人與AI的協作交流或進一步由Agents作為智能媒介實現,每個人都可以使用各類AI Agent完成現實任務的處理執行,人類由此進入龐大復雜的AI智能體文明。而要想實現這些,將寶貴的垂類數據與業務理解集成到Agent框架之中,保證大模型應用在執行任務時可以訪問到正確的信息并高效執行產出,是未來AI Agent能發揮出實際效用的關鍵。相較于模型層,AI Agents將留給創業者更多機會。

AIGC產業化價值與影響

內容生產和人機交互兩條主線并駕齊驅,拉開變革大幕

本章節所探討的AIGC應用,是以大模型為技術主體,同時涵蓋其他AIGC技術(如語音合成、策略生成)的應用范圍。總體來看,大模型基于其在內容生成、總結、邏輯推理等方面的能力,已在多種AI服務的技術開發環節中展開融合替代。其中,內容生成與理解是大模型的核心能力,AIGC的產業價值主要體現在以此為核心的“變革內容生產方式”與“變革人機交互方式”兩方面。大模型對內容理解和內容生成的雙向能力使其既能以極低門檻實現多模態內容生成,也可脫離內容生產核心場景泛化為一種人機對話的媒介。未來,全行業將借助大模型能力衍生出的大量AI生產工具,實現內容生產效率的飛躍,并進一步降低數字生態的人機交互門檻。

生產力變革帶動海量下游應用優化

生活領域充分釋放用戶創新能力,生產領域全面革新交互體驗和效率

以大模型為標志,生成式AI是一次新的技術革命,同時還具有極強的普適性,能夠對人類生產、生活的方方面面進行改造與升級。在生活領域,AIGC將通過進一步下放內容創作權,激發UGC創作熱情,加速內容裂變。加之社區玩法在部分內容平臺的良好盈利表現,內容消費領域從技術到商業模式的路徑已全線打通,以社區形式,通過用戶自發交流自主創作形成粘性,是各類平臺的發力方向。在生產領域,大模型能從研發流程、產品能力和交互上全方位為企服軟件帶來提升,也充分開拓了新的服務場景,因此各類企業數字化廠商都將圍繞大模型尋找自身優勢空間與定位。

AIGC將在全行業引發深度變革

線上化程度、數字化基礎、行業內容占比等影響AIGC應用前景與滲透速度

總體而言,AIGC主要影響內容創作與人機交互,因此價值鏈線上化程度越高,內容在價值鏈中占比越高,AIGC對其顛覆效應越明顯;另一方面,行業自身的數據、知識、監管要求等特點也會深刻影響到AIGC技術的滲透速度。比如電商、游戲、廣告、影視傳媒等以內容生產為價值核心的行業,以及電商、金融等研發設計、營銷等環節在行業價值鏈中地位較高的行業,能夠快速看到AIGC應用對原有生產工具的替代和業務流程的變革。

內容消費賽道:內容分發平臺為核心的AIGC布局

現階段AIGC主要在UGC與PGC中進行滲透

內容分發平臺一端鏈接創作者,一端綁定大量用戶,擁有最為完整的內容消費生態,也天然成為了AIGC內容消費的布局核心。原本,內容消費市場按照創作者和商業模式可大致分為PGC和UGC。PGC專業性強,以內容付費為主要盈利模式,需要快速大量推出新內容刺激用戶購買,因此PGC平臺的主要戰略是前向打通內容制作環節,并為了提高用戶粘性同步發展UGC;UGC內容相對生活化,本質是販賣流量,需要將內容質量保持在可持續吸引用戶注意力的水平。因此,兩類平臺均在積極布局面向UGC的AI創作工具。由于線上社交需求持續增長,社交業務也展現出超強的盈利能力,是內容分發平臺變現的新方向,如網易云音樂2022年在社交娛樂板塊收入已大大超出其音樂服務收入。各大內容平臺也都在布局社群業務,盤活手中用戶,其中應用到AIGC技術支撐的營銷文案、電商圖片甚至評論的自動生成中。此外,在各大內容、電商平臺的后臺普遍有大量精準推薦、智能客服等系統,平臺也在逐步使用大模型替換和補充原AI技術棧,但這部分應用并不能直接產生內容消費,因而艾瑞將其歸為AIGC企業服務賽道而非AIGC內容消費賽道。

創作工具賽道:模型能力為核心,文、圖發展路徑將分化

短期內模型—應用不分家,圖像生成領域尚有模型自研機會

與傳統內容創作工具相比,AIGC內容創作工具的最大特點為“底層模型重、前端輕”,因此產品競爭的核心要素也從功能設計變成模型能力。在這種情況下,是否擁有自研SOTA模型將成為AIGC應用廠商的關鍵分水嶺。基于基礎大模型的研發投入、使用現有模型開發高質量應用的可行性這兩個核心要素來看,文本類應用和圖像類應用的發展路徑差異明顯:大語言模型成熟度高,自研壁壘高,直接基于現有模型開發應用更為現實;而圖像生成模型成熟度低,自研成本可控,因此吸引更多創業者聚集。

企業服務賽道:產品化價值與商業變現

AIGC融入既有應用降本效果明顯,營收增長主要依靠服務新場景

AIGC帶動中國算力產業發展機遇總覽

重點關注“芯片硬件、服務器、應用模式、能源散熱”等算力模塊

全球將大力發展算力基礎設施建設

算力支撐與模型需求存在gap,AIGC的大算力需求讓供需結構進一步承壓

自2017年谷歌提出Transformer架構后,人工智能發展逐步邁入預訓練大模型時代。2018年6月,OpenAI的GPT模型參數量已經達到1.17億,模型參數量開始實現億級基底的飛越發展,平均每3-4個月即呈現翻倍態勢,由此帶來訓練算力需求也“水漲船高”。算力正在成為影響國家綜合實力和經濟發展的關鍵性要素。浪潮信息發布的相關報告表明,計算力指數平均每提高1個點,數字經濟和GDP將分別增長千分之3.3和千分之1.8。面對算力層的供需結構矛盾,各國積極發展算力層基礎設施建設。在計算力指數國家排名中,美國坐擁全球最多超大規模數據中心,以75分位列國家計算力指數排名第一,中國獲得66分位列第二,隨后為日本、德國、英國等國,算力建設已然成為國家高質量發展的戰略級方針。2022年末,在OpenAI的GPT模型涌現能力后,AI產業迅速進入以大模型為技術支撐的AIGC時代,巨量訓推算力需求讓本就供需不平的算力產業結構進一步承壓。目前中國各地正加快新一批數據中心與智算建設,持續優化算力資源,滿足未來高速發展的大算力需求。

算力產業模式將在AIGC時代有所演變

智能算力資源或將更多承載于云服務產品,以MaaS模式服務千行百業

過去數據中心以租賃與自建為主,算力需求方基于自身業務量級、財務預算情況、數據隱私要求等情況進行選擇租賃或自建。在AIGC時代背景下,數據中心將配置更多AI服務器滿足日益劇增的智能算力需求,云廠商更是提出MaaS(Model as a Service)模型即服務的商業模式,將云計算、智能算力、模型能力等資源做高度融合,客戶可以直接在云端調用、開發與部署模型,更好適配于客戶的個性化需求。未來,更多長尾企業的需求體量將擁抱MaaS商業模式。相較于云端算力發展,端側大模型雖然發展較緩,仍是各家終端廠商發展的技術焦點,如從蘋果招聘信息中可觀測到其對“在端側實現推理和加速大語言模型功能“的人才需求及產品規劃。未來,隨著大模型輕量級開源版本的發布,大模型有望進行進一步剪裁優化,將推理能力部署在端側,并帶動手機、機器人等端側芯片發展。

數據中心需對高速巨量運轉需求做出應對

大模型時代下,數據中心將進一步優化網絡帶寬、能源消耗與散熱運維等

預訓練大模型的訓練推理需要巨量數據資源與高性能計算機的全天候高速運轉,對數據中心的網絡帶寬、能源消耗與散熱運維等能力提出更高要求。首先,網絡是數據中心最為重要的組成部分,隨著數據量與計算量的飛漲,數據中心需優化網絡帶寬,實現數據在節點內與節點間的高吞吐低延遲的傳輸與連接,并進一步優化計算集群的架構與設計,保證數據中心的高效利用率;其次,能源消耗與碳排放問題是數據中心亟需關注的重點問題。普通服務器的標準功耗一般在750~1200W,而AI模型運行時會產生更多的能耗,以CPU+AI芯片(搭載4卡/8卡)異構服務器為例,系統功耗一般會達到1600W~6500W。根據斯坦福大學發布的《2023年AI指數報告》數據顯示,GPT-3模型訓練耗費的電力可供一個美國家庭使用數百年,CO?排放量也相當于一個家庭排放近百年;另一方面,基于大模型算力需求的高能耗運行,其熱量釋放呈現倍增態勢。為了確保服務器能夠長期處于適合的工作溫度,數據中心將更注重系統設計和散熱技術的發展應用。大模型散熱需求加速由風冷到液冷的技術升級,進一步提升經濟性、節能效果和散熱效率等。散熱也將更貼近發熱源,由機柜級散熱、服務器級到芯片級發展。目前,中國大力推進“東數西算” 工程,并發布《新型數據中心發展三年行動計劃(2021-2023年)》等政策性文件,引導新型數據中心實現集約化、高密化、智能化建設,在AIGC時代下完成中國算力產業在規模、網絡帶寬、算力利用率、綠色能源使用率等方面的全方位提升。

AI芯片是算力皇冠,關注其性能與利用率

為服務于大模型的訓推,AI芯片需進一步升級內存、帶寬、互聯等能力

算力是評價AI芯片的核心要素,而除了運算次數外,芯片的性能衡量還需考慮運算精度。基于運算數據精度不同,算力可分為雙精度算力(FP64)、單精度算力(FP32)、半精度算力(FP16)及整型算力(INT8、INT4)。數字位數越高,代表運算精度越高,可支持的運算復雜程度越高,以此適配更廣泛的AI應用場景。為了適配大模型的訓練及推理,AI芯片要求有更大的內存訪問帶寬并減少內存訪問延遲,由此帶動由GDDR到HBM的技術升級,另一方面需要更高的片間互聯甚至片內互聯能力以滿足AI加速器訪存、交換數據的需求。最后,大集群不等于大算力,在大規模集群部署下,集群訓練會引入額外通信成本,節點數越多算力利用率越低,且單點故障影響全局運行。因此,同比增加GPU卡數或計算節點,不能線性提升算力收益,中國面臨的單卡芯片性能差距將更難通過堆料等方式解決。

中國算力產業將堅持自主創新道路

英偉達能否延續強者恒強?中國何時迎來自主創新芯片曙光?

作為AIGC產業的基建層,算力是AIGC生產力卡脖子的關鍵環節。對此,算力生產商紛紛發力,如AMD、英特爾等追趕型企業針對AIGC的產品新品動作頻頻。對標英偉達的Grace Hopper,AMD推出“CPU+GPU”雙架構的Instinct MI 300進軍AI訓練端。英特爾即將在2025年發布Falcon Shores GPU,將其混合架構改為純GPU解決方案。目前,國內大模型訓練芯片仍以英偉達GPU為主,且英偉達作為首批訓推部署框架成品及平臺生態將進一步鞏固其在生成式AI的優勢地位,但國內客戶正積極與海內外追趕型企業如AMD接觸,意圖打破英偉達的溢價與壟斷體系。自2018年以來,美國陸續對中國企業實行貿易管制,進入到美方黑名單上的中國企業已達到了千余家,尤其在半導體、人工智能等先進科技領域,國產芯片實現自主創新迫在眉睫,中國科技部也陸續出臺政策推動人工智能公共算力平臺建設。目前國產芯片雖在成片進度有所突破,但整體還尚未進入成熟期。以適配AIGC大模型訓練角度出發,國產產品會出現宕機、兼容性差、AI框架支持度低及核心IP受限等過渡性問題。在AIGC浪潮下,AI芯片發展路徑更加聚焦于AISC品類,中國算力層也會進一步嘗試脫離對頭部廠商英偉達的依賴,以“云巨頭自研自用+獨立/創業公司服務于信創、運營商等To G與To B市場”為兩條主線發展路徑,靜待國產替代曙光,實現國產“算力+應用”的正循環。

AIGC的技術發展:科研與產業兩端突圍

中短期基于Transformer算法和結構優化仍是主流,長期可能被替代

學術界將通過擴大模型參數量、調整模型結構、局部算法優化等方式,進一步探索大模型的能力天花板,觸碰AGI可能性;以各大企業為代表的產業側,一方面從商業化落地角度追求更小模型參數下的高模型能力維持,以及解決大模型出現的知識幻覺問題,一方面也在積極研發探索新模型架構可能性,呈現“對外模型名稱為廠商能力代號,但內含技術架構隨時可能改變”的發展特征。產業與科研兩側的需求都已經暴露標準Transformer架構的巨大瓶頸,即“不可能三角”。各大機構與開發團隊對Transformer架構的成功改進在快速推進,未來極有可能會出現具備推廣價值的新Transformer架構。

AIGC的應用前景:軟硬一體化

大模型低參版本的端側應用,推動手機、機器人等物聯網應用的升級進化

大模型在端側的應用,軟硬一體的結合帶來廣闊的應用場景。端側的應用首先需要將大模型進行剪枝、稀疏化等處理,降低參數到十億級規模,同時根據場景進行專屬知識的訓練和微調以適配專門的終端設備和軟件。這對終端設備的功耗、內存、延遲、成本等都提出了新的要求。具體來看,目前在手機拍照、多終端語音助手、機器人具身智能(指從第一人稱視角出發,具備理解、推理、并與物理世界互動的智能系統)等方面表現出應用前景,推動物聯網應用的升級與進化。2023年8月,華為推出鴻蒙4引入盤古AI大模型,在消費電子領域賦能;小米官宣13億參數手機大模型;OPPO預計將與阿里云聯合打造OPPO大模型基礎設施。手機廠商紛紛入局輕量化手機大模型市場,以期為用戶帶來全方位智能化體驗提升,也許不久將來大模型應用將成為用戶體驗變革換代的“新觸點”。

AIGC的社會影響:新一波自動化浪潮

AI成為基礎設施,部分基礎工作被替代,社會人力結構和分配方式重塑

技術的躍遷、生產效率的提升并不會自然帶來社會整體福利水平的提升,相反往往以犧牲部分人的利益為前提,進而引發社會結構、分配方式的重塑。AIGC交互界面的用戶友好性、大模型開源及API價格的降低、插件服務帶來的應用生態繁榮等,都使得AI技術或將成為像水、電、網絡一樣的基礎設施,滲透并改變千行萬業。然而,大模型具有認知、分析、推理能力,不同于自動化浪潮下對藍領的沖擊,AIGC時代受AI影響最大的可能是初級專業人士和技術人員,即部分白領。據麥肯錫數據預測,到2045年左右,有50%的工作將被AI替代,比此前的估計加速了10年。與此同時,具有創造力、深度思考等高階智力的人才,將享受到AIGC帶來的效率優勢,成為AI的駕馭者,相應的工作需求也會增加。智力要素重要性的提升、附加值的提高,都將推動社會資源和財富向頂尖人才和組織聚集,但社會是一個整體,生產效率的提升并不代表著購買力的提升,被替代的普通職工才是購買力的最大來源,為了維持供需平衡,分配制度需要重塑。如美國總統競選人楊安澤提出向大企業征收增值稅,并向公民發放補貼,以及OpenAI創始人Sam Altman提出的世界幣均等分配等,都通過反思并調整現有的分配方式,以驅動社會向更美好的方向演進。

AIGC的監管展望:寬松鼓勵與整頓規范

鼓勵AIGC研究,放寬內容容錯率,強調AI生成標識,推動公開數據建設

自AIGC逐漸應用以來,引發了知識幻覺、數據安全、個人隱私、道德倫理等諸多問題和討論,新生的行業亟需監管措施的跟進和健康發展引導。2023年7月,網信辦等七個部門正式發布了《生成式人工智能服務管理暫行辦法》(以下簡稱《辦法》),距離征求意見稿發布僅隔三個月,且監管要求更為寬松,反復強調了鼓勵發展的態度。具體來看,《辦法》主要規范公共服務環節,不包含有關專業機構的研發和應用環節,鼓勵企業在自研自用范圍加強技術攻關;其次,《辦法》不強求生成內容的真實、準確性,放寬了容錯率,對前期探索的企業帶來一定利好,但同時也提高了用戶辨別的時間和成本。同時,《辦法》要求提供者對AI生成內容進行顯著標識,有望從根本上杜絕AI生成內容難以辨別的問題,但也可能影響用戶對內容的價值判斷,對企業帶來負面影響。最后,國家以立法的形式打造數據和算力協同共享的平臺,最大化促進資源利用,有利于為中小型企業減負,降低研發成本。《辦法》發布后,即引發了蘋果應用商店對ChatGPT、訊飛星火等AIGC相關App的下架整改行動,行業整頓步伐進一步加速。

中國企業人事管理| 中國企業服務研究

企業直播服務行業 | 企業級無代碼開發

中國薪稅服務研究 | 中國信創產業研究

歡迎關注艾瑞數智獲取更多內容

點擊閱讀原文

免費查看及下載PDF高清完整版報告

關鍵詞:

責任編輯:Rex_23