作者 | 曉陽
編輯 | 周燁
早在2007年,日本公司Crypton Future Media推出的虛擬聲優“初音未來”,便將虛擬人推向大眾視野。遺憾的是,往后數年,數字人并沒有在真正意義上迎來爆發。
但2021年以后,基于AI技術深度開發的AYAYI、度曉曉等應用場景更廣泛的數字人的出現,展現了更自然逼真的體驗,也向“真實”邁進了一大步。
在寫作、手語翻譯、直播等領域,數字人開始發揮作用。AI數字人挑戰高考作文,得分排總考生的前25%;數字人主播小C,已連續兩年報道兩會并采訪人大代表;AI手語主播,在今年冬奧會期間為數千萬聽障用戶提供直播及賽事的手語服務;百度數字人希加加,甚至成為麥當勞的首位虛擬代言人。
虛擬數字人正在快速走向大眾,經歷著大量的制作生成、不同場景的應用,展現出一幅“人”與人共生的未來圖景。
2022年,這場有關“造人”的暢想、實驗仍在進行。業內普遍認為,以洛天依為代表的“形象+語音合成”的數字人,為1.0階段。2.0階段,則是依靠“2D/3D模型+實時動作捕捉+聲優配音”模式。
而如今進入的3.0階段,將考驗企業的AIGC(人工智能自動生成內容)能力。算法、程序是數字人的基因,但通過AI,它們能在面部表情、形體表達、語音表述上變得更加“真實”、“個性”。
近期,沙利文發布的《2022年中國數字人市場觀測報告》(下稱報告)顯示,按綜合競爭實力量化評估,小冰、百度、商湯三家位列第一梯隊。從硬軟件、AI能力平臺到各產業的應用,各大廠商也開始試圖打通數字與現實的入口。
但目前為止,企業以及個人還無法獲得“數字人自由”。虛擬數字人距離真正意義上的爆發,還有一段路要走。
大多數字人僅能進行簡單的決策,而無法達到完全智能化交互。同時,數字人的生產效率問題,導致難以滿足企業的高頻需求,數字人制造成本較高。
打造有“靈魂”的數字人,能聽、能說、能理解、能互動,是企業、用戶的訴求,但技術方面依然面臨高難度挑戰。
1、數字人為什么被需要?
數字人浪潮的興起、爆發,一直是伴隨需求而生。
千禧年后,CG合成的“初音未來”讓虛擬偶像概念破土而出,愿意買單、參與創作的年輕人,制造了第一場圍繞虛擬偶像的“吸金效應”。
回到當下,在社交媒體上,虛擬美妝主播、虛擬換裝達人、虛擬演員等一夜爆紅的案例數不勝數。Z世代的新消費趨勢,驅動著數字人進入更多產業鏈條。
提及數字人,大多年輕人的第一反應也許是主打顏值的“演藝型”數字人。一位90后女生小蕾提到,她最早關注到虛擬人是在小紅書上,關注時尚博主AYAYI后,她隔幾天就會點進她的賬號瀏覽最新的發帖內容,后來才發現這是虛擬人。但目前,AYAYI小紅書的筆記點贊數已經從十萬+驟降至幾十,純演藝型數字人如何打破“虛火”、“過氣”的命運,也是各大數字人廠商面臨的難題。
另一位90后男生周凡也提到,從小他就混二次元圈,從動畫、游戲中的二次元人群到虛擬偶像,無論是顏值還是人設,都更能讓他產生興趣。真實的明星他絲毫不關心,卻很愿意為“虛擬人老婆”花錢買單。
主打顏值的演藝型數字人,常被塑造成網紅并進行品牌代言活動。比如希加加便是一個演藝型數字人,在多個社交平臺運營著個人IP賬號,一邊與蜘蛛俠、三體等超級IP合作,打造人氣,一邊與品牌在年輕化營銷方面進行合作,此前希加加便成為麥當勞的首位虛擬推薦官,還與Qee熊、FE賽車合作畫作并發布售賣。
可以看出,數字人扮演著為品牌開辟全新營銷場景、與未來消費主力軍溝通的角色。
但市場對數字人的期待不僅僅停留在“顏值”上,人們希望數字人承擔的角色從演藝繼續向服務型擴展,撐起更大的市場需求。
在過往提到人“人”共存爭議時,數字人替代人類的問題總被提及,但無論是前端的開發者還是投身其中的科技公司都一再強調,數字人的服務屬性。百度智能云AI人機交互實驗室負責人李士巖便曾提到,做數字人的初衷,并非為了替代人,而是為了“服務人和陪伴人”。
如何服務?取代部分基礎性工作、提升效能,是當下能看到的答案。數字員工、智能客服已經被廣泛應用到很多企業中,這幫助了企業降本增效、提升客戶體驗。
京東的數字人出現在618,在電商、社交、媒體等領域上崗就業;在直播帶貨領域,網易伏羲的24小時AI虛擬主播,可以填補真人主播無法出鏡的空白時間;在新聞報道方面,度曉曉與《工人日報》合作,在兩會期間應用“AI記者”播報、采訪。
百度數字人度曉曉則屬于典型的“服務型選手”。2022年百度世界大會即將在7月21日舉行,在其預溝通會上也提到,百度智能云專門打造了一個數字人平臺“曦靈”,基于此形成了一個“AI數字人家族”,包括虛擬偶像、數字人主播、數字人員工等,都在為企業品牌提供服務。
而今年的大會中,度曉曉還將迎接一個難度系數翻倍的新挑戰。此前,在寫作方面,度曉曉參與作答全國議論文,拿下48分高分;作畫方面,其具備領先的跨模態理解和生成能力,可以根據個性化需求自動生成油畫、水彩畫、中國畫等多種風格的圖像,還能實現“看圖說話”的效果;度曉曉甚至還能創作歌曲方面,其與龔俊數字人聯合演唱的歌曲,從作詞到編曲均由AI“操刀”。報告也提到,服務型數字人是百度的優勢所在,產品類型豐富,從最早的企業服務場景已經延伸到營銷、辦公等領域。
這一切也讓人們展望數字人在更多領域被全面喚醒。
2、實現“數字人自由”的技術難題
虛擬數字人呈現的爆發態勢,是過去數年制作水平、軟硬件技術等各方面的跨越式升級在催動。
盡管虛擬數字人不再停留在“紙片人”的階段,向智能化、精細化、多樣化方向發展,但還沒有到達談論“普及”、甚至大規模“復制”的階段。
由此,在談論虛擬數字人“服務和陪伴人”這件事之前,似乎需要先解答“數字人自由”的問題:數字人大規模普及,依然面臨著技術發展的阻礙。
經歷了長期的發展,如今到了數字人產業的3.0階段,通過掌握語義智能解析(NLP)和語音在線合成(TTS)等AI技術,數字人將變得更加“聰明”。
AIGC將進一步在數字人領域滲透,將顛覆現有的內容生產模式,AI將成為打造數字人的基礎硬實力。
AIGC的應用,說到底還是依賴于大模型等底層技術的創新。2022年百度數字大會的預溝通會也提到,希加加、度曉曉AI作畫、AI寫作文、AI作曲等,都是AIGC在內容生產提效的體驗,而這背后,是百度飛槳及大模型的支持。
AIGC如何讓數字人成為一個更真實的“人”,首先要從“真實”的要素說起。主要可分為:身體的靜動態(軀體、面部、口型),感知能力(看、聽、說),認知能力(情感識別、知識理解),它們都被期待著擺脫“紙片人”的僵硬。
目前而言,部分數字人僅僅擁有單一能力,且單一能力也僅僅是“半吊子”水平。
以涉及聽和說的“可交互”能力舉例,被稱作“人工智障”的數字人,無法完成多輪對話,更達不到“語言理解力”。當你說“不喜歡”時,它可能會回答,“我不明白你在說什么。”
但與度曉曉等更“真實”的數字人對話時,你會發現,跟她說你想看電影,她會給你推薦影片;你提到想喝咖啡,她就會跳轉到咖啡外賣的小程序去下單。顯然,度曉曉在對話中不僅能與用戶閑聊,同時能識別用戶說話的意圖,來提供給用戶搜索、推薦等,更好地為用戶服務。
那么,這樣流暢的對話是如何實現的?這需要依賴數個步驟:首先,預訓練對話大模型,使數字人學習通用的對話生成能力。再進一步學習不同畫像信息下的對話生成能力,使模型的答復更具“定制化”“一致性”。最后,將海量的問答知識內化到模型參數中,使得模型具備準確的問答能力。百度文心PLATO大模型,便具備接近真人水平的多輪對話能力。
簡單來說,不斷迭代大模型的能力,提高各項AI能力,而基于大模型生成的數字人也將擁有更高的“智商”“情商”。
不過,提高單一能力并非終點,數字人需要走向全能。隨著虛擬人扮演的角色逐漸復雜,比如協助國家隊訓練的虛擬教練觀君、負責萬科內部財務催收的虛擬員工崔筱盼、百度的AI手語數字人等,內容生成、感知表達等都在逐步進化。
比如在直播場景中,百度的AI手語數字人,需要“聽到”主播的話,并“理解”字句,再實時轉換成手語“動作”,展示給觀眾看。顯然,相比其他數字人,它進行著更高強度的“大腦”運轉,完成著更復雜的工作。
這便要考驗數字人背后的大模型的跨模態能力。從文字、聲音到圖像模態,AI需要讓數字人做到“聽說讀寫”樣樣俱全。AI驅動下,數字人將不斷成長,擁有更多可能性。
3、技術越來越強,大量復制卻依然艱難?
解決“數字人自由”,技術難題之外,生產效率問題也是討論的主要問題——如何低成本且快速地生成數字人,去滿足高頻的需求。
當下,數字人還很難快速低成本生成。當企業希望借助數字人營銷、服務用戶時,面臨著數字人的投入成本高、制作周期長、人設運營難、技術難度高等難題。
提供解決方案的服務平臺,被認為是“數字人自由”的加速器。如百度、騰訊、網易伏羲等,都是平臺型技術服務商。
通過服務平臺,企業品牌借助批量生成功能,定制與業務方面吻合的數字人,同時,可以通過平臺進行內容生產和運營,比如直播、制作短視頻等,或是對數字人的“人設”進行包裝。
過去兩年,縮短生產周期——企業的這一核心需求,在不斷被滿足。
比如根據不同需求所需時間區分:在百度智能云曦靈平臺上,較為簡單的2D數字人像,以前需要兩三個月時間做出來的3D數字人,現在可以壓縮到小時級;困難度最高、成本最高的特異型數字人(有具體的參照形象要求),也可在10到30天內生成。
另外,不同類型的數字人的制作成本都很高昂,企業品牌既要避免數字人同質化競爭,又要低成本,實屬艱難。
越來越多的企業也在通過AI技術釋放生產力、降低成本。比如在人像制作上,掃描真人、捏臉是常規手段,但生產周期長至3個月,成本高至上百萬。而各個平臺也在試圖尋找降低成本的方法。如百度的技術團隊,通過積累人像數據,利用數據訓練AI生成模型,最終通過AI模型快速打造各種需求的人像,大幅降低成本。
百度讓數字人制作成本十倍、百倍地下降,使數字人生產周期,從動輒幾個月,縮短到小時級別。2022年百度世界大會的預溝通會提到這一數據。
可以預見,未來數年,更多企業會加入應用數字人的隊伍,數字人的商業價值將在更多領域發揮,數字人幫助品牌代言、與用戶溝通互動等,都會變得普遍起來,而不止企業,甚至個人也能擁有屬于自己的數字人。
作為國內AI領先企業,百度多年積累的AI能力,成為它在數字人產業實力領先的基礎。此前互聯網周刊發布的《2021虛擬數字人企業排名TOP50》榜單中,百度因為語音、視覺等AI能力的積累,在數字人綜合實力方面排名第一。百度等服務平臺的下場也助推了數字人產業的發展。
數字人變得更加“真實”,服務于更多產業,得益于百度等廠商對AI能力的投入、培育,并將解決方案提供給更多有需求的企業,將數字人產業從0推向1,再走向虛實融生。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。