時(shí)間:2022-01-18|瀏覽:494
數(shù)字人正在給大眾消費(fèi)市場帶來新的血液。
1982年7月9日,好萊塢上映了一部對后人影響很大的科幻電影《電子世界大戰(zhàn)》。
這部電影講述了一個(gè)進(jìn)入電子世界并在自己開發(fā)的游戲中戰(zhàn)斗的黑客程序員的故事。當(dāng)《頭號玩家》和《失控玩家》無處不在時(shí),這個(gè)故事并不奇怪,但在當(dāng)時(shí),它準(zhǔn)確地開啟了一個(gè)時(shí)代。
從技術(shù)上講,《電子世界爭霸戰(zhàn)》是世界上第一部采用CG 以真人結(jié)合的方式完成特效的電影被認(rèn)為是創(chuàng)作的CG制作電腦的新時(shí)代。從文本或哲學(xué)的角度來看,這部電影的影響更為深遠(yuǎn)。從那以后,電影對世界起源的追溯從未停止過。
在《電子世界大戰(zhàn)》之后的第七年,日本漫畫家郎正宗創(chuàng)作了《攻殼機(jī)動(dòng)隊(duì)》,并于1995年由押井守搬上了大銀幕。
1999年,深受《電子世界大戰(zhàn)》和《攻殼機(jī)動(dòng)隊(duì)》影響的沃卓斯基兄弟現(xiàn)在創(chuàng)作了《黑客帝國》。這部作品是一部以現(xiàn)實(shí) 虛擬為世界觀框架的集成作品,至今沒有人能期待它。
因此,從電影史的歷史來看,雖然今年以來火災(zāi)的元宇宙的文本是1992年的尼奧·斯蒂文森在小說《雪崩》中提出,但具體概念應(yīng)該是1982年。
01
電子世界爭霸戰(zhàn)的形象風(fēng)格現(xiàn)在看起來很五毛,是典型的像素風(fēng)格。CG技術(shù)只能支持人體關(guān)節(jié)的動(dòng)作替代,沒有辦法對臉部進(jìn)行特效處理,否則會(huì)成為徹底的卡通片。所以只能用CG 真人結(jié)合。
2010年,這部電影重拍。重拍后,《創(chuàng):戰(zhàn)紀(jì)》的視聽效果大大提高,奧斯卡最佳音效獎(jiǎng)獲得,但仍在繼續(xù)。CG 真人結(jié)合拍攝模式。
與近年來上映的頭號玩家和失控玩家相比,圖像技術(shù)在過去十年中得到了很大的改進(jìn)。隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,看似遙遠(yuǎn)的元宇宙世界并不像海市蜃樓那么遙遠(yuǎn),虛擬世界中的數(shù)字成像技術(shù)是最需要克服的問題。
數(shù)字人可能是開啟元宇宙時(shí)代的任督二脈。
從最基本的文本交互到語音交互,再到集視覺、語音和語義技術(shù)于一體的多模態(tài)數(shù)字人交互,我們對虛擬世界的交流需求越來越高,數(shù)字人的概念也越來越熱門。
那么,實(shí)現(xiàn)數(shù)字人技術(shù)有哪些困難呢?
作為一個(gè)新的數(shù)字物種,數(shù)字人的真實(shí)感來自于圖像的表達(dá)。與文本和語音交互產(chǎn)品相比,數(shù)字人添加了視覺元素,這需要一個(gè)更逼真、更有表現(xiàn)力的圖像來滿足用戶的視覺需求,使用戶有足夠的交互沉浸感。這種表達(dá)需要數(shù)字人的聲音、圖像、嘴巴類型和表達(dá)的一致性。
此外,在與用戶對話的過程中需要實(shí)時(shí)生成相關(guān)的操作和處理AI算法和計(jì)算機(jī)的性能也很高。當(dāng)信息從簡單的文本信息轉(zhuǎn)變?yōu)閺?fù)雜的音頻和視頻信息時(shí),只有自然語言理解(NLP)、語音識別與生成、視覺合成等整體AI能力可以給用戶一個(gè)自然逼真的體驗(yàn)。
例如,捏臉是每個(gè)數(shù)字人誕生過程中最重要的環(huán)節(jié),也是數(shù)字人誕生過程中最耗時(shí)的部分。解決這個(gè)問題,Epic Games它提供了一套解決方案。通過工具實(shí)現(xiàn)從嘴唇到眼睛、皮膚顏色、牙齒形狀、皺紋形狀、毛細(xì)血管和胡須的自定性,創(chuàng)作者可以定制所有內(nèi)容,自由捏想要的臉,如抬起或放下眉毛,改變頜骨形狀和耳朵的高度,甚至睫毛的長度也可以改變。此外,隨著光和陰影的變化,光在不同的膚色、年齡和性別中會(huì)有不同的效果。
數(shù)字人如何表現(xiàn)得像人類,提供更合適的互動(dòng)手段,也是一個(gè)亟待解決的問題。雖然人工智能在互聯(lián)網(wǎng)上得到了越來越廣泛的應(yīng)用,包括人工智能客戶服務(wù)、自動(dòng)化流程、自動(dòng)化工具,甚至像AlphaGo這樣的人工智能玩家??梢哉f,人工智能技術(shù)的發(fā)展基本上可以滿足用戶的需求。然而,長期以來,人工智能一直受到用戶的批評:它總是呈現(xiàn)出一個(gè)冰冷的文本形象。這種二維世界體驗(yàn)與網(wǎng)絡(luò)技術(shù)和人工智能的發(fā)展不匹配。這種體驗(yàn)與我們現(xiàn)在看到的電子世界之戰(zhàn)相同。
因此,實(shí)現(xiàn)數(shù)字人的個(gè)性化,使數(shù)字人的行為像個(gè)人至關(guān)重要。
在這方面,該行業(yè)也有許多失敗的案例。2018年,瑞典一家銀行解雇了一名表現(xiàn)不佳的數(shù)字人。最直接的原因是Amelia盡管業(yè)績沒有達(dá)到預(yù)期。Amelia被認(rèn)為是世界上最好的AI該系統(tǒng)被廣泛應(yīng)用于醫(yī)療和金融行業(yè),但缺乏個(gè)性化也是許多用戶放棄數(shù)字人的原因。
02
8月,芯片巨頭NVIDIA真假皮衣教主事件將數(shù)字人推向熱點(diǎn)。當(dāng)時(shí)有媒體說NVIDIA英偉達(dá)CEO黃仁勛在網(wǎng)上發(fā)表了兩個(gè)小時(shí)的演講,整個(gè)數(shù)字人站出來,從家庭背景到人物、服裝等都是虛擬的AI能力展示。雖然黃仁勛的數(shù)字人只出現(xiàn)了14秒,其他部分都是真人演講,但它仍然向外界傳達(dá)了數(shù)字人技術(shù)未來的無限可能性。
其實(shí),數(shù)字人距離生活已不遙遠(yuǎn),虛擬主播、虛擬教師、虛擬明星、虛擬客服……
在我們的生活中,數(shù)字人的形象越來越立體和全面,這使得以商業(yè)和技術(shù)為導(dǎo)向的數(shù)字經(jīng)濟(jì)更加溫暖和煙火。
根據(jù)量子位智庫發(fā)布的《虛擬數(shù)字人深度產(chǎn)業(yè)分析報(bào)告》,截至2030年,中國將圍繞虛擬數(shù)字人形成高達(dá)2700億的藍(lán)海市場。這個(gè)市場并不單一,將圍繞更豐富的領(lǐng)域展開,包括游戲/影視、服務(wù)平臺(tái)、媒體平臺(tái)開。
用戶對數(shù)字體驗(yàn)真實(shí)化的需求永遠(yuǎn)不會(huì)停止。在數(shù)字文化產(chǎn)業(yè)領(lǐng)域,數(shù)字人最基本的應(yīng)用是提高游戲、影視作品的沉浸感。Epic Game在虛幻引擎泛應(yīng)用于虛幻引擎官網(wǎng),Epic Games定義數(shù)字人技術(shù)對游戲行業(yè)的影響:A world of possibilities。通過技術(shù),Epic Games實(shí)現(xiàn)了游戲角色的高保真。近年來,隨著人工智能技術(shù)的不斷發(fā)展,游戲行業(yè)出現(xiàn)的一些新技術(shù)有效地簡化了數(shù)字人的生產(chǎn)過程,使數(shù)字人成功地進(jìn)入了公眾的視野。
數(shù)字人甚至被應(yīng)用到許多非娛樂行業(yè),顯示出其強(qiáng)大的功能價(jià)值。
隨著虛擬互動(dòng)技術(shù)的擴(kuò)展,數(shù)字人已經(jīng)能夠發(fā)揮普通人無法企及的作用,
例如醫(yī)學(xué)、礦產(chǎn)、航空航天等領(lǐng)域。此外,通過定制主持人形象,也可以實(shí)現(xiàn)內(nèi)容快速、自動(dòng)化的生產(chǎn),優(yōu)化觀看體驗(yàn)。例如,在神州十二號成功發(fā)射三位航天員順利抵達(dá)空間站后不久,由新華社和騰訊聯(lián)合打造、專門面向航天主題和場景研發(fā)的數(shù)字航天員、國內(nèi)首個(gè)進(jìn)入多場景運(yùn)營的數(shù)字人“小諍”亮相,帶用戶漫游三大空間站。截至目前“小諍”已經(jīng)完成了多次太空報(bào)道,涵蓋了“天問一號”火星探測任務(wù)和中國空間站。這種效率從側(cè)面說明了當(dāng)前數(shù)字人技術(shù)的成熟度已經(jīng)到達(dá)了一定的水平。
除了功能性的應(yīng)用以外,數(shù)字人同樣具有“人文關(guān)懷”的功用。通過基于真人形象,打造出具有高度關(guān)懷感和真實(shí)感的多模態(tài)AI助手虛擬數(shù)字人。這種虛擬數(shù)字人可以在特定的護(hù)理場景甚至一般交互中提供顧問、護(hù)理、陪伴和事務(wù)處理服務(wù)。國外制造商現(xiàn)有的著陸場景包括個(gè)性化的金融顧問、心理顧問和購物助理。
03
在《電子世界大戰(zhàn)》發(fā)布后的近40年里,關(guān)于現(xiàn)實(shí)與虛擬的二元對立討論幾乎從未停止過,并在《黑客帝國》上映后達(dá)到了頂峰。然而,之前的討論更關(guān)注哲學(xué)層面,以及技術(shù)層面是否可以實(shí)現(xiàn)以及如何實(shí)現(xiàn),最近一直受到行業(yè)的關(guān)注。
2020年,馬提到了全真互聯(lián)網(wǎng)的概念,他認(rèn)為互聯(lián)網(wǎng)的下一步是虛擬世界和現(xiàn)實(shí)世界的大門完全開放。一個(gè)由游戲和虛擬空間組成的經(jīng)濟(jì)崛起。
游戲公司術(shù)的匹配和發(fā)展路徑來看,游戲公司將在元宇宙的崛起中發(fā)揮至關(guān)重要的作用。最關(guān)鍵的一步是繼續(xù)擴(kuò)大元宇宙的內(nèi)容生態(tài),即掌握數(shù)字人的發(fā)展。
換句話說,如果元宇宙被視為3A大作,再強(qiáng)的3A游戲跟不上玩家的消費(fèi)。只有不斷創(chuàng)新,才能保持新鮮感,進(jìn)而推動(dòng)全社會(huì)進(jìn)入真正的互聯(lián)網(wǎng)時(shí)代。
現(xiàn)在,互聯(lián)網(wǎng)和社交平臺(tái)的快速發(fā)展極大地?cái)U(kuò)大了人們的社會(huì)關(guān)系?,F(xiàn)有社交平臺(tái)的發(fā)展和用戶增長已經(jīng)觸及了上限,迫切需要一條新的增長路徑來幫助互聯(lián)網(wǎng)行業(yè)恢復(fù)快速增長的步伐。元宇宙和數(shù)字人類技術(shù)就是這條路徑的關(guān)鍵點(diǎn)。然而,元宇宙還有很長的路要走,要真正實(shí)現(xiàn)類似于失控玩家和頭號玩家的游戲世界。
但我們現(xiàn)在對元宇宙的投資和決定將決定元宇宙的未來。一篇文章來自Medium文章提到,元宇宙的組成與硬件、內(nèi)容和構(gòu)成世界的底層框架密切相關(guān),涵蓋了元宇宙的七個(gè)要素:體驗(yàn)層、發(fā)現(xiàn)層、創(chuàng)造者經(jīng)濟(jì)層、空間計(jì)算層、分散層、人機(jī)界面層和基礎(chǔ)設(shè)施層。在當(dāng)前的發(fā)展階段,雖然主要的互聯(lián)網(wǎng)巨頭進(jìn)入了局,但元宇宙的硬件水平并沒有發(fā)生定性的變化;因此,內(nèi)容和世界的底層框架已成為進(jìn)入元宇宙的力量點(diǎn)。
毫無疑問,元宇宙的沉浸感是體驗(yàn)的最高標(biāo)準(zhǔn)。要?jiǎng)?chuàng)造這種沉浸感,需要一個(gè)高保真的游戲環(huán)境。
因此,數(shù)字人技術(shù) 突破硬件是進(jìn)入元宇宙時(shí)代的先決條件,數(shù)字人技術(shù)可以使元宇宙的各種元素,突破硬件可以從外部世界和虛擬世界連接人們的意識,兩者可以構(gòu)建一個(gè)與現(xiàn)實(shí)世界不同的虛擬世界。
到目前為止,數(shù)字人的高保真技術(shù)越來越成熟。從數(shù)字人的外觀結(jié)構(gòu)來看,無論是否Epic Game還是NExT Studios數(shù)字人臉的細(xì)節(jié)還原取得了很大進(jìn)展,達(dá)到了實(shí)用水平。隨著攝像頭陣列掃描重建的快速發(fā)展,毫秒高速攝像頭掃描已成為人物建模的主流方式,并成功應(yīng)用于游戲、電影、媒體等行業(yè)。同時(shí),通過實(shí)時(shí)動(dòng)作捕捉系統(tǒng)還原人物動(dòng)作,也使各種互動(dòng)體驗(yàn)成為可能。
數(shù)字人的高保真也體現(xiàn)在整體環(huán)境和互動(dòng)體驗(yàn)的深度恢復(fù)上:利用虛幻引擎、實(shí)時(shí)光跟蹤技術(shù)等,創(chuàng)造更真實(shí)、更沉浸的模擬效果和視覺體驗(yàn)。
作為一件新事物,雖然數(shù)字人已經(jīng)進(jìn)入了一個(gè)實(shí)段,但他們?nèi)匀徊怀墒臁N覀冞€需要更多地思考數(shù)字人未來的發(fā)展方向。沒有人能預(yù)測數(shù)字人和元宇宙的最終發(fā)展結(jié)果。目前,我們對元宇宙的許多想象只是基于影視作品。
元宇宙的實(shí)現(xiàn)需要人工智能來提供源源不斷的內(nèi)容,并利用它AI推動(dòng)各行各業(yè)完成現(xiàn)實(shí)世界與虛擬世界的聯(lián)系;還需要VR/AR隨著技術(shù)的不斷進(jìn)步,不斷增強(qiáng)用戶的沉浸感和體驗(yàn)感;元宇宙需要心理知識來超越數(shù)字組成的寒冷世界的概念,數(shù)字也有溫度;甚至,元宇宙的實(shí)現(xiàn)也需要區(qū)塊鏈來確保新世界的身份、資產(chǎn)和社會(huì)關(guān)系,以建立元宇宙的可信度。
就目前而言,我們能做的就是在宇宙中構(gòu)建各種元素的基礎(chǔ)。
但總有一天,我們會(huì)在電子世界爭霸戰(zhàn)描繪的世界里相遇。