時間:2022-03-03|瀏覽:432
最近,新的活水涌入元宇宙。Meta在實驗室研討會上,Meta CEO小扎公布了自己元宇宙的許多新技術(shù)。
無論是資金還是技術(shù),Meta從去年10月開始,它們都是構(gòu)建元宇宙世界的最前沿之一。Facebook改為Meta,旗幟鮮明,投資100億元,一系列砸錢收購,小扎行動派的風(fēng)頭扎進(jìn)元宇宙的深海,最近公開分享了一系列成果。
在這個元宇宙中Meta實驗室的技術(shù)突破會給行業(yè)帶來什么啟示?作為行業(yè)的技術(shù)先驅(qū),肖扎對自己新技術(shù)的評價是勾勒元宇宙的關(guān)鍵一步,解鎖許多進(jìn)步AI”。AI與元宇宙碰撞對元宇宙世界有什么影響?你心里有很多問號嗎?話不多說,讓我們從這些新技術(shù)開始。
AI引人遐想
在新技術(shù)公布之前,Meta最火的消息是二月初的財報。整個2021年,Meta實驗室損失了101.2020年9億美元虧損66.2億美元。
真金白銀的投資被砸碎,雷聲大,雨點小。許多投資者和從業(yè)者從元宇宙的狂熱中醒來,但最近Meta在元宇宙中,技術(shù)的突破似乎讓很多人對Meta有了一點信心,元宇宙的數(shù)字世界向前邁進(jìn)了一步。
Meta發(fā)布的新技術(shù)包括語音生成元宇宙場景Builder Bot、超級AI助手CAIRaoke等。
1.語音生成場景Builder Bot。在錄制的視頻中,我們可以看到小扎和一個同伴在虛擬環(huán)境中添加了云、樹、島、桌椅等虛擬物品,通過一系列語音指令。隨著語音指令的結(jié)束,建立了一個相對豐富的虛擬場景。Builder Bot只是簡單的demo展示,更復(fù)雜的3D生成環(huán)境需要時間和更深入的研究。
2、超級AI助手CAIRaoke。底層是一種自我監(jiān)督的神經(jīng)網(wǎng)絡(luò)模型,可以理解和學(xué)習(xí)用戶的聲音和肢體語言,使我們在虛擬數(shù)字世界中與語音助手的對話更加流暢和自然。在視頻演示中,AI助手可以在與人溝通的同時,注意烹飪過程中的鹽量,及時提醒用戶補充鹽量。目前,該技術(shù)已在其視頻通話中使用potal設(shè)備的應(yīng)用將在未來集成AR/VR在產(chǎn)品中,增加與數(shù)字助手的互動。
3.通用機器翻譯工具。Meta正在開發(fā)的技術(shù)-通用語音翻譯器旨在為語音翻譯提供所有語言的即時語音,語言類型涵蓋所有書面語言。這個通用的AI機器翻譯工具可以打開我們與信息和人的屏障,語言不再是限制我們獲取信息的障礙。
除此之外,Meta還宣布了其他一些AI最新發(fā)布的工具,這些工具AI技術(shù)和此前Meta超級計算機的發(fā)布,未來的成熟轉(zhuǎn)型,對元宇宙的影響令人遐想。
元宇宙作為下一種技術(shù)形式的入口AI技術(shù)的耦合,我們可以明顯感受到對元宇宙世界生態(tài)內(nèi)容的豐富。數(shù)字世界中的智能陪伴、智能交互、場景內(nèi)容的生成與構(gòu)建等,無不在訴說著AI各種智能工具對元宇宙世界基礎(chǔ)設(shè)施的智能轉(zhuǎn)型,不僅包括大量的基礎(chǔ)設(shè)施和指導(dǎo)工作,減輕員工的負(fù)擔(dān),而且為人與機器之間的溝通提供不同于人類現(xiàn)實社會的價值。
我們看到,AI賦予的能力加速了元宇宙世界的模式運行。換句話說,元宇宙的世界建設(shè)也將深入到電影頭號玩家中的綠洲。
智能的人和環(huán)境
對于元宇宙來說,最重要的核心是交互,讓交互感身臨其境的感覺,需要元宇宙的身臨其境的體驗。元宇宙作為一個虛擬的平行世界,需要包含現(xiàn)實世界所擁有的所有元素。如果你想討論的話Meta新技術(shù)給元宇宙帶來了什么,需要回到元宇宙的基本要素來尋找答案。
行業(yè)對元宇宙基本要素的共識基本是Roblox公司給出了元宇宙的八大要素為主,包含:身份、社交、沉浸感、低延遲、多元化、隨時、經(jīng)濟(jì)系統(tǒng)、文明。
筆者認(rèn)為Meta元宇宙技術(shù)突破帶來的變化可以歸因于豐富的互動和沉浸體驗。
首先是沉浸式體驗,語音生成場景Builder Bot,歸根結(jié)底,元宇宙正朝著沉浸感更加智能化的方向發(fā)展。這種探索性的方式顯示了語音生產(chǎn)場景AI元宇宙可以創(chuàng)造復(fù)雜的3D新世界的環(huán)境和潛力。
在構(gòu)建各種沉浸式社會元宇宙的道路上,如果參與者的生產(chǎn)能力耗盡構(gòu)建場景內(nèi)容,內(nèi)容的生產(chǎn)能力仍然有限。如果轉(zhuǎn)化為AI技術(shù)的自動化建設(shè),一些重復(fù)的材料和腳本設(shè)計,簡單耗時的工作可以使AI完成工具后,元宇宙世界的核心產(chǎn)品內(nèi)容可以花費更多的精力進(jìn)行拋光。
在互動方面,它包含了社會需求、低延遲和多樣化的因素。AI助手CAIRaoke未來與通用機器翻譯工具的形式可以使元宇宙中人與人、人與數(shù)字人的交互更加順暢。元宇宙中的人是基本的組成部分,包括進(jìn)入元宇宙的探索者和元宇宙中的虛擬數(shù)字人。AI助手CAIRaoke我們可以理解和學(xué)習(xí)用戶的聲音,這樣我們就可以自然地與生態(tài)中的各種數(shù)字人互動。同時,通用機器翻譯工具可以立即翻譯不同民族的語言,使進(jìn)入元宇宙的各種背景用戶無障礙地交流。
超級AI助手CAIRaoke在通用機器翻譯工具的未來,可以掃除元宇宙中交互的語言障礙,使數(shù)字世界的交互更加簡單。
Builder Bot、 CAIRaoke、通用機器翻譯工具等AI技術(shù)的研發(fā)方向和未來形式基本上提升了元宇宙中的單元人和環(huán)境,使元宇宙越來越接近理想狀態(tài),吸引更多的人進(jìn)入元宇宙社交網(wǎng)絡(luò)。當(dāng)然,虛擬AI與現(xiàn)實AI對現(xiàn)實世界來說,技術(shù)的學(xué)習(xí)和進(jìn)步將相互反饋,也將促進(jìn)創(chuàng)造性人工智能技術(shù)的進(jìn)步。
元宇宙的生態(tài)系統(tǒng)將變得更加三維。我們知道內(nèi)容是吸引人的關(guān)鍵,但人們在數(shù)字世界中的感覺是粘附和持久的基礎(chǔ),這種感覺需要數(shù)字技術(shù)在虛擬世界中放大我們的感官,真正的定性升級沉浸感。
捕捉現(xiàn)實世界:數(shù)字“通感”的步步進(jìn)階
談?wù)撐覀冊跀?shù)字世界中的感官,引入通感的概念可能會更容易理解。通感的初衷是將視覺、嗅覺、觸覺、聽覺等不同感官相互交流和轉(zhuǎn)化,使人們的感覺更加三維和豐富。因此,在元宇宙的世界里,數(shù)字通感是一個借口AI與機器一起體驗和探索虛擬世界,表達(dá)和傳達(dá)情感的溫度,使身體更加生動。
語言是交互的背景,聽覺是語言交互的基礎(chǔ),數(shù)字視覺(VR)觸覺(傳感器)使我們的身體在虛擬世界中有真實的紋理和觸摸。先進(jìn)的聽覺設(shè)備和技術(shù),以及數(shù)字視覺(VR)與傳感器設(shè)備的耦合驅(qū)動著元宇宙的真實感。
聽覺的AI技術(shù)主要集中在智能語音識別和智能語音合成上。在上面的敘述中,我們了解到,在虛擬世界中,與語音技術(shù)集成AI無論是指令還是正常的語音交互,助手組合,AI語音技術(shù)的引入將讓用戶體驗到機器和人的陪伴和歸屬感。虛擬世界的溫度也更自然,因為語音技術(shù)的擬人化。同時,機器在溝通過程中的不斷學(xué)習(xí)也將使虛擬世界的數(shù)字人更了解用戶的特點,AI助手成長為虛擬密友只是時間問題。
元宇宙數(shù)字視覺的通感依賴于AR/VR技術(shù)。其與AI結(jié)合,也是未來AR/VR發(fā)展的重要環(huán)節(jié)Meta旗下的Oculus舉例來說,Oculus是很多人選擇頭顯的首選,在Horizon Home可以使用的虛擬空間Oculus在社交聚會上,手勢識別、桌面、鍵盤、沙發(fā)等物品的跟蹤離不開AI技術(shù)的加持。視覺的數(shù)字通感,讓AR與VR從虛擬世界的入口到AI智能升級的交互體驗,從實入虛,從虛到智。
數(shù)字觸覺的通感來自于一些搭載AI傳感器設(shè)備的技術(shù)。Meta發(fā)布的可穿戴手套和智能手腕設(shè)備可以動態(tài)跟蹤手勢和手腕,感知環(huán)境。通過對手腕肌電圖信號的分析,系統(tǒng)可以理解小手指的運動,然后將其轉(zhuǎn)換為數(shù)字命令并發(fā)送到設(shè)備上,實現(xiàn)數(shù)字交互和控制。觸覺手套通過氣動裝置和觸覺渲染系統(tǒng)模擬真實觸覺。觸覺渲染系統(tǒng)需要根據(jù)手的位置、虛擬環(huán)境項目的重量、紋理和硬度,構(gòu)建相應(yīng)的軟件和算法進(jìn)行建模,然后向手套的氣動裝置發(fā)送正確的指令,以呈現(xiàn)真實物理世界的觸覺。
視覺、聽覺和數(shù)字觸覺AI在技術(shù)的支持下,我們打破了虛擬世界的維度壁。在元宇宙中,我們可以感受到虛擬世界物質(zhì)在數(shù)字空間中的真實感,與信息碰撞,并在虛擬世界中成長。
在建設(shè)元宇宙的道路上,元宇宙基礎(chǔ)設(shè)施的完善還有很長的路要走,依靠通用智能技術(shù)的不斷進(jìn)步,AI應(yīng)用是使元宇宙更加沉浸和多樣化的關(guān)鍵。這也是吸引無數(shù)用戶進(jìn)入元宇宙平臺的有效途徑。
歸根結(jié)底,在傳統(tǒng)的互聯(lián)網(wǎng)上,我們的經(jīng)驗是作為旁觀者傳遞和交互信息。在元宇宙中使用AI不僅可以為元宇宙創(chuàng)造廣泛且豐富的環(huán)境與內(nèi)容,AI支持下的數(shù)字通感允許用戶在虛擬空間中打開和放大感官,并以通感的虛擬人為參與者。我們可以失去各種身體限制來互動、探索和分享。
數(shù)字通感與元宇宙的契合,AI為億萬用戶構(gòu)建人機共生共融的新未來,是連接的橋梁,不可或缺。