時(shí)間:2024-06-11|瀏覽:387
以內(nèi)容社區(qū)和社交平臺(tái)聞名的中國科技公司快手科技推出了 Kling AI,這是一款旨在根據(jù)文本提示生成高度逼真的視頻的新工具,是 OpenAI 的 Sora 模型的潛在競爭對(duì)手。
Sora 是一種人工智能模型,旨在根據(jù)文本輸入生成逼真且富有創(chuàng)意的場景。Sora 視頻生成功能的核心是深度學(xué)習(xí)框架。該模型學(xué)習(xí)單詞和短語與各種元素(例如物體、動(dòng)作、環(huán)境和風(fēng)格細(xì)微差別)之間的關(guān)聯(lián)。
OpenAI 的 Sora 模型能夠生成長達(dá)一分鐘的視頻,而 Kling AI 可以以每秒 30 幀的速度生成長達(dá)兩分鐘的逼真視頻,分辨率為 1080p。它支持多種寬高比,并通過先進(jìn)的 3D 面部和身體重建技術(shù)實(shí)現(xiàn)高水平的細(xì)節(jié),確保其 AI 生成的視頻與真實(shí)鏡頭幾乎沒有區(qū)別。
Kling AI 利用 3D 變分自編碼器 (VAE) 重建人臉和身體,能夠從一張全身圖像生成詳細(xì)的表情和肢體動(dòng)作。該技術(shù)通過 3D 時(shí)空聯(lián)合注意力機(jī)制增強(qiáng),提高了模型處理復(fù)雜場景和動(dòng)作的能力。這確保生成的內(nèi)容與物理定律保持一致。
該應(yīng)用采用開放式模式,但有區(qū)域限制。該模式目前處于試驗(yàn)階段。
不到 48 小時(shí)前,Sora 競爭對(duì)手 Kling 退出了。 人們已經(jīng)開始訪問并制作瘋狂的 AI 視頻。 1. 1 小時(shí)制作完成的 MadMax 啤酒廣告pic.twitter.com/CyKm2aI0It
— Min Choi (@minchoi) 2024 年 6 月 8 日
快手科技推出 KwaiYii LLM 和 Kolors 文本轉(zhuǎn)圖像模型
快手科技是幾家競相推出 Sora 替代品的中國科技公司之一。繼 5 月份推出 KwaiYii 大型語言模型 (LLM) 和文本轉(zhuǎn)圖像模型 Kolors 之后,文本轉(zhuǎn)視頻功能是其最新的 AI 創(chuàng)新。
此外,快手科技應(yīng)用程序和視頻制作應(yīng)用程序快影中還提供了“AI舞者”功能,用戶可上傳靜態(tài)照片并生成角色按照指定節(jié)奏和動(dòng)作跳舞的視頻。
快手科技推出 Kling AI,讓用戶能夠通過文本轉(zhuǎn)視頻來制作視頻,這篇文章首次出現(xiàn)在 Metaverse Post 上。