廣受歡迎的生成圖像服務(wù)公司Leonardo AI周一宣布發(fā)布其新模型Leonardo Phoenix。此次發(fā)布之前,Stability AI推出了其SD3模型,該模型提供了令人印象深刻的即時遵守和文本生成功能,但因其許可條款引發(fā)的爭議和對人體解剖學(xué)的令人困惑的誤解而受損。
毫不奇怪,《萊昂納多》的創(chuàng)作者們對他們的最新作品贊不絕口。
他們在一封電子郵件公告中寫道:“我們不想夸大這一點(diǎn),但我們真的相信,在忠實(shí)遵循用戶提示的能力方面,Phoenix是領(lǐng)先的模型之一?!比斯ぶ悄苣P偷母掳殡S著萊昂納多網(wǎng)站的大修。
Leonardo Phoenix模型被吹捧為提供增強(qiáng)的即時粘性、圖像中清晰準(zhǔn)確的文本、卓越的圖像質(zhì)量和更大的創(chuàng)造性控制。更新還引入了“提示增強(qiáng)”和“人工智能編輯”等新功能,幫助用戶自動將基本提示轉(zhuǎn)換為更詳細(xì)的提示,并指示人工智能分別以特定方式更改提示。
然而,由于新的體系結(jié)構(gòu),一些以前可用的功能,如圖像引導(dǎo)、元素和照片現(xiàn)實(shí),尚未得到支持。同樣值得注意的是,新型號的代幣成本暫時較低,但下周一將恢復(fù)到標(biāo)準(zhǔn)定價。
Ideogram榮譽(yù)
雖然穩(wěn)定擴(kuò)散模型要求用戶擁有將其安裝在本地計算機(jī)上的技術(shù)訣竅,但Leonardo AI可以通過自己的網(wǎng)站輕松訪問。這種易用性要求與Ideogram、MidJourney或Dall-E 3進(jìn)行自然比較,后者也是基于網(wǎng)絡(luò)的人工智能圖像生成器。
在Leonardo Phoenix發(fā)布之前,Decrypt比較了這些本地和基于網(wǎng)絡(luò)的模型,并得出結(jié)論:“Ideogram可能是目前市場上最好的圖像生成器。”當(dāng)SD3發(fā)布時,我們的快速測試得出結(jié)論,它“在很多用例中都比SDXL好,但不足以取代它?!?/p>
因此,Ideogram在我們的主觀測試中表現(xiàn)得很強(qiáng)。萊昂納多是否足夠優(yōu)秀,足以擊敗它?
Leonardo與Ideogram
為了比較這兩個模型,我們?yōu)閮烧咛峁┝讼嗤幕咎崾?。我們還在這兩項服務(wù)上都啟用了一項功能,以增強(qiáng)我們的提示文本,從而生成更好的圖像。
風(fēng)格解讀
基本提示:一男一女在一家未來主義餐廳用餐,插圖為文森特·梵高風(fēng)格。這家餐廳有一塊牌子,上面寫著“歡迎來到埃梅里奇,解密?!?/p>
我們想測試這些模型在多大程度上識別出相關(guān)的藝術(shù)家和藝術(shù)運(yùn)動——在本例中,是文森特·梵高的藝術(shù)風(fēng)格,他有一種獨(dú)特且易于識別的技術(shù)。萊昂納多在風(fēng)格上勝過了伊迪格拉姆。此外,在這個例子中,它的文本生成功能被證明更強(qiáng)大。
萊昂納多對風(fēng)格的關(guān)注使餐廳與野餐時的草地融為一體。
Ideogram采取了一種更安全的方法,專注于場景而不是風(fēng)格。修復(fù)萊昂納多這一代人更容易。Ideogram需要更復(fù)雜的技術(shù)(如使用IPAdapter或Img2Img)才能獲得可接受的結(jié)果,因為圖像與樣式根本不相似。
獲獎?wù)?萊昂納多
及時遵守和空間意識
基本提示:一只狗站在一只貓的身上。左邊是一個機(jī)器人,屏幕上寫著“Emerge”,右邊是一個戴著防毒面具、拿著注射器的恐怖主題醫(yī)生。背景融合了新興技術(shù)的元素,如DNA和遺傳學(xué)、二進(jìn)制代碼、太空探索和外星人、電子和未來技術(shù)。
在這里,我們想測試模型對特定元素在提示中的位置的理解程度。在他們這一代人中,他們都是準(zhǔn)確的,理解每一個要求的元素的位置、背景和文本。
Ideogram生成的圖像將所有元素融合在一起,更美觀。萊昂納多創(chuàng)造了一個更準(zhǔn)確的表現(xiàn),這在小細(xì)節(jié)中是顯而易見的。例如,Ideogram未能為醫(yī)生生成好的手,表上的元素只不過是混亂的抽象生成,看起來不錯,但沒有任何意義。
獲勝者:平手。李奧納多在準(zhǔn)確性方面獲勝,伊迪格拉姆在美學(xué)方面獲勝。
獎勵回合:我們決定從這一代開始,讓萊昂納多的“人工智能編輯”功能發(fā)揮一番作用。我們要求萊昂納多“在不改變元素的情況下,給這張照片一種70年代的復(fù)古風(fēng)格”,它在第一張照片中幾乎完美地生成了它——只是漏掉了貓。
值得注意的是,這一功能極大地改變了生成,不僅與穩(wěn)定擴(kuò)散中IPAdapter的使用相當(dāng)。
寫實(shí)主義
基本提示:專業(yè)照片,高加索男子特寫肖像照片,穿著黑色毛衣,嚴(yán)肅的臉,戲劇性的燈光,自然,陰郁,多云的天氣,bokeh。
伊迪格拉姆的照片比萊昂納多更逼真。它關(guān)注的是主題和他的所有特征,而萊昂納多再次關(guān)注的是圍繞主題的風(fēng)格和其他元素,如陰郁的美學(xué)和戲劇性的閃電。
獲獎?wù)?Ideogram
特性比較
Ideogram和Leonardo都是允許公眾訪問各自生成的人工智能模型的網(wǎng)站。他們還提供付費(fèi)等級,以增強(qiáng)他們的能力。雖然圖像比較令人信服,但細(xì)節(jié)也值得研究。畢竟,決定因素可以擴(kuò)展到模型本身之外,包括每個模型提供的整體服務(wù)。
即時增強(qiáng)和圖像處理
提示增強(qiáng):Leonardo和Ideogram都提供了提示增強(qiáng)功能,以完善和改進(jìn)用戶提示。在Leonardo中,這被稱為“改進(jìn)提示”,而Ideogram將其稱為“魔術(shù)提示”。這些工具旨在通過自動將基本提示擴(kuò)展到更詳細(xì)、更有效的版本來確保最佳效果。圖像大小:與Ideogram相比,Leonardo AI可容納更大的圖像分辨率。對于16:9的縱橫比,Leonardo可以生成高達(dá)1376x768像素的圖像,而Ideogram僅限于1280x720像素。對于需要更高分辨率輸出的用戶來說,最大圖像大小的這種差異可能是顯著的。圖像比例:這兩項服務(wù)都提供了廣泛的圖像縱橫比可供選擇。然而,Leonardo AI通過提供各種社交媒體平臺上常用的縱橫比參考,提供了額外的便利。生成速度和數(shù)量:雖然Ideogram的圖像生成過程往往更耗時,但其免費(fèi)層允許生成更多的圖像。相反,由于其模型的計算要求更高,Leonardo AI的自由層對圖像數(shù)量施加了更嚴(yán)格的限制。這種速度和數(shù)量之間的權(quán)衡可能會影響您的選擇。
高級編輯和自定義
使用AI編輯:Leonardo AI提供了“使用AI編輯”功能,而Ideogram目前缺乏該功能。該工具允許用戶提供自然語言指令,以特定方式修改提示,例如“將外套改為紅色”、“添加一頂藍(lán)色帽子”、“使其復(fù)古”或“添加引人注目的燈光”。然后,人工智能相應(yīng)地調(diào)整提示,從而對生成的圖像進(jìn)行更精確的控制。它類似于Stable Diffusion用戶自去年以來一直在使用的instructionPix2Pix插件。背景刪除:Leonardo AI提供了背景刪除功能,而Ideogram沒有。這一功能對于使用其他圖像編輯軟件的用戶或那些試圖在其生成的圖像中隔離和突出顯示特定主題的用戶來說尤其有用。圖像放大:Leonardo AI提供了一個放大功能,允許用戶提高生成圖像的分辨率。該功能目前在Ideogram平臺上不可用,需要使用其他工具。即時圖像生成:Leonardo AI提供了一個即時圖像生成器,類似于Meta的“想象”功能或Krea的即時生成。該工具在用戶鍵入提示時實(shí)時生成圖像,與傳統(tǒng)的基于批處理的生成相比,提供了更動態(tài)、更交互式的體驗。動畫和實(shí)時畫布:Leonardo AI允許用戶從生成的圖像中創(chuàng)建基本動畫,并為繁重的修復(fù)和外繪任務(wù)提供實(shí)時畫布。這些功能目前在Ideogram平臺上不可用。模型訓(xùn)練:Leonardo AI允許用戶根據(jù)精心挑選的圖像訓(xùn)練自己的模型。此功能需要大量計算資源,Ideogram不提供此功能。對于有特殊需求的用戶來說,這可能是一個顯著的優(yōu)勢。靈活性:Leonardo AI擁有多種型號,Phoenix是其最強(qiáng)大的產(chǎn)品與Ideogram的專有模型相當(dāng)。然而,該公司還提供其他專有模型,如Leonardo Kino、Leonardo Vision和Lightning Model,以及社區(qū)微調(diào)的開源模型,如Dreamshaper和Absolute Reality
定價和型號多樣性
每代人的價格:在定價方面,Ideogram的付費(fèi)層提供無限的慢代,每月20美元起,而Leonardo的Artisan unlimited層提供類似的產(chǎn)品,每月30美元起。對于需要更快的生成速度或額外功能的用戶來說,Leonardo AI可能是更具成本效益的選擇,盡管其定價結(jié)構(gòu)通常更高。
結(jié)論
Leonardo提供了一個全面的UI,具有廣泛的功能,專為尋求從生成的圖像中提取最大價值的用戶量身定制。用于提示編輯和生成操作的自然語言處理的集成也是一個顯著的優(yōu)勢。對于超級用戶,尤其是那些愿意投資優(yōu)質(zhì)服務(wù)的用戶來說,萊昂納多顯然是更具吸引力的選擇,尤其是考慮到其廣泛的功能集。
然而,對于主要專注于用最少的精力生成視覺上令人驚嘆的圖像的普通用戶來說,Ideogram的精簡方法——加上其人工智能增強(qiáng)的提示生成功能——可能更適合。
雖然萊昂納多似乎在圖像中生成更長的文本串方面表現(xiàn)出了輕微的優(yōu)勢,但差異并不大。
最終,在這兩種服務(wù)之間做出決定可能取決于個人的優(yōu)先級,Leonardo最適合那些尋求全面創(chuàng)意控制和高級工具的人,而Ideogram則呼吁用戶優(yōu)先考慮優(yōu)化但直接的圖像生成體驗。
就我們的錢而言,萊昂納多確實(shí)從伊迪格拉姆手中接過了桂冠。雖然Ideogram有時可以生成出色的圖像,但萊昂納多提供的大量特征令人信服。無論你是對生成圖像的新手還是專業(yè)人士,萊昂納多都能做到。
總冠軍:萊昂納多
由Ryan Ozawa編輯。
熱點(diǎn):AI 地位 幣界 挑戰(zhàn)