競品還在追趕OpenAI用GPT-4飚贏自己

時(shí)間：2023-03-17|瀏覽：893

趕在百度“文心一言”發(fā)布前一天，OpenAI祭出了GPT-4，這對于百度、谷歌們來說，可能是一個(gè)重大打擊。

人們已經(jīng)領(lǐng)略過GPT-3.5加持下的ChatGPT，但GPT-4比“前輩”更強(qiáng)大，它具有更高的可靠性和準(zhǔn)確性，能夠讀懂圖片，甚至還能角色扮演。目前，GPT-4已被應(yīng)用到ChatGPT和Bing上，再一次刷新外界對AI的能力認(rèn)知。

GPT-4越耀眼，谷歌、百度等競爭對手們便越焦慮。畢竟，其他公司忙著對標(biāo)GPT-3.5時(shí)，OpenAI快速將大模型升級為GPT-4，一騎絕塵的樣子絲毫“不講武德”，像一個(gè)孤獨(dú)求敗的殺手，眼望著挑戰(zhàn)者的到來。

GPT-4打敗GPT-3.5

知名KOL和菜頭說，因?yàn)镺penAI在3月15日凌晨發(fā)布了GPT-4，他和他的一些老朋友都沒睡好，微信里的消息提示此起彼伏，“感覺像是回到了喬布斯還在世的時(shí)候，大家相約線上看蘋果發(fā)布會(huì)的那些夜晚?！?/p>

北京時(shí)間3月15日凌晨，GPT-4發(fā)布受萬眾矚目，這是采用GPT-3.5的ChatGPT火爆后的必然結(jié)果?？纯蛡兿胍?，它比GPT-3.5到底強(qiáng)多少？人們甚至沒有興趣拿它來對比別的同類產(chǎn)品，因?yàn)槟苷驹谕黄鹋芫€上與之對比的還沒有出現(xiàn)。

OpenAI很了解圍觀者的胃口，在那場更像是產(chǎn)品演示的發(fā)布會(huì)里，開發(fā)者一上來就讓GPT-3.5和GPT-4分別嘗試回答同樣的問題。結(jié)果，熬夜的人沒白等。

一開始，OpenAI的開發(fā)者復(fù)制了一篇博客文章，并交給了GPT-3.5，讓它進(jìn)行總結(jié)，要求是每個(gè)單詞都要以“G”開頭。結(jié)果GPT-3.5直接選擇了放棄。輪到GPT-4，它快速地給出了答案，完全符合要求。隨后，開發(fā)者又讓它嘗試以字母“A”開頭回答同樣的問題，GPT-4又做到了。

這還沒完，如同提升“節(jié)目效果”一樣，開發(fā)者直接和Discord社群互動(dòng)起來，選取了網(wǎng)友提出的字母“Q”。再來一遍，GPT-4依然輕松拿捏。

這輪演示，OpenAI特地選取了一個(gè)超過GPT-3.5“閾值”的問題來測試，意在表現(xiàn)GPT-4的能力進(jìn)化水平。正如官方所解釋的，在隨意的談話中，GPT-3.5 和 GPT-4 之間的區(qū)別可能很微妙，當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí)，差異就會(huì)出現(xiàn)——GPT-4比GPT-3.5更可靠、更有創(chuàng)意，并且能夠處理更細(xì)微的指令。

為了全面且可視化地評估GPT-4的能力提升程度，OpenAI展示了它與GPT-3.5共同參與了多項(xiàng)模擬考試的情況，包括統(tǒng)一律師資格考試、研究生入學(xué)考試、醫(yī)學(xué)知識自測、藝術(shù)史、微積分等等，結(jié)果GPT-4幾乎碾壓了GPT-3.5。比如，在模擬律師考試中，GPT-4的分?jǐn)?shù)在應(yīng)試者的前10%左右，而GPT-3.5 的得分排在倒數(shù)10%左右。

各項(xiàng)考試中GPT-4領(lǐng)先GPT-3.5

如同蘋果發(fā)布會(huì)每次都會(huì)帶來一個(gè)大彩蛋，GPT-4也帶來了一項(xiàng)跨越式的功能——接受視覺輸入。這意味著，GPT-4能夠看懂圖片了。

官方解釋：GPT-4在給定由散布的文本和圖像組成的輸入的情況下，可生成文本輸出（自然語言、代碼等）。換言之，給它一張帶有文字的圖片，并提出要求，它就能給出想要的結(jié)果。

在演示中，開發(fā)者畫了一張網(wǎng)站的草圖，要求GPT-4用簡短的 HTML/JS 將這個(gè)草圖變成彩色的網(wǎng)站。僅僅幾秒鐘后，GPT-4就帶來了一個(gè)完整的網(wǎng)頁。

不僅如此，GPT-4還能嘗試?yán)斫庖恍┝餍械摹肮D”。如下圖所示，讓它解釋這張圖的笑點(diǎn)在哪，GPT-4不但Get到了，還一本正經(jīng)地解釋了一通。

GPT-4解釋“梗圖”的笑點(diǎn)

GPT-4的識圖功能只有體驗(yàn)過才能知道是否如OpenAI說得這么厲害。遺憾的是，目前視覺輸入還沒有完全開放，僅在一小部分開發(fā)者中進(jìn)行測試。OpenAI創(chuàng)始人Sam Altman解釋稱，此舉是為了防止可能出現(xiàn)的安全性和倫理問題。

GPT-4還有一項(xiàng)特別本領(lǐng)，它可以扮演不同的角色和說話的方式，這與具有固定語氣和風(fēng)格的GPT-3.5不同?；谶@個(gè)功能，用戶可以讓GPT-4實(shí)現(xiàn)角色扮演并定制它的性格。

就像當(dāng)年的一代代新款iPhone給人們帶來驚奇感受，GPT-4展現(xiàn)了比它的上一代更強(qiáng)大的能力。不過，它也并不完美。與GPT-3.5一樣，GPT-4有時(shí)仍會(huì)虛構(gòu)事實(shí)，“一本正經(jīng)地胡說八道”還不能完全避免。OpenAI宣稱，在內(nèi)部對抗性真實(shí)性評估中，GPT-4的得分比GPT-3.5高40%，顯然，它還有很大的提升空間。

谷歌、百度更焦慮了

OpenAI正和當(dāng)初的蘋果走在一樣的道路上：成為引領(lǐng)者，并在別人苦苦追趕時(shí)，又猛地拉開一大截。

就在GPT-4發(fā)布前，互聯(lián)網(wǎng)巨頭谷歌也在YouTube上發(fā)布了一支預(yù)告片，宣布將AI整合到Gmail電子郵件和GoogleDocs文檔等辦公應(yīng)用中。谷歌在視頻中費(fèi)了很大力氣展示相關(guān)功能，告訴人們可以在文件中進(jìn)行頭腦風(fēng)暴、校對、寫作和改寫；利用幻燈片中自動(dòng)生成的圖片、音頻和視頻，將創(chuàng)意構(gòu)想變?yōu)楝F(xiàn)實(shí)等。

然而，“一點(diǎn)水花都沒有，幾個(gè)小時(shí)之后GPT-4開發(fā)布會(huì)，人一下子就全跑光了?！焙筒祟^如此描述他的觀察。從社交網(wǎng)絡(luò)上輿論風(fēng)向看，谷歌的AI新動(dòng)作被鋪天蓋地的GPT-4消息所淹沒——無論是海外的推特還是國內(nèi)的微博，GPT-4都登上了熱搜榜。

和谷歌一樣被冷落的AI玩家還有Meta。不久前，Meta公布了旗下全新的AI大型語言模型LLaMA，宣稱可幫助研究人員降低生成式AI工具可能帶來的“偏見、有毒評論、產(chǎn)生錯(cuò)誤信息的可能性”等問題。Meta還放話，這一大模型僅用約1/10的參數(shù)規(guī)模，就能匹敵OpenAI GPT-3、谷歌PaLM等主流大模型的性能表現(xiàn)。這一新動(dòng)態(tài)在GPT-4到來后，沒有在輿論場上再露臉。

OpenAI的光芒越盛，其他科技巨頭們就越焦慮。

2月，倉促應(yīng)戰(zhàn)ChatGPT的谷歌還鬧出過笑話，其開發(fā)的聊天機(jī)器人Bard首秀“翻車”，答錯(cuò)問題導(dǎo)致其市值一天之內(nèi)蒸發(fā)約1000億美元。

在國內(nèi)，百度也在加急研發(fā)與ChatGPT類似的聊天機(jī)器人“文心一言”。按照預(yù)告，百度將在今天下午舉辦有關(guān)文心一言的新聞發(fā)布會(huì)。在許多人也許還在好奇文心一言能否比肩GPT-3.5模型下的ChatGPT，結(jié)果，OpenAI趕在百度發(fā)布會(huì)前帶來了更強(qiáng)大的GPT-4。

別人忙著對標(biāo)GPT-3.5時(shí)，OpenAI如同冷血?dú)⑹忠话?，親手擊敗了自己出品的GPT-3.5。同類競爭公司們有多焦慮，網(wǎng)友們已經(jīng)自行腦補(bǔ)出了各種“梗圖”。

“那種提刀在手，環(huán)顧天下，寂寞如雪的感覺，讓我忍不住感慨：即便在美國本土，這件事也和絕大多數(shù)美國科技公司無關(guān)了?！焙筒祟^形容，OpenAI迭代的速度讓他感覺到心驚肉跳，“所有試圖追趕的人和公司，目前落后進(jìn)度最少兩年。在這種AI爆發(fā)式增長的時(shí)代，兩年就是三輩子。”

回顧GPT的發(fā)展，它用5年時(shí)間里完成了從量變到質(zhì)變的飛躍。2018年，GPT-1首次發(fā)布，當(dāng)時(shí)的模型參數(shù)只有1.17億個(gè)，隨后的GPT-2將標(biāo)準(zhǔn)提高到15億個(gè)參數(shù)，GPT-3和GPT-3.5的神經(jīng)網(wǎng)絡(luò)直接提升到1750億個(gè)參數(shù)，而到了GPT-4，采用的參數(shù)超過2000億個(gè)，并利用了超過200萬個(gè)數(shù)據(jù)源（GPT-3.5使用了45萬個(gè)數(shù)據(jù)源），包括互聯(lián)網(wǎng)上的各種文本、圖像、音頻和視頻數(shù)據(jù)。

相比之下，2022年初谷歌曾披露其LaMDA 模型參數(shù)為1370億個(gè)，不如當(dāng)時(shí)的GPT-3多。而據(jù)百度透露，文心一言大模型參數(shù)規(guī)模達(dá)到2600億，相比GPT-4更多，這或許還能讓它留給人們一些期待。

不過，有專家指出，模型參數(shù)并不是決定AI聊天機(jī)器人能力的絕對因素，在此基礎(chǔ)上，對數(shù)據(jù)的清洗和標(biāo)注、模型結(jié)構(gòu)設(shè)計(jì)、訓(xùn)練推理的技術(shù)積累都會(huì)決定最終產(chǎn)品的表現(xiàn)。

GPT-4甚至不用擔(dān)心產(chǎn)品化了，它已經(jīng)應(yīng)用于ChatGPT和微軟的搜索引擎必應(yīng)（Bing）上。一騎絕塵后，塵土里若隱若現(xiàn)著谷歌和百度。文/元宇宙日爆

熱點(diǎn)：火幣網(wǎng)競品比特幣pt op虛擬幣 drop幣幣圈top