時(shí)間:2023-03-17|瀏覽:893
趕在百度“文心一言”發(fā)布前一天,OpenAI祭出了GPT-4,這對于百度、谷歌們來說,可能是一個(gè)重大打擊。
人們已經(jīng)領(lǐng)略過GPT-3.5加持下的ChatGPT,但GPT-4比“前輩”更強(qiáng)大,它具有更高的可靠性和準(zhǔn)確性,能夠讀懂圖片,甚至還能角色扮演。目前,GPT-4已被應(yīng)用到ChatGPT和Bing上,再一次刷新外界對AI的能力認(rèn)知。
GPT-4越耀眼,谷歌、百度等競爭對手們便越焦慮。畢竟,其他公司忙著對標(biāo)GPT-3.5時(shí),OpenAI快速將大模型升級為GPT-4,一騎絕塵的樣子絲毫“不講武德”,像一個(gè)孤獨(dú)求敗的殺手,眼望著挑戰(zhàn)者的到來。
知名KOL和菜頭說,因?yàn)镺penAI在3月15日凌晨發(fā)布了GPT-4,他和他的一些老朋友都沒睡好,微信里的消息提示此起彼伏,“感覺像是回到了喬布斯還在世的時(shí)候,大家相約線上看蘋果發(fā)布會(huì)的那些夜晚?!?/p>
北京時(shí)間3月15日凌晨,GPT-4發(fā)布受萬眾矚目,這是采用GPT-3.5的ChatGPT火爆后的必然結(jié)果??纯蛡兿胍?,它比GPT-3.5到底強(qiáng)多少?人們甚至沒有興趣拿它來對比別的同類產(chǎn)品,因?yàn)槟苷驹谕黄鹋芫€上與之對比的還沒有出現(xiàn)。
OpenAI很了解圍觀者的胃口,在那場更像是產(chǎn)品演示的發(fā)布會(huì)里,開發(fā)者一上來就讓GPT-3.5和GPT-4分別嘗試回答同樣的問題。結(jié)果,熬夜的人沒白等。
一開始,OpenAI的開發(fā)者復(fù)制了一篇博客文章,并交給了GPT-3.5,讓它進(jìn)行總結(jié),要求是每個(gè)單詞都要以“G”開頭。結(jié)果GPT-3.5直接選擇了放棄。輪到GPT-4,它快速地給出了答案,完全符合要求。隨后,開發(fā)者又讓它嘗試以字母“A”開頭回答同樣的問題,GPT-4又做到了。
這還沒完,如同提升“節(jié)目效果”一樣,開發(fā)者直接和Discord社群互動(dòng)起來,選取了網(wǎng)友提出的字母“Q”。再來一遍,GPT-4依然輕松拿捏。
這輪演示,OpenAI特地選取了一個(gè)超過GPT-3.5“閾值”的問題來測試,意在表現(xiàn)GPT-4的能力進(jìn)化水平。正如官方所解釋的,在隨意的談話中,GPT-3.5 和 GPT-4 之間的區(qū)別可能很微妙,當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí),差異就會(huì)出現(xiàn)——GPT-4比GPT-3.5更可靠、更有創(chuàng)意,并且能夠處理更細(xì)微的指令。
為了全面且可視化地評估GPT-4的能力提升程度,OpenAI展示了它與GPT-3.5共同參與了多項(xiàng)模擬考試的情況,包括統(tǒng)一律師資格考試、研究生入學(xué)考試、醫(yī)學(xué)知識自測、藝術(shù)史、微積分等等,結(jié)果GPT-4幾乎碾壓了GPT-3.5。比如,在模擬律師考試中,GPT-4的分?jǐn)?shù)在應(yīng)試者的前10%左右,而GPT-3.5 的得分排在倒數(shù)10%左右。
各項(xiàng)考試中GPT-4領(lǐng)先GPT-3.5
如同蘋果發(fā)布會(huì)每次都會(huì)帶來一個(gè)大彩蛋,GPT-4也帶來了一項(xiàng)跨越式的功能——接受視覺輸入。這意味著,GPT-4能夠看懂圖片了。
官方解釋:GPT-4在給定由散布的文本和圖像組成的輸入的情況下,可生成文本輸出(自然語言、代碼等)。換言之,給它一張帶有文字的圖片,并提出要求,它就能給出想要的結(jié)果。
在演示中,開發(fā)者畫了一張網(wǎng)站的草圖,要求GPT-4用簡短的 HTML/JS 將這個(gè)草圖變成彩色的網(wǎng)站。僅僅幾秒鐘后,GPT-4就帶來了一個(gè)完整的網(wǎng)頁。
不僅如此,GPT-4還能嘗試?yán)斫庖恍┝餍械摹肮D”。如下圖所示,讓它解釋這張圖的笑點(diǎn)在哪,GPT-4不但Get到了,還一本正經(jīng)地解釋了一通。
GPT-4解釋“梗圖”的笑點(diǎn)
GPT-4的識圖功能只有體驗(yàn)過才能知道是否如OpenAI說得這么厲害。遺憾的是,目前視覺輸入還沒有完全開放,僅在一小部分開發(fā)者中進(jìn)行測試。OpenAI創(chuàng)始人Sam Altman解釋稱,此舉是為了防止可能出現(xiàn)的安全性和倫理問題。
GPT-4還有一項(xiàng)特別本領(lǐng),它可以扮演不同的角色和說話的方式,這與具有固定語氣和風(fēng)格的GPT-3.5不同?;谶@個(gè)功能,用戶可以讓GPT-4實(shí)現(xiàn)角色扮演并定制它的性格。
就像當(dāng)年的一代代新款iPhone給人們帶來驚奇感受,GPT-4展現(xiàn)了比它的上一代更強(qiáng)大的能力。不過,它也并不完美。與GPT-3.5一樣,GPT-4有時(shí)仍會(huì)虛構(gòu)事實(shí),“一本正經(jīng)地胡說八道”還不能完全避免。OpenAI宣稱,在內(nèi)部對抗性真實(shí)性評估中,GPT-4的得分比GPT-3.5高40%,顯然,它還有很大的提升空間。
OpenAI正和當(dāng)初的蘋果走在一樣的道路上:成為引領(lǐng)者,并在別人苦苦追趕時(shí),又猛地拉開一大截。
就在GPT-4發(fā)布前,互聯(lián)網(wǎng)巨頭谷歌也在YouTube上發(fā)布了一支預(yù)告片,宣布將AI整合到Gmail電子郵件和GoogleDocs文檔等辦公應(yīng)用中。谷歌在視頻中費(fèi)了很大力氣展示相關(guān)功能,告訴人們可以在文件中進(jìn)行頭腦風(fēng)暴、校對、寫作和改寫;利用幻燈片中自動(dòng)生成的圖片、音頻和視頻,將創(chuàng)意構(gòu)想變?yōu)楝F(xiàn)實(shí)等。
然而,“一點(diǎn)水花都沒有,幾個(gè)小時(shí)之后GPT-4開發(fā)布會(huì),人一下子就全跑光了?!焙筒祟^如此描述他的觀察。從社交網(wǎng)絡(luò)上輿論風(fēng)向看,谷歌的AI新動(dòng)作被鋪天蓋地的GPT-4消息所淹沒——無論是海外的推特還是國內(nèi)的微博,GPT-4都登上了熱搜榜。
和谷歌一樣被冷落的AI玩家還有Meta。不久前,Meta公布了旗下全新的AI大型語言模型LLaMA,宣稱可幫助研究人員降低生成式AI工具可能帶來的“偏見、有毒評論、產(chǎn)生錯(cuò)誤信息的可能性”等問題。Meta還放話,這一大模型僅用約1/10的參數(shù)規(guī)模,就能匹敵OpenAI GPT-3、谷歌PaLM等主流大模型的性能表現(xiàn)。這一新動(dòng)態(tài)在GPT-4到來后,沒有在輿論場上再露臉。
OpenAI的光芒越盛,其他科技巨頭們就越焦慮。
2月,倉促應(yīng)戰(zhàn)ChatGPT的谷歌還鬧出過笑話,其開發(fā)的聊天機(jī)器人Bard首秀“翻車”,答錯(cuò)問題導(dǎo)致其市值一天之內(nèi)蒸發(fā)約1000億美元。
在國內(nèi),百度也在加急研發(fā)與ChatGPT類似的聊天機(jī)器人“文心一言”。按照預(yù)告,百度將在今天下午舉辦有關(guān)文心一言的新聞發(fā)布會(huì)。在許多人也許還在好奇文心一言能否比肩GPT-3.5模型下的ChatGPT,結(jié)果,OpenAI趕在百度發(fā)布會(huì)前帶來了更強(qiáng)大的GPT-4。
別人忙著對標(biāo)GPT-3.5時(shí),OpenAI如同冷血?dú)⑹忠话?,親手擊敗了自己出品的GPT-3.5。同類競爭公司們有多焦慮,網(wǎng)友們已經(jīng)自行腦補(bǔ)出了各種“梗圖”。
“那種提刀在手,環(huán)顧天下,寂寞如雪的感覺,讓我忍不住感慨:即便在美國本土,這件事也和絕大多數(shù)美國科技公司無關(guān)了?!焙筒祟^形容,OpenAI迭代的速度讓他感覺到心驚肉跳,“所有試圖追趕的人和公司,目前落后進(jìn)度最少兩年。在這種AI爆發(fā)式增長的時(shí)代,兩年就是三輩子。”
回顧GPT的發(fā)展,它用5年時(shí)間里完成了從量變到質(zhì)變的飛躍。2018年,GPT-1首次發(fā)布,當(dāng)時(shí)的模型參數(shù)只有1.17億個(gè),隨后的GPT-2將標(biāo)準(zhǔn)提高到15億個(gè)參數(shù),GPT-3和GPT-3.5的神經(jīng)網(wǎng)絡(luò)直接提升到1750億個(gè)參數(shù),而到了GPT-4,采用的參數(shù)超過2000億個(gè),并利用了超過200萬個(gè)數(shù)據(jù)源(GPT-3.5使用了45萬個(gè)數(shù)據(jù)源),包括互聯(lián)網(wǎng)上的各種文本、圖像、音頻和視頻數(shù)據(jù)。
相比之下,2022年初谷歌曾披露其LaMDA 模型參數(shù)為1370億個(gè),不如當(dāng)時(shí)的GPT-3多。而據(jù)百度透露,文心一言大模型參數(shù)規(guī)模達(dá)到2600億,相比GPT-4更多,這或許還能讓它留給人們一些期待。
不過,有專家指出,模型參數(shù)并不是決定AI聊天機(jī)器人能力的絕對因素,在此基礎(chǔ)上,對數(shù)據(jù)的清洗和標(biāo)注、模型結(jié)構(gòu)設(shè)計(jì)、訓(xùn)練推理的技術(shù)積累都會(huì)決定最終產(chǎn)品的表現(xiàn)。
GPT-4甚至不用擔(dān)心產(chǎn)品化了,它已經(jīng)應(yīng)用于ChatGPT和微軟的搜索引擎必應(yīng)(Bing)上。一騎絕塵后,塵土里若隱若現(xiàn)著谷歌和百度。文/元宇宙日爆
熱點(diǎn):火幣網(wǎng)競品 比特幣pt op虛擬幣 drop幣 幣圈top