時間:2024-06-29|瀏覽:251
人工智能研究組織OpenAI推出了基于GPT-4的新模型CriticGPT,旨在識別和糾正ChatGPT代碼生成的輸出中的錯誤。
新模型經(jīng)過專門訓(xùn)練,可以生成批評意見,指出 ChatGPT 提供的答案中的錯誤。它是支持 ChatGPT 的 GPT-4 系列模型之一,專注于通過一種稱為“從人類反饋中強化學(xué)習(xí)”(RLHF)的方法增強其實用性和交互性。這種方法涉及收集各種 ChatGPT 響應(yīng)的 AI 訓(xùn)練師評分。
隨著 ChatGPT 等大型 AI 模型在推理和行為方面的進步,它們的準(zhǔn)確性得到了提高,錯誤也變得更加細微。這種演變給負責(zé)在 RLHF 比較期間識別不準(zhǔn)確性的 AI 訓(xùn)練員帶來了挑戰(zhàn)。如果沒有增強的工具,評估這些系統(tǒng)可能會很困難。OpenAI 強調(diào),CriticGPT 模型旨在通過提供一種評估高級 AI 系統(tǒng)輸出的方法來解決這一問題。
據(jù)該公司介紹,當(dāng)用戶為 ChatGPT 分配“編寫特定 Python 函數(shù)”等任務(wù)時,ChatGPT 會生成相應(yīng)的代碼。同時,CriticGPT 在評估 ChatGPT 生成的代碼之一時,可能會建議更好的替代方案。
然而,OpenAI 指出,CriticGPT 的建議并不總是準(zhǔn)確的。盡管如此,它仍然可以幫助 AI 訓(xùn)練師識別模型生成的答案中的問題,而沒有 AI 幫助則無法做到這一點。此外,與人工努力結(jié)合使用時,CriticGPT 可以增強用戶的能力,從而產(chǎn)生更徹底的批評,與模型獨立運行時相比,幻覺錯誤更少。
OpenAI 與 Oracle 云基礎(chǔ)設(shè)施攜手推動 AI 模型開發(fā)
OpenAI 致力于人工智能 (AGI) 和生成模型領(lǐng)域的研究和開發(fā),并以其聊天機器人 ChatGPT 而聞名。據(jù)報道,該公司目前正在開發(fā)其最新版本 ChatGPT-5。
最近,OpenAI 與 Oracle Cloud Infrastructure (OCI) 合作以增強其功能。通過此次合作,它將利用 OCI 超級集群來訓(xùn)練和推理其下一代 AI 模型。
OpenAI 發(fā)布 CriticGPT 模型,旨在識別 ChatGPT 響應(yīng)中的不準(zhǔn)確性,該帖子首先出現(xiàn)在 Metaverse Post 上。