當(dāng)?shù)貢r間11月12日,OpenAI更新了今年8月發(fā)布的GPT-5,推出了新的GPT-5.1。在官網(wǎng)的介紹頁面,OpenAI并沒有放出GPT-5.1的基準(zhǔn)測試結(jié)果,而是用案例介紹了GPT-5.1的升級之處。
“GPT-5.1的答案讓人感覺更聰明,語氣更自然。優(yōu)秀的人工智能不僅應(yīng)該是聰明的,而且應(yīng)該提供令人愉快的交談。GPT-5.1在智能水平和溝通方式方面有顯著改進(jìn)。”OpenAI總結(jié)稱。
此次推出的GPT5.1包含GPT-5.1Instant和GPT?5.1Thinking兩個模型,前者是一個常用模型,OpenAI介紹稱,該模型更溫暖、智能且更善于遵循用戶指令,且在回答具挑戰(zhàn)性的問題之前可以進(jìn)行思考,在數(shù)學(xué)和編碼評估方面有所改進(jìn)。GPT?5.1Thinking則是一個較先進(jìn)的推理模型,可在簡單任務(wù)上反應(yīng)更快,在復(fù)雜任務(wù)上思考更久。這兩個模型即日起推出,付費(fèi)用戶可先行使用,免費(fèi)用戶后續(xù)也可以使用。OpenAI還引入了更有效的控制方式,使ChatGPT能更好地匹配用戶的語氣。
據(jù)OpenAI介紹,當(dāng)用戶說“壓力很大,需要一些放松的建議”時,GPT-5會直接提供建議,GPT-5.1Instant則會說“明白了,這很正常,尤其是你最近發(fā)生了這么多事”,隨后再提供建議。相比之下,GPT-5.1的回答更有“人味”,更能提供“情緒價值”。
GPT?5.1Thinking能更精確地根據(jù)問題調(diào)整思考時間。據(jù)介紹,GPT-5.1在簡單任務(wù)上反應(yīng)大約比GPT-5快兩倍,在復(fù)雜任務(wù)上反應(yīng)比GPT-5慢兩倍,且回答清晰、術(shù)語更少,語氣更溫暖且更有同理心。

OpenAI提供的案例顯示,向GPT-5問一個專業(yè)問題“在場球擊率是什么”,GPT-5會直接提供這個專業(yè)名詞的解釋,GPT-5.1Thinking則會提供一些上下文解釋,試圖讓用戶更容易理解。問“咖啡撒了一身,大家會不會覺得我是個白癡”,GPT-5會說“很抱歉”,GPT-5.1Thinking則會說“他們不會這樣覺得”。
今年8月,OpenAI推出基礎(chǔ)大模型GPT-5,當(dāng)時更新的重點(diǎn)在于幻覺率下降、對人類的“阿諛奉承”減少。不過,雖然整體變得更聰明,但GPT-5在部分基準(zhǔn)測試中的得分與OpenAI前代模型的差距并沒有很大。