今日(12月21日),OpenAI“連續12日聖誕發布”終於迎來激動人心的大結局,OpenAI推出重磅收官新品,其迄今最強前沿推理模型的升級版——o3。
OpenAI號稱o3在一些條件下接近通用人工智慧(AGI),共有o3和精簡版o3-mini兩個版本。
評估顯示,o3在軟體工程測試中準確率比o1高近47%,競賽數學測評的準確率比o1高15%,人類博士專家級生化物測試中準確率比o1高近13%。
AGI相關測試中,o3最佳成績87.5,超過人類水準門檻85,顯示邁向類人智能取得突破。
對比之下,GPT-3的評測結果為0%,GPT-4o為5%,而o3一舉將成績提升到87.5%。
OpenAI計劃明年初發布o3系列模型,CEO Altman暗示可能一段時間內都不會面向大眾上線這類模型,稱希望正式發布前,先有一個聯邦政府的測試框架,指導監控並減少這類模型的風險。
從本周五開始,OpenAI允許安全研究人員可以註冊訪問o3和o3-mini的預覽。