OpenAI最強推理模型o3發布:AGI能力暴漲 接近人類水準 - 遊戲狂
廣告

OpenAI最強推理模型o3發布:AGI能力暴漲 接近人類水準

請拿手機掃描此QRCODE

傳到手機看

2024-12-21
廣告

今日(12月21日),OpenAI“連續12日聖誕發布”終於迎來激動人心的大結局,OpenAI推出重磅收官新品,其迄今最強前沿推理模型的升級版——o3。

OpenAI最強推理模型o3發布:AGI能力暴漲 接近人類水準

廣告

OpenAI號稱o3在一些條件下接近通用人工智慧(AGI),共有o3和精簡版o3-mini兩個版本。

評估顯示,o3在軟體工程測試中準確率比o1高近47%,競賽數學測評的準確率比o1高15%,人類博士專家級生化物測試中準確率比o1高近13%。

AGI相關測試中,o3最佳成績87.5,超過人類水準門檻85,顯示邁向類人智能取得突破。

對比之下,GPT-3的評測結果為0%,GPT-4o為5%,而o3一舉將成績提升到87.5%。

OpenAI最強推理模型o3發布:AGI能力暴漲 接近人類水準

OpenAI計劃明年初發布o3系列模型,CEO Altman暗示可能一段時間內都不會面向大眾上線這類模型,稱希望正式發布前,先有一個聯邦政府的測試框架,指導監控並減少這類模型的風險。

從本周五開始,OpenAI允許安全研究人員可以註冊訪問o3和o3-mini的預覽。

OpenAI最強推理模型o3發布:AGI能力暴漲 接近人類水準

廣告
廣告
今日(12月21日),OpenAI“連續12日聖誕發布”終於迎來激動人心的大結局,OpenAI推出重磅收官新品,其迄今最強前沿推理模型的升級版——o3。 https://gamemad.com/news/114920 https://img3.gamemad.com/2024/12/21/HVZBwctE.jpg OpenAI號稱o3在一些條件下接近通用人工智慧(AGI),共有o3和精簡版o3-mini兩個版本。 評估顯示,o3在軟體工程測試中準確率比o1高近47%,競賽數學測評的準確率比o1高15%,人類博士專家級生化物測試中準確率比o1高近13%。 AGI相關測試中,o3最佳成績87.5,超過人類水準門檻85,顯示邁向類人智能取得突破。 對比之下,GPT-3的評測結果為0%,GPT-4o為5%,而o3一舉將成績提升到87.5%。 https://img3.gamemad.com/2024/12/21/a8skGXxQ.jpg OpenAI計劃明年初發布o3系列模型,CEO Altman暗示可能一段時間內都不會面向大眾上線這類模型,稱希望正式發布前,先有一個聯邦政府的測試框架,指導監控並減少這類模型的風險。 從本周五開始,OpenAI允許安全研究人員可以註冊訪問o3和o3-mini的預覽。 https://img3.gamemad.com/2024/12/21/SN7EKKyz.jpg
https://gamemad.com/news/114920
0