OpenAI发布季Day12|o3/o3-mini即将到来，模型能力再突破】

恋恋不舍不舍 · 发表于 2024-12-22 11:44

马上注册，享用更多功能，让你轻松玩转本论坛。

您需要登录才可以下载或查看，没有账号？立即注册 sms 手机登录

×

【OpenAI发布季Day12|o3/o3-mini即将到来，模型能力再突破】国金计算机
OpenAI展示最新推理模型o3/o3-mini，首次开放给外部研究人员进行安全测试。
o3基准测试取得突破性进展：
SWE-BenchVerified软件基础测试准确率达71.7%，比o1高22.8pct；
Codeforces竞赛编程评分2727，超过OpenAI首席科学家，o1评分1891；
美国奥数选拔考试AMIE准确率96.7%，比o1高13.4pct；
博士级难度科学问答GPQADiamond准确率87.7%，比o1高9.7pct；
前沿数学基准测试中准确率超过25%，目前其他所有模型准确率均低于2%。
o3-mini注重性价比：支持低、中、高三种推理计算选项，中档模式下编程、奥数能力优于满血版o1，延迟显著低于o1-mini。
计划根据安全测试结果在1月底左右正式发布o3Mini，随后发布完整版的o3。
建议关注A股/港股相关映射机会：
【AIAgent】金山办公、三六零、福昕软件、合合信息、拓尔思、新致软件、鼎捷数智、福昕软件、泛微网络、致远互联、金蝶国际、用友网络；
【通用模型训练】科大讯飞、商汤；
【模型训练支持】海天瑞声、星环科技、英方软件；
【多模态】万兴科技、虹软科技、海康威视、大华股份、萤石网络、广联达、千方科技、云从科技、第四范式、彩讯股份、汉仪股份、盛视科技、苏州科达、熵基科技、狄耐克

安逸安逸 · 发表于 2024-12-22 14:58

谢谢您的分享！

恋恋不舍不舍 · 发表于 2024-12-22 16:57

OpenAI展示最新推理模型o3/o3-mini，首次开放给外部研究人员进行安全测试。

OpenAI发布季Day12|o3/o3-mini即将到来，模型能力再突破】

马上注册，享用更多功能，让你轻松玩转本论坛。

浏览过的版块