恋恋不舍不舍 发表于 2024-12-22 11:44

OpenAI发布季Day12|o3/o3-mini即将到来,模型能力再突破】

【OpenAI发布季Day12|o3/o3-mini即将到来,模型能力再突破】国金计算机
OpenAI展示最新推理模型o3/o3-mini,首次开放给外部研究人员进行安全测试。
o3基准测试取得突破性进展:
SWE-BenchVerified软件基础测试准确率达71.7%,比o1高22.8pct;
Codeforces竞赛编程评分2727,超过OpenAI首席科学家,o1评分1891;
美国奥数选拔考试AMIE准确率96.7%,比o1高13.4pct;
博士级难度科学问答GPQADiamond准确率87.7%,比o1高9.7pct;
前沿数学基准测试中准确率超过25%,目前其他所有模型准确率均低于2%。
o3-mini注重性价比:支持低、中、高三种推理计算选项,中档模式下编程、奥数能力优于满血版o1,延迟显著低于o1-mini。
计划根据安全测试结果在1月底左右正式发布o3Mini,随后发布完整版的o3。
建议关注A股/港股相关映射机会:
【AIAgent】金山办公、三六零、福昕软件、合合信息、拓尔思、新致软件、鼎捷数智、福昕软件、泛微网络、致远互联、金蝶国际、用友网络;
【通用模型训练】科大讯飞、商汤;
【模型训练支持】海天瑞声、星环科技、英方软件;
【多模态】万兴科技、虹软科技、海康威视、大华股份、萤石网络、广联达、千方科技、云从科技、第四范式、彩讯股份、汉仪股份、盛视科技、苏州科达、熵基科技、狄耐克

安逸安逸 发表于 2024-12-22 14:58

谢谢您的分享!

恋恋不舍不舍 发表于 2024-12-22 16:57

OpenAI展示最新推理模型o3/o3-mini,首次开放给外部研究人员进行安全测试。
页: [1]
查看完整版本: OpenAI发布季Day12|o3/o3-mini即将到来,模型能力再突破】