找回密码
 立即注册

QQ登录

只需一步,快速开始

广告载入中...
查看: 55|回复: 2

OpenAI发布季Day12|o3/o3-mini即将到来,模型能力再突破】

[复制链接]
发表于 2024-12-22 11:44 | 显示全部楼层 |阅读模式

马上注册,享用更多功能,让你轻松玩转本论坛。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
【OpenAI发布季Day12|o3/o3-mini即将到来,模型能力再突破】国金计算机
OpenAI展示最新推理模型o3/o3-mini,首次开放给外部研究人员进行安全测试。
o3基准测试取得突破性进展:
SWE-BenchVerified软件基础测试准确率达71.7%,比o1高22.8pct;
Codeforces竞赛编程评分2727,超过OpenAI首席科学家,o1评分1891;
美国奥数选拔考试AMIE准确率96.7%,比o1高13.4pct;
博士级难度科学问答GPQADiamond准确率87.7%,比o1高9.7pct;
前沿数学基准测试中准确率超过25%,目前其他所有模型准确率均低于2%。
o3-mini注重性价比:支持低、中、高三种推理计算选项,中档模式下编程、奥数能力优于满血版o1,延迟显著低于o1-mini。
计划根据安全测试结果在1月底左右正式发布o3Mini,随后发布完整版的o3。
建议关注A股/港股相关映射机会:
【AIAgent】金山办公、三六零、福昕软件、合合信息、拓尔思、新致软件、鼎捷数智、福昕软件、泛微网络、致远互联、金蝶国际、用友网络;
【通用模型训练】科大讯飞、商汤;
【模型训练支持】海天瑞声、星环科技、英方软件;
【多模态】万兴科技、虹软科技、海康威视、大华股份、萤石网络、广联达、千方科技、云从科技、第四范式、彩讯股份、汉仪股份、盛视科技、苏州科达、熵基科技、狄耐克

发表于 2024-12-22 14:58 | 显示全部楼层
谢谢您的分享!
回复

使用道具 举报

 楼主| 发表于 2024-12-22 16:57 | 显示全部楼层
OpenAI展示最新推理模型o3/o3-mini,首次开放给外部研究人员进行安全测试。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|股海明灯官网 ( 京ICP备18020431号 )

GMT+8, 2024-12-26 01:52 , Processed in 0.089388 second(s), Total 11, Slave 10 queries , Gzip On, MemCached On.

Powered by Discuz! X3.5 Licensed

Copyright © 2001-2024 Tencent Cloud.

快速回复 返回顶部 返回列表