OpenAI发布最新论文:DeepSeek和Kimi发现了o1的秘密
创始人
2025-02-12 22:46:10
0

凤凰网科技讯 2月12日,在中国AI公司的影响下,OpenAI不得不公开O系列强化学习的秘密。今天(2月12日),OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告《Competitive Programming with Large Reasoning Models》,文中放出了OpenAI三个推理模型:o1、o1-ioi、o3在IOI(国际信息学奥林匹克竞赛)和CodeForces(全球知名在线编程竞赛)中的成绩。

论文显示,在IOI 2024中,o3在严格规则下拿到395.64分,达成金牌成就,并且在CodeForces上的表现与人类精英选手相当。论文中特别提到,中国的DeepSeek-R1和Kimi k1.5通过独立研究显示,利用思维链学习(COT)方法,可显著提升模型在数学解题与编程挑战中的综合表现。R1、k1.5是DeepSeek和Kimi在1月20日同时发布的新型推理模型。

该论文通过强化学习(RL)训练的大型语言模型在复杂编码和推理任务上的性能提升,比较了通用推理模型与针对特定领域优化的系统在竞技编程中的表现。研究结果表明,增加强化学习训练计算和测试时计算可显著提升模型性能,使其接近世界顶尖人类选手,这些模型将在科学、编码、数学等领域的AI应用中解锁新的应用体验。

原论文地址:https://arxiv.org/abs/2502.06807

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

相关内容

东亚太平洋地区谁受美国关税...
世界银行(下称“世行”)在最新报告中称,三大外部因素正在重塑东亚太...
2026-04-10 04:03:54
ETF收评 | 油气开采Ⅱ...
同壁财经4月9日讯,截至收盘,上证指数下跌0.72%,深证成指下跌...
2026-04-10 03:00:16
欧市尾盘,ICE英国天然气...
每经AI快讯,周三(4月8日)欧市尾盘,ICE英国天然气期货跌15...
2026-04-09 19:41:51
黄金因可能出现技术性回调而...
继纽商所近月 黄金期货合约隔夜上涨近2%后,黄金在早盘因可能出现技...
2026-04-09 11:33:22
伊斯坦布尔证券交易所30指...
每经AI快讯,4月8日,伊斯坦布尔证券交易所30指数期货盘前交易上...
2026-04-08 21:55:02
港股通信息科技ETF易方达...
格隆汇4月8日|地缘冲突缓和,亚太市场大反攻,科技股成为上涨先锋,...
2026-04-08 21:46:59

热门资讯

东亚太平洋地区谁受美国关税影响... 世界银行(下称“世行”)在最新报告中称,三大外部因素正在重塑东亚太平洋地区的经济前景,即中东冲突、关...
原创 中... 中美关系的发展不仅关乎两国自身的利益,更是全球经济和政治格局的重要风向标。随着美国关税战的持续升温,...
特朗普称将对向伊朗提供武器的国... 中新网北京4月9日电(记者 李京泽)中国外交部发言人毛宁4月9日主持例行记者会。 有记者提问:第一个...
特朗普称对向伊朗供应军事武器的... 今天,外交部例行记者会上,有记者提及:美国总统特朗普在社交平台上表示,任何向伊朗供应军事武器的国家,...
中方回应特朗普关税言论:关税战... 中国青年报客户端北京4月9日电(中青报·中青网记者 贾晓静)针对美国总统特朗普称将对向伊朗提供武器的...
越贤人才基金成立 投资界4月9日消息,一起创图南资本联合绍兴越城区政府产业基金共同发起设立绍兴市越城区越贤人才创业投资...
新强联:4月9日接受机构调研,... 证券之星消息,2026年4月9日新强联(300850)发布公告称公司于2026年4月9日接受机构调研...
原创 4... 写在文章前的声明:在本文之前的说明:本文中所列的投资信息,只是一个对基金资产净值进行排行的客观描述,...