OpenAI发布最新论文:DeepSeek和Kimi发现了o1的秘密
创始人
2025-02-12 22:46:10
0

凤凰网科技讯 2月12日,在中国AI公司的影响下,OpenAI不得不公开O系列强化学习的秘密。今天(2月12日),OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告《Competitive Programming with Large Reasoning Models》,文中放出了OpenAI三个推理模型:o1、o1-ioi、o3在IOI(国际信息学奥林匹克竞赛)和CodeForces(全球知名在线编程竞赛)中的成绩。

论文显示,在IOI 2024中,o3在严格规则下拿到395.64分,达成金牌成就,并且在CodeForces上的表现与人类精英选手相当。论文中特别提到,中国的DeepSeek-R1和Kimi k1.5通过独立研究显示,利用思维链学习(COT)方法,可显著提升模型在数学解题与编程挑战中的综合表现。R1、k1.5是DeepSeek和Kimi在1月20日同时发布的新型推理模型。

该论文通过强化学习(RL)训练的大型语言模型在复杂编码和推理任务上的性能提升,比较了通用推理模型与针对特定领域优化的系统在竞技编程中的表现。研究结果表明,增加强化学习训练计算和测试时计算可显著提升模型性能,使其接近世界顶尖人类选手,这些模型将在科学、编码、数学等领域的AI应用中解锁新的应用体验。

原论文地址:https://arxiv.org/abs/2502.06807

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

相关内容

民生银行(600016.S...
格隆汇5月14日丨民生银行(600016.SH)公布,经国家金融监...
2026-05-15 00:55:08
国债期货走弱 30年期主力...
每经AI快讯,5月14日,国债期货走弱,30年期主力合约盘中跌0....
2026-05-14 18:09:03
原创 ...
来源:网络消息 国家自然科学基金委员会近日放出重磅消息:2026...
2026-05-14 10:47:19
李申离任天治可转债增强债券
中国经济网北京5月13日讯 昨日,天治基金公告,李申离任天治可转债...
2026-05-14 10:39:01
软件ETF国泰(51523...
5月13日,A股市场整体回暖,三大指数集体飘红,创业板指以2.63...
2026-05-14 10:12:55
印度黄金期货价格跃升6%
每经AI快讯,印度黄金期货价格跃升6%,此前印度政府提高黄金进口关...
2026-05-13 23:17:27

热门资讯

美联储威廉姆斯:关税影响似乎已... 美联储威廉姆斯称,关税影响似乎已基本传导至经济之中,就业市场并未推动通胀压力,就业市场并不紧张;对近...
【机构调研记录】创金合信基金调... 证券之星消息,根据市场公开信息及5月14日披露的机构调研信息,创金合信基金近期对1家上市公司进行了调...
【机构调研记录】博时基金调研航... 证券之星消息,根据市场公开信息及5月14日披露的机构调研信息,博时基金近期对2家上市公司进行了调研,...
【机构调研记录】东方基金调研达... 证券之星消息,根据市场公开信息及5月14日披露的机构调研信息,东方基金近期对2家上市公司进行了调研,...
【机构调研记录】金信基金调研雷... 证券之星消息,根据市场公开信息及5月14日披露的机构调研信息,金信基金近期对1家上市公司进行了调研,...
【机构调研记录】信达澳亚基金调... 证券之星消息,根据市场公开信息及5月14日披露的机构调研信息,信达澳亚基金近期对1家上市公司进行了调...
【机构调研记录】华商基金调研金... 证券之星消息,根据市场公开信息及5月14日披露的机构调研信息,华商基金近期对2家上市公司进行了调研,...
【机构调研记录】华安基金调研广... 证券之星消息,根据市场公开信息及5月14日披露的机构调研信息,华安基金近期对1家上市公司进行了调研,...
【机构调研记录】富国基金调研阿... 证券之星消息,根据市场公开信息及5月14日披露的机构调研信息,富国基金近期对2家上市公司进行了调研,...
【机构调研记录】红土创新基金调... 证券之星消息,根据市场公开信息及5月14日披露的机构调研信息,红土创新基金近期对1家上市公司进行了调...