OpenAI发布最新论文:DeepSeek和Kimi发现了o1的秘密
创始人
2025-02-12 22:46:10
0

凤凰网科技讯 2月12日,在中国AI公司的影响下,OpenAI不得不公开O系列强化学习的秘密。今天(2月12日),OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告《Competitive Programming with Large Reasoning Models》,文中放出了OpenAI三个推理模型:o1、o1-ioi、o3在IOI(国际信息学奥林匹克竞赛)和CodeForces(全球知名在线编程竞赛)中的成绩。

论文显示,在IOI 2024中,o3在严格规则下拿到395.64分,达成金牌成就,并且在CodeForces上的表现与人类精英选手相当。论文中特别提到,中国的DeepSeek-R1和Kimi k1.5通过独立研究显示,利用思维链学习(COT)方法,可显著提升模型在数学解题与编程挑战中的综合表现。R1、k1.5是DeepSeek和Kimi在1月20日同时发布的新型推理模型。

该论文通过强化学习(RL)训练的大型语言模型在复杂编码和推理任务上的性能提升,比较了通用推理模型与针对特定领域优化的系统在竞技编程中的表现。研究结果表明,增加强化学习训练计算和测试时计算可显著提升模型性能,使其接近世界顶尖人类选手,这些模型将在科学、编码、数学等领域的AI应用中解锁新的应用体验。

原论文地址:https://arxiv.org/abs/2502.06807

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

相关内容

量子加密技术概念、原理、关...
在数字经济飞速发展的今天,信息安全已成为关乎个人隐私、企业利益乃至...
2026-06-20 09:09:28
港股通信息ETF华富基金延...
中国经济网北京6月18日讯 今日,华富基金发布关于华富中证港股通信...
2026-06-19 22:13:13
现货黄金日内跌幅扩大至2%...
每经AI快讯,6月19日,现货黄金日内跌幅扩大至2%,报4123....
2026-06-19 20:30:33
币安广场生态下加密货币钓鱼...
摘要 关键词:加密货币;币安广场;网络钓鱼;分层检测;闭环防御;视...
2026-06-19 18:22:49
四方精创:积极探索AI、区...
有投资者在互动平台向四方精创提问:“你好董秘,请问公司是否运用了a...
2026-06-19 16:56:29
财中ETF风向标|国产芯片...
华为提出“韬定律”,将国产半导体竞争焦点从单一制程节点追赶,扩展至...
2026-06-19 16:47:46

热门资讯

半年用尽20万吨配额:澳洲牛肉... 全球牛肉市场正在经历一场罕见的供给收缩。中国此时收紧进口配额,恰好踩在了周期的节点上。 6月19日,...
原创 世... 北京时间6月20日晚间,在土耳其与巴拉圭比赛结束后的8个小时,意大利媒体《慢镜头》报道称,52岁的意...
【1192亿美元!本周美股吸引... 【1192亿美元!本周美股吸引创纪录资金,投资者涌向科技股】截至6月17日当周,流入美国股票基金的资...
原创 美... 不管美国方面如何试图解释和淡化,有一个事实已经被摆在台面上,无法回避——美国副总统万斯在公开场合已经...
原创 关... 近日,美国特朗普政府宣布将向60个国家和地区加征额外关税,其中中国及中国香港被征收最高的12.5%。...
原创 向... 结局不出所料,还没到特朗普的“最后通牒日”,欧盟就主动妥协了。然而,欧盟一边下跪服软,抱怨美国对自己...
财中基金发行聚焦丨华安基金发行... 6月5日,华安智享量化选股股票(027352.OF)启动发行,认购期12天,募集份额上限20亿份,管...