OpenAI发布最新论文:DeepSeek和Kimi发现了o1的秘密
创始人
2025-02-12 22:46:10
0

凤凰网科技讯 2月12日,在中国AI公司的影响下,OpenAI不得不公开O系列强化学习的秘密。今天(2月12日),OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告《Competitive Programming with Large Reasoning Models》,文中放出了OpenAI三个推理模型:o1、o1-ioi、o3在IOI(国际信息学奥林匹克竞赛)和CodeForces(全球知名在线编程竞赛)中的成绩。

论文显示,在IOI 2024中,o3在严格规则下拿到395.64分,达成金牌成就,并且在CodeForces上的表现与人类精英选手相当。论文中特别提到,中国的DeepSeek-R1和Kimi k1.5通过独立研究显示,利用思维链学习(COT)方法,可显著提升模型在数学解题与编程挑战中的综合表现。R1、k1.5是DeepSeek和Kimi在1月20日同时发布的新型推理模型。

该论文通过强化学习(RL)训练的大型语言模型在复杂编码和推理任务上的性能提升,比较了通用推理模型与针对特定领域优化的系统在竞技编程中的表现。研究结果表明,增加强化学习训练计算和测试时计算可显著提升模型性能,使其接近世界顶尖人类选手,这些模型将在科学、编码、数学等领域的AI应用中解锁新的应用体验。

原论文地址:https://arxiv.org/abs/2502.06807

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

相关内容

欧洲斯托克50指数期货上涨...
每经AI快讯,4月10日,欧洲斯托克50指数期货上涨0.5%,德国...
2026-04-10 16:17:40
AI算力需求激增,软件ET...
截至4月10日10点15分,上证指数涨0.95%,深证成指涨2.3...
2026-04-10 16:01:32
东亚太平洋地区谁受美国关税...
世界银行(下称“世行”)在最新报告中称,三大外部因素正在重塑东亚太...
2026-04-10 04:03:54
ETF收评 | 油气开采Ⅱ...
同壁财经4月9日讯,截至收盘,上证指数下跌0.72%,深证成指下跌...
2026-04-10 03:00:16
欧市尾盘,ICE英国天然气...
每经AI快讯,周三(4月8日)欧市尾盘,ICE英国天然气期货跌15...
2026-04-09 19:41:51
黄金因可能出现技术性回调而...
继纽商所近月 黄金期货合约隔夜上涨近2%后,黄金在早盘因可能出现技...
2026-04-09 11:33:22

热门资讯

富时中国A50指数期货涨幅扩大... 富时中国A50指数期货涨幅扩大至2%。
CBOT农产品期货主力合约收盘... 每经AI快讯,当地时间4月9日,芝加哥期货交易所(CBOT)农产品期货主力合约收盘多数下跌,大豆期货...
周四纽约尾盘,ICE原糖期货跌... 每经AI快讯,周四(4月9日)纽约尾盘,ICE原糖期货跌1.97%,ICE白糖期货跌2.04%。IC...
集运指数欧线期货主力合约跌逾6... 人民财讯4月10日电,集运指数欧线期货主力合约跌逾6%,现报1942.9点。
周四(4月9日)纽约尾盘,IC... 周四(4月9日)纽约尾盘,ICE原糖期货跌1.97%,ICE白糖期货跌2.04%。 ICE阿拉比卡...
欧洲斯托克50指数期货上涨0.... 每经AI快讯,4月10日,欧洲斯托克50指数期货上涨0.5%,德国DAX指数期货上涨0.4%,英国富...
证监会核准中金财富期货吸收合并... 据财联社消息,4月8日,证监会发布批复,核准中金财富期货有限公司变更控股股东并吸收合并中金期货有限公...
地缘风险未根本缓解,金价维持震... 2026年4月10日,地缘风险未根本缓解,现货黄金早盘冲高后迅速回落,维持震荡,盘中最高4780美元...
黄金饰品价格连涨8个月后首次下... 新京报讯(记者姜慧梓)4月10日,国家统计局公布数据,3月份居民消费价格同比上涨1.0%,环比下降0...
中期协:黄金期货成交额10.4... 4月10日,中国期货业协会发布的最新统计资料表明,以单边计算,3月全国期货市场成交量为11.86亿手...