OpenAI发布最新论文:DeepSeek和Kimi发现了o1的秘密
创始人
2025-02-12 22:46:10
0

凤凰网科技讯 2月12日,在中国AI公司的影响下,OpenAI不得不公开O系列强化学习的秘密。今天(2月12日),OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告《Competitive Programming with Large Reasoning Models》,文中放出了OpenAI三个推理模型:o1、o1-ioi、o3在IOI(国际信息学奥林匹克竞赛)和CodeForces(全球知名在线编程竞赛)中的成绩。

论文显示,在IOI 2024中,o3在严格规则下拿到395.64分,达成金牌成就,并且在CodeForces上的表现与人类精英选手相当。论文中特别提到,中国的DeepSeek-R1和Kimi k1.5通过独立研究显示,利用思维链学习(COT)方法,可显著提升模型在数学解题与编程挑战中的综合表现。R1、k1.5是DeepSeek和Kimi在1月20日同时发布的新型推理模型。

该论文通过强化学习(RL)训练的大型语言模型在复杂编码和推理任务上的性能提升,比较了通用推理模型与针对特定领域优化的系统在竞技编程中的表现。研究结果表明,增加强化学习训练计算和测试时计算可显著提升模型性能,使其接近世界顶尖人类选手,这些模型将在科学、编码、数学等领域的AI应用中解锁新的应用体验。

原论文地址:https://arxiv.org/abs/2502.06807

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

相关内容

ETF午评 | 金价连续第...
A股三大指数早盘表现不一,截至午盘,沪指平收,深成指跌0.92%,...
2026-02-04 12:30:34
中国信息通信研究院取得基于...
国家知识产权局信息显示,中国信息通信研究院取得一项名为“基于区块链...
2026-02-04 10:02:17
洲际交易所(ICE)纽约可...
每经AI快讯,2月3日,洲际交易所(ICE)纽约可可期货上涨超过4...
2026-02-04 07:26:31
黄金、白银,直线拉升!
现货黄金、现货白银开盘快速走高! 2月3日早盘,现货黄金开盘反弹,...
2026-02-04 07:16:15
上期所:调整白银期货相关合...
每经AI快讯,2月3日,上期所公告,经研究决定,自2026年2月4...
2026-02-03 21:41:05
富国基金毛一凡:红利不是风...
导读:索罗斯曾经说过,他有一个重要的择时信号是“背疼”。当市场到达...
2026-02-03 21:39:46

热门资讯

“网红基”国投瑞银白银LOF连... 来源:视觉中国 2月4日,国投瑞银白银期货(LOF)复牌再度跌停,报3.825元,已连续三日跌停。 ...
技术分析:布伦特原油期货价格暂... Economies.com的分析师今日最新观点:在最近的日内交易中,布伦特原油 期货价格下跌,回吐了...
【ETF动向】2月3日鹏华中证... 证券之星消息,2月3日,鹏华中证细分化工产业ETF基金(159870)涨4.1%,成交额20.8亿元...
【ETF动向】2月3日华夏中证... 证券之星消息,2月3日,华夏中证科创创业50ETF基金(159783)涨0.63%,成交额4.09亿...
双创板块集体回调,创业板ETF... 截至午间收盘,创业板指数下跌1.7%,上证科创板50成份指数、中证科创创业50指数均下跌2.4%,创...
市场冲高回落,持续关注A500... 2月4日早盘,市场冲高回落,沪指接近平收,板块题材上,煤炭开采、航空运输、太空光伏概念活跃,互联网、...
中国工商银行取得基于区块链的票... 国家知识产权局信息显示,中国工商银行股份有限公司取得一项名为“基于区块链的票据会签方法、装置及系统”...
黄金重回5000美元大关!易方... 今日,国际现货黄金重回5000美元/盎司关键关口,截至9:00,伦敦金现报5015.55美元/盎司,...
国投白银LOF暴跌31.5%创... 2月3日,市场上广受关注的公募“顶流”——国投白银LOF,在复牌后再度跌停。 值得注意的是,在这次跌...