OpenAI发布最新论文:DeepSeek和Kimi发现了o1的秘密
创始人
2025-02-12 22:46:10
0

凤凰网科技讯 2月12日,在中国AI公司的影响下,OpenAI不得不公开O系列强化学习的秘密。今天(2月12日),OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告《Competitive Programming with Large Reasoning Models》,文中放出了OpenAI三个推理模型:o1、o1-ioi、o3在IOI(国际信息学奥林匹克竞赛)和CodeForces(全球知名在线编程竞赛)中的成绩。

论文显示,在IOI 2024中,o3在严格规则下拿到395.64分,达成金牌成就,并且在CodeForces上的表现与人类精英选手相当。论文中特别提到,中国的DeepSeek-R1和Kimi k1.5通过独立研究显示,利用思维链学习(COT)方法,可显著提升模型在数学解题与编程挑战中的综合表现。R1、k1.5是DeepSeek和Kimi在1月20日同时发布的新型推理模型。

该论文通过强化学习(RL)训练的大型语言模型在复杂编码和推理任务上的性能提升,比较了通用推理模型与针对特定领域优化的系统在竞技编程中的表现。研究结果表明,增加强化学习训练计算和测试时计算可显著提升模型性能,使其接近世界顶尖人类选手,这些模型将在科学、编码、数学等领域的AI应用中解锁新的应用体验。

原论文地址:https://arxiv.org/abs/2502.06807

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

相关内容

OpenAI发布最新论文:...
凤凰网科技讯 2月12日,在中国AI公司的影响下,OpenAI不得...
2025-02-12 22:46:10
DeepSeek概念持续上...
今日,DeepSeek概念表现活跃,人工智能产业指数集体走强。截至...
2025-02-12 19:09:18
ETF盘中资讯|港股重拾牛...
2月12日,港股龙头再启攻势,截至发稿,三大指数均涨逾1%。AI概...
2025-02-12 16:26:01
ETF盘中资讯|多家金融机...
12日早盘,计算机板块再度大涨,金融科技方向表现亮眼,中证金融科技...
2025-02-12 16:11:59
AI题材涨幅居前,科创成长...
科创板系列指数午盘收涨,盘面上,DeepSeek、液冷服务器、算力...
2025-02-12 16:10:46
行业ETF风向标丨光线传媒...
今日上午,DeepSeek产业链相关ETF继续全面大涨,多只云计算...
2025-02-12 15:11:14

热门资讯

区块链概念13日主力净流出4.... 8月13日,区块链概念上涨0.65%,今日主力资金流出4.6亿元,概念股180只上涨,40只下跌。 ...
IPO雷达|背靠五粮液,“白酒... 深圳商报·读创客户端记者 宁可坚 港交所官网信息显示,宜宾商业银行已于12月20日通过港交所聆讯,有...
【ETF动向】12月16日国寿... 证券之星消息,12月16日,国寿安保沪深300ETF基金(510380)跌0.44%,成交额1274...
12月16日基金净值:广发沪深... 证券之星消息,12月16日,广发沪深300ETF联接A最新单位净值为1.7625元,累计净值为2.3...
货币信贷改善将推动钢市“供需转... 宏观数据 据中国人民银行统计数据显示,2024年8月末,广义货币(M2)余额305.05万亿元,同比...
How to Reduce t... 1. The hazards of solder balls There are solder ba...
葡萄牙贝森银行——实现法定货币... 01 银行简介 贝森银行是一家成立于2001年的全牌照实体银行,总部位于葡萄牙。作为欧盟央行监管下的...
银行“港漂”IPO有了新进展 ... [ 今年截至目前,A股市场银行股IPO仍“颗粒无收”,不仅未有银行成功实现上市,反而有3家主动撤回了...
中国建设银行股份有限公司重庆市... 金融界2024年11月27日消息,国家知识产权局信息显示,中国建设银行股份有限公司重庆市分行取得一项...