阶跃星辰推理模型Step R-mini上线：宣称“文理兼修”，AIME等数学基准测试成绩超o1-preview

2025-01-18 发布在科技

IT之家 1 月 18 日消息，阶跃星辰昨日（1 月 16 日）宣布，自研推理模型 Step Reasoner mini（简称 Step R-mini ）上线。

官方表示，在 AIME 和 Math 等数学基准测试上，Step Reasoner mini 的成绩超过了 o1-preview，比肩 OpenAI o1-mini。在 LiveCodeBench 代码任务上，也比 o1-preview 效果更佳。

Step Reasoner mini 通过大规模的强化学习训练，并使用 On-Policy（同策略）强化学习算法，实现了“文理兼修”。Step Reasoner mini 除了能准确解答数学、代码、逻辑推理问题，还能富有创意地完成文学内容创作和日常聊天的任务。

IT之家附体验链接：https://yuewen.cn

“特别声明：以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布，本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”

声明：本站所有文章资源内容，如无特殊说明或标注，均为采集网络资源。如若本站内容侵犯了原著者的合法权益，可联系本站删除。

阶跃星辰推理模型Step R-mini上线：宣称“文理兼修”，AIME等数学基准测试成绩超o1-preview

相关文章

热门

推荐

随机

标签

阶跃星辰推理模型Step R-mini上线：宣称“文理兼修”，AIME等数学基准测试成绩超o1-preview

相关文章

热门

推荐

随机

标签

微信扫一扫打赏