原标题:百川智能发布深度思考模型Baichuan-M1-preview,同时具备语言、视觉和搜索三大领域推理能力

IT之家 1 月 24 日消息,百川智能今日宣布推出全场景深度思考模型 Baichuan-M1-preview,聚齐三大核心推理能力。同时,百川智能还推出了行业首个开源医疗增强大模型 Baichuan-M1-14B。

据官方介绍,Baichuan-M1-preview 同时具备语言、视觉和搜索三大领域推理能力,在数学、代码等多个权威评测中的表现可对标 o1-preview。

IT之家注意到,它还解锁了“医疗循证模式”,实现了从证据检索到深度推理的完整端到端服务,能够快速、精准地回答医疗临床、科研问题。

Baichuan-M1-14B 则是 Baichuan-M1-preview 的小尺寸版本,同时也是行业首个开源的医疗增强大模型。据介绍,其医疗能力超越了更大参数量的 Qwen2.5-72B,与 o1-mini 相差无几。

Github:https:https//github.com/baichuan-inc/Baichuan-M1-14B

Huggingface(base):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Base

Huggingface(Instruct):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Instruct

NPU 版本支持 BF16 推理:https://modelers.cn/models/MindIE/Baichuan-M1-14B-Base

语言推理方面,其在 AIME 和 Math 等数学基准测试,以及 LiveCodeBench 代码任务上的成绩均超越了 o1-preview 等模型。

视觉推理能力方面,在 MMMU-val、MathVista 等权威评测中的成绩,超越了 GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview 等模型。

“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。

Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”