科大讯飞AI for Science版图再落一子,人工智能国家队在科学智能赛道持续加码
近日,科大讯飞研究院与认知智能全国重点实验室联合团队在Nature旗下《通讯-化学》发表论文,系统揭示了当前多模态大模型在化学推理任务中的能力边界与技术瓶颈。这是继核聚变等离子体建模、智能化工大模型等成果之后,科大讯飞在科学智能方向的又一重要进展。

一项“照镜子”式的研究
与此前聚焦具体应用场景不同,此次发表的研究更像是一面“镜子”——它的核心价值不在于解决某个具体问题,而在于系统性地检验当前AI在科学推理领域的真实水平。
研究团队从二十余年美国化学奥林匹克竞赛中精选473道图文结合题目,构建了名为USNCO-V的多模态评测基准,随后对包括GPT-5、Gemini-2.5-Pro在内的40款主流大模型进行了全面测试。
结果喜忧参半。喜的是,顶尖模型GPT-5准确率达93.2%,大幅超越人类选手44.6%的平均水平;忧的是,研究首次发现了“视觉失配效应”——部分模型在移除图像输入后,答题准确率反而提升,说明当前多模态AI在处理科学图像时,视觉与语言模块尚未形成有效协同。
此外,分子结构识别与实验装置理解仍是各类模型的共同短板。这些发现为行业指明了下一阶段的攻关方向。
大模型国家队的科学智能版图
将此次研究置于科大讯飞整体战略中观察,其布局脉络更加清晰。
作为人工智能国家队核心成员,科大讯飞依托认知智能全国重点实验室,近年来在AI for Science领域多线并进:
在科研基础设施层面,与中国科学院共建的“星火科研助手”已覆盖全国1300余所高校,服务17万余名科研人员,累计功能调用近400万次;
在垂直领域应用层面,联合中科院大连化物所打造的智能化工大模型已迭代至3.0版本,并在《催化学报》发表700亿参数的ChenELLM大模型;与中国科学技术大学合作的PaMMA-Net模型则突破了核聚变等离子体磁测量演化建模瓶颈,成果发表于《Nuclear Fusion》;
在基础能力建设层面,其自研的化学基础科学大模型在分子理解任务上较GPT-4o提升超15%,此次发表的评测基准则为行业提供了标准化的能力检验工具。
值得关注的是,科大讯飞在技术路线上始终强调全栈自主可控,其星火大模型从底层算力到核心算法均采用全国产方案。在当前国际科技博弈背景下,这一坚持的战略意义不言而喻。
科学智能赛道的竞争逻辑
与通用大模型的“百模大战”不同,AI for Science赛道的竞争逻辑更强调深度耕耘与生态构建。
一方面,科学问题的复杂性决定了技术突破需要长期积累,难以通过短期资源堆砌实现弯道超车;另一方面,科研场景高度依赖专业数据与领域知识,谁能率先打通“数据-模型-场景”的闭环,谁就有望建立起持久的竞争壁垒。
从这个角度看,科大讯飞的布局思路颇为清晰:以全国重点实验室为技术底座,以星火大模型为能力引擎,以高校科研院所为核心用户,逐步构建起覆盖多学科的科学智能生态。
当AI从“替代重复劳动”走向“加速科学发现”,一个更具想象空间的市场正在打开。而对于早已将科学智能纳入核心战略的科大讯飞而言,这场竞赛才刚刚进入中场。















