讯兔科技2026年AI投研展望:AI研究员元年丨深度
每年新年伊始,AI的飞速进化总是给我们带来新的惊喜和焦虑。2025年春节回来所有人都在学deepseek;2026年复工后都在问“如何养龙虾(OpenClaw)”。
今年年初Agent的进化,带来了个人助理技术的无限可能。2026年的AI投研年度展望报告,我们将:梳理过去数月Agent进化的核心脉络、探讨通用模型是否会吞噬垂直软件、对2026年AI在投研能力进化、人类研究与AI研究的前景做出展望。
本文一方面旨在提供一些Alpha派在Agent应用一线研发的视角,另一方面也希望多少缓解大家的焦虑感,提供一些能见度更高的节奏感。
核心观点
通用Agent进化跨过可用门槛,日常信息处理开始进入50分水平
垂类应用的壁垒——Know-how-context,即把专业的数据、技巧以舒服的姿势喂给AI
Skills机制是这一波最重要的范式变化,定义了未来专业工作者跟Agent怎么交互
行业软件不会被通用模型直接吞噬,而是“消融”:有的向上突围成为行业新入口,有的向后退化为API服务者
跑分夺冠≠实际投研能力,SOTA模型当前不具备人类对于公司业务的精细理解、预测的能力,更多是形式上的厉害
2026年,可能是人机协同元年。人类先以合理的方式“培养”AI研究员,AI研究员会增强对人类研究工作的赋能
人类研究员的价值——养好AI研究员,回归与人的交互,构建差异化信息网络,并在市场共识之上独立推理非共识
01
通用模型和Agent进化回顾
2025年下半年以来,通用模型的推理、工具调用与多模态处理持续增强,Agent从“能聊”走向“能干”。对投研而言,最直观的变化是:通用Agent已经能把一些简单投研任务做到50分水平——不完美,但能节省大量重复劳动。
从Manus观测Agent进化
Manus是2025年全球通用Agent产品的顶流。我们经常把同样的投研任务定期丢给Manus,看他隔一段时间能进化到什么程度。
我们以“从上市公司年报中提取煤炭成本数据、搭建初级数据库”为例跑了2次。2025年6月,Manus用了1小时,一家公司的数据都没提出来,0分——核心原因:200页左右的年报PDF读取失败。
2026年1月,同样的任务,他25分钟提了4家公司的成本数据,已经有50分的水平。关键进化点在于:知道200页的年报PDF属于特殊类型的长文本,需要coding与AI能力融合才能准确地区数据。

任务运行时间节省了60%,也进一步体现Agent的任务规划、工具调用和推理更加合理、高效。
国产模型在投研推理场景
与海外模型的差距
Alpha派有一个很考验逻辑水平的Agent:观点Challenge——就是找文本/报告段落是否存在事实错误、逻辑谬误或者宏大叙事等“坑”。
我们用一个投研常见陷阱做测试:某机构研究员以“25年1月同比景气”来推荐金饰品公司(bug在于忽略了“春节错位”导致的基数效应,即24年与25年春节月份不同,用1月同比直接推出景气结论并不严谨)。
从几个海外模型与国产模型的Challenge结果来看,海外SOTA模型通常能快速定位逻辑漏洞;国产模型在过去2-3个月的迭代后,对这类文字逻辑问题的定位能力明显追上。

图为最新的Doubao-Seed-2.0、智谱GLM-5.0与之前版本的Challenge案例比较
可以预见,在2026年,绝大部分日常的投研信息处理类需求,国产模型的文本推理能力足以胜任。
02
爆火的OpenClaw产品背后的技术脉络
2026年伊始,Agent应用领域迎来爆发,OpenClaw的爆火让人兴奋,也带来一丝“不学习就被淘汰”的FOMO情绪。
那么,突飞猛进的背后,除去基础模型能力的进步,还发生了什么?对未来投研工作流会产生什么影响?我们来系统化梳理一下。
Agent应用的技术架构
如果把个人工作助理型Agent的技术设计粗暴抽象一下,其实就三层:数据、Context(上下文)、交互。

数据层负责把公开数据和私域资料联通起来;交互层是入口;真正最关键、也最难的还是Context层——把专业信息用舒服的姿势喂给模型,里面既有工程化(压缩、记忆、指令),也有专业化(Know-how)。对垂类软件而言,真正的“卡位”多半就在Know-how-context,最近出圈的Skills,本质也在这一层。
Skills:最重要的范式变化
在2026年初这波Agent热潮的新概念中,我们认为最为重要的创新是Skills机制的推出——它定义了未来专业工作者跟Agent怎么交互。
Skills并不是什么玄幻的概念,本质就是一种更高级的prompt:用自然语言把自己的工作流写成一个Agent也看得懂的“攻略”,在未来复杂的任务中,Agent可以自己判断调用Skills并按步骤完成工作。它对投研工作未来产生的潜在影响包括三部分:
工作流复用:比如“写业绩点评/公司一页纸/行业周报”等重复任务沉淀为可迭代的Skill.md文件,后续反复调用并持续调优
上下文增强:技术上倡导“渐进式披露(progressive disclosure)”,能按需调用,需要哪段资料就调哪段,省上下文,对投研这种token超长的活是利好
流通生态:Skills的本质是将人类的知识、工作流程落笔为markdown文件,在可见的未来,各个细分行业内的Skills也将逐渐被书写和传播甚至合理地定价
2026年,可能日常投研工作中会多一句话:
你的拆模型/写点评/整理日报/算弹性的skills是怎么写的?
狂奔的“龙虾(OpenClaw)”
先说Anthropic更早发布的Claude Cowork。
本质上讲,Claude Cowork和OpenClaw都是一类产品——“个人桌面AI助手”。
近期Agent产品的爆发,本质是AI Coding(及背后的大模型、Agent技术)的能力外溢。正如Anthropic官方所说,因为发现大量用户在用Claude Code处理“清理邮箱、制定旅行计划”等非编程任务,才促使他们将Coding Agent的能力外化为这款人人可用的桌面端应用。
相比于(我们定义为个人云端助理的)Manus,Claude Cowork发布时最大的独特性在于:可无缝读取用户电脑磁盘文件、可应用Skills。它不仅支持用户主动声明创建并修改Skills,还支持Agent自动化地判定是否需要加载Skills完成任务。正是这种能力,让它一经推出便迅速出圈。
再说投资圈最火爆的OpenClaw。
公众注意力容易被“Mac Mini卖断货”“养虾”这类博眼球的带偏。事实上,我们认为OpenClaw仍然没有偏离“个人桌面助理”的主线。龙虾的出圈因为其满足了以下几个核心要素:
能联通用户本地、可定义和应用Skills(并内置了大量社区流行的通用Skills)
可在用户本地额外的一台设备中部署Agent,不和用户抢电脑、可以24小时工作、可以同步读取用户私域文件
打通了IM工具,让用户可以通过即时通讯软件(Whatsapp、Discord、飞书、钉钉等)和AI交流,随时派活
主动发言机制:Agent会主动报备、推送可能重要的信息,“活人感”十足

也就是说,OpenClaw的成功,是源于其精巧的工程化设计,他整合了当下所有前沿Agent能力和最新成果,用活人感最强的方式推向了全球用户;他并不是大模型自身的进步,也不必一定绑定MacMini或者NAS系统。
Q需要自己搭一个“龙虾”吗
我们的答案是不必因为焦虑而投入精力。“龙虾”终究是一款个体开发的开源软件,其在Agent优化、工具调用(尤其涉及投研常见的浏览器工具、写作工具、数据分析工具等)能力甚至显著弱于Manus、Kimi等商业Agent应用。对于一个非编程背景的研究员来说,通常需要5-10个小时不等去部署、启动,且绝大部分任务无法得到60分以上的结果。因此我们认为此时并不需要因为“FOMO”而占用精力。
03
模型会吞噬垂直软件吗?
——Alpha派的思考
应用消融(Melting Away)
近期市场对“通用模型击穿软件壁垒”的担忧升温,我们认为:软件应用不会因为大模型的进化而消亡,更合理的表述,是OpenClaw作者在博客中提出的“消融(Melting Away)”。
消融这个词可谓精准,将未来垂直软件应用划分为三种命运归宿:
有垂直行业深厚的数据和逻辑壁垒,通用Agent无法进入,从而向上突围成为行业新入口
掌握了垂直行业的核心工作流和数据,但是入口被通用个人助理型Agent占据,向后退化为API服务者(被动与AI融合,也即“消融”)
行业内提供局部工具的胶水型应用,最容易被“消灭”

模型跑分≠实际投研能力
2月6日,Anthropic称Claude Opus 4.6在Finance Agent Benchmark跑分登顶,引发美股金融信息服务类软件股价一度暴跌10%以上,也加剧了从业者的焦虑。实际上,这个开源评测集大多是数据查询、信息检索题,对于投研任务来说,还是过于简单了。

因此Claude Opus 4.6的Finance跑分很强,并不意味着他可以超越垂直金融Agent甚至人类研究员的能力,甚至还差很远。举个例子:
案例:做一份英伟达的估值模型Excel。
最终生成的Excel文件么……说他差,确实像模像样,格式、公式都很像投行分析师的作品;说他好——他的基本假设页的拆分实在是过于简单:仅把英伟达公司的核心业务拆分为DC、Gaming、Automobile等就草草了事。这样的结果相信在任何一家投研机构都没办法给及格。

对于英伟达,哪怕是初级人类分析师,也会将公司的GPU(数据中心)业务进一步拆分为A、H、B、Rubin和其他衍生收入的细项,并针对B卡带来的隐含销售收入(如机柜、Grace CPU等)做出测算。

从Claude模型的表现看,SOTA模型当前可能还不具备人类对于公司业务的精细理解、预测的能力,更多还是形式上的厉害。
投研Agent的壁垒在哪里
随着大模型的推理能力加速进化,对于垂直行业AI应用来说,最核心的卡位在于通用大模型无法轻易直连的“行业内环境”,也即圈内数据、工具和工作方法。

在2025年,Alpha派秉承“完成用户1000件小事”的理念,创新性推出了一系列投研工作流专用Agent:公司一页纸、调研大纲、可比公司、画图等;投研问答助手PaiPai,也在年末推出了Pro思考模式,达到了投研领域SOTA水平。
其中,公司一页纸累计帮助用户完成超5000家新公司(含港美股)的入门学习,广泛应用的本质,是Alpha派研发团队编排了一种工作流,用中国投资者快速学习新公司的框架,“教会”了模型如何学习关于公司的资料并写出长度、深度和数据准确合理的作文。
一页纸的开篇段落即为“公司核心逻辑”和“近期催化”(而非传统的公司简介)。从用户的使用数据看,超过40%的用户在读完核心逻辑和催化部分后就离开了一页纸,这也验证了其核心诉求就是“快速了解新公司的短期逻辑”。这种精细的段落次序,通用模型是很难深入理解并完成的。
另一个典型案例是AI会议纪要,2025年Q4,我们推出了语音转写Pro模型,一举将会议中晦涩技术名词、环境嘈杂、中英夹杂等疑难问题单篇转写错误率降低到2%以下(传统ASR模型为近30%,Alpha派上一代模型约5%)。
将语音转写正确率提升至接近99%,正是将更加正确的语义(Context)喂给模型的关键要素,也正是我们对于垂直领域应用壁垒在数据和Know-how-context的实践。在2026年,Alpha派还会将更多“小事”、专业的投研工作流程完成到95分,做到让用户拿来即用。
04
AI与投研生态展望
未来的AI投研知识库
从2025年初,个人知识库就是AI产品的热门分支。但去年并没有真正跑出在垂直行业内可信任、可迭代的产品。2026年随着Agent更完善、桌面个人AI助手兴起,联通个人知识框架(私域数据+Skills)的路径已经通畅。
我们认为2026年的投研Agent可能会有如下发展趋势:
每个研究员/基金经理都能有自己的Agent和工作流(不再是每个人运行Alpha派定义好的一页纸)
Agent开始有“记忆”,能在你的个人知识空间里干活(可能需要机构系统配合)
不再只被call才回答,而是7*24帮你盯信息、提示变化
当然,从通用问答走向个人助理,算力与存储成本会成倍上升,垂直软件的商业模式也会被迫进化。
AI研究员的能力进化节奏
我们维持2025年做出的AI研究员进化时间表的判断:
2023-2024:实习生水平
2025-2027:研究员水平(初级-中级-高级)
2028-未来:基助水平
2026年全球Agent能力进化的节奏,让我们看到了AI走向中级研究水平的曙光。但是完整打造一个AI研究员的时间,依然还需要2年甚至更久,有更多的数据、Know-How需要让模型学习。而且这种能力也不是均等分发的,你的Agent强不强,很大程度取决于你的心态和跟他的交互深度:你教他越多,他进步越快。
7-2-1分化定律
2025年,我们提出了一个投研行业内人群分化定律:
10%的从业者受益于AI,完成能力拓圈和职业生涯跃升
70%的从业者受益于AI,(或被动地)大幅提升了工作效率
20%的从业者的工作内容被AI替代
研究发现,95%左右的用户向AI提出的,都是简单的事实核查、信息检索的“小秘书”型问题,只有不到10%的用户,会尝试将自己的工作流梳理出来,写成工整、清晰的prompt(未来可能演化为Skills)。
这10%的高门槛在于,他们知道AI不只是秘书,是可以被培养的;同时也能接受他不完美,在交付不及格时陪伴共同迭代。
对于最后的20%——我们仍认为从业者不会被替代。事实上到今天AI的替代更多是“横向”而非“纵向”,即把听会、调研等局部环节提效,但知识密集型领域还没出现某个职能的整套工作流全部消失。
人机协同
“养龙虾(与OpenClaw的Agent交互)”是时下流行的概念。2026年,可能是人类研究员和AI研究员真正协同的元年。人类先以合理的方式“培养”AI研究员,AI研究员会逐渐开始增强对人类研究工作的赋能。
说白了,无论是Prompt、Skills还是个人知识库,交给AI按照既定指令把任务跑完,就是在培养AI研究员,2026年Agent的加速进化,让培养的重复动作更少,拿到正反馈更快,体验更加丝滑。
一个人类研究员可以“养”多个AI研究员,如果愿意,每家公司都能配一个专用Agent盯指标、盯变量;每类任务也能写一套对应的Skills。
相应的,人与人的研究协同方式也可能发生进一步的变化。从前拓圈看新行业需要找相熟研究员要压缩包研读、缓慢上手,未来可能你只需要去问问他培养的AI研究员就好了。
机构内部也一样,同一个团队的队友们也可以与一个标的下的Agent协作,这可能会把投研系统的建设思路从“搭功能页面”推向“把工作流做成Agent协作系统”。

Q人类研究的价值在哪?
投研工作的本质是在和市场的所有环境要素交互,包含各个参与主体(机构、上市公司、交易所、监管等)和主体中的人(董秘、分析师、销售、领导、同事等),还有这个市场中的数据要素(结构化数据、非结构化文本、视频等)。
中长期看,与市场环境要素交互的工作,会成为AI研究员的主场,哪个Agent能把信息以最佳姿势喂给模型,哪个就能在竞争中胜出。在这一层次,人类的职责就是养好你的AI,让他能处理市场中的数据(信息)要素,帮你构建市场共识。
当信息处理被AI接管后,真正留给人类研究的工作,就回归到了与市场中另一部分主体——人的交互。与产业、上市公司、同业伙伴的网络和圈层壁垒,可能因此变得更加坚实。多年后,人类研究的核心价值可能会逐渐演化为:
与AI交互,构建最高效的信息处理智能体
与人交互,构建信息网络优势
独立决策,在市场共识的基础上推理非共识
我们始终将以Alpha派为代表的投研Agent产品定义为“AI研究员”,是因为资产定价的决定因素是个人脑都不足以完全覆盖处理的超级复杂系统。最终的预测、推荐和交易行为,还是要由人来完成。
写在最后
时代的车轮不会停步。Alpha派已和大家共度了三载春秋。我们将在2026年将继续陪伴左右,努力突破自我,为大家的业绩提供更好的AI杠杆,助力每一个有志立于时代潮头的朋友成为那top level的10%。
2026年,预祝大家事业兴旺,马到成功,业绩长虹!
——予淳















