
“一份专业级股票研报,华尔街分析师要熬3天,AI却只要3分钟——还把推荐准确率干到55%!”这项研究甩出6825份双语研报的开源数据集,搭起9个AI Agent的流水线,让财务数字、投资建议、行业洞察一次到位。代码全公开,FinRpt-Gen直接挑战GPT-4o,ROUGE-L飙到49.06,专家点头率90%。自动生成研报,这次真的来了。
A股60页研报传统路径=72小时+5万元,FinRpt-Gen把流程压进4分钟,ROUGE-L 49.06分、投资建议命中率55%开源可查。作者让9个AI智能体并行吞入公告、舆情、量价、财务等七类数据,数字误差<1%,而人工仍在Excel逐行勾稽现金流。该论文首次披露Equity Research Report生成基准,证明“慢、贵、错”不再是分析师必付的代价。

传统研报的“人力黑洞”正在吞噬效率:一份深度报告需4人×5天,仅数据搬运就耗掉38工时;手工抄录财报时,7%数字悄悄走样,小数点错位即可令估值模型塌方。更棘手的是情绪漂移,同一家公司在牛市段落被冠以“高成长白马”,熊市段落却成“估值承压”,观点随分析师早盘咖啡浓度起伏。信息孤岛让六类源数据各自沉睡,公告、新闻、行情表缺乏自动勾稽,交叉验证全靠肉眼,错配漏配无人察觉。

整条多智能体流水线被拆成四步,由9个Agent接力:信息提取Agent用LoRA-SFT把公告、新闻、行情中的关键数字秒级结构化,召回率93%;核对Agent交叉比对六类异构数据,误差超阈即唤醒冲突消解子Agent,财务误差锁在0.8%以内;预测Agent在DAPO强化学习框架里自我对弈,把投资建议准确率从48%提到55%,同步输出置信度;写作Agent按六段式模板生成自然语言报告,风格一致性Agent实时把关术语与格式,零人工润色。四步通过共享向量缓存传递语义,延迟<200 ms,3-4分钟端到端交付。

49.06的ROUGE-L、90%的人工一致性、0.8%的数字错误率,三项硬指标把FinRpt-Gen送上财务文本生成榜首,领先GPT-4o6.3分。作者披露,多智能体协同与后训练策略让该框架在BERTScore、投资建议命中率、数值完整度等维度全面压制开源及闭源对手,首次让“AI研报”达到可直接落地的精度门槛。

GitHub 上,作者一次性公开了 FinRpt-Gen 的完整链路:Dockerfile、requirements.txt、Prompt 模板与 LoRA 权重全部可拉。单张 A100-80G 实测 3.8 min 输出 6 页中英文 ERR,GPU 峰值 65 GB,显存带宽利用率 78%。按 OpenAI 2025-02-01 官方价折算,单篇成本 ¥1.2,其中 9 次 API 调用 占 60%,ReportLab 转 PDF 不足 0.01 元。爬虫数据 120–160 s 提前落盘为 Parquet,缓存让后续调用提速 2.3 倍。仓库附可执行 notebook,改三行参数即可换标的、语言与格式,零门槛复现。
FinRpt让单人在4分钟内产出专家级A股研报,人工一致性90%已落地。短板同样锋利:债券、ESG仍处空白,监管盲区与伦理风险随用户激增同步膨胀。作者透露,下一步框架将横向扩张至固收与可持续披露,并倒逼合规标准实时迭代。当“一人研究所”成为机构标配,市场能否承受随之而来的信息洪峰与责任真空?
论文地址:https://arxiv.org/abs/2511.07322 开源地址:https://github.com/jinsong8/FinRpt