
(1)需求1:用户希望提供更详细的Text2SQL基准测试评估分数,包括在Spider-dev、Spider-test集和BIRD基准上的执行准确率等详细指标对比
(2)需求2:用户希望支持在多GPU环境下的训练能力,充分利用VERL算法的多GPU训练特性,并提供相应的训练脚本示例
(3)需求3:用户希望在RAG示例中提供完整的检索语料文件(nq_list.pkl和nq_hnsw_faiss_n32e.index),以便完整复现实验效果
(4)需求4:用户希望提供RAG代理在实际部署中的推理示例,明确如何在实际使用过程中流式打印轨迹信息
(5)需求5:用户希望在多轮LLM调用中实现选择性追踪功能,允许部分调用发送到服务器进行追踪,而其他调用不进行追踪
article id:4b2210066b2be5070776912f6a969605
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。