基于LangGraph搭建自己的rebattle小组

原创

用户11925555

发布于 2025-11-23 09:54:47

1330

一、动机：为什么我需要一个“Rebuttal 小组”

如果你最近在写 CVPR/ICML rebuttal，大概率经历过这种场景：

三个 reviewer，加起来几千字；
意见互相矛盾：
- R1 说 “实验不够多”，
- R2 说 “已经太复杂建议简化”，
- R3 说 “理论不清楚，要补证明”；
你一边翻 PDF，一边在 Notion 上 copy / paste，一边试图对齐：
- 哪些是「事实错误」可以直接更正；
- 哪些是「要补实验」；
- 哪些是「只能好好道歉 + 限制性说明」。

单一 Agent（一个大模型对着整个 PDF 硬怼）通常会有几个问题：

长上下文会飘：很容易出现“混淆 reviewer 身份 / 把 R2 的话塞到 R1 的回答里”的情况；
难以保持风格统一：有的回答很硬邦邦，有的又太谦卑；
无法显式建模“策略”：
- 哪些要强硬反驳；
- 哪些要补充实验承诺；
- 哪些要承认并留到 future work。

于是我干脆搭了一个Rebuttal Multi-Agent 小组，核心角色：

Parser Agent：把审稿意见结构化；
Planner Agent：为每条意见制定“应对策略”；
Writer Agent：生成具体回复段落；
Polisher Agent：统一风格、压字数、保证礼貌又不卑微。

二、系统拆解：Single Agent 为什么不够用？

先说结论：Single Agent 完全可以做“辅助模板生成”，但在下面这些需求上明显吃力：

需要跨多轮推理的地方
- 先判断这是哪类意见（实验、理论、写作、related work…）
- 再决定要不要补实验 / 查文献 / 改表述
- 最后才是写回复 → 这是典型「规划 + 执行」结构。
需要显式的中间产物
- 我希望能得到一个结构化表格：
  - comment_id, reviewer, type, severity, strategy, status
- 方便我之后复盘 / 修改，而不是只拿到一坨自然语言。
需要不同“性格”的协作者
- 有的 Agent 负责“挑刺”，
- 有的负责“润色外交辞令”，
- 如果都让一个大模型扮演，很难在 prompt 里兼顾。

所以我的拆法是：

Single Agent 模式：
- 输入：整份 review + 文章
- 输出：整份 rebuttal 草稿
- 优点：简单粗暴；
- 缺点：不可控、中间过程不可见。
Multi-Agent 模式（本篇实现的）：
- 流程化、每一步可插拔、可调参与复盘。

三、整体架构：4 个 Agent + 1 个共享 State

整体状态 RebuttalState 大概长这样（Python TypedDict）：

from typing import TypedDict, List, Dict, Any

class ParsedComment(TypedDict):
    id: str
    reviewer: str
    raw_text: str
    type: str          # 'experiment' / 'theory' / 'writing' ...
    severity: str      # 'major' / 'minor'
    summary: str

class PlanItem(TypedDict):
    id: str            # 对应 comment_id
    strategy: str      # 'refute' / 'accept' / 'partial' / 'clarify'
    actions: List[str] # ['recompute ablation', 'add limitation section' ...]
    notes: str         # 给自己看的审稿策略说明

class DraftReply(TypedDict):
    id: str
    content: str
    tokens: int

class RebuttalState(TypedDict):
    paper_title: str
    paper_abstract: str
    paper_key_ideas: str
    raw_reviews: str              # 原始所有 reviewer 意见
    parsed_comments: List[ParsedComment]
    reply_plan: List[PlanItem]
    draft_replies: Dict[str, DraftReply]
    final_rebuttal: str
    token_budget: int             # rebuttal 总 token 限制（例如 4000 字符）

然后用 LangGraph 的 StateGraph 串起来

四、核心 Agent 设计与关键代码

4.1 Parser Agent：把杂乱的审稿意见变成结构化 comment

这个 Agent 的职责：

识别 reviewer（R1 / R2 / R3）；
按 bullet 或段落拆分成一条一条 comment；
对每条 comment 标注：
- type（实验 / 理论 / 写作 / related work / 评分理由…）
- severity（major / minor）
- 一句 summary。

# agents/parser_agent.py
import json
from typing import cast, List
from langchain_openai import ChatOpenAI
from .state import RebuttalState, ParsedComment

llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.0)

def parser_node(state: RebuttalState) -> RebuttalState:
    """解析 raw_reviews -> parsed_comments"""
    prompt = f"""
你是一个学术审稿意见解析助手。

当前论文标题：{state['paper_title']}

以下是所有审稿意见（包含多个 reviewer）：
========
{state['raw_reviews']}
========

请你：
1. 按 reviewer 拆分意见（例如 R1 / R2 / R3）；
2. 按 bullet 或自然段将意见拆分为若干条 comment；
3. 对每条 comment 标注：
   - id: "R1-1", "R1-2" 这种
   - reviewer: "R1" / "R2" / ...
   - type: 从 ["experiment", "theory", "writing", "related_work", "clarification", "other"] 中选
   - severity: "major" 或 "minor"
   - summary: 用一句话中文概括该意见

请以 JSON 列表输出，比如：
[
  {{
    "id": "R1-1",
    "reviewer": "R1",
    "type": "experiment",
    "severity": "major",
    "summary": "认为跨数据集实验不充分，需要在 CelebDF-v2 上补充结果",
    "raw_text": "..."
  }},
  ...
]
只输出 JSON，不要加多余文字。
"""
    resp = llm.invoke(prompt)
    try:
        comments = json.loads(resp.content)
    except Exception:
        comments = []

    new_state = dict(state)
    new_state["parsed_comments"] = cast(List[ParsedComment], comments)
    return cast(RebuttalState, new_state)

这个 Agent 做完之后，你已经可以在本地把 parsed_comments 转成一个表格，自己人工调整一遍，再让下面几个 Agent 接力。

4.2 Planner Agent：为每条意见选策略

这个 Agent 的逻辑很简单：对每条 comment 生成一个处理策略。

实验类 + major → 优先“补实验 / 解释实验设置”；
理论类 + major → 优先“补 lemma / 附录证明”；
写作类 + minor → “承认问题 + 承诺修正”。

# agents/planner_agent.py
from typing import List, cast
from langchain_openai import ChatOpenAI
from .state import RebuttalState, PlanItem, ParsedComment
import json

planner_llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.2)

def planner_node(state: RebuttalState) -> RebuttalState:
    """根据 parsed_comments 生成 reply_plan"""
    comments: List[ParsedComment] = state["parsed_comments"]

    prompt = f"""
你是一个论文 Rebuttal 策略助手，擅长在保证礼貌的前提下，尽量维护论文评分。

下面是已经解析好的审稿 comment 列表（JSON）：
{json.dumps(comments, ensure_ascii=False, indent=2)}

请针对每条 comment 生成一个策略 PlanItem：
- id: 原样照抄 comment.id
- strategy: 从 ["refute", "accept", "partial", "clarify"] 中选
    - refute: 认为审稿人误解或说错了，要据理力争
    - accept: 明确承认问题，并说明已在修改中解决
    - partial: 部分同意，解释限制条件或 trade-off
    - clarify: 主要是澄清表述或补充说明
- actions: 列表，列出你建议的具体动作（用中文），例如：
    - "在附录中补充 CelebDF-v2 的 cross-dataset 实验"
    - "在方法部分补充公式推导细节"
- notes: 写给作者看的“策略说明”，比如
    - "该意见误读了我们的设置，可以通过强调 XXX 来澄清"

只输出一个 JSON 列表。
"""
    resp = planner_llm.invoke(prompt)
    try:
        plans = json.loads(resp.content)
    except Exception:
        plans = []

    new_state = dict(state)
    new_state["reply_plan"] = cast(List[PlanItem], plans)
    return cast(RebuttalState, new_state)

到了这里，你已经拥有一张很有用的表格： comment ↔ strategy ↔ actions ↔ notes，就算完全不用后面的 Writer Agent，这一步本身就很值。

4.3 Writer Agent：按照策略逐条生成回复

Writer 的输入：

论文标题 / 摘要 / 关键点；
单条 comment；
对应的 plan（strategy + actions）；
rebuttal 整体的剩余 token 预算（可以做一点 budget 控制）。

核心逻辑示意：

# agents/writer_agent.py
from typing import Dict, List, cast
from langchain_openai import ChatOpenAI
from .state import RebuttalState, ParsedComment, PlanItem, DraftReply
import json

writer_llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.3)

def writer_node(state: RebuttalState) -> RebuttalState:
    """根据 reply_plan 逐条生成 draft_replies"""
    comments: List[ParsedComment] = state["parsed_comments"]
    plans: List[PlanItem] = state["reply_plan"]
    token_budget = state.get("token_budget", 4000)

    # 建立 id -> comment / plan 索引
    comment_map = {c["id"]: c for c in comments}
    plan_map = {p["id"]: p for p in plans}

    draft_replies: Dict[str, DraftReply] = {}

    for cid, comment in comment_map.items():
        plan = plan_map.get(cid)
        if plan is None:
            continue

        prompt = f"""
你现在在写论文 Rebuttal 的单条回复段落。

论文标题：{state['paper_title']}
论文关键想法：{state['paper_key_ideas']}

审稿意见（comment）：
{json.dumps(comment, ensure_ascii=False, indent=2)}

处理策略（plan）：
{json.dumps(plan, ensure_ascii=False, indent=2)}

请用英文写一段针对该 comment 的回复，要求：
- 开头先简要感谢 reviewer
- 根据 strategy:
  - refute: 礼貌但明确地指出 reviewer 的误解，并给出证据
  - accept: 承认问题并说明已经或将如何修改
  - partial: 部分同意，解释为什么在当前限制下这么做是合理的
  - clarify: 主要澄清文字或设置，保持语气温和
- 不要超过 220 词
- 语气专业、礼貌、有逻辑

直接输出正文，不要附加解释。
"""
        resp = writer_llm.invoke(prompt)
        content = resp.content

        draft_replies[cid] = {
            "id": cid,
            "content": content,
            "tokens": len(content.split()),
        }

    new_state = dict(state)
    new_state["draft_replies"] = cast(Dict[str, DraftReply], draft_replies)
    return cast(RebuttalState, new_state)

如果你想做得更高级一点，可以加一个“token 预算减法”：每生成一条 reply，就从 token_budget 里扣掉，超了预算就自动简化。

4.4 Polisher Agent：拼成完整 rebuttal、统一风格 + 压字数

最后一步，把所有 draft_replies 按 R1 / R2 / R3 归类，拼成一个完整 rebuttal，并做一次“全局风格统一 + 字数压缩”。

# agents/polisher_agent.py
from typing import Dict, List, cast
from langchain_openai import ChatOpenAI
from .state import RebuttalState, DraftReply, ParsedComment
import json

polish_llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.2)

def polisher_node(state: RebuttalState) -> RebuttalState:
    comments: List[ParsedComment] = state["parsed_comments"]
    replies: Dict[str, DraftReply] = state["draft_replies"]
    budget = state.get("token_budget", 4000)

    # 按 reviewer 分组
    grouped: Dict[str, List[Dict]] = {}
    for c in comments:
        rid = c["reviewer"]
        grouped.setdefault(rid, [])
        rep = replies.get(c["id"])
        if rep is None:
            continue
        grouped[rid].append({
            "comment_id": c["id"],
            "comment_summary": c["summary"],
            "reply": rep["content"],
        })

    prompt = f"""
你现在要将下面的逐条 Rebuttal 回复整合成一份正式的 rebuttal 文档。

要求：
- 按 reviewer 分块（Reviewer #1, #2, #3）
- 对每个 comment:
  - 先引用一小段 reviewer 的 summary
  - 再给出我们的回复
- 控制整体长度不要太长（假设总限制约为 {budget} 词）
- 语气统一、礼貌、专业
- 可以适度合并相似的 comment，避免重复

下面是按 reviewer 分组的所有草稿回复（JSON）：
{json.dumps(grouped, ensure_ascii=False, indent=2)}

请直接输出最终 rebuttal 正文（英文）。
"""
    resp = polish_llm.invoke(prompt)
    rebuttal = resp.content

    new_state = dict(state)
    new_state["final_rebuttal"] = rebuttal
    return cast(RebuttalState, new_state)

五、用 LangGraph 串成“Rebuttal 流水线”

最后，用 LangGraph 把这四个节点连起来：

# graph/build_rebuttal_graph.py
from langgraph.graph import StateGraph, START, END
from .state import RebuttalState
from agents.parser_agent import parser_node
from agents.planner_agent import planner_node
from agents.writer_agent import writer_node
from agents.polisher_agent import polisher_node

def build_rebuttal_graph():
    g = StateGraph(RebuttalState)

    g.add_node("parser", parser_node)
    g.add_node("planner", planner_node)
    g.add_node("writer", writer_node)
    g.add_node("polisher", polisher_node)

    g.add_edge(START, "parser")
    g.add_edge("parser", "planner")
    g.add_edge("planner", "writer")
    g.add_edge("writer", "polisher")
    g.add_edge("polisher", END)

    return g.compile()

运行入口示例：

# run_rebuttal.py
from graph.build_rebuttal_graph import build_rebuttal_graph
from state import RebuttalState

if __name__ == "__main__":
    # 这里的 raw_reviews / paper_xxx 都可以从本地文件读取
    raw_reviews = open("reviews.txt", "r", encoding="utf-8").read()
    paper_abstract = open("abstract.txt", "r", encoding="utf-8").read()
    key_ideas = "我们提出 FFE 模块从潜空间中显式提取 forgery factor，并基于能量分区做 targeted augmentation..."

    init_state: RebuttalState = {
        "paper_title": "Energy-aware Forgery Factor Extraction for Generalizable Deepfake Detection",
        "paper_abstract": paper_abstract,
        "paper_key_ideas": key_ideas,
        "raw_reviews": raw_reviews,
        "parsed_comments": [],
        "reply_plan": [],
        "draft_replies": {},
        "final_rebuttal": "",
        "token_budget": 3800,
    }

    graph = build_rebuttal_graph()
    final_state = graph.invoke(init_state)

    print("==== Final Rebuttal ====")
    print(final_state["final_rebuttal"])

    with open("rebuttal_draft.md", "w", encoding="utf-8") as f:
        f.write(final_state["final_rebuttal"])

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯技术创作特训营S16

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯技术创作特训营S16

#大模型

登录后参与评论

0 条评论

热度