
关键词:Prompt工程、提示词优化、LLM技巧、GPT技巧、AI提问技巧、Prompt Repetition、提示词工程

pdf地址
https://arxiv.org/pdf/2512.14982最近在看一篇 Google Research 的论文时,被一个非常“反直觉”的结论震到了:
只要把 Prompt 再写一遍,模型效果就能明显提升。
是的,你没看错。 不是换模型、不是微调、不是RAG,也不是CoT。 只是——把问题复制一遍。
论文名字很直接:
Prompt Repetition Improves Non-Reasoning LLMs
这篇论文直接测试了 GPT、Claude、Gemini、Deepseek 等多个主流模型。
结论一句话总结:
在不启用推理模式时,Prompt重复可以稳定提升模型准确率,而且不增加输出长度与延迟。
这就很离谱了。
先说结论,再说原因。
论文提出一个关键点:
LLM是 因果语言模型(Causal LM)
这意味着:
前面的token看不到后面的token
所以 Prompt 的顺序、上下文位置、信息分布,都会影响模型理解。
论文给了一个非常关键的解释:
当我们把
<QUERY>变成
<QUERY>
<QUERY>会发生什么?
答案:
每个token都能再次“看到”整个Prompt,从而让注意力机制覆盖更完整的上下文。
换句话说:
Prompt重复 = 强行让模型重新阅读题目
这和人类做题一模一样:
模型其实也一样。
论文测试了 7 个模型 + 7 个Benchmark:
测试模型包括:
模型厂商 | 模型 |
|---|---|
Gemini 2.0 Flash / Lite | |
OpenAI | GPT-4o / GPT-4o-mini |
Anthropic | Claude 3 Haiku / Sonnet |
Deepseek | Deepseek V3 |
测试数据集包括:
结果:
Prompt重复在70个测试中赢了47个,没有任何失败。
这意味着什么?
几乎全模型通吃。
更离谱的是:
例如自定义任务:
Gemini Flash Lite 从 21.33% → 97.33%
这不是提升,是暴击。
很多Prompt技巧有副作用:
技巧 | 副作用 |
|---|---|
CoT | 输出变长 |
思维链 | 延迟增加 |
多轮思考 | 成本变高 |
但Prompt重复:
不会增加生成token数量。
原因:
重复发生在 prefill阶段(并行阶段)
而不是生成阶段。
这点非常关键。
实验结论:
在大多数情况下,延迟没有变化。
也就是说:
白嫖性能提升。
很多人第一反应:
那还要CoT干嘛?
论文给了结论:
场景 | Prompt重复效果 |
|---|---|
不使用推理 | 显著提升 |
使用推理(CoT) | 中性或小幅提升 |
原因很有意思:
推理模型本身就会“复述问题”。
所以:
Prompt重复 ≈ 轻量版推理。
论文给了三种模板。
<QUERY>
<QUERY>示例:
请用Vue写一个分页组件
请用Vue写一个分页组件<QUERY>
Let me repeat that:
<QUERY><QUERY>
Let me repeat that:
<QUERY>
Let me repeat that one more time:
<QUERY>有些任务×3效果更好。
我已经开始在这些场景使用:
帮我写一个axios请求封装
帮我写一个axios请求封装分析下面Vue报错原因
分析下面Vue报错原因根据下面需求设计数据库
根据下面需求设计数据库体感提升非常明显:
有人可能会想:
是不是因为Prompt变长了?
论文专门做了一个对照实验:
用 句号填充长度:
.......结果:
没有任何提升。
说明:
不是长度问题,而是重复本身。
论文最后给了一个非常大胆的结论:
Prompt重复可能成为默认策略。
这意味着:
未来Prompt工程可能变成:
两个路线并存。
这可能是我今年见过:
性价比最高的Prompt技巧
因为它同时满足:
一句话总结:
不知道怎么优化Prompt时,先复制一遍再说。
如果你经常用AI写代码、写文档、做分析,建议马上试试这个技巧。