一种名为DetectGPT
的零样本机器生成文本检测方法,识别是否由GPT方法生成的论文或文章,检测准确率达95%
工具使用,比如输入文字,进入到检测工具DetectGPT
,结果输出:是否GPT生成
通过分析语言模型的概率曲率来判断文本是否由特定模型生成。实验证明,这种方法比现有的零样本方法
更具辨别力。
识别并利用机器生成的文本样本 x ∼ pθ(·) (左侧)倾向于位于 log p(x) 的负曲率区域,这意味着附近的样本平均具有较低的模型对数概率。相比之下,人类编写的文本 x ∼ preal(·) (右侧)通常不会处于具有明显负对数概率曲率的区域;附近的样本可能具有更高或更低的对数概率。如下图所示:
研究发现,DetectGPT在各种领域和模型上都表现出色。
所以,看到这里的读者,大家写论文,一定不要纯靠GPT,后面查重中加入这项,检查出是用GPT生成的,可能就会有问题。提前了解好要求才行。
本文分享自 程序员郭震zhenguo 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!