研究提出了一种元学习框架,用于在标注数据有限的情况下检测不同领域的人类语言异常。语言异常(包括垃圾邮件、虚假新闻和仇恨言论)因其稀疏性和变异性而构成重大挑战。该方法将异常检测视为小样本二分类问题,并利用元学习训练能够跨任务泛化的模型。
使用来自以下领域的数据集进行评估:
评估重点在于模型在未见任务上使用最少标注异常样本时的泛化能力。
实证结果表明:
为促进小样本文本异常检测的进一步研究:
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。