| 全文共1244字,建议阅读时2分钟 |
转载自公众号:量子位
编译整理:林鳞
这是一个由互联网催生的“杠精”充斥的时代,想必你一定遇到过。
回想一下,你在微博上针对问题提出看法,几小时后发现一队人马@你排队挑衅,他们奉行“只对人不对事”和“以抬杠为己任”的基本原则,试图和你吵架。
前方注意,一大波杠精来袭。
请问客官,预防吵架的特效神器要不要了解一下?
近日,Google旗下的科技孵化器Jigsaw、康奈尔大学和维基媒体基金会合作,联合开发了一个预测谈话走向的AI系统。
这个系统能从一开始就能预测谈话是否会失控,想在对话能被挽救的情况下,尽早预防不必要的争吵,活脱脱一个“吵架预防器”。
检测元件
在今年ACL大会收录的论文Conversations Gone Awry: Detecting Early Signs of Conversational Failure中,Lucas Dixon和Nithum Thain等人通过分析维基百科中的讨论页面,收集了1207次谈话,当做训练数据。
其中,一半对话最终发展成攻击性言论,另一半数据仍然为礼貌交流。研究人员通过使用Jigsaw的Perspective API识别有害言论,并收集人类标注的标签作为数据集。最终,一组对话的平均长度为4.6条。
检测原理
至此,数据集。
随后,研究人员开始分析这些对话中的关键词有怎样的特征。
他们通过“表示礼貌的语用手段”将对话分类。这是一系列特征,并且与谈话的感情走向一致。无论是对话中包含友好的礼貌用语(比如“谢谢”、“请”等词语),还是表达了希望继续探讨的积极用语(比如“我认为”“我觉得”),它都能识别出来,并依此分类。
然后,研究人员分析了结果和最初的评论,看看他们的系统是否能学会预测将来是否会产生负面评论。
效果展示
当当当当,杠精预防发生器在一系列努力后终于完工。
研究人员做了一个测试,人类成功预测了大约72%的恶意对话,这个AI系统最终预测准确率达到61.6%。
此外,研究人员还得出了一些统计相关性,可以帮助人类和机器更好地发现那些容易出现攻击评论。“我们粗略发现,言语越直率,遭到个人攻击的可能性越大。”这一效应与我们的直觉一致,即太直接的表达暗示了交谈中潜在的敌意。
为了便于以后的探索,研究人员还将数据和代码整合,作为康奈尔会话分析工具箱的一部分。
附赠说明
对了,关于这个杠精预防发生器的更多说明,可以查看它的原理说明:
https://arxiv.org/abs/1805.05345
康奈尔会话分析工具箱地址:
https://github.com/CornellNLP/Cornell-Conversational-Analysis-Toolkit
对了,文中提到的Perspective API已上线,需要的话自取吧~
https://perspectiveapi.com/#/
虽然有吵架预防器的保护,还是要谨记八字箴言“珍爱生命,远离杠精”呀。
喜欢我们就多一次点赞多一次分享吧~
有缘的人终会相聚,慕客君想了想,要是不分享出来,怕我们会擦肩而过~
《预约、体验——新维空间站》
《【会员招募】“新维空间站”1年100场活动等你来加入》
《有缘的人总会相聚——MOOC公号招募长期合作者》
产权及免责声明本文系“MOOC”公号转载、编辑的文章,编辑后增加的插图均来自于互联网,对文中观点保持中立,对所包含内容的准确性、可靠性或者完整性不提供任何明示或暗示的保证,不对文章观点负责,仅作分享之用,文章版权及插图属于原作者。如果分享内容侵犯您的版权或者非授权发布,请及时与我们联系,我们会及时内审核处理。
了解在线教育,
把握MOOC国际发展前沿,请关注:
微信公号:openonline
公号昵称:MOOC
领取专属 10元无门槛券
私享最新 技术干货