前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【评论生成】AI生成评论,如何既相关又多样?

【评论生成】AI生成评论,如何既相关又多样?

原创
作者头像
百川AI
修改于 2022-09-06 12:11:12
修改于 2022-09-06 12:11:12
2.6K0
举报
文章被收录于专栏:我还不懂对话我还不懂对话

AI评论生成,如何既相关有多样?

筛选评论

Learning comment generation by leveraging user-generated data, ICASSP 2019

当前开放域的评论生成常常产生重复且无趣的回复。作者认为原因是直接使用真实用户评论会带入大量的噪音,比如同一篇文章会有多个、且可能相互矛盾的评论,并且由于检索方法会比较刻板,最终导致生成的结果问题。因此文章提出了结合检索和生成的方法,利用已有用户评论和检索出相关评论,训练一个打分器scorer(怎么训练呢?)。然后利用这些评论和文章,作为copy机制生成模型的训练数据。

image.png
image.png

上文提到了打分器,这里有三个:

  • relevance scorer:这里相关性是通过计算标题和评论的bag-of-word向量的点积,只不过向量的每个词语是带TF-IDF的权重。
  • upvote scorer:半监督的方法,主要是预测这些文章的评论没有任何赞。训练数据来源于文章中有评论的文章,并且评论至少10个赞做为正样本,其余负样本。模型如上,文章和评论通过BiLSTM之后,通过attention获得两者的context向量u
\begin{array}{c}u=\sum_{i=1}^{n} \frac{\exp \left(e_{i}\right)}{\sum_{k=1}^{n} \exp \left(e_{k}\right)} h_{i}^{a} \ e_{i}=\left(h_{i}^{a}\right)^{T} \mathbf{W}_{a} h\_{m}^{c}\end{array}
  • ensemble:集成上面俩,可以看到图中的α是一个超参,通过它平衡两者之间的权重,从而得到最终的得分。relevance是评估相关性,避免千篇一律,而upvote也是为了生成更好容易获赞的评论。

道理是这样,两个relevance和upvote也是文章的点,但是实际过程中,好评论不一定会获得很多点赞,因为点赞的基础是该作品有大量的人看到,而大多数长尾可能没有,或者冷启动阶段多数文章没有。所以大概率正样本都是热门的文章,因此对于冷门文章可能是欠拟合。 所以正样本和负样本选择还是有待考究。

而生成模型,用到的是CopyNet机制,通过设置超参控制生成和拷贝的概率叠加。

DeepCom

Read, Attend and Comment: A Deep Architecture for Automatic News Comment Generation, 2019 https://cloud.tencent.com/developer/news/454058

借鉴人的阅读思想,先读文章,然后选择自己的关注点,再进行评论。因此文章提出了reading network和generation network。

  • reading network:负责理解文章,提取重要的观点信息。
  • generation network:通过关注标题和reading网络获取的观点信息,来生成回复。

两个网络通过端到到的方式训练,目标是最大化真实目标的变分下界(variational lower bound)。

image.png
image.png

reading network:representation层分别对body和title做表征学习(title的token表征经过一个GRU获得隐变量表征,body通过attention加权和),然后fusion层对body和title做融合,然后prediction层是预测多个(开始,结束)对,每个对代表一段span。这样的话,不同的span就可以代表不同的要点。

Generation Network:输入HT和HS(要点span),然后按词解码输出评论

这篇文章挺复杂的。。。并且作者实验,没有reading网络效果下降最多,这一跨也是最复杂的。。。

TPGN

Generating Pertinent and Diversified Comments with Topic-aware Pointer-Generator Networks

相关性和多样性是评论生成的两个要点,本文提出了一种Topic-aware Pointer-Generator Networks (TPGN),通过提取文章中的topic,来知道生成相关和多样的评论。在encoder中引入keyword和topic级别的attention机制来获取文章中的topic信息,然后生成过程中在融合topic信息来知道评论的生成。

Keyword-level encoder attention:文章使用TextRank抽取关键词片段,然后放入BiLSTM后的final state作为keyword的表征h_n,然后h_n通过使用attention机制获取文章中词语加权获得最终的contex表征。

Topic-level encoder attention: 文章使用LDA主题模型和Gibbs采样从数据中训练topic向量表征,然后抽取主题的top n词语作为主题词,然后计算每个topic词语的向量表征。其中Cwz是该词w在topic z中出现的次数。

`$$

p(z \mid w) \propto \frac{C{w z}}{\sum{z^{\prime}} C_{w z^{\prime}}}

$$`

Pointer机制和之前提出的模型很像,也不是本文重点,就不介绍了。

Reader-Aware Topic Modeling

Generating Diversified Comments via Reader-Aware Topic Modeling and Saliency Detection, 2021, AAAI 2021

评论生成不仅要关注文章中的重点和有趣的信息,并且多样性也很重要,之前的一些论文关注文章中的重要信息,忽略了评估中的读者理解因素。因此论文提出一个读者理解的话题和关键信息检测的统一框架。

image.png
image.png

reader-aware topic modeling:从评论中获取读者的topic,提出variational generative clustering algorithm,从训练集中的评论语料获取K个读者的topic标注向量。

reader-aware saliency information detection:提出Bernoulli distribution estimating。预估文章中的每个词语是否重要,用于指导下游生成,模型即转化为一个序列任务,预估每个词语是否重要。

两个模块通过端到端方式集合生成任务一起训练。

利用用户知识

Automatic Generation of Personalized Comment Based on User Profile ACL 2019

社交媒体中的用户评论非常多样,不同的用户有不同表达风格,因此论文重要集中于如何利用用户信息来做社交中的评论生成。提出PCGN模型,将用户特征通过gated memory 编码,并且加入用户描述(可能是个性签名之类)。

模型如下图,主要关注用户编码部分:

  • 用户个性签名:通过BiLSTM编码,Attentive其实就是attention机制,加权求和后获得contexD向量。
  • 数值特征:embedding编码后,通过gated memory机制针对生成不同步产生动态的用户表征,gate的计算是g_t^u=sigmoid(W^u_g s_t)。(讲真,fixed也不是不可)
image.png
image.png

利用外部知识图谱来生成:

modeling global and local node contexts for text generation from knowledge graph TACL, 2020

这篇主要是结合外部知识来生成,不止是评论生成,只是评论生成是,针对某些明星的评论,可能需要结合外部知识,例如明星的领域、代表作等,可以做参考。

关注公众号接收最新文章:百川NLP

image.png
image.png

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
​小程序商城的火爆该如何把握2019年小程序创业方向
[小程序商城的火爆该如何把握2019年小程序创业方向.jpg] 经过一年多的摸索,小程序商城的热火朝天让很多人意想不到,微信用户流量红利逐渐出现,现在小程序不仅给用户带来了方便,也给企业和商家带来了很
闪云科技小程序
2019/04/04
4100
​小程序商城的火爆该如何把握2019年小程序创业方向
微信小程序商城社交+电商购物获取流量多样化更能提高拉新与转化
对于微信平台来讲,电商可是离用户钱包是最近的,它肯定也想从这块蛋糕中分得一块,近期小程序也陆续开放了许多与电商有关的功能,加之创业者许多成功的先例,小程序走电商之路毫无疑问是可行的。速成应用小程序给大家介绍小程序商城到底有哪些优势?
速成应用小程序开发平台
2018/07/09
5650
10 个理由告诉你,小程序才是电商的正确打开方式!
最近,有些看过我们之前推荐的电商模版的朋友纷纷表示:你们推荐的模版啊,靠谱!看衰小程序这么久了,差点被你们「掰弯」。BUT,要想让我们用你推荐的模版,有几个问题不问不快:
知晓君
2018/08/01
5170
为什么要做微信小程序?因为客户在这里呀,方法已经告诉你,快来看看怎么飞!
小程序未来会如何发展?商家现在是否要布局小程序?这个问题,最近两个月,小编回答了无数遍,但是,我的答案从来没有变过:你不做小程序,你的竞争对手一定会去做,到底要不要做,各位老板可以看完下面的文章思考一下。
微盛企微管家
2020/07/23
5480
微信小程序凭什么能成为企业、商家流量变现竞争新宠?
PC互联网时代的商业模式是通过入口级产品获取用户,把控网络流量,最后通过流量变现来赢利。
速成应用小程序开发平台
2018/07/19
5010
微信小程序凭什么能成为企业、商家流量变现竞争新宠?
PC互联网时代的商业模式是通过入口级产品获取用户,把控网络流量,最后通过流量变现来赢利。
场景录小程序
2018/07/27
4080
微信小程序凭什么能成为企业、商家流量变现竞争新宠?
小程序做电商的六大优势,看了你就知道为什么必须做小程序了
最近小程序甚是火爆,许多电商朋友都坐不住了,也想加入进来。但是这几个关于小程序却在心里:
中微信通
2018/11/05
2.1K0
农产品微信小程序利用电商模式营销实现在线交易才是展的突破口
农产品类小程序无需太过花哨的设计,简洁美观即可,功能图标设计偏向于棕色,给用户营造出泥土、大自然、淳朴的感觉,凸显自然、健康的农产品特性。
速成应用小程序开发平台
2018/08/26
8770
小程序数据分析报告:公测一周年,为你揭秘变现的9亿流量红利
作者 咫尺网络 本文转自网络,如涉侵权请及时联系我们 根据小程序近期卓越的市场表现,创业者可能要重新思考小程序的真正价值。 在小程序公测一周年之际,咫尺网络发布了一份《小程序变现能力及消费用户洞察数据报告》。报告显示,小程序经过将近一年的时间发展,变现能力已经凸显,其中零售电商和餐饮行业两大领域的小程序月流水环比增长在8月时均已超过60%。此外从报告中还可以看出,小程序已经基本渗透到微信活跃用户人群中,用户使用习惯逐渐形成,小程序用户数量预计在Q4阶段可增长至2亿。 小程序真的没有流量红利吗?
CDA数据分析师
2018/02/26
1.3K0
小程序数据分析报告:公测一周年,为你揭秘变现的9亿流量红利
一篇文章告诉你,为什么小程序能够火的一塌糊涂!
据微信官方数据显示,目前小程序已有超过3亿用户,简直火的一塌糊涂,小程序未来可能带来的颠覆还会更多,作为一个服务工具连接各行各业,真正实现互联网时代,不论是传统行业还是已经进入互联网大军的企业都正在逐
用户1745481
2018/04/27
7200
一篇文章告诉你,为什么小程序能够火的一塌糊涂!
小程序+公众号玩出新花样?有趣skr了
微信也是一张流量温床,奈何转化能力一般,而小程序的出现结合小程序一起,从公众号呈现内容,到引流吸粉,再到转化成交,很大程度上帮助了商家解决了高成本问题。
微盛企微管家
2018/09/17
1.2K0
小程序+公众号玩出新花样?有趣skr了
KTV微信小程序能够解决KTV行业哪些痛点
1、时段性明显,营业额差异被拉开,顾客集中在节假日,或者是晚上,预约难、排队久的问题难以解决;
速成应用微信小程序开发平台
2018/06/02
1.4K0
微信小程序电商平台,商家非做不可?
  近日,微信在支付页面开放“智慧零售”入口引发关注。继福州地区之后,深圳地区的用户同样可以通过微信客户端的“我-支付-腾讯服务-智慧零售”访问腾讯智慧零售小程序。这意味着,腾讯智慧零售小程序正逐步从小范围测试,慢慢变为全国开放,给商家们增加了一大流量入口。
木鱼小铺小程序1
2020/03/31
1.9K0
微信小程序电商平台,商家非做不可?
行业 | 农产品+小程序,让销量提升的奥秘!
天然农产品以其远离城市无污染,无公害受到不少城市居民的欢迎,农产品进城也就有了一个良好的开端。微信小程序经过发展,已经渗透到人们的日常生活,越来越多的人衣食住行都离不开小程序。面对小程序发展正猛的势头,不少商家们都设计了专属的小程序,来顺应时代的潮流。
极客小程序分享
2019/02/19
1.3K0
行业 | 农产品+小程序,让销量提升的奥秘!
电商小程序7分钟破百万?看了这篇文章你就懂了
网络变化的世界风起云涌,自小程序出来之后,有不少老顾客都抱着迟迟观望的态度,虽然跃跃欲试但又有不少顾虑,其中我收到最多的问题就是如上图:小程序该如何引流? 小程序自带流量 小程序自动覆盖五公里的的功能让它和其他宣传手段甚至他一母同胞的公众号兄弟本质区别开来:其他的宣传手段均为被动宣传,需要人为的去吸引流量,而小程序则是主动出击。店铺根据距离来排名,与品牌大小无关,也就是说,用户离你越近,你就排得越前。 小程序“以客带客” 立足小程序强大的社交基本属性,利用有效的社交运营模式实行“以客拉客
用户1745481
2018/07/05
4400
开发商城小程序有什么好处
众所周知,目前的移动互联网端都在小程序市场的笼罩之下,百度的工具类智能小程序,支付宝的支付类和金融类小程序,微信的社交类、电商类小程序等,每一个小程序平台都有其独特的特点,都在其各自擅长的领域发挥着自
用户1745481
2019/01/08
1.3K0
小程序 + 政务,可以碰出怎样的火花
  刘特鑫  微信高级产品经理  小程序自今年一月份发布以来,不断开放接口能力,丰富连接场景。不同行业在小程序开发上的应用创新也可谓是多种多样。 在政务服务领域,小程序也以其便捷、迅速、功能强大而获得青睐,以外交部、工商总局、农业部为代表的部委级的单位开发的政务服务小程序,更是独领风潮。 下面就结合小程序发布三个多月来的一些发展,来谈谈我对小程序在政务领域应用的一些思考。 一、从科斯定律说起,为什么要做小程序? 到底小程序是什么?什么样的场景更适合小程序?最近在听薛兆丰的北大经济课,里面讲的
腾讯研究院
2018/02/06
1.9K0
小程序 + 政务,可以碰出怎样的火花
产业安全专家谈 | 银行业小程序安全防护的实践路径
当前,随着网络业务与移动业务的兴起,银行业已经进入智能化、数字化的新时代。网上银行、移动客户端、小程序相继成为各个银行实现数字化转型的重要载体。
腾讯安全
2020/06/01
7330
产业安全专家谈 | 银行业小程序安全防护的实践路径
金融小程序风险如何控制,WeTest小程序质量专项方案一步到位
导语 自2017年微信小程序推出以来,便凭借其开放、便捷的产品特点实现了用户的高速增长。伴随着近年来金融业数字化转型的推进与移动网络业务的兴起,如今,小程序已成为银行、保险、证券交易等金融场景服务用户的重要载体之一。 小程序在金融领域的应用: 1,快捷便利,降低用户办理相关业务的门槛; 2,打通线上线下服务场景,构建场景闭环; 3,提升线下服务效率,线上助力新客获取; 4,整合流量入口,构建金融生态体系。 由于金融类业务自身的高敏感性、交易性,与移动设备的复杂性、安全风险等原因,使得行业与用户对金融类
WeTest质量开放平台团队
2022/01/07
4430
福州速成应用微信小程序:为KTV酒吧行业带来一轮新的福音
简介:通过附近的小程序定位引流,KTV小程序将吸引大批新潮的用户。用户不需要下载注册,微信即可在线预定包厢,商家的服务效率大大提高,降低服务成本。商家通过优惠促销活动微信分享优惠等功能,吸引更多潜在用户。
速成应用微信小程序开发平台
2018/06/02
9280
推荐阅读
相关推荐
​小程序商城的火爆该如何把握2019年小程序创业方向
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档