首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

当AI学会了咪蒙的文风之后……

作者 | shadow chi

来源 | 无界社区mixlab(ID:Design-AI-Lab)

不小心训练了一个AI学习了咪蒙的文章风格,获取了她的世界观,本文演示下此AI的能力。

1

预测

可以预测2个内容。一个是基于咪蒙以往对各种事物/人的描述,提炼出其对事对人的态度/看法,用于预测。

另一个应用是针对全网热门事件(通过爬虫监测提取),取一个有咪蒙风格的标题。

1.1 针对人/事,咪蒙是如何看待的?

这里针对:

离婚、男朋友、女朋友、开学、滴滴、延禧攻略

从数据上,挖掘下咪蒙是如何看待这些人或事的。

说明:

后面的数字是每个答案的准确率,准确越高,结果越可信;

基于公众号文章的历史数据的预测,并非本文作者的主观看法。

咪蒙觉得离婚:

这里让AI稍微多透露一些内容:

咪蒙觉得离婚对下面的人/事影响最大:

继续其他预测:

咪蒙觉得男朋友:

咪蒙觉得女朋友:

咪蒙觉得开学:

咪蒙觉得滴滴:

咪蒙觉得延禧攻略:

1.2 如何为热点事件,取一个有咪蒙风格的标题?

针对最近几天的全网热点事件:

军训后走路都不自然了

mh370写给2014的一封信

晒被大军五点起床占位

微信交学费摇一摇免单

不想上幼儿园用袋子背去

一生都离不开的调味料

个人税后月薪一万在上海是什么样的体验?

员工是否要对公司忠诚?

自如甲醛房数据

预测咪蒙会如何取文章的标题。

说明:

后面的数字是每个答案的准确率,准确越高,结果越可信

基于公众号文章的历史数据的预测,并非本文作者的主观看法。

咪蒙对热点《军训后走路都不自然了》,会这么取标题:

3 你减肥失败的9条原因 被我找到了

0.9941999835387336

咪蒙对热点《mh370写给2014的一封信》,会这么取标题:

5 因为我高考失败 我的下属才是清华的

0.9862017510367604

6 你减肥失败的9条原因 被我找到了

0.9860994891322602

咪蒙对热点《晒被大军五点起床占位》,会这么取标题:

咪蒙对热点《微信交学费摇一摇免单》,会这么取标题:

咪蒙对热点《不想上幼儿园用袋子背去》,会这么取标题:

咪蒙对热点《一生都离不开的调味料》,会这么取标题:

咪蒙对热点《个人税后月薪一万在上海是什么样的体验? 》,会这么取标题:

1一个地方就能看清 你是在生活 还是在凑合

0.9921539472114738

咪蒙对热点《员工是否要对公司忠诚?》,会这么取标题:

咪蒙对热点《自如甲醛房数据》,会这么取标题:

3 这三个字 胜过自由 胜过生命 胜过甜言蜜语......

0.24869003831935418

4 这个刺激的问题 你敢问男友吗

0.24810450875665513

技术原理

本文的AI是如何训练的?先了解下核心的技术原理:

技能要求:机器学习、python、分词

AI训练目标

符合全网用户阅读喜好

提取咪蒙文风中所使用的形容性的短句

为了达成这个目标,对评论数高的文章提高其权重

AI训练步骤

4.1数据收集

爬取868篇公众号文章,包括标题+简介+正文。

4.2 数据处理与提取

从数据中根据词性、常用的短句、常用的形容词等,提取出属于咪蒙文风的词典。

4.3 词向量的训练

利用word2vec进行词向量的训练,并对评论数高的文章提高权重

以上为全文,再次强调,本文是AI基于大数据预测出来的结果,仅供参考。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180908A0ER6400?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券