Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >中秋佳节,用 AI 为家人写一首诗(文末送中秋福利)

中秋佳节,用 AI 为家人写一首诗(文末送中秋福利)

作者头像
数据森麟
发布于 2019-09-27 07:17:09
发布于 2019-09-27 07:17:09
9870
举报
文章被收录于专栏:数据森麟数据森麟

作者:神经小兮

来源:HyperAI超神经

中秋节即将来临,这个团圆赏月的节日,激发了古今无数文人的情怀,留下了

诸多隽永的诗句。

面对中秋花好月圆的良辰美景,古人能够吟出「海上生明月,天涯共此时」的绝美诗句,而现在大多数人却只能无奈地,将无限感慨化为一句「啊,月亮好圆。」

这大概就是「落霞与孤鹜齐飞,秋水共长天一色」和「好大一只鸟」之间的距离吧。

不过,不用难过,现在,AI 可以帮我们跨越这个距离,让每个人都能轻松吟诗作对,成为诗人!

华为推出「乐府作诗」小程序

近日,华为 EI 体验空间小程序上线了一个新功能——乐府作诗。只要给出主题,选定字数与体裁(绝句或律诗),就能瞬间作出一首诗。

比如,输入「中秋」:

「赏月」:

机器学习」:

人工智能」:

如果不告诉你,你能看出这些诗是 AI 所写吗?

今年 6 月,华为诺亚方舟实验室就发表了论文《GPT-based Generation for Classical Chinese Poetry》,详细介绍了该模型的训练过程以及成果展示。

总的来说,这个诗歌生成模型背后的关键技术,在于强大的 GPT 模型。

GPT 是由 OpenAI 提出的预训练自然语言模型,核心理念是先用无标签的文本去训练生成语言模型,然后再根据具体的任务通过有标签的数据对模型进行微调。

团队先用大规模中文新闻语料,训练出了中文 GPT 模型。然后用中国古典诗歌作为语料库,对其进行了微调,就得到了诗歌生成系统——乐府 AI。

除了绝句和律诗,诺亚方舟团队还用微调的方法

训练它学会生成藏头诗

而且,为了让 AI 能够学习自己写诗,这个 GPT 模型没有进行任何设定,作诗所需要的字数、韵律、平仄、对仗知识,都没有设定,模型全靠自己从古诗数据中学会了这些。

和「乐府 AI」相比,学了多年语文,却依然写不出一句像样的诗的人类,真要自叹弗如了。

细数 AI 学作诗的历程

中国古典诗歌的生成,是自然语言生成领域中一个有趣的挑战。

与自由文本生成不同,中国古典诗歌在形式和内容上通常要满足一定的要求。比如字数、押韵、平仄以及对仗等。此外,内容上也要求整首诗的主题是一致且连贯的。

苏轼的《水调歌头》朗朗上口

如今还被谱成歌曲传唱

此外,中国古典诗歌有很多形式,五言绝句、律诗,七言绝句、律诗,以及词牌如满江红、水调歌头等,还有对联。

因此,要用人工智能的方法产生中国古典诗歌是比较复杂的。华为诺亚方舟实验室的科学家,通过研究给定形式和特定主题的诗歌生成问题,提出了基于预训练模型 GPT 的诗歌生成方法。

方法具体细节为:「乐府 AI」以 Transfomer 为基础模型,基于 BERT 源代码,实现了自己的 GPT 模型。其 Transformer 大小的配置与 BERT-Base 相同,还采用了 BERT 中发布的标记化脚本和中文词汇。对于文本生成,他们实现了截断的 top-k 采样来生成不同的文本。

三首「乐府 AI」生成的诗歌,与一首诗歌真迹

总的来说,「乐府 AI」学作诗一共分为以下三个阶段:

第一阶段:数据处理

华为诺亚方舟实验室的 GPT 模型,以中文新闻语料库进行训练,数据训练主要分为预培训和微调两个阶段。为了进行微调,他们收集了公开的中国古典诗歌,然后将样本诗转换为格式化的序列。

数据训练过程

第二阶段:模型训练

接着,他们在云服务上预训练了其 GPT 模型,包含一个新闻语料库,这一过程花费了 90 个小时。然后用 8 个 NVIDIA V100(16 GB)训练了 4 个阶段。

训练完成后,进行微调,将所有诗歌训练序列输入 transformer,并训练自动回归语言模型,以观察任何序列的概率最大化 X:

第三阶段:诗歌生成

训练完成后,便应用该模型,根据要求生成特定主题的诗歌。

他们首先将形式和主题转换为[形式,标识符 1,主题,标识符 2 ]的初始序列,然后将初始序列给到模型,并对主体字段逐个进行解码。

在解码过程中,并不需要硬约束来保证形式的正确性。相反,该模型能够在解码时,自动分配逗号和句号的位置。当完成诗歌的生成时,会以「EOS」的 token 来结束这一过程。

「乐府 AI」不仅学会了作诗,还掌握了一个新技能——藏头诗。

对于藏头诗,他们依然采用同样的方法来训练。只不过,训练藏头诗模型时,他们将之前训练过程中的主题(如「静夜思」),用该诗歌的每句首字来替换(如「床疑举低」)。

AI 诗人带来的惊喜

通过该方法生成的结果,令团队感到惊讶。

他们发现模型学会了律诗的复杂配对规则,这一规则,即使对于母语为中文,并接受了正常教育的人来说,都很难掌握(相信很多同学也深有同感)。

在生成的绝句和律诗中,95% 以上都表现良好,不过在词牌方面稍有逊色。原因可能是,相对绝句和律诗来说,词牌的形式相对来说更加复杂,而且训练样本也远远不如前者多。

绝句和律诗都有成千上万的训练样本,而词牌只有 882 种,其中,只有 104 种的训练样本超过 100 个,即使是最大的样本,也仅包含 816 个。

系统根据「秋思」主题生成的各个体裁的诗歌

另外,在给定的主题中,通常生成结果都很好,但是对于某些主题,比如「机器翻译」,因为在训练语料库中很少出现,就不好生成诗歌。相反的,像「秋思」这类主题,就很容易生成。

团队介绍道,该方法比现有基于循环神经网络(RNN)的方法简单的多,并且可以产生更好的诗歌。

AI 学作诗,早已有之

有人说,中国是一个诗的国度。自古至今,文人墨客、文艺青年对于写诗都热情不减。而广大理工生,也不断用技术来表达其浪漫情怀。

2017 年 12 月,清华大学团队研发的诗歌机器人「九歌」亮相央视节目《机智过人》,作的诗给观众带来了巨大惊喜。

「九歌」就是基于深度学习,学习了超 80 万诗歌后学会了写诗。它具有多模态输入、多体裁多风格、人机交互创作模式等特点。

除了古诗,现代诗对于 AI 来说也似乎不在话下,比如微软小冰就出版过诗集,国外也有多种语言版本的 AI 诗歌生成工具。

AI 是真正会写诗,还是瞎凑?

AI 写诗,有人赞赏,有人批判。

微博网友对 AI 写诗的看法

上海诗词学会理事刘鲁宁曾表示,写诗拼速度,人类比不过电脑,但是自己用一天时间写的诗,电脑写一千首页比不过。理事邓婉莹也表示,AI 作诗的特点是「有诗无篇」。

相比起文人墨客,在文思泉涌之时的创作而言, AI 写的诗可以说是「没有感情的写手」,他们在大量的文字中,发现诗词的规律,并「拼凑」出完整但可能无意义的诗句。

但对于研究者们来说, AI 作诗更多是作为技术能力的展现,他们更看重 AI 作诗背后 NLP 技术的发展。

另外,对于普通人来说,AI 作诗工具也让每个人都可以去创作,用诗歌表达自己的感情,就是作为一个娱乐的工具,也是不错的。让我们也给 AI 一些时间,相信它会为这个世界带来更多惊喜。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据森麟 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
AI也能写高考作文?我们用清华刚刚开源的「九歌」试了试
今天是高考第一天,我猜,你一定在看全国各地那些奇奇怪怪的高考作文题,还要纠结一下:
量子位
2020/07/14
8380
清华团队让 AI 写诗“更上一层楼”,诗歌图灵测试迷惑近半数玩家
作者 | 黄珊 来源 | 数据实战派 比特币 外挖无穷洞,机神犹未休。 卡中窥币影,池里验沙流。 屡载吸金主,孤深渍盗求。 方知区块链,本是古来游。 这首诗歌来自一支清华团队开发的古诗 AI。它的创作才华可不仅限于此。再看下面这首诗: 夜过虹桥机场  卢浦斜晖里,西楼醉客行。 影侵双塔晚,灯落一城明。 空客还频顾,航灯未可惊。 空留城市夜,月映水帘星。 你仍可以在文采上对它有所挑剔,但不得不承认的是,这至少是一个不会离题万里的 AI,尤其还是颇具难度的古诗生成。在这一点,它已经超越此前的作诗 AI。 论文名
AI科技大本营
2023/05/08
6990
清华团队让 AI 写诗“更上一层楼”,诗歌图灵测试迷惑近半数玩家
《庆余年》:如何当好一个合格的穿越者
“君不见,黄河之水天上来,奔流到海不复回。君不见,高堂明镜悲白发,朝如青丝暮成雪。”
庞九公子
2020/01/21
1.3K1
《庆余年》:如何当好一个合格的穿越者
百度NLP | 自动写诗 PK 古代诗人:百度「为你写诗」技术深度揭秘
百度NLP专栏 作者:百度NLP 「百度NLP」专栏是机器之心联合百度推出的专栏文章,探讨百度在自然语言处理领域的研究成果、实践经验与心得。该系列专栏以机器之心专访百度副总裁王海峰开篇(参阅:独家对话百度副总裁王海峰:NLP 的路还很长)。这篇文章为「百度NLP」专栏的第二篇,解读了百度在自动作诗方面的研究。 引子 「两个黄鹂鸣翠柳,一行白鹭上青天。」像这样优美的古诗,几乎每个人都在语文课堂上学习甚至背诵过。好的诗歌千古流传,深受广大人民的喜爱,然而诗歌创作却有很高的门槛。对于普通人来说,最多写几首打油诗
机器之心
2018/05/07
3.1K0
百度NLP | 自动写诗 PK 古代诗人:百度「为你写诗」技术深度揭秘
文本挖掘实操课!手把手教你用文本挖掘剖析54万首诗歌
历史上有名的“东坡续词”,是文学史上的一段佳话,这也引发了作者的深思。他在这诗词创作的过程中,看到了数理思维的影子,就好比在求解一个“最优化问题”:
大数据文摘
2020/09/08
1.1K0
文本挖掘实操课!手把手教你用文本挖掘剖析54万首诗歌
AI:为你写诗,为你作画,为你学会弹琴作词,为你做所有不可能的事
本文介绍了AI在文化艺术创作领域的应用,包括诗歌创作、图像设计、音乐创作和舞蹈编排等方面的案例。虽然AI在这些领域的应用已经取得了一定的进展,但目前仍处在研究和试点阶段,需要更多的时间和技术去实现规模化商业应用。
企鹅号小编
2018/01/09
4.4K0
AI:为你写诗,为你作画,为你学会弹琴作词,为你做所有不可能的事
中文大语言模型提示工程:解锁AI力量的密钥(完整优化版)
当ChatGPT用英文流畅作诗时,你是否苦恼于中文输出的"机械感"?当文心一言能生成营销文案却总差几分"中国味",你是否想过——问题的核心在于提示词设计。
DevKevin
2025/03/15
472
中文大语言模型提示工程:解锁AI力量的密钥(完整优化版)
“诗歌大模型”在西安城墙激活数字诗词|腾讯探元计划场景共建成果(一)
诗词一直以来都是中华传统文化中一段绚丽的瑰宝,今年春晚西安分会场的“山河诗长安”运用了动画与AR技术,上千名观众与顶流IP“李白”齐诵《将进酒》,传统文化和现代科技的完美融合起来,展示着独属于中国诗词的美和中国人的文化自信。
腾讯研究院
2024/02/28
3980
“诗歌大模型”在西安城墙激活数字诗词|腾讯探元计划场景共建成果(一)
动态丨情人节降至,百度推出基于 AI 的魅力值测评和诗歌自动生成主题功能
百度搜索在近日推出了基于人工智能技术的“情人节用脸撩,开启桃花运”功能,迎接情人节。 用户在百度搜索 App 中需用语音说一句“开启桃花运”即可进入主题页面。该页面包含两大核心功能,一个是“自拍撩汉/
AI科技评论
2018/03/09
8560
动态丨情人节降至,百度推出基于 AI 的魅力值测评和诗歌自动生成主题功能
Prompt进阶3:LangGPT(构建高性能质量Prompt策略和技巧2)--稳定高质量文案生成器
先预训练,然后用数据集微调模型的输出层,这是一种通用做法。实际微调多少层,多少参数等等都是可以变化的,甚至可以全参微调。微调有很多好处,缺点也很明显,依赖高质量标注数据,需要调试训练超参数,常常训练失败,甚至性能不如预训练模型。
汀丶人工智能
2024/03/13
3910
Prompt进阶3:LangGPT(构建高性能质量Prompt策略和技巧2)--稳定高质量文案生成器
七夕节脱单“神助攻”!AI教你写情话
这些只是刚刚及格,要想赢得女神芳心,文(甜)艺(言)情(蜜)话(语)也是不能少的!
用户1386409
2020/08/28
8560
七夕节脱单“神助攻”!AI教你写情话
Facebook 用神经网络写十四行诗,比人类更像人类
【新智元导读】作为语言最富表现力的形式之一,诗歌生成的难点在于既要满足审美,又要符合语义约束。Facebook 人工智能研究院和剑桥大学的一项联合研究提出了两种新方法,使自动生成的诗歌比人类创作的诗歌更像“出自人类之手”。 诗歌自动生成模型不仅需要聚焦于“正在写什么”(内容),还要聚焦“如何写”(形式) 微软诗人小冰不寂寞了,在她写下诗集《阳光失了玻璃窗》之后,Facebook 人工智能研究院和剑桥大学一起,也开始研究用神经网络生成韵律诗了。从小冰那本诗集中的作品看,“韵律”应该不是小冰作诗时考虑的要素。让
新智元
2018/03/22
7360
Facebook 用神经网络写十四行诗,比人类更像人类
一张贺年卡里,能有多少尖端AI技术?
写诗、作词、绘画,AIGC大包大揽,给你送上新年祝福。 ‍ 作者 | 董子博‍‍‍ 编辑 | 岑峰‍‍‍ 农历新春将近,新一届“拜年文学大赛”又要开始了。 一到此时,各路拜年祝福就争奇斗艳,层出不穷。想要文义优美、辞藻生动,本就让不少人想破脑袋;如果再想配上一幅优美的图片,原创且有新意,更是成了每一年的大难题。 往年“卷”得不行的拜年消息,在今天只需输入简单几句话,就能轻松搞定。而这背后,自然是AIGC技术的重大赋能。 这张由智谱AI生成的贺年卡,不仅不花什么功夫,还包含了一段年味十足的祝福语,和一张精美
AI科技评论
2023/02/23
4520
一张贺年卡里,能有多少尖端AI技术?
博客 | ACM MM最佳论文全文:通过多对抗训练,从图像生成诗歌
雷锋网 AI 科技评论按:多媒体信息处理领域顶级学术会议 ACM MM 2018(ACM International Conference on Multimedia)于 2018 年 10 月 22 日至 26 日在韩国首尔举行。
AI研习社
2018/11/30
9160
博客 | ACM MM最佳论文全文:通过多对抗训练,从图像生成诗歌
2457亿参数!全球最大AI巨量模型「源1.0」发布,中国做出了自己的GPT-3
算法方面,相比于1750亿参数的英文语言模型GTP-3,「源1.0」共包含了2457亿个参数,是前者参数量的1.404倍。
新智元
2021/10/12
6800
2021 ACL Fellow名单出炉!一共8人,刘群、宗成庆入选
作者 | 陈彩娴 编辑丨岑峰1月6日,2021年ACL Fellow名单正式公布! 今年,一共有8位知名的自然语言处理学者入选,其中,华人学者有2位,占了1/4,分别是中国科学院自动化所的宗成庆教授与华为诺亚方舟实验室刘群博士。 根据官网消息,今年两位华人学者的入选理由分别是: 刘群:对机器翻译与中文自然语言处理作出了卓越贡献; 宗成庆:对机器翻译与情感分析的研究作出重大贡献,并不断促进中国自然语言处理的发展。 ACL Fellow计划始于2011年,旨在表彰对自然语言处理领域的科技研究与社区服务作出了杰出
AI科技评论
2022/03/03
8450
学界 | 清华大学自然语言处理与社会人文计算研究中心成立!
AI 科技评论按:2019 年 7 月 1 日,清华大学人工智能研究院自然语言处理与社会人文计算研究中心成立仪式暨学术报告与开元成功发布会在清华大学 FIT 楼举行。这是继知识智能研究中心、听觉智能研究中心、基础理论研究中心、智能机器人研究中心、智能人机交互研究中心、智能信息获取研究中心、视觉智能研究中心之后成立的第八个研究中心。清华大学副校长、清华大学人工智能研究院管委会主任尤政院士,清华大学人工智能研究院院长张钹院士出席成立仪式并共同为中心揭牌。清华大学人工智能研究院院长助理朱军教授主持了成立仪式。
AI科技评论
2019/07/05
7810
学界 | 清华大学自然语言处理与社会人文计算研究中心成立!
北京大学万小军教授:让机器进行文学创作,有什么进展和挑战?
导语:本文是北京大学万小军教授在Byte Tech 2019 机器智能前沿论坛上的分享。Byte Tech 2019由中国人工智能学会、字节跳动、清华大学联合主办,清华大学数据科学研究院协办。
数据派THU
2019/05/09
8600
北京大学万小军教授:让机器进行文学创作,有什么进展和挑战?
2023年,你需要在爆发前夕了解这些AIGC技术与应用
岁末,阳生,春来。新年度机器之心「AI 科技年会」如约而至,邀大家 2023 年 1 月 11 日-12 日线上相聚。 本次年会由两场全天论坛组成:「人工智能论坛」覆盖当前最值得关注的多个 AI 技术领域热门话题,「AIGC 技术应用论坛」则聚焦今年接连取得实质性突破的 AIGC。 作为内容生产效率工具,AIGC 将在各领域各场景催生怎样的范式变化?进入商业化阶段,图文多模态大模型的技术能力边界及未来发展可能?作为 AI 基础设施的预训练模型,及其安全可控、开源普惠……1 月 12 日,「AIGC 技术应用
机器之心
2023/03/29
7400
2023年,你需要在爆发前夕了解这些AIGC技术与应用
Prompt进阶系列4:LangGPT(构建高性能Prompt实践指南)--结构化Prompt
结构化的思想很普遍,结构化内容也很普遍,我们日常写作的文章,看到的书籍都在使用标题、子标题、段落、句子等语法结构。结构化 Prompt 的思想通俗点来说就是像写文章一样写 Prompt。
汀丶人工智能
2024/03/23
8430
推荐阅读
AI也能写高考作文?我们用清华刚刚开源的「九歌」试了试
8380
清华团队让 AI 写诗“更上一层楼”,诗歌图灵测试迷惑近半数玩家
6990
《庆余年》:如何当好一个合格的穿越者
1.3K1
百度NLP | 自动写诗 PK 古代诗人:百度「为你写诗」技术深度揭秘
3.1K0
文本挖掘实操课!手把手教你用文本挖掘剖析54万首诗歌
1.1K0
AI:为你写诗,为你作画,为你学会弹琴作词,为你做所有不可能的事
4.4K0
中文大语言模型提示工程:解锁AI力量的密钥(完整优化版)
472
“诗歌大模型”在西安城墙激活数字诗词|腾讯探元计划场景共建成果(一)
3980
动态丨情人节降至,百度推出基于 AI 的魅力值测评和诗歌自动生成主题功能
8560
Prompt进阶3:LangGPT(构建高性能质量Prompt策略和技巧2)--稳定高质量文案生成器
3910
七夕节脱单“神助攻”!AI教你写情话
8560
Facebook 用神经网络写十四行诗,比人类更像人类
7360
一张贺年卡里,能有多少尖端AI技术?
4520
博客 | ACM MM最佳论文全文:通过多对抗训练,从图像生成诗歌
9160
2457亿参数!全球最大AI巨量模型「源1.0」发布,中国做出了自己的GPT-3
6800
2021 ACL Fellow名单出炉!一共8人,刘群、宗成庆入选
8450
学界 | 清华大学自然语言处理与社会人文计算研究中心成立!
7810
北京大学万小军教授:让机器进行文学创作,有什么进展和挑战?
8600
2023年,你需要在爆发前夕了解这些AIGC技术与应用
7400
Prompt进阶系列4:LangGPT(构建高性能Prompt实践指南)--结构化Prompt
8430
相关推荐
AI也能写高考作文?我们用清华刚刚开源的「九歌」试了试
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档