走向未来 (kdd.wang@gmail.com)
大语言模型(LLMs)的崛起无疑是人工智能领域的一场范式革命。它们展现了惊人的语言生成能力,能够撰写文章、编写代码、进行对话,在许多方面达到了与人类相当的流畅度。然而,在这种表面的繁荣之下,一个深刻的悖论日益凸显:尽管LLMs能够处理海量的文本数据并模仿人类的语言模式,但它们在真正的“创造力”——尤其是那种超越字面意义、捕捉人类艺术与对话中精妙之处的能力——方面,依然存在着巨大的鸿沟。市场一方面对能够自动生成内容的AI工具报以极高的热情,另一方面,内容创作者、设计师和艺术家们却发现,这些工具生成的产物往往缺乏新意、深度和情感共鸣,陷入了“能写”但“不会创”的窘境。
哥伦比亚大学一份233页的报告从知识增强、人机协同与价值评估三个维度系统的研究了如何赋予AI系统真正的创造力这个问题,为我们理解和构建下一代创造性AI系统提供了深刻的洞见。对这份长达233页的报告原文感兴趣的读者,可以从“走向未来”【https://t.zsxq.com/xpWzq】知识星球中获取全文进行深度研读。本文将深入剖析这份报告的核心思想,并评估其技术路径的商业价值。
本文接下来的安排如下:第一,如何通过注入常识等外部知识,让模型掌握讽刺、隐喻等高级语言技巧,从而突破生成内容的“字面性”束缚;第二,人与AI如何通过高效协作,共同完成高质量创意数据集的构建和创意作品的迭代,形成一种全新的生产关系;第三,如何构建科学、可靠的评估体系,去度量和验证AI的创造力水平,从而指导技术发展并建立市场信任。这三大议题不仅是技术上的挑战,更直接关系到AI能否在创意产业中从一个“玩具”或“助手”真正进化为有价值的“合作伙伴”。
当前主流的大语言模型,其核心能力源于在海量互联网文本上进行的“下一个词预测”训练。这种训练机制决定了模型擅长捕捉和复现高频、常见的语言模式,这使得它们在生成事实性、说明性的文本时表现出色。然而,创造力的本质恰恰在于对常规模式的突破和重组。讽刺、隐喻、明喻等修-辞手法,其魅力正是在于打破字面含义的逻辑,通过语义的“不协调”或“跳跃”来产生更丰富的表达效果。
报告敏锐地指出,LLMs在这一领域的短板根源在于其“知识的局限性”。模型从训练数据中学到的主要是语言的统计规律,但缺乏支撑这些语言背后、真实世界运转的常识知识(Commonsense Knowledge)。例如,要生成一句讽刺“我的邻居半夜吵架的声音真是悦耳”,模型需要理解“半夜吵架”在常识中是“令人烦躁的”,而“悦耳”是“令人愉悦的”,正是这种常识层面的冲突构成了讽刺的核心。没有这种知识,模型很可能只会生成“我的邻居半夜吵架的声音真是烦人”这样平铺直叙的句子。
因此,报告提出的第一个核心策略是知识增强(Knowledge-Enhanced),即通过外部知识库和知识图谱(如ConceptNet、COMET等)为LLM注入常识,作为其进行创造性生成的“脚手架”。知识增强策略的提出,为AI创意工具的商业化开辟了一条区别于“军备竞赛”式大模型的新路径。
第一,催生更具成本效益的专用模型(Domain-Specific Models)。 当前,像GPT-4这样的大模型虽然能力强大,但其训练和推理成本极其高昂,使得许多中小型企业望而却步。报告中的方法表明,通过为中等规模的模型(如BART、T5)注入特定领域的知识(无论是常识、还是概念隐喻框架),可以在创造性文本生成这一垂直领域达到甚至超越通用大模型的效果。这意味着市场上有机会出现一系列轻量级、低成本但高效的“创意专用模型”。这些模型可以被集成到写作助手、广告文案生成器、社交媒体内容创作平台中,为用户提供高质量的修辞建议和内容优化服务,其商业模式更加灵活。
第二,提升创意生成的可控性和可解释性。 市场对于AI生成内容的一大担忧是其“黑箱”特性和不可控性。广告商希望生成的文案能够精准地传达品牌调性,作家希望AI提供的句子能够符合人物的性格和情绪。报告中提出的“受控隐喻生成”技术,正是解决这一问题的关键。它允许用户指定隐喻的风格(源域),从而让AI的输出更加可预测和可定制。这种“可控性”是AI创意工具从一个新奇的玩具转变为一个可靠的生产力工具的必要条件。当AI的创意过程变得部分可解释(例如,因为它遵循了“ARGUMENT IS WAR”的概念映射),用户对其的信任度会显著提升,从而更愿意在商业项目中使用它。
第三,为内容多样性和创新性提供技术保障。 过度依赖单一的通用大模型可能会导致生成内容的同质化,即所谓的“AI味”。知识增强方法,特别是那些能够探索不常见知识关联(如罕见或未见过的概念隐喻映射)的技术,为生成新颖、独特的创意内容提供了可能。一个能够生成“操作车辆就是死亡”这样不寻常隐喻的系统,显然比只会重复“人生是一场旅程”这种陈词-滥调的系统更具市场吸引力。对于追求品牌差异化和内容创新的企业而言,这种能够“制造惊喜”的AI能力具有极高的商业价值。
值得注意的是,本文所探讨的知识增强方法,实际上是解决当前大模型普遍存在的“幻觉”和“知识陈旧”问题的关键所在。这不仅是学术界的前沿方向,也已成为产业界落地大模型应用的核心技术。资深大模型和知识图谱专家王文广老师在其畅销书灯塔书《知识增强大模型》中,就系统性地阐述了这一范式的重要性。 王文广老师作为长期专注于人工智能核心技术与产业应用结合的高级人才,深刻理解大模型在实际应用中的痛点。他的著作从产业实践的视角出发,详细剖析了从检索增强生成(RAG)(第四章)到更高级的知识图谱增强生成(GraphRAG)(第九章)的全链路技术体系。书中提出的“图模互补应用范式”(第八章),即知识图谱(Graph)与大模型(Model)的协同工作模式,为如何将结构化、高精度的知识与大模型的泛化生成能力相结合,提供了清晰的路线图和实战指南。对于希望将本文探讨的创意生成技术转化为稳定、可靠商业产品的开发者和产品经理而言,这本书无疑是指路明灯,它将学术报告中的前瞻性思想,转化为了可落地、可扩展的工程实践。
如果说知识注入解决了模型“从无到有”生成创意的能力问题,那么人机协同则解决了如何规模化、高质量地实现这一目标,并将其应用到更复杂的多模态创意任务中的问题。报告的第二部分将焦点从单一的模型技术转向了人与AI协作的框架和流程,这体现了对AI在现实世界中落地应用的深刻理解。
创意任务的复杂性和主观性决定了单纯依靠AI或单纯依靠人力都存在瓶颈。AI缺乏对高质量创意的深刻理解和判断力,而人类专家则面临着成本高、效率低的困境。报告提出的人机协同(Human-AI Collaboration)框架,本质上是一种“AI赋能人类专家,人类专家指导AI迭代”的闭环模式。
报告展示了人机协同在两个核心环节的应用:一是构建高质量的基准数据集,二是迭代优化多模态创意作品。人机协同框架的价值,远不止于提升单项任务的性能,它为AI在创意产业的商业化勾勒了一幅从“工具”走向“平台”和“生态”的蓝图。
第一,高质量专有数据集成为核心资产。 随着基础大模型逐渐商品化和开源化,真正的竞争壁垒将从模型本身转向高质量的专有数据。报告展示的FLUTE和HAIVMet数据集的构建方法,实际上揭示了一种“数据即服务”(Data-as-a-Service)的商业模式。企业可以利用这种人机协同的流程,为特定创意领域(如法律文书、医疗报告、特定风格的插画)构建独家的、高质量的训练/评测数据集。这些数据集本身就可以作为产品出售,或者成为其AI服务的“护城河”,让竞争对手难以复制。
第二,催生专业级的协同创作平台。 目前市场上的AI创意工具大多是单向的“生成器”,用户输入提示,AI输出结果。报告所描绘的协同框架,则指向了一种更高级的形态:交互式协同创作平台。在这个平台上,AI不仅仅是执行者,更是创意伙伴。设计师可以与AI进行多轮对话,迭代视觉稿;作家可以让AI扮演不同角色,进行头脑风暴;广告策划可以要求AI生成多种风格的方案,并进行A/B测试。这种平台的核心竞争力在于其“交互体验”和“迭代效率”。能够无缝集成生成、编辑、反馈、评估等多个环节,并让AI真正理解人类专家意图的平台,将在专业创意市场中占据主导地位。Adobe等行业巨头已经在其产品线中融入生成式AI,正是看中了这一趋势。
第三,构建创作者与AI的共生生态。 人机协同的终极形态是一个共生生态。在这个生态中,人类创作者的专业知识和审美判断被用来训练和优化AI模型;反过来,AI则为创作者提供灵感、提升效率、扩展创作边界。一个成功的商业生态,需要建立有效的激励机制。例如,平台可以允许艺术家上传自己的作品来微调个人专属的AI模型,并对该模型产生的内容进行收益分成。平台也可以将专家在协同编辑过程中提供的“高质量指令”数据化,作为宝贵的训练资源,并对提供者给予奖励。这种模式将AI的发展与创作者的利益深度绑定,有助于形成一个健康、可持续的商业闭环。
人机协同的未来充满了机遇与挑战,如何设计出优秀的协同平台、构建繁荣的创作者生态,这些都是值得业界持续关注和探讨的议题。欢迎加入“走向未来”知识星球,一起探讨生成式人工智能、大模型和AIGC的产品、技术和应用实践,探讨如何使用各种不同的人工智能大模型和智能体来为工作增效,为生活添彩。点击链接(https://t.zsxq.com/xpWzq)加入“走向未来”知识星球,与行业专家和爱好者们共同探索,一起走向AGI的未来。
一个产品或技术的市场价值,最终取决于其能否被客观、可靠地衡量。在AI创造力领域,评估问题尤为突出和棘手。传统的NLP评估指标,如BLEU、ROUGE,衡量的是生成文本与参考文本之间的字面重合度,这对于评估创造性任务几乎是无效的——一个富有创意的改写,恰恰可能因为字面差异大而得分很低。缺乏科学的评估标准,不仅让研究人员难以判断技术是否真的取得了进步,也让市场和用户无法信任AI生成的创意内容。
报告的第三部分直面这一“终极挑战”,提出了构建以人为中心的、有理论依据的评估框架(Evaluation Framework) 的重要性,并进行了深入的实践探索。报告的核心贡献是设计并验证了TTCW(托兰斯创造性写作测试),一个专为评估短篇小说创造力而设计的评估量规(Rubric)。除了TTCW这一“实验室”环境下的评估,报告还进行了一项真实世界研究,邀请了17名MFA(艺术硕士)学生使用一个基于认知过程写作理论设计的协同写作平台,与GPT-3.5合作完成30篇短篇小说。这项研究的目的,是观察专业写作者在真实的创作流程中,到底如何使用AI,以及他们真正的需求和痛点是什么。一个可靠的评估框架,对于AI创意产业的健康发展具有不可估量的市场价值。
第一,为产品设定了黄金标准(Gold Standard)。 任何一家声称其AI工具能够“提升创造力”的公司,都面临着如何向客户证明这一点的难题。TTCW这样的评估框架,提供了一套客观、可复现的评测方法。通过TTCW的得分,企业可以量化地展示其模型相比竞争对手的优势,或者证明其新版本在创造力方面的提升。这使得产品的市场营销从模糊的“自卖自夸”转变为有数据支撑的“可信交付”,极大地增强了客户的购买信心。未来,甚至可能出现第三方的“AI创造力评测机构”,专门为市场上的各类创意AI工具提供权威的TTCW认证。
第二,指导产品研发和功能迭代。 TTCW的14项测试,实际上为AI创意工具的研发团队提供了一张清晰的“能力地图”和“待办清单”。当发现模型在“角色发展”(Character Development)上得分普遍偏低时,团队就可以针对性地收集相关数据、设计新的训练任务来弥补这一短板。MFA学生的用户研究,则更直接地揭示了市场的真实需求。研究表明,与其投入巨大资源去追求AI的“原创情节构思”能力,不如优先优化其“段落改写”、“风格模仿”和“提供建设性反馈”的功能,因为这才是专业用户当前最需要、也最看重的。这种以用户为中心、以评估为驱动的研发模式,可以帮助企业更高效地分配资源,开发出真正有市场竞争力的产品。
第三,挖掘“过程支持”这一蓝海市场。 当前AI创意工具的市场,大多集中在“一键生成”的成品交付上。然而,MFA学生的研究明确指出,对于专业创作者而言,创作的“过程”本身同样重要,甚至更为重要。他们需要的不是一个代替他们写作的“枪手”,而是一个能够激发灵感、提供不同视角、帮助他们打磨语言的“陪练”和“镜子”。这揭示了一个巨大的蓝海市场:专注于支持创作过程的AI工具。这类工具可能不直接生成最终文案,而是提供诸如“反向词典”(根据描述找词)、“隐喻引擎”(根据概念生成多种隐喻选项)、“节奏分析器”(分析文本的韵律和节奏)等功能。这些工具赋能而非取代创作者,更容易被专业社群所接纳,并形成高粘性的用户群体。
这份研究报告系统性地回答了如何让AI具备真正创造力的核心问题,并描绘了一幅从技术突破到市场应用的清晰路线图。它所提出的知识增强、人机协同、价值评估三位一体的框架,摒弃了对更大模型的盲目崇拜,转向了一种更精细、更务实、更以人为本的技术哲学。
展望未来,AI在创意领域的应用,其竞争焦点将不再是“谁的模型更大”,而是“谁的系统更懂创意”。这意味着:
对于市场而言,这意味着巨大的机遇。那些能够提供可控、可信、并能无缝融入专业工作流的AI创意工具,将拥有强大的定价能力和客户忠诚度。而那些能够构建起创作者、AI和数据之间良性循环生态的平台,则可能成为下一个创意时代的“操作系统”。要实现这一切,如何将本文探讨的“更深度的知识融合”从一个愿景变为工程现实,便成了重中之重。我们该如何系统性地构建、管理和应用这些外部知识,从而真正赋能大模型呢?对此,知名人工智能学者王文广老师的灯塔书《知识增强大模型》一书再次为我们提供了答案。 这本书不仅仅是一本理论著作,更是一本详尽的“实战手册”。它系统地讲解了构建知识增强系统的两大核心支柱技术:向量数据库(第三章)和图数据库(第七章)。书中详细介绍了如何设计知识图谱模式(第五章),以及如何利用大模型从非结构化文本中抽取实体、关系和事件来构建知识图谱(第六章)。这些内容,为实现本文结论中“更深度的知识融合”提供了具体的技术路径和操作指南。对于任何一个旨在构建下一代智能创意应用的企业或团队来说,这本书所提供的知识体系,是从跟风模仿走向构建核心技术壁垒的必经之路。
最终,AI创造力的“奇点”,或许不在于AI何时能写出超越莎士比亚的戏剧,而在于它何时能成为每一位创作者不可或缺、激发其无限潜能的“缪斯”。这份报告,无疑为我们抵达那个未来,指明了坚实的第一步。如果您也对这一切充满好奇和热情,渴望在AGI的浪潮中与同行者共同成长,那么,我们诚挚地邀请您。
欢迎加入【走向未来】知识星球!在这里,我们共同探索生成式AI、大语言模型与AIGC的无限可能——从技术原理到产品落地,从应用实践到未来趋势。无论是AI和智能体为工作提效,还是为生活添彩,这里都有你想了解的答案,和一群志同道-合同的伙伴。在【走向未来】知识星球,你可以轻松学会调用各类大模型与智能体,解锁高效与创意并存的新方式,一起见证AI如何重塑我们的日常,一步步走近AGI的精彩未来。点击链接【https://t.zsxq.com/xpWzq】加入我们,马上启程,和我们一起——走向未来,不负热爱!
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。