在深入探讨AI呼叫行业之前,我们先来理解客户选择使用AI外呼的根本原因。呼叫行业,作为人类沟通的一种古老形式,其历史可以追溯到20世纪90年代。那时,随着腾讯等企业的兴起,呼叫行业以寻呼机的形式开始进入公众视野。而后,华为等其他企业也开始提供通信增值服务,推动了这一行业的早期发展。呼叫行业之所以经久不衰,是因为它提供了一种直接与用户互动的方式,这种互动可以绕过传统的通信壁垒,实现主动式的联系。呼叫行业包括主动式的呼出和被动式的呼入两种形式,分别对应AI外呼和AI接听。这种主动式的沟通方式,使得呼叫行业在效率上具有无可比拟的优势。
从90年代至今,呼叫行业经历了显著的演变。起初,呼叫主要依赖人工操作,随后发展到硬件辅助的人工呼叫,再到网页版的人工呼叫。大约六年前,机器人呼叫开始出现,而今天,我们利用智能体大模型进行呼叫,这一变化过程直观地展示了技术的进步如何推动行业的发展。
AI外呼的技术路径是一个复杂而精细的过程。它涉及到语音识别、自然语言处理、机器学习等核心技术。这些技术共同协作,使得AI外呼系统能够理解用户的意图,提供准确的响应,并持续优化其性能。尽管在六七年前,电话机器人的智能水平和识别准确性有限,但用户依然选择使用,这主要是因为AI外呼的成本效益比人工呼叫要低得多。AI外呼的高效性使得它即使在技术尚未成熟的早期,也已经被市场所接受。
1.智能呼叫系统的优势
在当今快速发展的人工智能领域,智能呼叫系统无疑是AI技术商业化应用的典范之一。这一系统之所以能够成为商业化的一个亮点,主要得益于其在效率、成本效益和容错性方面的显著优势。
智能呼叫系统的能力足以应对业务需求,这表明AI呼叫是一个适合商业化的低精度业务场景。比如说自动驾驶技术。自动驾驶技术在汽车行业的应用的年限已经不短了,但大部分人依然不太敢使用自动驾驶的方式开100到200公里,但自动驾驶的技术在扫地机器人的场景里已经进行了大量的应用。以此类推,大模型技术也将在客服语音数字人等相关领域里先进行应用,因为这些是典型的低精度场景,但是像法律,医疗等高精度场景,这种技术的应用速度就会偏慢,这是整个行业的一个变化。智能呼叫系统正是利用了这一技术演进路径,SaaS和AI都是一种复利游戏,它们本身的特点就在于每一个月或者每一周都会基于代码量和数据量进行不断的升级,而这样的升级就会带动的产品进入到一个快速的业务增长期。
综合以上优势,智能呼叫系统的早期应用受到青睐的原因一目了然。即使在六年前,智能呼叫技术尚处于起步阶段,语音识别技术的准确性也有待提高,甚至很多的最基础的语音都会识别不准,但随着技术的进步,这些问题已经得到了显著改善。值得一提的是,在通信环境下,尽管许多人使用的是5G网络,但打电话时实际上使用的是3G或4G网络,这导致了通话音质相对较低。从音频质量的角度来看,人们在正常通话中使用的是8000赫兹的音频,而在像腾讯会议这样的应用中,则使用的是16K的音频。在这种音质较低的场景下,智能客服需要进行特别的优化和应用,以确保用户的体验。作为AI技术商业化的一个成功案例,智能呼叫系统不仅展示了AI在特定领域的应用潜力,也反映了技术进步如何推动行业向前发展。随着技术的不断成熟和优化,智能呼叫系统有望在未来的商业环境中扮演更加重要的角色。
2.客户联络演变
在AI技术的浪潮中,智能客服行业经历了翻天覆地的变化,主要包括内容、渠道、活动和决策四个方面。
通过个性化的联络,甲方从直觉化的驱动进入到了一种数据化的驱动。智能呼叫系统还推动了企业从直觉驱动向数据驱动的转变。通过收集和分析大量的用户数据,如接通率、意向客户标签率、通话时长、客户所属地域等,企业可以更加精准地调整业务策略,提高营销效果。这种数据驱动的决策模式,为企业提供了更加科学和客观的依据。
随着人力成本的不断上升和私域运营需求的增加,甲方对于提高营收和客户满意度的要求也越来越高,这些因素共同推动了新一代智能客服场景的有效落地。总之,智能客服行业的发展是一个不断演进和创新的过程。随着AI技术的不断进步,智能呼叫系统将在未来的客户服务领域扮演更加重要的角色。它将帮助企业实现更高效、更个性化的客户沟通,为企业的持续发展提供强大的支持。
(二)AI相对人力优势
在探讨人工智能(AI)在呼叫行业中的效率优势时,我们不得不提到AI在处理高容量任务时的卓越能力。AI呼叫系统的设计初衷是为了提高效率、降低成本,并且提供一致性的服务体验。让我们深入分析AI如何实现这一目标。
在成本效益方面,AI呼叫系统同样展现出其无与伦比的优势。AI的成本大约只有人力成本的十分之一,这意味着在相同投入下,AI能够提供更高的产出。如果我们进一步分析,AI的综合成本仅为人力的四十分之一,而效率却是人类的四倍。这一成本与效率的结合,无疑为AI呼叫系统带来了巨大的市场竞争力。
AI呼叫系统以其高效率、低成本和一致性服务,正在逐步改变呼叫行业的面貌。随着技术的不断进步,我们可以预见,AI将在未来的呼叫行业中扮演越来越重要的角色,为企业提供更高效、更智能的客户服务解决方案。
在AI时代,呼叫行业的成本结构发生了根本性的变化。传统上,人力成本占据了呼叫中心运营成本的很大一部分。然而,随着人工智能技术的发展和应用,我们见证了成本结构的重塑。AI呼叫系统的核心优势在于其能够显著降低人力成本,转而将成本重心转移到经营性成本上,比如通信费用。在不计算通信费用的情况下,AI的综合成本可能仅为人力成本的四十分之一。这一成本优势源于AI系统的自动化和规模化能力,它们能够以极低的边际成本处理大量的呼叫任务。当通信费用被纳入计算时,AI的成本可能降至人力成本的十分之一左右。这种成本效益的显著提升,为AI呼叫系统在商业领域的广泛应用提供了坚实的基础。
在人工智能(AI)引领的呼叫行业革命中,技术路径的明确性和系统性是确保成功实施的关键。AI呼叫系统的设计和实现遵循一个非常直观的分层架构,分别是支撑能力层、基础服务层、业务层,这不仅保证了技术的可扩展性,还为未来的创新提供了坚实的基础。以下是对AI呼叫技术路径的深入分析,旨在为读者提供科普性和专业性的洞见。
支撑能力层是AI呼叫系统的底层,它为整个架构提供了必要的技术支撑。这一层由三个核心组成部分构成:AI基础能力、智能引擎和通信能力。
通信能力是呼叫行业特有的技术要求,包括SIP(Session Initiation Protocol)协议、呼叫转接技术、空号识别和智能路由调度。这些技术确保了呼叫的顺畅进行和高效管理。
在人工智能(AI)呼叫行业的架构中,基础服务层扮演着至关重要的角色,它建立在支撑能力层的坚实基础之上,各种组成要素共同作用为AI呼叫系统提供强大动力,并为业务层提供必要的服务和功能。
API接口能力为AI呼叫系统提供了与其他系统和服务集成的能力。通过开放的API接口,企业可以将AI呼叫系统与现有的业务流程、数据库和其他应用程序相连接,实现数据的导入、导出以及信息回传等功能。
基础服务层是AI呼叫行业的中坚力量,它通过提供一系列强大的服务和功能,使得AI呼叫系统能够高效、智能地运行。随着AI技术的不断进步,基础服务层的功能将变得更加强大和多样化,为企业带来更高的运营效率和更好的客户体验。在这本畅销AI书籍中,我们将继续探索AI呼叫系统的更多奥秘,揭示它如何改变我们的沟通方式和商业实践。
3.业务层:AI与消费者互动的前沿
业务层是AI呼叫产品的核心,它涉及AI坐席与消费者之间的直接互动。这种互动可以采取多种形式,包括但不限于主动呼叫、被动呼入以及人机协同等。主动呼叫指的是AI系统根据预设的策略或用户需求,主动联系消费者;被动呼入则是消费者主动联系AI坐席,寻求帮助或信息;而人机协同则是一种更为高级的互动形式,它结合了人工智能的高效处理能力和人类坐席的灵活性,以提供更加个性化和人性化的服务。
这些互动过程中产生的数据是至关重要的,它们不仅为企业提供洞察消费者行为和需求的机会,也是优化服务和提高效率的关键。数据的流转通常通过以下几种方式实现:
(二)智能呼叫的历史演进
智能呼叫技术的发展历程,无疑是一段充满突破与创新的史诗。从最初的自动化拨号器到现代的高级人工智能系统,智能呼叫技术已经走过了一段漫长而充满挑战的旅程。在这段旅程中,我们见证了技术如何从简单的机械自动化,逐步演进为能够理解和响应复杂人类语言的智能系统。
随着大模型技术的兴起,智能呼叫行业进入了一个新的技术周期。大模型智能体结合NLP语义理解,提供了一种成本效益高、响应迅速的解决方案。这些模型通常拥有数十亿甚至数千亿的参数,能够处理更加复杂的交互场景,提供更加精准和个性化的服务。大模型的引入,使得智能呼叫系统在理解用户意图、提供个性化服务以及处理复杂对话方面达到了前所未有的水平。
AI呼叫中心正站在一个新的历史机遇面前。随着大模型技术的发展,智能呼叫行业有望实现根本性的变革。在中国,每天有近500万人在呼叫中心工作;在国际市场上,许多东南亚国家,如柬埔寨、菲律宾等,以英语为母语,利用较低的人力成本,将呼叫中心作为国家的支柱产业。大模型技术的低成本、高智能特性,为这些国家的呼叫中心行业提供了巨大的替代潜力。随着技术的不断成熟和应用的不断深入,我们有理由相信,AI呼叫中心将在全球范围内发挥更加重要的作用,推动整个行业的创新和发展。
智能体对行业的变更是很明显的,人力呼叫的每通电话成本在 3~5 元,而 AI 可以实现十倍+的成本下降,很多朋友会说 AI 不能完全取代人力,但是假定一个 1000 人的呼叫职场,那么 1000人的综合管理及人力成本为 2亿元,将此调整为 2000+AI 智能体结合 200 人的团队,可以将成本从 2 亿下降至 8000 万。
(三)智能客服的知识类型
在人工智能(AI)领域,智能客服的演进是企业服务创新的重要体现。新一代的智能客服系统不仅仅是一个简单的交互工具,而是一个高度集成的智能平台,它通过整合企业的知识资产,提供深度定制化的客户服务体验。新一代智能客服系统的核心是一个被称为“知识大脑”的复杂知识库。这个知识大脑是智能客服系统智慧的源泉,它由三种类型的知识构成:
1.行业知识
第一种类型是行业知识,这是智能客服系统理解特定行业需求和语境的基础。以家装或房地产行业为例,智能客服需要掌握与这些行业相关的专业知识和术语。这些知识不完全由企业提供,而是由SaaS(Software as a Service)厂商结合不同行业的专业能力构建而成。行业知识的整合使得智能客服能够更准确地理解用户的需求,并提供专业的服务。
2.职业知识
第二种类型是职业知识,它涉及特定职业角色的交流方式和行为准则。例如,销售冠军的沟通技巧、优秀客服人员的服务标准、前台接待的专业用语等。职业知识帮助智能客服系统模拟专业人士的行为,提供更加人性化和专业的服务。
3.企业私有知识库
第三种类型是企业自己的私有知识库。这个知识库包含了企业独特的信息和知识,如产品细节、服务流程、客户案例等。私有知识库可以通过表格、文档、API或网页等多种形式呈现。这些知识是企业员工,包括新入职员工,必须掌握的,涵盖了个人履历、行业背景、职业培训以及企业特有的私有知识。
智能客服系统通过整合上述三种知识,构建了一个全面的知识体系。这个体系不仅包含了行业和职业的通用知识,还融入了企业特有的私有知识,使得智能客服能够提供高度个性化和专业化的服务。随着AI技术的不断进步,智能客服系统将变得更加智能和自适应。机器学习和深度学习技术的应用将使智能客服能够不断学习和优化,提供更加精准和个性化的服务。此外,随着自然语言处理(NLP)技术的发展,智能客服将能够更好地理解用户的意图和情感,提供更加人性化的服务体验。新一代智能客服系统的发展,标志着企业服务模式的一次重大变革。通过构建强大的知识大脑,智能客服不仅能够提供专业的服务,还能够不断学习和进化,满足不断变化的市场需求。
(四)模型的选择
在智能呼叫行业的发展历程中,选择合适的大模型对于实现高效、个性化的客户服务至关重要。本文将深入探讨这一主题,从技术选择到业务场景的应用,以及未来技术的发展趋势。
1.选择合适的大模型
智能呼叫系统的核心在于其处理自然语言的能力,这需要依赖于先进的大模型。大模型的选择应基于业务场景的具体需求,考虑到通话的流程特性和成本效益。由于通话通常较短,不会超过十分钟,一个人一分钟说话的数量大约在300字左右,这意味着在一次通话中,大模型的token消耗通常不会超过3000个token。因此,智能呼叫系统可以选择成本更低、尺寸适中的模型,如turbo或4K大小的模型,以实现成本效益和性能的平衡。
模型的大小也会进一步影响互动,并非越大的模型越好,越大的模型代表成本更高,速度更慢,而小模型也会存在智商偏低的问题。所以模型的选择需要根据实际的业务进行判断。我们更倾向于国产大模型,因为延迟和对话逻辑更符合中文特点。
2.智能呼叫的业务场景
智能呼叫系统的输出可以广泛应用于多种业务场景,包括但不限于文本客服和音频客服。文本客服可以在公域和私域中提供服务,而音频客服则包括AI外呼、AI接听和数字人客服等形式。这些业务场景的实现,依赖于大模型的自然语言处理能力,能够理解和响应用户的需求。
随着技术的进步,模型选择变得更加自定义化。企业可以根据自己的业务需求和市场定位,选择不同的大模型来构建智能呼叫系统。例如,Deepseek、通义千问、智谱清言、豆包等模型可以针对特定的中文市场进行优化。而在国际市场上,Lama或ChatGPT 4等技术能力则提供了更广泛的语言支持和应用场景。我们认为,智能呼叫技术的未来将朝着第五代技术能力发展。这一代技术将更加注重个性化、智能化和集成化,能够提供更加精准和人性化的服务。
智能呼叫行业的发展是一个不断演进的过程,它需要不断地技术创新和业务模式的探索。选择合适的大模型,实现模型选择的自定义化,以及探索未来的技术能力,是智能呼叫行业持续发展的关键。随着技术的不断进步,我们有理由相信,智能呼叫系统将在未来的客户服务领域发挥更加重要的作用,为用户带来更加便捷、高效和个性化的服务体验。
(五)智能体呼叫的概述
智能体呼叫技术是人工智能领域中一个令人兴奋的分支,它不仅融合了传统呼叫中心的自动化特性,还引入了声音克隆、多语种交互等创新技术。比如,通过声音克隆技术,系统可以模仿特定人的声音进行呼叫,这不仅提高了用户体验,还为个性化服务提供了新的可能性。此外,智能体广场的概念允许企业快速构建和部署一系列呼叫智能体,实现规模化的智能服务。多语种交互是智能体呼叫技术的另一大亮点。随着全球化的发展,企业和客户之间的交流越来越频繁,能够处理中英文等多语种的智能呼叫系统变得尤为重要。这不仅有助于企业拓展国际市场,还能为不同语言背景的用户提供更加便捷的服务。
1.问题
尽管智能体呼叫技术带来了许多创新和便利,但在实际应用中也面临着一些挑战。以下是大模型呼叫技术中存在的一些典型问题:
2.解决措施
在AI呼叫行业的发展过程中,我们见证了技术的不断演进和挑战的逐步克服。本章节将深入探讨智能体呼叫技术如何通过创新手段解决成本、延迟和拟人化程度低的问题,并展望其未来的发展方向。
随着技术的演进,TTS语音合成技术会越来越拟人,能够模拟人类语音的韵律、语调和情感,使得机器生成的语音更加贴近真人发音,让拟人化程度越来越高。
对当前情况进行进一步拆解,我们把它统称为agents模式,这种模式下,大并发、交互弱,如AI外呼中的营销或通知类的业务场景,通过NLP(Natural Language Processing)问法匹配技术,再结合大模型的方式,以上一代外呼为主,这一代大模型呼叫为辅的形式来完成,可以实现高效的自动化服务。 对于并发量较小的业务场景,即单个对话模型的有效通话量低于5万通电话,传统的对话模型需要AI训练师来搭建,这会带来额外的成本。AI训练师的成本通常在600到1000元之间,当通话量较小时,这一成本均摊到每一通电话中,会导致总体成本偏高。相比之下,采用纯大模型呼叫的方式,可以省去AI训练师的参与,从而降低成本。因此,以小并发、交互强、目标是取代人工的业务场景,可以采用纯粹的大模型智能体呼叫的形式来完成。
解决方案:
·采用声音克隆+大语言 TTS
·声音克隆结合真人录音缓存
·采用端到端语音互动,具备情绪理解能力
3.业务场景
在AI呼叫行业的快速发展中,业务场景的多样化和复杂化是其显著特点。下面将详细探讨AI呼叫行业的几种典型业务场景,以及它们如何通过技术的进步实现更加智能化和自动化的服务。
对于一些技术复杂度较高的业务场景,通常以人工为主,如车险核定等,AI呼叫技术的应用可以提供更加精准和高效的服务。在这些场景中,AI系统需要处理大量的数据和复杂的业务逻辑,以实现自动化的业务处理。
通过集成先进的数据分析和机器学习技术,大模型呼叫系统可以对用户的需求进行深入分析,提供个性化的服务方案。这种技术的应用有助于提高业务处理的准确性和用户满意度。
所以其实 AI 语音互动可以解决 AI 营销(会员、陌生拜访)、回访、调研和呼入等多种场景。
AI技术的应用不仅仅局限于音频端,而是在多个维度上扩展,为行业带来了革命性的升级。从AI外呼、AI接听、人工呼叫到人机协同,这些技术的融合正在重塑呼叫行业的面貌。然而,这只是冰山一角。随着5G通信技术的普及,AI呼叫行业将迎来更为激动人心的变革——视频端的兴起。
在这样的技术背景下,AI音频与AI视频的结合显得尤为重要。AI音频端的实质是利用大模型与WAV文件的结合,通过声音识别和自然语言处理技术,实现对用户语音的准确理解和响应。这一过程不仅需要高效的算法,还需要对大量数据进行学习和训练,以确保AI能够准确捕捉用户的意图,并提供恰当的反馈。而AI视频端则进一步扩展了这一概念。它不仅要求AI能够处理声音信息,还需要对MP4文件中的视频内容进行解析和理解。这意味着AI需要具备更高级的视觉识别能力,能够识别和理解用户的面部表情、手势等非语言信息。这种多模态的交互方式,使得AI能够提供更加丰富和人性化的服务。
随着5G技术的普及,视频通话的质量和速度将得到显著提升,这为AI视频呼叫提供了完美的技术基础。用户将能够通过电话进行高清的视频对话,享受到与面对面交流相似的体验。数字人的互动技术在这样的环境下将得到广泛应用,它们不仅能够提供信息查询、预约服务等基本功能,还能够进行情感交流,甚至在某些情况下替代人工客服,提供更加个性化和高效的服务。
在探索人工智能呼叫行业的演进历程中,我们见证了技术能力的显著提升和转型。AI外呼技术,作为AI呼叫行业的重要组成部分,已经经历了数个技术周期的迭代和升级。目前,我们正处于第六代技术能力的阶段,这一阶段的核心特征是大模型与RAG(Retrieval-Augmented Generation)搜索增强能力的结合。RAG技术是一种结合了检索与生成的先进方法,通过从大量数据中检索相关信息,并结合生成模型的创造力,为AI呼叫提供了更为精准和个性化的响应。
然而,技术的演进永无止境。展望未来,我们预计AI呼叫行业将迈入第七代技术能力,这一阶段将以GPT(Generative Pre-trained Transformer)四代O(Optimized)的特性为主导。GPT四代O,一种端到端的音频交互技术,预示着AI呼叫行业将迎来一次质的飞跃。端到端的音频交互,即音频对音频的形式,意味着AI将能够直接处理和响应音频输入,无需转换为文本或其他格式。这种直接的音频处理方式,将极大地优化交互流程,提高响应速度,并减少延迟。
当前的AI呼叫技术,尽管已经相当先进,但综合延迟仍然在1.2到1.5秒之间。这在某些情况下可能会影响用户体验,尤其是在需要快速响应的场景中。然而,随着端到端7.0版本的出现,预计整个智能呼叫的互动速度将被压缩到300到500毫秒之间。这一速度的提升,不仅将极大地改善用户体验,还将为AI呼叫行业带来更广阔的应用前景。
在AI呼叫行业的广阔天地中,我们见证了技术的飞速发展和应用场景的不断拓展。以下是对AI呼叫领域的全面分享,包括用户使用智能呼叫产品的理由、技术演进、业务能力、核心技术指标,以及未来发展趋势的深入分析:
首先,用户选择智能呼叫产品的原因主要基于几个方面:高效化的获客、个性化的联络,以及有价值的数据分析。这些因素共同推动了智能呼叫产品在各行各业的应用和普及。同时,AI呼叫技术经历了从底层技术到支撑层、业务层的演进。从早期的AVR播报、关键词图形化表达式、NLP问法,发展到今天的大模型RAG技术。我们预见,下一代技术——以GPT-4o为代表的端到端技术,将进一步推动AI呼叫行业的发展。目前,大模型呼叫技术更多依赖于RAG搜索增强结合大模型的方式。通过构建企业的知识大脑,企业能够输出AI智能销售和AI智能前台,为用户提供更加智能化的服务。AI呼叫的服务模式包括代理人模式的纯粹呼叫和辅助模式的人工呼叫。此外,还有基于音频和视频端的自媒体模式,为用户提供更加丰富和互动的服务体验。AI呼叫的上下游业务能力涵盖了从客户触达、数据筛选到CRM客户管理等一系列环节。这些环节涉及到的核心技术包括自然语言理解能力、SaaS端的架构能力和Web RTC技术能力。对一系列技术核心指标的分析,有助于企业更好地理解和评估AI呼叫产品的性能和效果。除了技术以外,运营服务和线路服务能力也是AI呼叫产品的重要组成部分。这些能力直接影响到服务的稳定性和用户体验。AI呼叫未来的技术发展将包括智能体之间的互动、超高并发处理、超拟人的AI沟通、端到端的识别效率和5G高清通话等方向。通过分享各类客户案例,我们可以更具体地了解AI呼叫产品在实际应用中的效果和价值。提供了如何有效使用AI呼叫产品以及如何选择一个好的AI呼叫产品的指导和建议。最后,笔者提出了对当前行业的一些思考,包括面临的挑战、机遇和发展趋势,为读者提供了宏观的行业视角。
AI呼叫行业正处在一个快速发展和不断变革的时期。随着技术的不断进步和应用场景的不断拓展,AI呼叫产品将为企业和用户带来更多的价值和便利。我们期待未来在现实世界中与大家进行更多的沟通和交流,共同探索AI呼叫技术的无限可能。通过这些深入的分析和案例分享,我们可以看到AI呼叫技术正逐步成为企业通信战略中不可或缺的一部分,引领着智能通信服务的未来趋势。
Ai is calling.
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。