部署DeepSeek模型,进群交流最in玩法!
立即加群
发布
社区首页 >专栏 >大模型 AI 呼叫产品的发展演变

大模型 AI 呼叫产品的发展演变

原创
作者头像
用户11506085
修改2025-02-20 16:51:25
修改2025-02-20 16:51:25
310
举报
  1. 产品背景

在深入探讨AI呼叫行业之前,我们先来理解客户选择使用AI外呼的根本原因。呼叫行业,作为人类沟通的一种古老形式,其历史可以追溯到20世纪90年代。那时,随着腾讯等企业的兴起,呼叫行业以寻呼机的形式开始进入公众视野。而后,华为等其他企业也开始提供通信增值服务,推动了这一行业的早期发展。呼叫行业之所以经久不衰,是因为它提供了一种直接与用户互动的方式,这种互动可以绕过传统的通信壁垒,实现主动式的联系。呼叫行业包括主动式的呼出和被动式的呼入两种形式,分别对应AI外呼和AI接听。这种主动式的沟通方式,使得呼叫行业在效率上具有无可比拟的优势。

从90年代至今,呼叫行业经历了显著的演变。起初,呼叫主要依赖人工操作,随后发展到硬件辅助的人工呼叫,再到网页版的人工呼叫。大约六年前,机器人呼叫开始出现,而今天,我们利用智能体大模型进行呼叫,这一变化过程直观地展示了技术的进步如何推动行业的发展。

AI外呼的技术路径是一个复杂而精细的过程。它涉及到语音识别自然语言处理、机器学习等核心技术。这些技术共同协作,使得AI外呼系统能够理解用户的意图,提供准确的响应,并持续优化其性能。尽管在六七年前,电话机器人的智能水平和识别准确性有限,但用户依然选择使用,这主要是因为AI外呼的成本效益比人工呼叫要低得多。AI外呼的高效性使得它即使在技术尚未成熟的早期,也已经被市场所接受。

1.智能呼叫系统的优势

在当今快速发展的人工智能领域,智能呼叫系统无疑是AI技术商业化应用的典范之一。这一系统之所以能够成为商业化的一个亮点,主要得益于其在效率、成本效益和容错性方面的显著优势。

  1. 高投资回报率 智能呼叫系统的投资回报率(ROI)通常高于1,这意味着其使用效率,尤其是与人工呼叫相比的产出效率,具有明显的优越性。企业在采用AI呼叫系统时,会特别关注其综合北极星指标的表现,例如通过AI呼叫添加微信好友的成本效益。如果通过人工方式添加微信好友的综合成本为50元,而AI呼叫的成本仅为100元,那么AI呼叫系统的ROI显然具有吸引力。
  2. 高容错率 智能呼叫系统具有较高的容错率。与文本交互相比,音频交互在智能客服领域更为单一,因为文本交互是一个多模态场景,可能包含文本、音频和附件等多种元素。然而,在呼叫领域,由于通信条件的限制,互动主要依赖音频进行,这就使得智能呼叫系统在容错性上具有优势。用户对AI在通话中的错误具有一定的容忍度,这与阅读书籍时对作者逻辑错误的容忍性相似。
  3. 高能力

智能呼叫系统的能力足以应对业务需求,这表明AI呼叫是一个适合商业化的低精度业务场景。比如说自动驾驶技术。自动驾驶技术在汽车行业的应用的年限已经不短了,但大部分人依然不太敢使用自动驾驶的方式开100到200公里,但自动驾驶的技术在扫地机器人的场景里已经进行了大量的应用。以此类推,大模型技术也将在客服语音数字人等相关领域里先进行应用,因为这些是典型的低精度场景,但是像法律,医疗等高精度场景,这种技术的应用速度就会偏慢,这是整个行业的一个变化。智能呼叫系统正是利用了这一技术演进路径,SaaS和AI都是一种复利游戏,它们本身的特点就在于每一个月或者每一周都会基于代码量和数据量进行不断的升级,而这样的升级就会带动的产品进入到一个快速的业务增长期。

综合以上优势,智能呼叫系统的早期应用受到青睐的原因一目了然。即使在六年前,智能呼叫技术尚处于起步阶段,语音识别技术的准确性也有待提高,甚至很多的最基础的语音都会识别不准,但随着技术的进步,这些问题已经得到了显著改善。值得一提的是,在通信环境下,尽管许多人使用的是5G网络,但打电话时实际上使用的是3G或4G网络,这导致了通话音质相对较低。从音频质量的角度来看,人们在正常通话中使用的是8000赫兹的音频,而在像腾讯会议这样的应用中,则使用的是16K的音频。在这种音质较低的场景下,智能客服需要进行特别的优化和应用,以确保用户的体验。作为AI技术商业化的一个成功案例,智能呼叫系统不仅展示了AI在特定领域的应用潜力,也反映了技术进步如何推动行业向前发展。随着技术的不断成熟和优化,智能呼叫系统有望在未来的商业环境中扮演更加重要的角色。

2.客户联络演变

在AI技术的浪潮中,智能客服行业经历了翻天覆地的变化,主要包括内容、渠道、活动和决策四个方面。

  1. 内容层面 从早期的大规模、无差别化的沟通方式,到如今个性化、一对一的交流模式,智能呼叫系统已经实现了质的飞跃。随着大模型时代的到来,智能呼叫系统不仅能够提供个性化的服务,还能够与客户管理系统紧密联动,实现更加精准和高效的客户沟通。在大模型的加持下,智能呼叫系统能够读取并理解客户管理系统中的用户信息,如姓名、背景等,进而生成个性化的沟通内容。这种基于大模型的智能呼叫,与上一代机器人相比,实现了跨时代的进步。它不再是一种简单的自动化工具,而是一个能够理解、学习和适应客户需求的智能伙伴。
  2. 渠道层面 同时,智能呼叫系统的渠道也在不断演变。过去,智能呼叫系统可能只是单一的通信工具,但现代的智能呼叫系统需要与多种产品和渠道进行协同工作。例如,智能呼叫可以与挂机短信、微信推送、企业微信机器人通知等进行整合,实现全方位的客户接触和沟通。这种整合不仅提高了沟通效率,也为客户提供了更加连贯和一致的体验。
  3. 活动层面 维护用户的全生命周期里有大量的点是需要进行智能化的客户联络的,智能呼叫系统从单一的节点式爆发,走向了持续的关系化,其应用场景也在持续扩展。比如在电商行业,从用户购买、收货、评价、后期复购,到会员营销、节日回访以及用户流失管理,智能呼叫系统在用户生命周期的各个阶段都发挥着重要作用。通过智能化的客户联络,企业能够更好地维护与客户的关系,提高客户满意度和忠诚度。
  4. 决策层面

通过个性化的联络,甲方从直觉化的驱动进入到了一种数据化的驱动。智能呼叫系统还推动了企业从直觉驱动向数据驱动的转变。通过收集和分析大量的用户数据,如接通率、意向客户标签率、通话时长、客户所属地域等,企业可以更加精准地调整业务策略,提高营销效果。这种数据驱动的决策模式,为企业提供了更加科学和客观的依据。

随着人力成本的不断上升和私域运营需求的增加,甲方对于提高营收和客户满意度的要求也越来越高,这些因素共同推动了新一代智能客服场景的有效落地。总之,智能客服行业的发展是一个不断演进和创新的过程。随着AI技术的不断进步,智能呼叫系统将在未来的客户服务领域扮演更加重要的角色。它将帮助企业实现更高效、更个性化的客户沟通,为企业的持续发展提供强大的支持。

(二)AI相对人力优势

在探讨人工智能(AI)在呼叫行业中的效率优势时,我们不得不提到AI在处理高容量任务时的卓越能力。AI呼叫系统的设计初衷是为了提高效率、降低成本,并且提供一致性的服务体验。让我们深入分析AI如何实现这一目标。

  1. 工作效率 AI呼叫系统不受人类工作者的生理限制。人类呼叫中心的工作人员每天最多工作八个小时,而这段时间内,他们能够处理的有效通话数量大约在100到200通电话之间。相比之下,AI系统能够持续不断地工作,不受时间限制,其有效通话量可以达到惊人的800到1000通电话,大大提升工作效率。
  2. 工作状态 AI系统在处理任务时的严格性和一致性也是人工呼叫所无法比拟的。AI不会因情绪波动、疲劳或个人偏见而偏离业务主线,它能够始终如一地执行任务,确保服务质量的稳定性。此外,AI系统能够进行高效的数据分类,这不仅提高了处理速度,还增强了对客户信息的精准把握。
  3. 客户跟进 然而,尽管AI呼叫系统在效率和成本上具有显著优势,上一代的AI机器人呼叫并没有实现广泛的普及。这主要是因为它们的智能水平有限,无法满足复杂多变的客户需求。但是,随着大模型技术和搜索增强技术的演进,新一代的AI智能客服已经具备了超越人工的能力。这些技术的进步使得AI客服能够更好地理解和处理复杂的客户查询,提供更加个性化和精准的服务。新一代AI智能客服的市场价值在于它们真正具备了取代人工的可能性。随着自然语言处理(NLP)和机器学习技术的发展,AI客服能够更加自然地与人类进行交流,理解客户的意图,并提供相应的解决方案。这种智能水平的提升,不仅提高了客户满意度,也为呼叫中心带来了更高的运营效率。
  4. 费用成本

在成本效益方面,AI呼叫系统同样展现出其无与伦比的优势。AI的成本大约只有人力成本的十分之一,这意味着在相同投入下,AI能够提供更高的产出。如果我们进一步分析,AI的综合成本仅为人力的四十分之一,而效率却是人类的四倍。这一成本与效率的结合,无疑为AI呼叫系统带来了巨大的市场竞争力。

AI呼叫系统以其高效率、低成本和一致性服务,正在逐步改变呼叫行业的面貌。随着技术的不断进步,我们可以预见,AI将在未来的呼叫行业中扮演越来越重要的角色,为企业提供更高效、更智能的客户服务解决方案。

在AI时代,呼叫行业的成本结构发生了根本性的变化。传统上,人力成本占据了呼叫中心运营成本的很大一部分。然而,随着人工智能技术的发展和应用,我们见证了成本结构的重塑。AI呼叫系统的核心优势在于其能够显著降低人力成本,转而将成本重心转移到经营性成本上,比如通信费用。在不计算通信费用的情况下,AI的综合成本可能仅为人力成本的四十分之一。这一成本优势源于AI系统的自动化和规模化能力,它们能够以极低的边际成本处理大量的呼叫任务。当通信费用被纳入计算时,AI的成本可能降至人力成本的十分之一左右。这种成本效益的显著提升,为AI呼叫系统在商业领域的广泛应用提供了坚实的基础。

  1. AI呼叫的技术路径

在人工智能(AI)引领的呼叫行业革命中,技术路径的明确性和系统性是确保成功实施的关键。AI呼叫系统的设计和实现遵循一个非常直观的分层架构,分别是支撑能力层、基础服务层、业务层,这不仅保证了技术的可扩展性,还为未来的创新提供了坚实的基础。以下是对AI呼叫技术路径的深入分析,旨在为读者提供科普性和专业性的洞见。

  1. 产品的基本架构
  2. 支撑能力层:AI呼叫的基石

支撑能力层是AI呼叫系统的底层,它为整个架构提供了必要的技术支撑。这一层由三个核心组成部分构成:AI基础能力、智能引擎和通信能力。

  1. AI能力 AI能力涉及语音识别(ASR)、自然语言处理(NLP)和语音合成(TTS)等,这些技术使得AI呼叫系统能够理解人类的语音,并以自然的方式进行回应。随着技术的进步,NLP的能力得到了显著提升,现在可以支持实时打断、变量呼叫和多轮对话等高级功能。 AI 能力也不仅仅在于逻辑对话,还包括了 VAD 及降噪等模块。
  2. 智能引擎 智能引擎是AI呼叫系统的核心,它负责处理和理解用户的意图。得益于大模型技术的发展,智能引擎的能力已经从传统的意图理解升级为更加复杂的处理能力,如基于RAG(Retrieval-Augmented Generation)搜索增强和大模型的智能处理。
  3. 通信能力

通信能力是呼叫行业特有的技术要求,包括SIP(Session Initiation Protocol)协议、呼叫转接技术、空号识别和智能路由调度。这些技术确保了呼叫的顺畅进行和高效管理。

  1. 基础服务层:AI呼叫的中坚力量

在人工智能(AI)呼叫行业的架构中,基础服务层扮演着至关重要的角色,它建立在支撑能力层的坚实基础之上,各种组成要素共同作用为AI呼叫系统提供强大动力,并为业务层提供必要的服务和功能。

  1. 话术管理:智能交互的核心 AI对话能力是基础服务层的核心,它使得AI呼叫系统能够与用户进行自然、流畅的交流。这一能力依赖于先进的自然语言处理(NLP)技术,包括语音识别(ASR)、自然语言理解(NLU)和语音合成(TTS)。通过这些技术,AI呼叫系统能够理解用户的意图,生成合适的回应,并以语音的形式传达给用户。
  2. 外呼管理:高效任务执行 外呼管理能力涉及到呼叫任务的配置和管理。这包括呼叫策略的制定、任务的调度以及黑名单管理等。通过智能路由和调度,AI呼叫系统能够确保每个呼叫都能够得到及时和有效的处理。
  3. 客户管理:客户关系维护 用户管理能力是AI呼叫系统中用于维护客户信息和关系的重要组成部分。类似于客户关系管理(CRM)系统,它负责管理用户的个人信息、呼叫历史、偏好设置等。这有助于企业更好地了解客户,提供更加个性化的服务。客户数据公海管理是指对潜在客户资源的管理和分配。通过将潜在客户信息导入客户公海,企业可以更有效地分配销售和营销资源,提高转化率。
  4. API接口:开放与集成

API接口能力为AI呼叫系统提供了与其他系统和服务集成的能力。通过开放的API接口,企业可以将AI呼叫系统与现有的业务流程、数据库和其他应用程序相连接,实现数据的导入、导出以及信息回传等功能。

基础服务层是AI呼叫行业的中坚力量,它通过提供一系列强大的服务和功能,使得AI呼叫系统能够高效、智能地运行。随着AI技术的不断进步,基础服务层的功能将变得更加强大和多样化,为企业带来更高的运营效率和更好的客户体验。在这本畅销AI书籍中,我们将继续探索AI呼叫系统的更多奥秘,揭示它如何改变我们的沟通方式和商业实践。

3.业务层:AI与消费者互动的前沿

业务层是AI呼叫产品的核心,它涉及AI坐席与消费者之间的直接互动。这种互动可以采取多种形式,包括但不限于主动呼叫、被动呼入以及人机协同等。主动呼叫指的是AI系统根据预设的策略或用户需求,主动联系消费者;被动呼入则是消费者主动联系AI坐席,寻求帮助或信息;而人机协同则是一种更为高级的互动形式,它结合了人工智能的高效处理能力和人类坐席的灵活性,以提供更加个性化和人性化的服务。

这些互动过程中产生的数据是至关重要的,它们不仅为企业提供洞察消费者行为和需求的机会,也是优化服务和提高效率的关键。数据的流转通常通过以下几种方式实现:

  1. 人工坐席:在AI无法解决复杂问题或需要人类判断的情况下,人工坐席能够介入,提供必要的支持和决策。
  2. 挂机短信:在通话结束后,系统可以自动发送短信给消费者,提供进一步的信息或确认服务细节,增强用户体验。
  3. 数据报表:通过收集和分析AI呼叫过程中的数据,企业可以生成详细的报表,这些报表不仅帮助企业了解服务效果,还能指导未来的业务决策和流程优化。

(二)智能呼叫的历史演进

智能呼叫技术的发展历程,无疑是一段充满突破与创新的史诗。从最初的自动化拨号器到现代的高级人工智能系统,智能呼叫技术已经走过了一段漫长而充满挑战的旅程。在这段旅程中,我们见证了技术如何从简单的机械自动化,逐步演进为能够理解和响应复杂人类语言的智能系统。

  1. IVR播报时代 智能呼叫技术的起点可以追溯到IVR(Interactive Voice Response,交互式语音响应)播报系统——0.0版本,即IVR播报,通过按键选择来引导用户完成对话。在大约过去十年的时间里,IVR播报成为了主流的交互方式。它通过简单的按键指令,如“用户请按零”或“用户请按一”,来引导用户进行操作,实现基本的交互功能。这种方式虽然基础,但在当时已经极大地提高了服务效率和用户自助服务的能力。
  2. 语音识别与合成技术的应用 进入2017至2018年,智能呼叫行业迎来了技术革新的浪潮。语音识别技术使得系统能够理解用户的语音指令,而语音合成技术则让系统能够以自然流畅的语音回应用户。结合关键词搜索引擎(ES),智能呼叫系统开始提供更为自然和流畅的交互体验,用户不再需要通过按键来选择服务,而是可以直接用语音与系统进行交流。
  3. 图形化与上下文理解 2019年,智能呼叫系统进一步发展,引入了图形化界面和上下文理解能力。图形化界面使得用户可以通过触摸屏等设备与系统交互,而上下文理解能力则让系统能够根据对话的上下文来提供更加精准的服务。智能呼叫系统开始能够处理更加复杂的对话场景。尽管关键词匹配依然是主流的处理方式,但这一阶段的系统已经能够处理更加复杂的对话场景。
  4. 正则表达式的突破 到了2020年,正则表达式的引入为智能呼叫系统带来了新的突破。正则表达式是一种强大的文本匹配工具,它使得系统能够更有效地解析用户的复杂意图。例如,当用户询问“大户型的房子多少钱”时,系统能够通过正则表达式拆解出“大户型”和“多少钱”这两个关键信息,从而提供更加精确的回答。
  5. NLP自然语义理解技术的兴起 2022年左右,随着NLP自然语义理解技术的发展,智能呼叫系统开始采用问法对问法的相似度算法,通过向量化处理,实现了对词条的高效索引和排序。这种方法不仅能够处理复杂的问法,还能够解决问法之间的互斥问题。
  6. 大模型时代的技术革新

随着大模型技术的兴起,智能呼叫行业进入了一个新的技术周期。大模型智能体结合NLP语义理解,提供了一种成本效益高、响应迅速的解决方案。这些模型通常拥有数十亿甚至数千亿的参数,能够处理更加复杂的交互场景,提供更加精准和个性化的服务。大模型的引入,使得智能呼叫系统在理解用户意图、提供个性化服务以及处理复杂对话方面达到了前所未有的水平。

AI呼叫中心正站在一个新的历史机遇面前。随着大模型技术的发展,智能呼叫行业有望实现根本性的变革。在中国,每天有近500万人在呼叫中心工作;在国际市场上,许多东南亚国家,如柬埔寨、菲律宾等,以英语为母语,利用较低的人力成本,将呼叫中心作为国家的支柱产业。大模型技术的低成本、高智能特性,为这些国家的呼叫中心行业提供了巨大的替代潜力。随着技术的不断成熟和应用的不断深入,我们有理由相信,AI呼叫中心将在全球范围内发挥更加重要的作用,推动整个行业的创新和发展。

智能体对行业的变更是很明显的,人力呼叫的每通电话成本在 3~5 元,而 AI 可以实现十倍+的成本下降,很多朋友会说 AI 不能完全取代人力,但是假定一个 1000 人的呼叫职场,那么 1000人的综合管理及人力成本为 2亿元,将此调整为 2000+AI 智能体结合 200 人的团队,可以将成本从 2 亿下降至 8000 万。

(三)智能客服的知识类型

在人工智能(AI)领域,智能客服的演进是企业服务创新的重要体现。新一代的智能客服系统不仅仅是一个简单的交互工具,而是一个高度集成的智能平台,它通过整合企业的知识资产,提供深度定制化的客户服务体验。新一代智能客服系统的核心是一个被称为“知识大脑”的复杂知识库。这个知识大脑是智能客服系统智慧的源泉,它由三种类型的知识构成:

1.行业知识

第一种类型是行业知识,这是智能客服系统理解特定行业需求和语境的基础。以家装或房地产行业为例,智能客服需要掌握与这些行业相关的专业知识和术语。这些知识不完全由企业提供,而是由SaaS(Software as a Service)厂商结合不同行业的专业能力构建而成。行业知识的整合使得智能客服能够更准确地理解用户的需求,并提供专业的服务。

2.职业知识

第二种类型是职业知识,它涉及特定职业角色的交流方式和行为准则。例如,销售冠军的沟通技巧、优秀客服人员的服务标准、前台接待的专业用语等。职业知识帮助智能客服系统模拟专业人士的行为,提供更加人性化和专业的服务。

3.企业私有知识库

第三种类型是企业自己的私有知识库。这个知识库包含了企业独特的信息和知识,如产品细节、服务流程、客户案例等。私有知识库可以通过表格、文档、API或网页等多种形式呈现。这些知识是企业员工,包括新入职员工,必须掌握的,涵盖了个人履历、行业背景、职业培训以及企业特有的私有知识。

智能客服系统通过整合上述三种知识,构建了一个全面的知识体系。这个体系不仅包含了行业和职业的通用知识,还融入了企业特有的私有知识,使得智能客服能够提供高度个性化和专业化的服务。随着AI技术的不断进步,智能客服系统将变得更加智能和自适应。机器学习和深度学习技术的应用将使智能客服能够不断学习和优化,提供更加精准和个性化的服务。此外,随着自然语言处理(NLP)技术的发展,智能客服将能够更好地理解用户的意图和情感,提供更加人性化的服务体验。新一代智能客服系统的发展,标志着企业服务模式的一次重大变革。通过构建强大的知识大脑,智能客服不仅能够提供专业的服务,还能够不断学习和进化,满足不断变化的市场需求。

(四)模型的选择

在智能呼叫行业的发展历程中,选择合适的大模型对于实现高效、个性化的客户服务至关重要。本文将深入探讨这一主题,从技术选择到业务场景的应用,以及未来技术的发展趋势。

1.选择合适的大模型

智能呼叫系统的核心在于其处理自然语言的能力,这需要依赖于先进的大模型。大模型的选择应基于业务场景的具体需求,考虑到通话的流程特性和成本效益。由于通话通常较短,不会超过十分钟,一个人一分钟说话的数量大约在300字左右,这意味着在一次通话中,大模型的token消耗通常不会超过3000个token。因此,智能呼叫系统可以选择成本更低、尺寸适中的模型,如turbo或4K大小的模型,以实现成本效益和性能的平衡。

模型的大小也会进一步影响互动,并非越大的模型越好,越大的模型代表成本更高,速度更慢,而小模型也会存在智商偏低的问题。所以模型的选择需要根据实际的业务进行判断。我们更倾向于国产大模型,因为延迟和对话逻辑更符合中文特点。

2.智能呼叫的业务场景

智能呼叫系统的输出可以广泛应用于多种业务场景,包括但不限于文本客服和音频客服。文本客服可以在公域和私域中提供服务,而音频客服则包括AI外呼、AI接听和数字人客服等形式。这些业务场景的实现,依赖于大模型的自然语言处理能力,能够理解和响应用户的需求。

随着技术的进步,模型选择变得更加自定义化。企业可以根据自己的业务需求和市场定位,选择不同的大模型来构建智能呼叫系统。例如,Deepseek、通义千问、智谱清言、豆包等模型可以针对特定的中文市场进行优化。而在国际市场上,Lama或ChatGPT 4等技术能力则提供了更广泛的语言支持和应用场景。我们认为,智能呼叫技术的未来将朝着第五代技术能力发展。这一代技术将更加注重个性化、智能化和集成化,能够提供更加精准和人性化的服务。

智能呼叫行业的发展是一个不断演进的过程,它需要不断地技术创新和业务模式的探索。选择合适的大模型,实现模型选择的自定义化,以及探索未来的技术能力,是智能呼叫行业持续发展的关键。随着技术的不断进步,我们有理由相信,智能呼叫系统将在未来的客户服务领域发挥更加重要的作用,为用户带来更加便捷、高效和个性化的服务体验。

(五)智能体呼叫的概述

智能体呼叫技术是人工智能领域中一个令人兴奋的分支,它不仅融合了传统呼叫中心的自动化特性,还引入了声音克隆、多语种交互等创新技术。比如,通过声音克隆技术,系统可以模仿特定人的声音进行呼叫,这不仅提高了用户体验,还为个性化服务提供了新的可能性。此外,智能体广场的概念允许企业快速构建和部署一系列呼叫智能体,实现规模化的智能服务。多语种交互是智能体呼叫技术的另一大亮点。随着全球化的发展,企业和客户之间的交流越来越频繁,能够处理中英文等多语种的智能呼叫系统变得尤为重要。这不仅有助于企业拓展国际市场,还能为不同语言背景的用户提供更加便捷的服务。

1.问题

尽管智能体呼叫技术带来了许多创新和便利,但在实际应用中也面临着一些挑战。以下是大模型呼叫技术中存在的一些典型问题:

  1. 成本高:大模型的运行需要消耗大量的计算资源,尤其是在处理大量token时,这会导致成本显著增加。为了降低成本,企业和开发者需要寻找更高效的算法和优化模型结构。
  2. 延迟高:在实时交互中,响应速度至关重要。然而,大模型的复杂性可能导致处理延迟,影响用户体验。为了解决这一问题,可以采用边缘计算、模型剪枝等技术来减少延迟。
  3. 拟人化程度低:尽管大模型在理解和生成自然语言方面取得了显著进展,但在模拟人类情感和复杂语境方面仍有提升空间。提高拟人化程度需要进一步研究人类语言的细微差别,并将其融入到模型训练中。
  4. 幻觉:由于对时延的要求,采用类似Dify的多智能体编排,或者 扣子、百炼的操作会导致延迟过高,所以幻觉和时延形成了逻辑对比。

2.解决措施

在AI呼叫行业的发展过程中,我们见证了技术的不断演进和挑战的逐步克服。本章节将深入探讨智能体呼叫技术如何通过创新手段解决成本、延迟和拟人化程度低的问题,并展望其未来的发展方向。

  1. 成本问题:采用预合成策略 智能体呼叫技术面临的成本问题主要源于对大量token的处理需求。为了解决这一问题,行业采用了预合成策略,即对最常见的90%的内容进行预先处理并通过 NLP 解决。例如,通话中80%会在开场白结束后结束,因此可以对开场白及其结束语进行预合成。这种方法不仅降低了成本,还减少了处理延迟。
  2. 延迟问题:优化技术手段 智能体呼叫系统的高延迟问题可以通过多种技术手段进行优化。通过分层处理(愈合层)和结合自然语言处理(NLP)的互动形式,可以有效地解决高并发处理的问题。这种方法允许系统快速响应大量用户的请求,同时保持低延迟。 解决方案: ·引入语气承接和主动倾听能力,让 AI 具备延迟响应能力。 ·引入缓存机制 ·AI 和 ECS 全部内网 VPC,解决带宽延迟 ·引入背景音模块,主动减缓时延带来的感受问题
  3. 拟人化程度问题:引入agents模式

随着技术的演进,TTS语音合成技术会越来越拟人,能够模拟人类语音的韵律、语调和情感,使得机器生成的语音更加贴近真人发音,让拟人化程度越来越高。

对当前情况进行进一步拆解,我们把它统称为agents模式,这种模式下,大并发、交互弱,如AI外呼中的营销或通知类的业务场景,通过NLP(Natural Language Processing)问法匹配技术,再结合大模型的方式,以上一代外呼为主,这一代大模型呼叫为辅的形式来完成,可以实现高效的自动化服务。 对于并发量较小的业务场景,即单个对话模型的有效通话量低于5万通电话,传统的对话模型需要AI训练师来搭建,这会带来额外的成本。AI训练师的成本通常在600到1000元之间,当通话量较小时,这一成本均摊到每一通电话中,会导致总体成本偏高。相比之下,采用纯大模型呼叫的方式,可以省去AI训练师的参与,从而降低成本。因此,以小并发、交互强、目标是取代人工的业务场景,可以采用纯粹的大模型智能体呼叫的形式来完成。

解决方案:

·采用声音克隆+大语言 TTS

·声音克隆结合真人录音缓存

·采用端到端语音互动,具备情绪理解能力

3.业务场景

在AI呼叫行业的快速发展中,业务场景的多样化和复杂化是其显著特点。下面将详细探讨AI呼叫行业的几种典型业务场景,以及它们如何通过技术的进步实现更加智能化和自动化的服务。

  1. AI外呼回访和调研 AI外呼技术在回访和调研性质的业务中扮演着重要角色。例如,运营商满意度回访和APP端对用户的回访调研等,这些业务场景通常需要大量的电话沟通,而AI外呼技术可以有效地提高这一过程的效率和效果。在这类场景中,AI系统可以自动拨打电话,根据预设的脚本进行标准化的回访或调研,收集用户的反馈信息。由于这些业务的标准化程度较高,采用大模型技术可以有效地完成这些任务,同时降低人力成本和提高数据收集的准确性。
  2. AI呼入接听外国语种 随着全球化的发展,企业需要处理来自不同国家和地区的客户咨询。AI呼入接听技术可以支持多种语言,包括英文、法语、西班牙语等主流业务语种,为国际客户提供多语种服务。在这种场景下,大模型呼叫技术的应用可以替代传统的人工翻译或多语种客服人员,实现自动化的语言识别和翻译,提供即时的、准确的客户服务。这不仅提高了服务效率,还降低了跨语言沟通的复杂性和成本。
  3. 目标替代人工

对于一些技术复杂度较高的业务场景,通常以人工为主,如车险核定等,AI呼叫技术的应用可以提供更加精准和高效的服务。在这些场景中,AI系统需要处理大量的数据和复杂的业务逻辑,以实现自动化的业务处理。

通过集成先进的数据分析和机器学习技术,大模型呼叫系统可以对用户的需求进行深入分析,提供个性化的服务方案。这种技术的应用有助于提高业务处理的准确性和用户满意度。

所以其实 AI 语音互动可以解决 AI 营销(会员、陌生拜访)、回访、调研和呼入等多种场景。

  1. 客户联络:多模式 在AI呼叫行业中,有两种主要的模式:Agents模式和Copilot模式。Agents模式是指AI系统完全独立地完成呼叫任务,而不需要人工干预。这种模式适用于标准化程度高、技术复杂度低的业务场景,常作为主流模式使用。相比之下,Copilot模式是指AI系统辅助人工呼叫员完成工作。在这种模式下,AI系统可以提供实时的数据分析、语音质检、无感介入和AI转人工等功能,帮助人工呼叫员提高工作效率和服务质量。 尽管AI呼叫技术的发展预示着人工呼叫行业的未来可能会被取代,但目前仍有许多企业和竞争对手选择对人工呼叫进行产品升级,以适应市场的变化和需求。 作为AI领域的专家,我们更倾向于开发Agents模式,因为这种模式能够实现真正的自动化和智能化,减少对人工的依赖。然而,在过渡期间,我们也认识到Copilot模式的重要性,它可以帮助人工呼叫员逐步适应AI技术的应用,提高整体的服务水平。AI呼叫行业的发展正在改变传统的呼叫中心业务模式。通过引入AI外呼回访、多语种呼入接听和处理技术复杂度高的业务场景,大模型呼叫技术正在推动行业的创新和进步。同时,Agents模式和Copilot模式的应用为人工呼叫员提供了新的工作方式和辅助工具。随着技术的不断发展,我们期待AI呼叫行业能够实现更加智能化、自动化的服务,为企业和用户创造更大的价值。
  2. 表现形式:多模态

AI技术的应用不仅仅局限于音频端,而是在多个维度上扩展,为行业带来了革命性的升级。从AI外呼、AI接听、人工呼叫到人机协同,这些技术的融合正在重塑呼叫行业的面貌。然而,这只是冰山一角。随着5G通信技术的普及,AI呼叫行业将迎来更为激动人心的变革——视频端的兴起。

在这样的技术背景下,AI音频与AI视频的结合显得尤为重要。AI音频端的实质是利用大模型与WAV文件的结合,通过声音识别和自然语言处理技术,实现对用户语音的准确理解和响应。这一过程不仅需要高效的算法,还需要对大量数据进行学习和训练,以确保AI能够准确捕捉用户的意图,并提供恰当的反馈。而AI视频端则进一步扩展了这一概念。它不仅要求AI能够处理声音信息,还需要对MP4文件中的视频内容进行解析和理解。这意味着AI需要具备更高级的视觉识别能力,能够识别和理解用户的面部表情、手势等非语言信息。这种多模态的交互方式,使得AI能够提供更加丰富和人性化的服务。

随着5G技术的普及,视频通话的质量和速度将得到显著提升,这为AI视频呼叫提供了完美的技术基础。用户将能够通过电话进行高清的视频对话,享受到与面对面交流相似的体验。数字人的互动技术在这样的环境下将得到广泛应用,它们不仅能够提供信息查询、预约服务等基本功能,还能够进行情感交流,甚至在某些情况下替代人工客服,提供更加个性化和高效的服务。

在探索人工智能呼叫行业的演进历程中,我们见证了技术能力的显著提升和转型。AI外呼技术,作为AI呼叫行业的重要组成部分,已经经历了数个技术周期的迭代和升级。目前,我们正处于第六代技术能力的阶段,这一阶段的核心特征是大模型与RAG(Retrieval-Augmented Generation)搜索增强能力的结合。RAG技术是一种结合了检索与生成的先进方法,通过从大量数据中检索相关信息,并结合生成模型的创造力,为AI呼叫提供了更为精准和个性化的响应。

然而,技术的演进永无止境。展望未来,我们预计AI呼叫行业将迈入第七代技术能力,这一阶段将以GPT(Generative Pre-trained Transformer)四代O(Optimized)的特性为主导。GPT四代O,一种端到端的音频交互技术,预示着AI呼叫行业将迎来一次质的飞跃。端到端的音频交互,即音频对音频的形式,意味着AI将能够直接处理和响应音频输入,无需转换为文本或其他格式。这种直接的音频处理方式,将极大地优化交互流程,提高响应速度,并减少延迟。

当前的AI呼叫技术,尽管已经相当先进,但综合延迟仍然在1.2到1.5秒之间。这在某些情况下可能会影响用户体验,尤其是在需要快速响应的场景中。然而,随着端到端7.0版本的出现,预计整个智能呼叫的互动速度将被压缩到300到500毫秒之间。这一速度的提升,不仅将极大地改善用户体验,还将为AI呼叫行业带来更广阔的应用前景。

  1. AI呼叫的上下游能力 在AI呼叫行业的广阔领域中,技术的上游和下游能力构成了一个复杂而高效的生态系统。智能呼叫业务场景的核心目标是实现用户触达,即通过智能技术提高与用户的沟通效率和质量。这一愿景的实现,不仅仅依赖于呼叫本身,还涉及到一系列与用户互动的环节。 在用户端,除了传统的呼叫服务,AI呼叫行业还拓展了多种服务方式,以增强用户体验和提高服务效率。例如,挂机短信服务能够在通话结束后向用户发送相关信息,这种即时反馈机制能够加深用户的品牌印象并提供额外价值。此外,人工呼叫、微信推送、AI转人工等服务模式,使得人机互动和文本客服更加无缝和个性化。 呼叫服务与客服、短信、人工呼叫台等环节的紧密关联,构成了AI呼叫行业的服务链。在这个链条中,上游环节包括智能化的数据收集和客户商机挖掘。用户数据的来源主要有三个渠道:B2B线索、广告平台线索以及企业自有数据。这些数据来源为AI呼叫系统提供了丰富的信息基础,使得企业能够更精准地识别和接触潜在客户。通过整合这些数据,AI呼叫系统能够智能地识别用户的潜在联系方式,并采用一系列用户触达策略,如智能呼叫、短信通知、外呼转接以及人工无干扰介入等,以实现有效的用户沟通和服务。这些策略不仅提高了服务的响应速度,也增强了用户的满意度和忠诚度。在用户触达之后,AI呼叫行业还涉及到下游的客户管理环节。这包括CRM(客户关系管理)系统的应用、语音质量检测以及意向标签管理等。这些工具和方法帮助企业更好地理解客户需求,优化服务流程,并提高客户管理的效率。 值得注意的是,在AI呼叫行业的整个服务链中,人工协同点起着至关重要的作用。然而,随着技术的发展,这些协同点有望通过大模型agents的方式得到替代。大模型agents能够模拟人类行为,自动执行一系列任务,从而减少对人工操作的依赖,提高整个系统的自动化水平。AI呼叫行业是一个由多个环节紧密相连的生态系统。从上游的数据收集和商机挖掘,到下游的客户管理和服务执行,每一个环节都至关重要。随着AI技术的不断进步,我们有理由相信,AI呼叫行业将变得更加智能、高效和人性化,为用户带来更加卓越的服务体验,为企业创造更大的商业价值。
  2. 总结与展望

在AI呼叫行业的广阔天地中,我们见证了技术的飞速发展和应用场景的不断拓展。以下是对AI呼叫领域的全面分享,包括用户使用智能呼叫产品的理由、技术演进、业务能力、核心技术指标,以及未来发展趋势的深入分析:

首先,用户选择智能呼叫产品的原因主要基于几个方面:高效化的获客、个性化的联络,以及有价值的数据分析。这些因素共同推动了智能呼叫产品在各行各业的应用和普及。同时,AI呼叫技术经历了从底层技术到支撑层、业务层的演进。从早期的AVR播报、关键词图形化表达式、NLP问法,发展到今天的大模型RAG技术。我们预见,下一代技术——以GPT-4o为代表的端到端技术,将进一步推动AI呼叫行业的发展。目前,大模型呼叫技术更多依赖于RAG搜索增强结合大模型的方式。通过构建企业的知识大脑,企业能够输出AI智能销售和AI智能前台,为用户提供更加智能化的服务。AI呼叫的服务模式包括代理人模式的纯粹呼叫和辅助模式的人工呼叫。此外,还有基于音频和视频端的自媒体模式,为用户提供更加丰富和互动的服务体验。AI呼叫的上下游业务能力涵盖了从客户触达、数据筛选到CRM客户管理等一系列环节。这些环节涉及到的核心技术包括自然语言理解能力、SaaS端的架构能力和Web RTC技术能力。对一系列技术核心指标的分析,有助于企业更好地理解和评估AI呼叫产品的性能和效果。除了技术以外,运营服务和线路服务能力也是AI呼叫产品的重要组成部分。这些能力直接影响到服务的稳定性和用户体验。AI呼叫未来的技术发展将包括智能体之间的互动、超高并发处理、超拟人的AI沟通、端到端的识别效率和5G高清通话等方向。通过分享各类客户案例,我们可以更具体地了解AI呼叫产品在实际应用中的效果和价值。提供了如何有效使用AI呼叫产品以及如何选择一个好的AI呼叫产品的指导和建议。最后,笔者提出了对当前行业的一些思考,包括面临的挑战、机遇和发展趋势,为读者提供了宏观的行业视角。

AI呼叫行业正处在一个快速发展和不断变革的时期。随着技术的不断进步和应用场景的不断拓展,AI呼叫产品将为企业和用户带来更多的价值和便利。我们期待未来在现实世界中与大家进行更多的沟通和交流,共同探索AI呼叫技术的无限可能。通过这些深入的分析和案例分享,我们可以看到AI呼叫技术正逐步成为企业通信战略中不可或缺的一部分,引领着智能通信服务的未来趋势。

Ai is calling.

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档