原标题:对话浪潮信息:AI大模型“源”炼造客服大脑
2018年至今,NLP领域经历了非常大的变化,Transformer、ELMO、BERT、GPT-3,再到最近的ChatGPT(GPT 3.5的微调)的突破,NLP在预训练大模型的暴力拆解路上越走越远,这也让各行业开始相信:很多之前无法做到的场景、效果,现在可以有新的解法和落地。
智能客服,是NLP和深度学习技术落地的重要领域之一。客服可以基于提前设定好的规则,对用户意图进行判断并生成对应的固定话术。文本机器人、外呼机器人,可以替代掉原有重复性比较强的人工动作,逐渐转变为相对日常的落地场景。比如你日常所接听到的快递客服电话,订单咨询的对话框等等,背后都有来自客服机器人的驱动。
但在对客服要求比较高的企业级场景中,对多轮对话理解用户意图和知识专业度要求较高,现有的客服机器人仍有很高提升的空间。
一是系统整体搭建的维护成本比较高,效率比较低,因为大多数的企业级智能客服的知识库不是流程化的,而是技术知识库,需要人工/半自动的方式进行搭建。
二是业务场景复杂,专门知识门槛会更高,往往会涉及不同客户的应用场景,与业务流程相关的复杂场景。
三是持续突破比较难,边际效益递减明显,一般在良好技术知识库的支撑下,企业级智能客服的起步较快,但受制于方法论的影响,前期需要投入的大量人力、算力和数据,而到一定阶段则会陷入提升的瓶颈。
这样的问题也曾经困扰浪潮信息的客服系统研发人员。
近日,钛媒体App对话浪潮信息服务总监陈彬、浪潮信息AI软件研发总监吴韶华,围绕智能客服市场当前解决的难题,以AI大模型的实际落地应用为视角,进行深入交流。
具体来讲,浪潮信息以AI大模型“源”为智能引擎,和InService智能服务平台,搭建出了“智能客服大脑”。
据介绍,“智能客服大脑”学习了2万余份产品文档和用户手册的数据,并结合百万条浪潮信息专家工程师服务对话、数十万份日志、工单数据等算法训练,具备语言理解、数据分析、自主学习和智能推理等能力,支持自然语言交互服务、已授权IT设备的智能运维与诊断、以及备品备件等资源的智能管理和调度。
AI大模型在应用过程中必然会面临各个行业的应用落地。在此之前,浪潮AI大模型“源”已经在人机交互、知识检索、语言翻译、文学创作等领域有所应用。
以大模型作为基础能力,通过大模型的蒸馏实现相关的小模型,不仅实现的速度更快,智能化水平更高,从技术角度来讲,大模型在落地过程中呈现出了与以往模型非常不同的技术特征,也带来了更好的智能化水平。不论对大模型进行微调,还是引入领域知识库的方式,均是业界在探索的路径。
在浪潮信息AI软件研发总监吴韶华看来,“大模型想要在某个方向上训练得更好,智能化水平更高,确实需要在具体落地场景引入额外的领域知识,才能解决实际问题。AI大模型有其自身特点,训练时使用的数据集主要来自互联网,在通用知识和领域知识的分布上存在不均,会影响其在具体行业的应用。”
举个例子,在浪潮信息服务所面临的主要客户问题,包括咨询和故障报修两大类:前者如各类的产品服务政策、设备使用、以及复杂的技术咨询,如技术咨询方面其实比较常见的是如何做系统安装、Raid配置等,因为这个过程比较复杂,常出现各种问题;产品咨询包括购买产品的内存配置、保修时长等等;故障报修相对会比较有针对性、更多元,例如无法开机、硬盘故障、内存故障等等。
在浪潮信息的咨询客户中,有80%的用户为非专业工程师,智能客服需要在准确理解用户、精准定义问题的基础上,通过多轮回答解决技术问题,给予客户满意的答案。对于客户而言,如若智能客服所给予的答案过于标准和冗余,却无法快速帮客户解决具体问题,客服所给予的答案只可被定义为对的答案而不是好的答案。
实际上,浪潮信息从4、5年前就开始进行客服的数字化转型和探索,并且在2019年开始着手应用业内在探索的FAQ、任务式对话、知识图谱等NLP领域相关技术,对客服系统进行了一定程度的改造和提升。
但当时遇到的瓶颈也十分明显,主要在于两方面:“一是企业产品信息更新快,造成模型训练任务非常大,加之模型知识库的封闭,在训练效果上也受到制约;二是机器人需要对上下文结合语境进行语义理解,引导客户提问并且精准识别问题,在专业知识领域的IT行业,难度非常高。”浪潮信息服务与实施部总监陈彬指出。
除了在大模型的落地中引入领域知识外,浪潮智能客服在研发过程中还重点考虑了其他几点因素:
第一,客服系统是不是真正地理解客户,是否能够通过多次对话了解到客户真实的服务意图。企业级场景中,客户有个报修问题,但无法用专业的技术语言对服务场景进行准确描述时,就非常考验客服系统的理解能力。
第二,是否需要投入额外和高昂的人力成本让客服机器人具备自主学习、迭代的能力。让专业工程师做重复的模型训练工作,既不符合企业成本要求,也不符合企业建设专家型团队的长期规划。
第三,B端客户对企业的服务体验、服务口碑要求高,训练出的客服系统是否能够让更多的客户接受、信任并满意地使用。相较于传统的智能客服采用多模型、多数据库的架构,浪潮信息智能客服系统最终实现统一架构支持多任务解决问题。而此前完成一套客服动作,往往涉及FAQ、任务式知识图谱、知识检索等模块,需要在多个知识库、模型之间进行任务调度,架构复杂且维护难度比较大。
此外,由于在模型训练上实现了自进化、快进化学习,而不是原有需要人工或半人工搭建和训练模型的过程,在人工标注和训练成本上得到了极大降低。
从浪潮信息数据中心服务的成效来看,在应用智能客服系统后,客户问答的匹配率(即覆盖率)达到92%,对常见的复杂问题的解决率目前能达到80%以上,平均解决率是65%左右。此外,服务整体人员规模占浪潮信息总人员规模的4%,而业内一般都占比15%到20%左右,在整体人均效能上得到了一定提升。
“服务作为一个公司的重要窗口业务部门,也是和客户交互最紧密的平台。所以我们首先考虑的是怎么把实际业务和AI算法结合在一起。本身IT的服务场景非常复杂,且面对是更多大量的B类客户,我们当初也在讨论,是否真的需要花这么大的精力,把传统的服务场景,做AI的相关技术和算法的落地,在项目初期也是比较有争议的。”陈彬表示。
但从目前取得的成效来看,当初的投入是值得的。
结合钛媒体的观察,客服机器人的背后仍是复杂的AI技术栈作为支撑。涉及语音识别、语义理解和生成、人机交互等等,存在系统搭建成本较高。如AI的边际成本,模型训练中对人工标注数据的成本,加之企业多数存在二次开发的定制化要求,导致部署交付成本也难以避免。
企业对技术的投入和成熟与否直接决定了体验的高低,而如今浪潮AI大模型“源”在智能客服场景的实际落地应用,为业界提供了一种另一种可参考的解决方案。