笔者从事呼叫中心-联络中心-客户体验中心这一行大约十来年了,几乎见证了整个行业产品技术的大变革,当然,也涉及到你方唱罢我登场的玩家排名浮浮沉沉。从PSTN到VOIP(SIP)的切换,再到单体式SOA系统软件到分布式微服务架构的迁移,从闭源的IP内核再到以开源Freeswitch、Asterisk、Opensips、Kamailio的技术普世化,从基于MRCP的ASR/TTS的IVR到现在语音机器人和虚拟数字人,深感CX行业随着技术革命的浪潮不断地被裹挟前进。
然而,今年的大语言模型技术的横空出世,再一次颠覆了作为技术人员的想象,想起了一位同事跟我说的话:
GPT技术是呼叫中心三十年未有之大变局!
那么它会带来什么样的变局?
在做Voice的人员眼中,Chat是一个很.......的事情。因为毕竟在着急的时候,作为客户的我还是会第一时间拿起手机打电话,而且我本能地会听到IVR后按0转人工。然而Chat场景是特殊的,首先它一定是非实时或者准实时的,同时因为非接触式沟通,允许坐席一对多的延时回复。随着上一波NLP-AI浪潮的席卷,几乎没有不带chatbot的聊天场景,消费者似乎也是习以为常,用户体验并不能得到与语音媲美的地步。
坦然,文字聊天由于自带富媒体属性,在做好UE优化体验设计的情况下,还是可以很好的解决问题(这里面涉及到流程的判断、多种自动化技术的协同以及场景设计)。但是因为成本投入因素,尽管企业方都在宣称应答率、问题解决率有多高,客观地说,90%的文字聊天并不能得到很好的效果。
那么,“传统”的NLP解决问题的思路出了哪些问题?笔者参考了不同AI厂家的机器人对话平台,或多或少都有开源RASA架构的影子,包括了NLU语言理解、DM对话管理、NLG语言生成、Policy对话策略、Aciton/Endpoint、Tracker槽位以及Domain/Stories 领域知识和示例等。多数情况下会包括了 单轮FAQ(相似问扩写)、多轮/任务式(状态机)、词槽词典、行业语料库等,有些还会包括表格图谱、机器学习等功能。
但是,还是太复杂了... 复杂在哪里?任务式的流程画布制作、语料的收集、相似问的扩写、词槽的关联等,正所谓有多少人工就有多少智能.....
大模型的到来,彻底掀了桌子.
相似问的扩写?大语言模型的最基本特征就是能“听得懂”人话,所以压根儿就不存在相似问的扩写---这可能是甄别大模型客服机器人的基本要素哦。
流程画布?大语言模型通过数据预训练与强化学习优化策略,针对给定任务学会提问与跳过,同时Token数满足上下文对照的要求。
语料的收集?大语言模型+本地向量数据库的方式,可以构建丰富的语料。
看起来,大模型似乎完美地解决了如上问题,但是秉着摁下葫芦起了瓢定律,一定会带来新的问题:
对于严谨对话(如政务、企业专业知识域等),如何保证大模型不会一本正经胡说八道地输出错误信息?
对于针对大模型做好业务安全, 包括输入安全与输出安全?
沉船侧畔千帆过,关关难过关关过,历史总是押韵,也只是押韵。
但是,我看好它。