查看原文
其他

实战 | 助力客户体验提升——NLP在分析客户反馈场景下的应用

金融电子化 金融电子化 2022-09-24

欢迎金融科技工作者积极投稿!

投稿邮箱:newmedia@fcmag.com.cn

                                           ——金融电子化

文 / 中原银行数据银行部    王琛


项目背景:时代浪潮中的暗礁

数字化转型的浪潮正迅速将客户体验触点打散,由此产生多渠道、多类型的反馈数据。要做好客户体验,就需要将分散在不同渠道的反馈数据进行整合分析,透过数据理解客户的需求。然而实际推行过程并不是很顺利,原因有以下五个方面。

 图1    客户反馈数据分析的五个困境

 

1.团队规模偏小。大部分客户体验团队人数不超过10人,面对海量数据,显得力不从心。


2.抽样存在偏差。传统客户体验以问卷调查为载体,这类调研中实际受访的人数往往只占到客户总量的7%,由此得到的客户体验分析难免有失偏颇,容易造成抽样偏差。


3.分析标准不统一。人工分析数据时,容易受主观情绪的影响,缺乏客观的评判依据,造成分析标准不统一、分析结果不一致。


4.反馈类型多样。大量非结构化数据(文本、图片、音视频等)相对于结构化信息而言,更难被标准化和解析,这类数据需要大量人工进行处理,投入回报率偏低。


5.角色面临边缘化。一系列的困境导致客户体验团队难以证明其对公司的价值,导致角色面临边缘化,形成恶性循环。


解决思路:以AI为变革号角

随着人工智能的不断发展,针对海量非结构化数据的处理已经可以不依赖大量手工劳动,便可以挖掘出数据潜在的价值。我们通常将人工智能中的NLP技术应用于客服反馈分析这一垂直领域。NLP的全称是Natural Language Processing,其中文表述为“自然语言处理”。它是计算机和人工智能的一个重要领域。顾名思义,该领域研究如何处理自然语言。自然语言就是我们人类社会交流所使用的语音和字符系统。就目前而言,NLP所研究的对象以字符系统为主,也就是以我们通常说的“文字”。


NLP主要应用于自然语言理解和自然语言生成两个大方向,细分领域包括分词、词性标注、NER、抽取、情感分析、文本摘要、对话生成等。


本项目使用NLP多维度分析客户反馈数据,旨在确保分析结论的准确性、全面性,主要应用到的NLP能力包括以下五类。


1.情感分析:分析客户反馈过程中的情感倾向,包括正向、反向、中性三个倾向。“正向”代表客户对我行服务的认可,“反向”代表客户对我行发展提出了宝贵意见,“中性”代表客户反馈是以咨询为目的。


2.反馈分类:精准理解反馈数据,提高归因分析能力。每一条数据都将以“反馈客户来自于XX分行,反馈问题归属于总行XX部门,反馈的产品名是XX,反馈的产品问题是XX”的形式进行归类。


3.信息抽取:通过分析客户反馈数据,从中摘取出关键的词、短语或者句子,以词云的方式将反馈数据直观地呈现出来,以便业务人员快速了解客户的“惊喜点”和“吐槽点”。


4.故障检测:对特定时间段负向反馈中的热点词汇进行趋势分析,及时发现潜在功能方面、服务方面的问题,并对故障演变趋势做出精准预测。


5.文本摘要:提炼反馈要点,降低处理成本。


基于以上五类能力,中原银行自主研发了一套VoC客户之声洞察系统。该系统依托于大数据平台、机器学习平台、一站式分析平台这三大数据平台,现已具备灵活伸缩、迭代周期短、易于扩展等特点。其中,大数据平台负责底层数据存储,机器学习平台提供NLP标准能力,一站式分析平台负责前端展示。整体系统架构如图2所示。

图2    VoC客户洞察系统架构示意图


实践方案:系统的技术要点

能力层是VoC客户洞察系统的核心,决定了分析结论的可靠性。以下将详细介绍与能力层相关的三类模型。


1.分类模型

 图3    分类模型


分类模型采用先进的预训练模型结构,先验知识使得模型无需大量标注数据,可减少人力成本。情感极性、反馈问题归属部门、反馈问题归属产品某类功能均可以经由分类模型得到。


2.关键词模型

图4    关键词模型


关键词模型首先需要对反馈数据进行分词处理,在分词之前,我们需要将一些特色的词汇加入到词表,通过语义模型分别得到句子和词的向量表示,然后通过MMR算法计算词与句子之间的相似得分,最终输出最有价值的词。这些词往往就是客户反馈中的“惊喜点”或者“吐槽点”。


3.摘要模型

图5    摘要生成模型


摘要模型采用Seq2Seq,选择了较为经典的UniLM结构,同时考虑到“输入+输出”的总长度限制,选择了华为的NEZHA模型作为基础模型架构,因为NEZHA使用了相对位置编码,对长度友好。此外,在使用预训练模型方面,我们将部分词语加入到了NEZHA模型中,改变了中文预训练模型以字为单位的通用选择,这使得模型的效果和速度都有一定的提升,同时引入BIO Copy机制使其具有Copy连续片段的能力。


基于以上三种模型分别对反馈数据进行细化分析,最终分析效果如图6所示。

图6    分析效果


项目成果:系统迭代与既有效能

VoC客户洞察系统自上线以来,日均处理300+反馈数据,真正做到全量分析、精准识别,大幅缩短反馈周期,加速产品迭代。其中,1.0云间版本涵盖了大部分文本分析能力,包括文本摘要、文本分类、信息抽取、渠道分发等功能。2.0鸿图版本新增统计分析、预测等功能,使结果更加直观。

 图7    鸿图版本


未来展望:赓续以客户为本

VoC客户洞察系统是一套构建在数据中台之上的,用于辅助业务人员提升客户体验的轻量级系统。有了VoC客户洞察系统,我们可以结合业务特点、产品自身特点,更快找到提升客户体验的方向。


该系统将持续保持对客户心声的关切,一方面,持续扩充反馈数据来源,支持更多类型的反馈数据,比如:音频、视频等,同时可以接入一些外部数据来辅助分析;另一方面,将尝试挑战一些新的任务,比如说可以利用生成式摘要技术,来总结客户与坐席之间的对话内容,沉淀经验,进一步提升服务效率。


让客户满意,让客户放心,做“中原人民自己的银行”!



参考文献

【1】苏剑林:《SPACES:“抽取-生成”式长文本摘要(法研杯总结)》,https://kexue.fm/archives/8046







往期精选:

(点击查看精彩内容)


● 实战 | WiFi6网络打造移动型数字化银行

● 实战 | 保险业智能人群计数研究与应用

● 实战 | 远程银行探索与实践

● 实战 | 云室吸气式极早期探测预警系统在数据中心火灾防范的应用

● 实战 | 运维动态口令管理模式拓展与实践






《金融电子化》新媒体部:主任 / 邝源  编辑 / 傅甜甜 潘婧

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存