情感网购情感客服机器人研究

客服机器人  时间:2021-02-25  阅读:()

网购情感客服机器人研究

目录

1、系统体系结构

1中文分词模块可以在流程图中看到系统有三处需要用到中文分词

2 AIML知识文件 AIML是扩展自XML的人工智能标记语言

3

4 AIML推理引擎推理引擎的工作主要有两部分

5情感词典情感词典存储词汇的情感化信息

6情感统计分析情感统计分析是情感对话的核心模块

7

8同义词处理对于语境和预输出模板情感分类不匹配的情况

2、 AIML框架

G=Greeing

3、 中文分词

4、情感对话

4. 1情感词典的构建

4. 2情感分析

5、总结

正文

引言

随着近年来即时通信和电子商务的蓬勃发展 网上购物被越来越多人接受并显示出巨大的市场需求而网店的人工客服却承受着越来越大的工作量和压力。 由于人工智能、深度学习[1] 、 自然语言处理在近几年取得的突破性进展用机器人逐步取代人工客服的优势逐渐变得明显且可行起来。 目前已有一些客服机器人实例但主要是根据对话

内容的关键字与知识库中的知识匹配实现问题的回复极少涉及对客户情感的研究但服务态度对客服来说往往是关键的一项。

本文提出的情感机器人就是在这种背景下应运而生的它具有较好的扩充性及学习能力能通过各种渠道如与用户的交流对话、专业知识导入、网络知识挖掘、知识库共享等方式自主学习实现知识框架自适应调整从根本上改变商家低效耗时的人工培训成本问题实现常用问题的自动高效回复 同时引入情感对话模型尝试解决人机对话中的语境问题为客户提供一个高效、人性化的客服环境。

1、系统体系结构

系统基于A I ML框架机器人的知识库由A I ML类文件构成为了满足中文对话的需求在机器人的解析器中引入中文分词[2]模块并在由AIML框架和Lucene分词构成的基本框架上尝试了以情感词典和关键情感统计分析为核心技术的情感对话模型。本文的系统流程图如图1

重要模块分析

1中文分词模块可以在流程图中看到系统有三处需要用到中文分词分别是将知识文件分词后以词语为节点构建知识库的内存知识树、对用户输入语句进行分词以及将预输出模板做分词处理后交给情感统计分析模块。

2 A I ML知识文件 A I ML是扩展自XML的人工智能标记语言知识使用各类标签进行标记存储重要且常用的标签包括

3 A I ML内存知识树 内存知识树是知识文件进行分词后以词语作为节点进行存储的知识集合。逻辑结构为树树的每个子节点代表一个中文单词或一个通配符组织时根据单词在模式中出现的位置插入到树的节点中以最高效地利用内存空间树的叶子节点包含一个t emp late属性 template是对模式的回答。 内存知识树由知识推理引擎负责构建并在知识引擎匹配模板时作为输入。

4 A I ML推理引擎推理引擎的工作主要有两部分一部分是构建内存知识树另一部分就是将查询推理树与内存知识树的信息进行匹配找到相应的模板预输出。一个完整的处理流程大致包含四个步骤分别是初始化 问句规范化处理 问句查询推理以及模板处理[3]

5情感词典情感词典存储词汇的情感化信息主要由人工对初始收集的语料进行情感信息标注并录入存储系统形成情感词典。情感词典中的每一词语主要包含三方面信息情感分类信息、情感强度信息、同义词汇信息。它是情感统计分析处理逻辑和同义词处理逻辑的数据来源。

6情感统计分析情感统计分析是情感对话的核心模块 以情感词典为支撑负责对接收的词汇进行统计将出现频率最高的情感分类词汇作为上下文语境存储。 同时它也对预输出模板做同样的统计工作并将情感分类信息输出给语境匹配判定逻辑。

7语境匹配判定逻辑它负责判定预输出模板中的情感是否与上下文语境相匹配若匹配则直接输出。否则交给同义词处理模块进行后续处理。

8同义词处理对于语境和预输出模板情感分类不匹配的情况 同义词处理模块将抽取情感词典中的同义信息将模板中与语境不符的词汇替换为相符的同义词汇即情感变化并将最终的结果输出给用户。

2、 A I ML框架

A IML是机器人的核心。它是一个扩展自XML的人工智能标记语言在处理对话过程中不同于传统的语义规则构建与分析而是简单的匹配上下文这种无需事先确定专业领域语义规则的模式为知识库的构建提供了非常大的自由空间。 由于客服机器人的应用领域非常广普适性强知识库的构建往往需要大量非专业人士的配合 AIML符合人类思维表达模式的特性使其在自然语言处理领域有特殊的优势从某种程度上看它更接近于人类语言理解的本质。

此客服机器人知识库的整体逻辑框架分为两大类一类为系统预先定义的机器人常用语句对话类文件或称为模板第二类为由用户自行定义或导入的专业领域类文件。

基于对网购交际语篇的语类结构研究[4] 将其中得到的语类结构作为模板构建基础

其中

G=Greeing SI=Sale Initiation SR=Sale Request SC=SaleCompliance SE=Sale Enquiry S=Sale P=Purchase PC=PurchaseClosure F=Finish “()”表示可选择性 “[. ]”表示可调换位置 “[ ]”表示可调换位置的范围 “[ {} ]”表示可重复的程度相同。我们将AIML模板中的各基本类文件定义为上述的各语类 由此进行扩充。

AIML知识库的主要来源途径主要有初始专业知识分类导入 同行业知识库云共享对话经验学习扩展AIML的target ing技术 网络知识挖掘。

为提高Targeting技术的灵活性提供GUI界面供系统管理员操作系统将提供所有可能新增的知识 由管理员确定是否加入到内存知识树中。

Targeting技术为AIML自主学习以及自适应调整知识框架上提供了技术保障使机器人能在和用户的对话交流过程中不断累积知识减轻了管理员对知识库更新管理的负担。

3、 中文分词

中文分词器作用于A I ML解析器的两个阶段第一阶段在A I ML搭建GraphMa ster知识树之前将读出的知识模式即AIML类文件进行分词处理将分出的词语作为节点进行存储并交给解析器的下一模

块最终形成以中文词语为最小单位的内存知识树。第二阶段在接收用户问句并做标准化处理之后分词器将对问句进行分词构建出对应的查询推理树后再到GraphMast er中进行问句匹配。得到匹配的输出。

中文分词算法目前的解决思路大致可以归为三大类基于字符串匹配的词典分词算法、理解分词算法、统计分词算法[5] 。 由于客服机器人处理的是网络聊天口语信息其特点是灵活多变未登录词的更新频率高不合法语义、语法使用频繁。综合考虑算法的技术成熟度和适用范围本文使用以统计分词为核心的分词算法并应用隐马尔科夫模型。在HMM 隐马尔科夫分词方法中状态序列为词性、词类、语义角色等观察序列为输入的词串[6]

分词器的具体实现继承自Lucene开源全文检索工具包中的SmartChinese analyzer分词器[7] 。此分词器源于中科院的ICTCLAS中文分词系统并且采用隐马尔科夫模型在处理对话语料时有较好的分词效果。但由于分词器将要作用的领域不仅仅包含通用词汇多数情况下需要处理大量的专业词汇且词汇库需要经常更新。所以本文在实现客服机器人的分词器中添加了扩展词汇库的类使用户能自定义词汇库并对词汇库进行增删改查等操作。

4、情感对话

当前研发的客服机器人以回答常见问题为多很少能与用户做情感层面上的交流而服务态度在交流过程中是至关重要的一个因素。鉴

于此本文构建了一个情感分析模型模型基于情感词典使用关键词统计的方法对用户输入的语句进行情感分析在对当前语境做出判断后将预输出语句做情感化处理匹配客户情感 以达到提高机器人智能化的效果。

4. 1情感词典的构建

情感词典是情感词汇高度组织的集合。构建一个合理高效的情感词典是后续进行情感分析的重要基石。其中词汇的描绘与存储是关键技术。本文借鉴词汇本体构建技术[8]对存储的情感词汇进行描述。通过一个三元组进行描述

Lexicon=(B R E)

公式二情感词汇本体结构

其中B表示词汇的基本信息 R代表词汇间的同义关系 E代表词汇的情感信息。情感信息是词汇描述中最关键的部分其构建基于情感认知中的维度论本文将情感信息通过情感分类、强度和极性三个维度进行描述。其中情感分类基于中国传统的七情划分用数字标号表示。强度分为九级表示包含该情感的强度大小。极性取值包括褒义、贬义、 中性三类。

语料的来源以网购中客服与商家对话为主体但为了训练语料库对情感信息的理解能力辅以各类包含丰富情感的文本载体如诗歌散文类文本。

语料信息的处理可分为两步。第一步对原始语料进行自动筛选主要是从各词典中根据词汇释义进行自动归类。第二步人工对初加工语料进行情感信息标注并录入最终存储系统。

4.2情感分析

在情感词典的基础上机器人每次接收到用户输入的对话语句并做分词处理后都首先将结果交给情感分析模块对其中包含的各类词汇做情感统计分析计算得出出现频率最高的一类情感将此作为上下文语境。 A I ML解析器在得到匹配模板后并不直接输出情感分析模块将对模板做同样的情感分析计算检查预输出的模板情感是否与上下文语境相符若相符将直接输出否则根据情感字典中的同义信息把模板中的情感词汇替换为情感分类与上下文语境相匹配的同义词汇再输出给用户。

5、总结

本文是在基于A I ML、中文分词、情感对话模型的框架上搭建的情感客服机器人其中由A I ML和中文分词构建的基础框架模型已经较为成熟有很多成功应用的实例如招生咨询机器人、图书馆问答检索机器人?。但总的来说基于AIML的中文知识库建设还处在起步阶段仅有少数领域的知识库而且知识库之间难以共享与融合本文构建的情感客服机器人的知识库大部分由人工录入效率偏低这也是目前大多数基于AIML的中文知识库构建普遍存在的问题。作者认为增强共享是解决的一条途径但更为关键的是找到A I ML知识库搭建的

7月RAKsmart独立服务器和站群服务器多款促销 G口不限量更低

如果我们熟悉RAKsmart商家促销活动的应该是清楚的,每个月的活动看似基本上一致。但是有一些新品或者每个月还是有一些各自的特点的。比如七月份爆款I3-2120仅30美金、V4新品上市,活动期间5折、洛杉矶+硅谷+香港+日本站群恢复销售、G口不限流量服务器比六月份折扣力度更低。RAKsmart 商家这个月依旧还是以独立服务器和站群服务器为主。当然也包括有部分的低至1.99美元的VPS主机。第一、I...

选择Vultr VPS主机不支持支付宝付款的解决方案

在刚才更新Vultr 新年福利文章的时候突然想到前几天有网友问到自己有在Vultr 注册账户的时候无法用支付宝付款的问题,当时有帮助他给予解决,这里正好顺带一并介绍整理出来。毕竟对于来说,虽然使用的服务器不多,但是至少是见过世面的,大大小小商家的一些特性特征还是比较清楚的。在这篇文章中,和大家分享如果我们有在Vultr新注册账户或者充值购买云服务器的时候,不支持支付宝付款的原因。毕竟我们是知道的,...

萤光云(13.25元)香港CN2 新购首月6.5折

萤光云怎么样?萤光云是一家国人云厂商,总部位于福建福州。其成立于2002年,主打高防云服务器产品,主要提供福州、北京、上海BGP和香港CN2节点。萤光云的高防云服务器自带50G防御,适合高防建站、游戏高防等业务。目前萤光云推出北京云服务器优惠活动,机房为北京BGP机房,购买北京云服务器可享受6.5折优惠+51元代金券(折扣和代金券可叠加使用)。活动期间还支持申请免费试用,需提交工单开通免费试用体验...

客服机器人为你推荐
文件夹删不掉文件夹删除不了,怎么办?真正免费的网络电话谁知道哪个真正免费的网络电话啊?告诉我把3?太感谢了在线漏洞检测网站检测工具,谁有?免费开通黄钻如何免费开通qq黄钻自助建站自助建站哪个平台最好?童之磊网文大学很强吗?idc前线穿越火线河北的服务器好卡 有人知道怎么回事嘛 知道的速回机械键盘轴机械键盘的轴哪种好?怎么上传音乐如何上传音乐宽带接入服务器宽带接入服务器的五大功能是什么?
域名备案网站 主机优惠码 softlayer uk2 空间服务商 南昌服务器托管 中国电信测网速 100m独享 中国电信测速网 web服务器安全 香港新世界中心 阿里云官方网站 百度云空间 万网空间 ledlamp 国内空间 创速 hdsky hdchina phpinfo 更多