情感网购情感客服机器人研究

客服机器人  时间:2021-02-25  阅读:()

网购情感客服机器人研究

目录

1、系统体系结构

1中文分词模块可以在流程图中看到系统有三处需要用到中文分词

2 AIML知识文件 AIML是扩展自XML的人工智能标记语言

3

4 AIML推理引擎推理引擎的工作主要有两部分

5情感词典情感词典存储词汇的情感化信息

6情感统计分析情感统计分析是情感对话的核心模块

7

8同义词处理对于语境和预输出模板情感分类不匹配的情况

2、 AIML框架

G=Greeing

3、 中文分词

4、情感对话

4. 1情感词典的构建

4. 2情感分析

5、总结

正文

引言

随着近年来即时通信和电子商务的蓬勃发展 网上购物被越来越多人接受并显示出巨大的市场需求而网店的人工客服却承受着越来越大的工作量和压力。 由于人工智能、深度学习[1] 、 自然语言处理在近几年取得的突破性进展用机器人逐步取代人工客服的优势逐渐变得明显且可行起来。 目前已有一些客服机器人实例但主要是根据对话

内容的关键字与知识库中的知识匹配实现问题的回复极少涉及对客户情感的研究但服务态度对客服来说往往是关键的一项。

本文提出的情感机器人就是在这种背景下应运而生的它具有较好的扩充性及学习能力能通过各种渠道如与用户的交流对话、专业知识导入、网络知识挖掘、知识库共享等方式自主学习实现知识框架自适应调整从根本上改变商家低效耗时的人工培训成本问题实现常用问题的自动高效回复 同时引入情感对话模型尝试解决人机对话中的语境问题为客户提供一个高效、人性化的客服环境。

1、系统体系结构

系统基于A I ML框架机器人的知识库由A I ML类文件构成为了满足中文对话的需求在机器人的解析器中引入中文分词[2]模块并在由AIML框架和Lucene分词构成的基本框架上尝试了以情感词典和关键情感统计分析为核心技术的情感对话模型。本文的系统流程图如图1

重要模块分析

1中文分词模块可以在流程图中看到系统有三处需要用到中文分词分别是将知识文件分词后以词语为节点构建知识库的内存知识树、对用户输入语句进行分词以及将预输出模板做分词处理后交给情感统计分析模块。

2 A I ML知识文件 A I ML是扩展自XML的人工智能标记语言知识使用各类标签进行标记存储重要且常用的标签包括

3 A I ML内存知识树 内存知识树是知识文件进行分词后以词语作为节点进行存储的知识集合。逻辑结构为树树的每个子节点代表一个中文单词或一个通配符组织时根据单词在模式中出现的位置插入到树的节点中以最高效地利用内存空间树的叶子节点包含一个t emp late属性 template是对模式的回答。 内存知识树由知识推理引擎负责构建并在知识引擎匹配模板时作为输入。

4 A I ML推理引擎推理引擎的工作主要有两部分一部分是构建内存知识树另一部分就是将查询推理树与内存知识树的信息进行匹配找到相应的模板预输出。一个完整的处理流程大致包含四个步骤分别是初始化 问句规范化处理 问句查询推理以及模板处理[3]

5情感词典情感词典存储词汇的情感化信息主要由人工对初始收集的语料进行情感信息标注并录入存储系统形成情感词典。情感词典中的每一词语主要包含三方面信息情感分类信息、情感强度信息、同义词汇信息。它是情感统计分析处理逻辑和同义词处理逻辑的数据来源。

6情感统计分析情感统计分析是情感对话的核心模块 以情感词典为支撑负责对接收的词汇进行统计将出现频率最高的情感分类词汇作为上下文语境存储。 同时它也对预输出模板做同样的统计工作并将情感分类信息输出给语境匹配判定逻辑。

7语境匹配判定逻辑它负责判定预输出模板中的情感是否与上下文语境相匹配若匹配则直接输出。否则交给同义词处理模块进行后续处理。

8同义词处理对于语境和预输出模板情感分类不匹配的情况 同义词处理模块将抽取情感词典中的同义信息将模板中与语境不符的词汇替换为相符的同义词汇即情感变化并将最终的结果输出给用户。

2、 A I ML框架

A IML是机器人的核心。它是一个扩展自XML的人工智能标记语言在处理对话过程中不同于传统的语义规则构建与分析而是简单的匹配上下文这种无需事先确定专业领域语义规则的模式为知识库的构建提供了非常大的自由空间。 由于客服机器人的应用领域非常广普适性强知识库的构建往往需要大量非专业人士的配合 AIML符合人类思维表达模式的特性使其在自然语言处理领域有特殊的优势从某种程度上看它更接近于人类语言理解的本质。

此客服机器人知识库的整体逻辑框架分为两大类一类为系统预先定义的机器人常用语句对话类文件或称为模板第二类为由用户自行定义或导入的专业领域类文件。

基于对网购交际语篇的语类结构研究[4] 将其中得到的语类结构作为模板构建基础

其中

G=Greeing SI=Sale Initiation SR=Sale Request SC=SaleCompliance SE=Sale Enquiry S=Sale P=Purchase PC=PurchaseClosure F=Finish “()”表示可选择性 “[. ]”表示可调换位置 “[ ]”表示可调换位置的范围 “[ {} ]”表示可重复的程度相同。我们将AIML模板中的各基本类文件定义为上述的各语类 由此进行扩充。

AIML知识库的主要来源途径主要有初始专业知识分类导入 同行业知识库云共享对话经验学习扩展AIML的target ing技术 网络知识挖掘。

为提高Targeting技术的灵活性提供GUI界面供系统管理员操作系统将提供所有可能新增的知识 由管理员确定是否加入到内存知识树中。

Targeting技术为AIML自主学习以及自适应调整知识框架上提供了技术保障使机器人能在和用户的对话交流过程中不断累积知识减轻了管理员对知识库更新管理的负担。

3、 中文分词

中文分词器作用于A I ML解析器的两个阶段第一阶段在A I ML搭建GraphMa ster知识树之前将读出的知识模式即AIML类文件进行分词处理将分出的词语作为节点进行存储并交给解析器的下一模

块最终形成以中文词语为最小单位的内存知识树。第二阶段在接收用户问句并做标准化处理之后分词器将对问句进行分词构建出对应的查询推理树后再到GraphMast er中进行问句匹配。得到匹配的输出。

中文分词算法目前的解决思路大致可以归为三大类基于字符串匹配的词典分词算法、理解分词算法、统计分词算法[5] 。 由于客服机器人处理的是网络聊天口语信息其特点是灵活多变未登录词的更新频率高不合法语义、语法使用频繁。综合考虑算法的技术成熟度和适用范围本文使用以统计分词为核心的分词算法并应用隐马尔科夫模型。在HMM 隐马尔科夫分词方法中状态序列为词性、词类、语义角色等观察序列为输入的词串[6]

分词器的具体实现继承自Lucene开源全文检索工具包中的SmartChinese analyzer分词器[7] 。此分词器源于中科院的ICTCLAS中文分词系统并且采用隐马尔科夫模型在处理对话语料时有较好的分词效果。但由于分词器将要作用的领域不仅仅包含通用词汇多数情况下需要处理大量的专业词汇且词汇库需要经常更新。所以本文在实现客服机器人的分词器中添加了扩展词汇库的类使用户能自定义词汇库并对词汇库进行增删改查等操作。

4、情感对话

当前研发的客服机器人以回答常见问题为多很少能与用户做情感层面上的交流而服务态度在交流过程中是至关重要的一个因素。鉴

于此本文构建了一个情感分析模型模型基于情感词典使用关键词统计的方法对用户输入的语句进行情感分析在对当前语境做出判断后将预输出语句做情感化处理匹配客户情感 以达到提高机器人智能化的效果。

4. 1情感词典的构建

情感词典是情感词汇高度组织的集合。构建一个合理高效的情感词典是后续进行情感分析的重要基石。其中词汇的描绘与存储是关键技术。本文借鉴词汇本体构建技术[8]对存储的情感词汇进行描述。通过一个三元组进行描述

Lexicon=(B R E)

公式二情感词汇本体结构

其中B表示词汇的基本信息 R代表词汇间的同义关系 E代表词汇的情感信息。情感信息是词汇描述中最关键的部分其构建基于情感认知中的维度论本文将情感信息通过情感分类、强度和极性三个维度进行描述。其中情感分类基于中国传统的七情划分用数字标号表示。强度分为九级表示包含该情感的强度大小。极性取值包括褒义、贬义、 中性三类。

语料的来源以网购中客服与商家对话为主体但为了训练语料库对情感信息的理解能力辅以各类包含丰富情感的文本载体如诗歌散文类文本。

语料信息的处理可分为两步。第一步对原始语料进行自动筛选主要是从各词典中根据词汇释义进行自动归类。第二步人工对初加工语料进行情感信息标注并录入最终存储系统。

4.2情感分析

在情感词典的基础上机器人每次接收到用户输入的对话语句并做分词处理后都首先将结果交给情感分析模块对其中包含的各类词汇做情感统计分析计算得出出现频率最高的一类情感将此作为上下文语境。 A I ML解析器在得到匹配模板后并不直接输出情感分析模块将对模板做同样的情感分析计算检查预输出的模板情感是否与上下文语境相符若相符将直接输出否则根据情感字典中的同义信息把模板中的情感词汇替换为情感分类与上下文语境相匹配的同义词汇再输出给用户。

5、总结

本文是在基于A I ML、中文分词、情感对话模型的框架上搭建的情感客服机器人其中由A I ML和中文分词构建的基础框架模型已经较为成熟有很多成功应用的实例如招生咨询机器人、图书馆问答检索机器人?。但总的来说基于AIML的中文知识库建设还处在起步阶段仅有少数领域的知识库而且知识库之间难以共享与融合本文构建的情感客服机器人的知识库大部分由人工录入效率偏低这也是目前大多数基于AIML的中文知识库构建普遍存在的问题。作者认为增强共享是解决的一条途径但更为关键的是找到A I ML知识库搭建的

GreenCloudVPS$20/年多国机房可选,1核@Ryzen 3950x/1GB内存/30GB NVMe/10Gbps端口月流量2TB

GreencloudVPS此次在四个机房都上线10Gbps大带宽VPS,并且全部采用AMD处理器,其中美国芝加哥机房采用Ryzen 3950x处理器,新加坡、荷兰阿姆斯特丹、美国杰克逊维尔机房采用Ryzen 3960x处理器,全部都是RAID-1 NVMe硬盘、DDR4 2666Mhz内存,GreenCloudVPS本次促销的便宜VPS最低仅需20美元/年,支持支付宝、银联和paypal。Gree...

Asiayun:枣庄电信Asiayun美国Cera葵湾VPSvps月付,美国CERA VPS月付26元/年

亚洲云Asiayun怎么样?亚洲云成立于2021年,隶属于上海玥悠悠云计算有限公司(Yyyisp),是一家新国人IDC商家,且正规持证IDC/ISP/CDN,商家主要提供数据中心基础服务、互联网业务解决方案,及专属服务器租用、云服务器、云虚拟主机、专属服务器托管、带宽租用等产品和服务。Asiayun提供源自大陆、香港、韩国和美国等地骨干级机房优质资源,包括BGP国际多线网络,CN2点对点直连带宽以...

阿里云香港 16核32G 20M 999元/月

阿里云香港配置图提速啦是成立于2012年的十分老牌的一个商家这次给大家评测的是 阿里云香港 16核32G 20M 这款产品,单单说价格上就是十分的离谱原价8631元/月的现价只要 999元 而且还有个8折循环优惠。废话不多说直接进入正题。优惠时间 2021年8月20日-2021年9月20日 优惠码 wn789 8折优惠阿里云香港BGP专线 16核32G 10M带宽 优惠购买 399元购买链接阿里云...

客服机器人为你推荐
湖南商标注册湖南商标注册怎么办理雅虎社区雅虎是中国的吗百度抢票浏览器现在火车票越来越难买了,新版百度手机浏览器,除了抢票外,还有什么其他功能吗?公章制作如何制作公章二叉树遍历写出二叉树的先序遍历、中序遍历、后序遍历。不兼容vivo手机和软件不兼容怎么办?唱吧电脑版官方下载唱吧有电脑版吗蘑菇街美丽说蘑菇街、美丽说这类网站前期是怎么推广的?xp系统停止服务XP停止服务后该怎么办?商标注册查询官网怎么查商标有没有注册
域名空间购买 中国域名交易中心 com域名抢注 火山主机 dns是什么 服务器评测 圣迭戈 mysql主机 铁通流量查询 云全民 域名转接 183是联通还是移动 域名和空间 isp服务商 美国堪萨斯 in域名 免费外链相册 云营销系统 我的世界服务器ip 国外网页代理 更多