情感网购情感客服机器人研究

客服机器人  时间:2021-02-25  阅读:()

网购情感客服机器人研究

目录

1、系统体系结构

1中文分词模块可以在流程图中看到系统有三处需要用到中文分词

2 AIML知识文件 AIML是扩展自XML的人工智能标记语言

3

4 AIML推理引擎推理引擎的工作主要有两部分

5情感词典情感词典存储词汇的情感化信息

6情感统计分析情感统计分析是情感对话的核心模块

7

8同义词处理对于语境和预输出模板情感分类不匹配的情况

2、 AIML框架

G=Greeing

3、 中文分词

4、情感对话

4. 1情感词典的构建

4. 2情感分析

5、总结

正文

引言

随着近年来即时通信和电子商务的蓬勃发展 网上购物被越来越多人接受并显示出巨大的市场需求而网店的人工客服却承受着越来越大的工作量和压力。 由于人工智能、深度学习[1] 、 自然语言处理在近几年取得的突破性进展用机器人逐步取代人工客服的优势逐渐变得明显且可行起来。 目前已有一些客服机器人实例但主要是根据对话

内容的关键字与知识库中的知识匹配实现问题的回复极少涉及对客户情感的研究但服务态度对客服来说往往是关键的一项。

本文提出的情感机器人就是在这种背景下应运而生的它具有较好的扩充性及学习能力能通过各种渠道如与用户的交流对话、专业知识导入、网络知识挖掘、知识库共享等方式自主学习实现知识框架自适应调整从根本上改变商家低效耗时的人工培训成本问题实现常用问题的自动高效回复 同时引入情感对话模型尝试解决人机对话中的语境问题为客户提供一个高效、人性化的客服环境。

1、系统体系结构

系统基于A I ML框架机器人的知识库由A I ML类文件构成为了满足中文对话的需求在机器人的解析器中引入中文分词[2]模块并在由AIML框架和Lucene分词构成的基本框架上尝试了以情感词典和关键情感统计分析为核心技术的情感对话模型。本文的系统流程图如图1

重要模块分析

1中文分词模块可以在流程图中看到系统有三处需要用到中文分词分别是将知识文件分词后以词语为节点构建知识库的内存知识树、对用户输入语句进行分词以及将预输出模板做分词处理后交给情感统计分析模块。

2 A I ML知识文件 A I ML是扩展自XML的人工智能标记语言知识使用各类标签进行标记存储重要且常用的标签包括

3 A I ML内存知识树 内存知识树是知识文件进行分词后以词语作为节点进行存储的知识集合。逻辑结构为树树的每个子节点代表一个中文单词或一个通配符组织时根据单词在模式中出现的位置插入到树的节点中以最高效地利用内存空间树的叶子节点包含一个t emp late属性 template是对模式的回答。 内存知识树由知识推理引擎负责构建并在知识引擎匹配模板时作为输入。

4 A I ML推理引擎推理引擎的工作主要有两部分一部分是构建内存知识树另一部分就是将查询推理树与内存知识树的信息进行匹配找到相应的模板预输出。一个完整的处理流程大致包含四个步骤分别是初始化 问句规范化处理 问句查询推理以及模板处理[3]

5情感词典情感词典存储词汇的情感化信息主要由人工对初始收集的语料进行情感信息标注并录入存储系统形成情感词典。情感词典中的每一词语主要包含三方面信息情感分类信息、情感强度信息、同义词汇信息。它是情感统计分析处理逻辑和同义词处理逻辑的数据来源。

6情感统计分析情感统计分析是情感对话的核心模块 以情感词典为支撑负责对接收的词汇进行统计将出现频率最高的情感分类词汇作为上下文语境存储。 同时它也对预输出模板做同样的统计工作并将情感分类信息输出给语境匹配判定逻辑。

7语境匹配判定逻辑它负责判定预输出模板中的情感是否与上下文语境相匹配若匹配则直接输出。否则交给同义词处理模块进行后续处理。

8同义词处理对于语境和预输出模板情感分类不匹配的情况 同义词处理模块将抽取情感词典中的同义信息将模板中与语境不符的词汇替换为相符的同义词汇即情感变化并将最终的结果输出给用户。

2、 A I ML框架

A IML是机器人的核心。它是一个扩展自XML的人工智能标记语言在处理对话过程中不同于传统的语义规则构建与分析而是简单的匹配上下文这种无需事先确定专业领域语义规则的模式为知识库的构建提供了非常大的自由空间。 由于客服机器人的应用领域非常广普适性强知识库的构建往往需要大量非专业人士的配合 AIML符合人类思维表达模式的特性使其在自然语言处理领域有特殊的优势从某种程度上看它更接近于人类语言理解的本质。

此客服机器人知识库的整体逻辑框架分为两大类一类为系统预先定义的机器人常用语句对话类文件或称为模板第二类为由用户自行定义或导入的专业领域类文件。

基于对网购交际语篇的语类结构研究[4] 将其中得到的语类结构作为模板构建基础

其中

G=Greeing SI=Sale Initiation SR=Sale Request SC=SaleCompliance SE=Sale Enquiry S=Sale P=Purchase PC=PurchaseClosure F=Finish “()”表示可选择性 “[. ]”表示可调换位置 “[ ]”表示可调换位置的范围 “[ {} ]”表示可重复的程度相同。我们将AIML模板中的各基本类文件定义为上述的各语类 由此进行扩充。

AIML知识库的主要来源途径主要有初始专业知识分类导入 同行业知识库云共享对话经验学习扩展AIML的target ing技术 网络知识挖掘。

为提高Targeting技术的灵活性提供GUI界面供系统管理员操作系统将提供所有可能新增的知识 由管理员确定是否加入到内存知识树中。

Targeting技术为AIML自主学习以及自适应调整知识框架上提供了技术保障使机器人能在和用户的对话交流过程中不断累积知识减轻了管理员对知识库更新管理的负担。

3、 中文分词

中文分词器作用于A I ML解析器的两个阶段第一阶段在A I ML搭建GraphMa ster知识树之前将读出的知识模式即AIML类文件进行分词处理将分出的词语作为节点进行存储并交给解析器的下一模

块最终形成以中文词语为最小单位的内存知识树。第二阶段在接收用户问句并做标准化处理之后分词器将对问句进行分词构建出对应的查询推理树后再到GraphMast er中进行问句匹配。得到匹配的输出。

中文分词算法目前的解决思路大致可以归为三大类基于字符串匹配的词典分词算法、理解分词算法、统计分词算法[5] 。 由于客服机器人处理的是网络聊天口语信息其特点是灵活多变未登录词的更新频率高不合法语义、语法使用频繁。综合考虑算法的技术成熟度和适用范围本文使用以统计分词为核心的分词算法并应用隐马尔科夫模型。在HMM 隐马尔科夫分词方法中状态序列为词性、词类、语义角色等观察序列为输入的词串[6]

分词器的具体实现继承自Lucene开源全文检索工具包中的SmartChinese analyzer分词器[7] 。此分词器源于中科院的ICTCLAS中文分词系统并且采用隐马尔科夫模型在处理对话语料时有较好的分词效果。但由于分词器将要作用的领域不仅仅包含通用词汇多数情况下需要处理大量的专业词汇且词汇库需要经常更新。所以本文在实现客服机器人的分词器中添加了扩展词汇库的类使用户能自定义词汇库并对词汇库进行增删改查等操作。

4、情感对话

当前研发的客服机器人以回答常见问题为多很少能与用户做情感层面上的交流而服务态度在交流过程中是至关重要的一个因素。鉴

于此本文构建了一个情感分析模型模型基于情感词典使用关键词统计的方法对用户输入的语句进行情感分析在对当前语境做出判断后将预输出语句做情感化处理匹配客户情感 以达到提高机器人智能化的效果。

4. 1情感词典的构建

情感词典是情感词汇高度组织的集合。构建一个合理高效的情感词典是后续进行情感分析的重要基石。其中词汇的描绘与存储是关键技术。本文借鉴词汇本体构建技术[8]对存储的情感词汇进行描述。通过一个三元组进行描述

Lexicon=(B R E)

公式二情感词汇本体结构

其中B表示词汇的基本信息 R代表词汇间的同义关系 E代表词汇的情感信息。情感信息是词汇描述中最关键的部分其构建基于情感认知中的维度论本文将情感信息通过情感分类、强度和极性三个维度进行描述。其中情感分类基于中国传统的七情划分用数字标号表示。强度分为九级表示包含该情感的强度大小。极性取值包括褒义、贬义、 中性三类。

语料的来源以网购中客服与商家对话为主体但为了训练语料库对情感信息的理解能力辅以各类包含丰富情感的文本载体如诗歌散文类文本。

语料信息的处理可分为两步。第一步对原始语料进行自动筛选主要是从各词典中根据词汇释义进行自动归类。第二步人工对初加工语料进行情感信息标注并录入最终存储系统。

4.2情感分析

在情感词典的基础上机器人每次接收到用户输入的对话语句并做分词处理后都首先将结果交给情感分析模块对其中包含的各类词汇做情感统计分析计算得出出现频率最高的一类情感将此作为上下文语境。 A I ML解析器在得到匹配模板后并不直接输出情感分析模块将对模板做同样的情感分析计算检查预输出的模板情感是否与上下文语境相符若相符将直接输出否则根据情感字典中的同义信息把模板中的情感词汇替换为情感分类与上下文语境相匹配的同义词汇再输出给用户。

5、总结

本文是在基于A I ML、中文分词、情感对话模型的框架上搭建的情感客服机器人其中由A I ML和中文分词构建的基础框架模型已经较为成熟有很多成功应用的实例如招生咨询机器人、图书馆问答检索机器人?。但总的来说基于AIML的中文知识库建设还处在起步阶段仅有少数领域的知识库而且知识库之间难以共享与融合本文构建的情感客服机器人的知识库大部分由人工录入效率偏低这也是目前大多数基于AIML的中文知识库构建普遍存在的问题。作者认为增强共享是解决的一条途径但更为关键的是找到A I ML知识库搭建的

Gcore(gcorelabs)俄罗斯海参崴VPS简单测试

有一段时间没有分享Gcore(gcorelabs)的信息了,这是一家成立于2011年的国外主机商,总部位于卢森堡,主要提供VPS主机和独立服务器租用等,数据中心包括俄罗斯、美国、日本、韩国、新加坡、荷兰、中国(香港)等多个国家和地区的十几个机房,商家针对不同系列的产品分为不同管理系统,比如VPS(Hosting)、Cloud等都是独立的用户中心体系,部落分享的主要是商家的Hosting(Virtu...

hostkvm:美国VPS,三网强制CU-VIP线路,$5/月,1G内存/1核/15gSSD/500g流量

hostkvm在2021年3月新上线洛杉矶新VPS业务,强制三网接入中国联通优化线路,是当前中美之间性价比最高、最火热的线路之一,性价比高、速度非常好,接近联通AS9929和电信AS4809的效果,带宽充裕,晚高峰也不爆炸。 官方网站:https://hostkvm.com 全场优惠码:2021(全场通用八折,终身码,长期) 美国 US-Plan0【三网联通优化线路】 内存:1G CPU:...

妮妮云80元/月,香港站群云服务器 1核1G

妮妮云的来历妮妮云是 789 陈总 张总 三方共同投资建立的网站 本着“良心 便宜 稳定”的初衷 为小白用户避免被坑妮妮云的市场定位妮妮云主要代理市场稳定速度的云服务器产品,避免新手购买云服务器的时候众多商家不知道如何选择,妮妮云就帮你选择好了产品,无需承担购买风险,不用担心出现被跑路 被诈骗的情况。妮妮云的售后保证妮妮云退款 通过于合作商的友好协商,云服务器提供2天内全额退款,超过2天不退款 物...

客服机器人为你推荐
cornerradiuscorner radius是什么意思手机区号手机号码前怎样填写正确的国内区号?安装迅雷看看播放器怎样安装迅雷看看播放器宕机人们说的宕机是什么意思iphone6上市时间苹果6什么时候出来安全漏洞什么是安全漏洞攻击??系统分析员系统分析员的工作内容宽带接入服务器什么是宽带接入系统?怎样绕过宽带接入系统上网发邮件怎么发发邮件怎么发?网络虚拟机虚拟机网络怎么连接
沈阳虚拟主机 北京服务器租用 浙江vps net主机 ftp空间 omnis kddi 56折 主机屋免费空间 国外网站代理服务器 150邮箱 太原联通测速平台 双拼域名 tna官网 爱奇艺vip免费试用7天 免费网页申请 申请网页 华为云盘 空间登陆首页 网页加速 更多