情感网购情感客服机器人研究

客服机器人  时间:2021-02-25  阅读:()

网购情感客服机器人研究

目录

1、系统体系结构

1中文分词模块可以在流程图中看到系统有三处需要用到中文分词

2 AIML知识文件 AIML是扩展自XML的人工智能标记语言

3

4 AIML推理引擎推理引擎的工作主要有两部分

5情感词典情感词典存储词汇的情感化信息

6情感统计分析情感统计分析是情感对话的核心模块

7

8同义词处理对于语境和预输出模板情感分类不匹配的情况

2、 AIML框架

G=Greeing

3、 中文分词

4、情感对话

4. 1情感词典的构建

4. 2情感分析

5、总结

正文

引言

随着近年来即时通信和电子商务的蓬勃发展 网上购物被越来越多人接受并显示出巨大的市场需求而网店的人工客服却承受着越来越大的工作量和压力。 由于人工智能、深度学习[1] 、 自然语言处理在近几年取得的突破性进展用机器人逐步取代人工客服的优势逐渐变得明显且可行起来。 目前已有一些客服机器人实例但主要是根据对话

内容的关键字与知识库中的知识匹配实现问题的回复极少涉及对客户情感的研究但服务态度对客服来说往往是关键的一项。

本文提出的情感机器人就是在这种背景下应运而生的它具有较好的扩充性及学习能力能通过各种渠道如与用户的交流对话、专业知识导入、网络知识挖掘、知识库共享等方式自主学习实现知识框架自适应调整从根本上改变商家低效耗时的人工培训成本问题实现常用问题的自动高效回复 同时引入情感对话模型尝试解决人机对话中的语境问题为客户提供一个高效、人性化的客服环境。

1、系统体系结构

系统基于A I ML框架机器人的知识库由A I ML类文件构成为了满足中文对话的需求在机器人的解析器中引入中文分词[2]模块并在由AIML框架和Lucene分词构成的基本框架上尝试了以情感词典和关键情感统计分析为核心技术的情感对话模型。本文的系统流程图如图1

重要模块分析

1中文分词模块可以在流程图中看到系统有三处需要用到中文分词分别是将知识文件分词后以词语为节点构建知识库的内存知识树、对用户输入语句进行分词以及将预输出模板做分词处理后交给情感统计分析模块。

2 A I ML知识文件 A I ML是扩展自XML的人工智能标记语言知识使用各类标签进行标记存储重要且常用的标签包括

3 A I ML内存知识树 内存知识树是知识文件进行分词后以词语作为节点进行存储的知识集合。逻辑结构为树树的每个子节点代表一个中文单词或一个通配符组织时根据单词在模式中出现的位置插入到树的节点中以最高效地利用内存空间树的叶子节点包含一个t emp late属性 template是对模式的回答。 内存知识树由知识推理引擎负责构建并在知识引擎匹配模板时作为输入。

4 A I ML推理引擎推理引擎的工作主要有两部分一部分是构建内存知识树另一部分就是将查询推理树与内存知识树的信息进行匹配找到相应的模板预输出。一个完整的处理流程大致包含四个步骤分别是初始化 问句规范化处理 问句查询推理以及模板处理[3]

5情感词典情感词典存储词汇的情感化信息主要由人工对初始收集的语料进行情感信息标注并录入存储系统形成情感词典。情感词典中的每一词语主要包含三方面信息情感分类信息、情感强度信息、同义词汇信息。它是情感统计分析处理逻辑和同义词处理逻辑的数据来源。

6情感统计分析情感统计分析是情感对话的核心模块 以情感词典为支撑负责对接收的词汇进行统计将出现频率最高的情感分类词汇作为上下文语境存储。 同时它也对预输出模板做同样的统计工作并将情感分类信息输出给语境匹配判定逻辑。

7语境匹配判定逻辑它负责判定预输出模板中的情感是否与上下文语境相匹配若匹配则直接输出。否则交给同义词处理模块进行后续处理。

8同义词处理对于语境和预输出模板情感分类不匹配的情况 同义词处理模块将抽取情感词典中的同义信息将模板中与语境不符的词汇替换为相符的同义词汇即情感变化并将最终的结果输出给用户。

2、 A I ML框架

A IML是机器人的核心。它是一个扩展自XML的人工智能标记语言在处理对话过程中不同于传统的语义规则构建与分析而是简单的匹配上下文这种无需事先确定专业领域语义规则的模式为知识库的构建提供了非常大的自由空间。 由于客服机器人的应用领域非常广普适性强知识库的构建往往需要大量非专业人士的配合 AIML符合人类思维表达模式的特性使其在自然语言处理领域有特殊的优势从某种程度上看它更接近于人类语言理解的本质。

此客服机器人知识库的整体逻辑框架分为两大类一类为系统预先定义的机器人常用语句对话类文件或称为模板第二类为由用户自行定义或导入的专业领域类文件。

基于对网购交际语篇的语类结构研究[4] 将其中得到的语类结构作为模板构建基础

其中

G=Greeing SI=Sale Initiation SR=Sale Request SC=SaleCompliance SE=Sale Enquiry S=Sale P=Purchase PC=PurchaseClosure F=Finish “()”表示可选择性 “[. ]”表示可调换位置 “[ ]”表示可调换位置的范围 “[ {} ]”表示可重复的程度相同。我们将AIML模板中的各基本类文件定义为上述的各语类 由此进行扩充。

AIML知识库的主要来源途径主要有初始专业知识分类导入 同行业知识库云共享对话经验学习扩展AIML的target ing技术 网络知识挖掘。

为提高Targeting技术的灵活性提供GUI界面供系统管理员操作系统将提供所有可能新增的知识 由管理员确定是否加入到内存知识树中。

Targeting技术为AIML自主学习以及自适应调整知识框架上提供了技术保障使机器人能在和用户的对话交流过程中不断累积知识减轻了管理员对知识库更新管理的负担。

3、 中文分词

中文分词器作用于A I ML解析器的两个阶段第一阶段在A I ML搭建GraphMa ster知识树之前将读出的知识模式即AIML类文件进行分词处理将分出的词语作为节点进行存储并交给解析器的下一模

块最终形成以中文词语为最小单位的内存知识树。第二阶段在接收用户问句并做标准化处理之后分词器将对问句进行分词构建出对应的查询推理树后再到GraphMast er中进行问句匹配。得到匹配的输出。

中文分词算法目前的解决思路大致可以归为三大类基于字符串匹配的词典分词算法、理解分词算法、统计分词算法[5] 。 由于客服机器人处理的是网络聊天口语信息其特点是灵活多变未登录词的更新频率高不合法语义、语法使用频繁。综合考虑算法的技术成熟度和适用范围本文使用以统计分词为核心的分词算法并应用隐马尔科夫模型。在HMM 隐马尔科夫分词方法中状态序列为词性、词类、语义角色等观察序列为输入的词串[6]

分词器的具体实现继承自Lucene开源全文检索工具包中的SmartChinese analyzer分词器[7] 。此分词器源于中科院的ICTCLAS中文分词系统并且采用隐马尔科夫模型在处理对话语料时有较好的分词效果。但由于分词器将要作用的领域不仅仅包含通用词汇多数情况下需要处理大量的专业词汇且词汇库需要经常更新。所以本文在实现客服机器人的分词器中添加了扩展词汇库的类使用户能自定义词汇库并对词汇库进行增删改查等操作。

4、情感对话

当前研发的客服机器人以回答常见问题为多很少能与用户做情感层面上的交流而服务态度在交流过程中是至关重要的一个因素。鉴

于此本文构建了一个情感分析模型模型基于情感词典使用关键词统计的方法对用户输入的语句进行情感分析在对当前语境做出判断后将预输出语句做情感化处理匹配客户情感 以达到提高机器人智能化的效果。

4. 1情感词典的构建

情感词典是情感词汇高度组织的集合。构建一个合理高效的情感词典是后续进行情感分析的重要基石。其中词汇的描绘与存储是关键技术。本文借鉴词汇本体构建技术[8]对存储的情感词汇进行描述。通过一个三元组进行描述

Lexicon=(B R E)

公式二情感词汇本体结构

其中B表示词汇的基本信息 R代表词汇间的同义关系 E代表词汇的情感信息。情感信息是词汇描述中最关键的部分其构建基于情感认知中的维度论本文将情感信息通过情感分类、强度和极性三个维度进行描述。其中情感分类基于中国传统的七情划分用数字标号表示。强度分为九级表示包含该情感的强度大小。极性取值包括褒义、贬义、 中性三类。

语料的来源以网购中客服与商家对话为主体但为了训练语料库对情感信息的理解能力辅以各类包含丰富情感的文本载体如诗歌散文类文本。

语料信息的处理可分为两步。第一步对原始语料进行自动筛选主要是从各词典中根据词汇释义进行自动归类。第二步人工对初加工语料进行情感信息标注并录入最终存储系统。

4.2情感分析

在情感词典的基础上机器人每次接收到用户输入的对话语句并做分词处理后都首先将结果交给情感分析模块对其中包含的各类词汇做情感统计分析计算得出出现频率最高的一类情感将此作为上下文语境。 A I ML解析器在得到匹配模板后并不直接输出情感分析模块将对模板做同样的情感分析计算检查预输出的模板情感是否与上下文语境相符若相符将直接输出否则根据情感字典中的同义信息把模板中的情感词汇替换为情感分类与上下文语境相匹配的同义词汇再输出给用户。

5、总结

本文是在基于A I ML、中文分词、情感对话模型的框架上搭建的情感客服机器人其中由A I ML和中文分词构建的基础框架模型已经较为成熟有很多成功应用的实例如招生咨询机器人、图书馆问答检索机器人?。但总的来说基于AIML的中文知识库建设还处在起步阶段仅有少数领域的知识库而且知识库之间难以共享与融合本文构建的情感客服机器人的知识库大部分由人工录入效率偏低这也是目前大多数基于AIML的中文知识库构建普遍存在的问题。作者认为增强共享是解决的一条途径但更为关键的是找到A I ML知识库搭建的

创梦网络-江苏宿迁BGP云服务器100G高防资源,全程ceph集群存储,安全可靠,数据有保证,防护真实,现在购买7折促销,续费同价!

官方网站:点击访问创梦网络宿迁BGP高防活动方案:机房CPU内存硬盘带宽IP防护流量原价活动价开通方式宿迁BGP4vCPU4G40G+50G20Mbps1个100G不限流量299元/月 209.3元/月点击自助购买成都电信优化线路8vCPU8G40G+50G20Mbps1个100G不限流量399元/月 279.3元/月点击自助购买成都电信优化线路8vCPU16G40G+50G2...

ftlcloud(超云)9元/月,1G内存/1核/20g硬盘/10M带宽不限/10G防御,美国云服务器

ftlcloud怎么样?ftlcloud(超云)目前正在搞暑假促销,美国圣何塞数据中心的云服务器低至9元/月,系统盘与数据盘分离,支持Windows和Linux,免费防御CC攻击,自带10Gbps的DDoS防御。FTL-超云服务器的主要特色:稳定、安全、弹性、高性能的云端计算服务,快速部署,并且可根据业务需要扩展计算能力,按需付费,节约成本,提高资源的有效利用率。点击进入:ftlcloud官方网站...

无忧云:服务器100G高防云服务器,bgpBGP云,洛阳BGP云服务器2核2G仅38.4元/月起

无忧云怎么样?无忧云值不值得购买?无忧云,无忧云是一家成立于2017年的老牌商家旗下的服务器销售品牌,现由深圳市云上无忧网络科技有限公司运营,是正规持证IDC/ISP/IRCS商家,主要销售国内、中国香港、国外服务器产品,线路有腾讯云国外线路、自营香港CN2线路等,都是中国大陆直连线路,非常适合免备案建站业务需求和各种负载较高的项目,同时国内服务器也有多个BGP以及高防节点。目前,四川雅安机房,4...

客服机器人为你推荐
百度k站百度是怎么样k站的呢?百度k站百度k站的原因是什么手游运营手册游戏发展国主机开发怎么做 怎么开发主机云播怎么看片云播影视怎么样?不兼容vivo手机和软件不兼容怎么办?idc前线求电影敢死队电影里的歌曲!mate8价格手机华为mat8售价多少安全漏洞计算机一般存在哪些安全漏洞?什么是云平台什么是家庭云平台?blogcn南京明城墙(太平门一带某些地区)的城砖上为什么会有一些小洞(每块砖两个洞洞……)?
购买域名 广东服务器租用 个人域名备案 主机优惠码 主机评测 site5 空间打开慢 河南m值兑换 广州服务器 gtt 国外视频网站有哪些 闪讯官网 360云服务 下载速度测试 百度云空间 服务器硬件配置 服务器防御 闪讯网 nnt tracker服务器 更多