情感网购情感客服机器人研究

客服机器人  时间:2021-02-25  阅读:()

网购情感客服机器人研究

目录

1、系统体系结构

1中文分词模块可以在流程图中看到系统有三处需要用到中文分词

2 AIML知识文件 AIML是扩展自XML的人工智能标记语言

3

4 AIML推理引擎推理引擎的工作主要有两部分

5情感词典情感词典存储词汇的情感化信息

6情感统计分析情感统计分析是情感对话的核心模块

7

8同义词处理对于语境和预输出模板情感分类不匹配的情况

2、 AIML框架

G=Greeing

3、 中文分词

4、情感对话

4. 1情感词典的构建

4. 2情感分析

5、总结

正文

引言

随着近年来即时通信和电子商务的蓬勃发展 网上购物被越来越多人接受并显示出巨大的市场需求而网店的人工客服却承受着越来越大的工作量和压力。 由于人工智能、深度学习[1] 、 自然语言处理在近几年取得的突破性进展用机器人逐步取代人工客服的优势逐渐变得明显且可行起来。 目前已有一些客服机器人实例但主要是根据对话

内容的关键字与知识库中的知识匹配实现问题的回复极少涉及对客户情感的研究但服务态度对客服来说往往是关键的一项。

本文提出的情感机器人就是在这种背景下应运而生的它具有较好的扩充性及学习能力能通过各种渠道如与用户的交流对话、专业知识导入、网络知识挖掘、知识库共享等方式自主学习实现知识框架自适应调整从根本上改变商家低效耗时的人工培训成本问题实现常用问题的自动高效回复 同时引入情感对话模型尝试解决人机对话中的语境问题为客户提供一个高效、人性化的客服环境。

1、系统体系结构

系统基于A I ML框架机器人的知识库由A I ML类文件构成为了满足中文对话的需求在机器人的解析器中引入中文分词[2]模块并在由AIML框架和Lucene分词构成的基本框架上尝试了以情感词典和关键情感统计分析为核心技术的情感对话模型。本文的系统流程图如图1

重要模块分析

1中文分词模块可以在流程图中看到系统有三处需要用到中文分词分别是将知识文件分词后以词语为节点构建知识库的内存知识树、对用户输入语句进行分词以及将预输出模板做分词处理后交给情感统计分析模块。

2 A I ML知识文件 A I ML是扩展自XML的人工智能标记语言知识使用各类标签进行标记存储重要且常用的标签包括

3 A I ML内存知识树 内存知识树是知识文件进行分词后以词语作为节点进行存储的知识集合。逻辑结构为树树的每个子节点代表一个中文单词或一个通配符组织时根据单词在模式中出现的位置插入到树的节点中以最高效地利用内存空间树的叶子节点包含一个t emp late属性 template是对模式的回答。 内存知识树由知识推理引擎负责构建并在知识引擎匹配模板时作为输入。

4 A I ML推理引擎推理引擎的工作主要有两部分一部分是构建内存知识树另一部分就是将查询推理树与内存知识树的信息进行匹配找到相应的模板预输出。一个完整的处理流程大致包含四个步骤分别是初始化 问句规范化处理 问句查询推理以及模板处理[3]

5情感词典情感词典存储词汇的情感化信息主要由人工对初始收集的语料进行情感信息标注并录入存储系统形成情感词典。情感词典中的每一词语主要包含三方面信息情感分类信息、情感强度信息、同义词汇信息。它是情感统计分析处理逻辑和同义词处理逻辑的数据来源。

6情感统计分析情感统计分析是情感对话的核心模块 以情感词典为支撑负责对接收的词汇进行统计将出现频率最高的情感分类词汇作为上下文语境存储。 同时它也对预输出模板做同样的统计工作并将情感分类信息输出给语境匹配判定逻辑。

7语境匹配判定逻辑它负责判定预输出模板中的情感是否与上下文语境相匹配若匹配则直接输出。否则交给同义词处理模块进行后续处理。

8同义词处理对于语境和预输出模板情感分类不匹配的情况 同义词处理模块将抽取情感词典中的同义信息将模板中与语境不符的词汇替换为相符的同义词汇即情感变化并将最终的结果输出给用户。

2、 A I ML框架

A IML是机器人的核心。它是一个扩展自XML的人工智能标记语言在处理对话过程中不同于传统的语义规则构建与分析而是简单的匹配上下文这种无需事先确定专业领域语义规则的模式为知识库的构建提供了非常大的自由空间。 由于客服机器人的应用领域非常广普适性强知识库的构建往往需要大量非专业人士的配合 AIML符合人类思维表达模式的特性使其在自然语言处理领域有特殊的优势从某种程度上看它更接近于人类语言理解的本质。

此客服机器人知识库的整体逻辑框架分为两大类一类为系统预先定义的机器人常用语句对话类文件或称为模板第二类为由用户自行定义或导入的专业领域类文件。

基于对网购交际语篇的语类结构研究[4] 将其中得到的语类结构作为模板构建基础

其中

G=Greeing SI=Sale Initiation SR=Sale Request SC=SaleCompliance SE=Sale Enquiry S=Sale P=Purchase PC=PurchaseClosure F=Finish “()”表示可选择性 “[. ]”表示可调换位置 “[ ]”表示可调换位置的范围 “[ {} ]”表示可重复的程度相同。我们将AIML模板中的各基本类文件定义为上述的各语类 由此进行扩充。

AIML知识库的主要来源途径主要有初始专业知识分类导入 同行业知识库云共享对话经验学习扩展AIML的target ing技术 网络知识挖掘。

为提高Targeting技术的灵活性提供GUI界面供系统管理员操作系统将提供所有可能新增的知识 由管理员确定是否加入到内存知识树中。

Targeting技术为AIML自主学习以及自适应调整知识框架上提供了技术保障使机器人能在和用户的对话交流过程中不断累积知识减轻了管理员对知识库更新管理的负担。

3、 中文分词

中文分词器作用于A I ML解析器的两个阶段第一阶段在A I ML搭建GraphMa ster知识树之前将读出的知识模式即AIML类文件进行分词处理将分出的词语作为节点进行存储并交给解析器的下一模

块最终形成以中文词语为最小单位的内存知识树。第二阶段在接收用户问句并做标准化处理之后分词器将对问句进行分词构建出对应的查询推理树后再到GraphMast er中进行问句匹配。得到匹配的输出。

中文分词算法目前的解决思路大致可以归为三大类基于字符串匹配的词典分词算法、理解分词算法、统计分词算法[5] 。 由于客服机器人处理的是网络聊天口语信息其特点是灵活多变未登录词的更新频率高不合法语义、语法使用频繁。综合考虑算法的技术成熟度和适用范围本文使用以统计分词为核心的分词算法并应用隐马尔科夫模型。在HMM 隐马尔科夫分词方法中状态序列为词性、词类、语义角色等观察序列为输入的词串[6]

分词器的具体实现继承自Lucene开源全文检索工具包中的SmartChinese analyzer分词器[7] 。此分词器源于中科院的ICTCLAS中文分词系统并且采用隐马尔科夫模型在处理对话语料时有较好的分词效果。但由于分词器将要作用的领域不仅仅包含通用词汇多数情况下需要处理大量的专业词汇且词汇库需要经常更新。所以本文在实现客服机器人的分词器中添加了扩展词汇库的类使用户能自定义词汇库并对词汇库进行增删改查等操作。

4、情感对话

当前研发的客服机器人以回答常见问题为多很少能与用户做情感层面上的交流而服务态度在交流过程中是至关重要的一个因素。鉴

于此本文构建了一个情感分析模型模型基于情感词典使用关键词统计的方法对用户输入的语句进行情感分析在对当前语境做出判断后将预输出语句做情感化处理匹配客户情感 以达到提高机器人智能化的效果。

4. 1情感词典的构建

情感词典是情感词汇高度组织的集合。构建一个合理高效的情感词典是后续进行情感分析的重要基石。其中词汇的描绘与存储是关键技术。本文借鉴词汇本体构建技术[8]对存储的情感词汇进行描述。通过一个三元组进行描述

Lexicon=(B R E)

公式二情感词汇本体结构

其中B表示词汇的基本信息 R代表词汇间的同义关系 E代表词汇的情感信息。情感信息是词汇描述中最关键的部分其构建基于情感认知中的维度论本文将情感信息通过情感分类、强度和极性三个维度进行描述。其中情感分类基于中国传统的七情划分用数字标号表示。强度分为九级表示包含该情感的强度大小。极性取值包括褒义、贬义、 中性三类。

语料的来源以网购中客服与商家对话为主体但为了训练语料库对情感信息的理解能力辅以各类包含丰富情感的文本载体如诗歌散文类文本。

语料信息的处理可分为两步。第一步对原始语料进行自动筛选主要是从各词典中根据词汇释义进行自动归类。第二步人工对初加工语料进行情感信息标注并录入最终存储系统。

4.2情感分析

在情感词典的基础上机器人每次接收到用户输入的对话语句并做分词处理后都首先将结果交给情感分析模块对其中包含的各类词汇做情感统计分析计算得出出现频率最高的一类情感将此作为上下文语境。 A I ML解析器在得到匹配模板后并不直接输出情感分析模块将对模板做同样的情感分析计算检查预输出的模板情感是否与上下文语境相符若相符将直接输出否则根据情感字典中的同义信息把模板中的情感词汇替换为情感分类与上下文语境相匹配的同义词汇再输出给用户。

5、总结

本文是在基于A I ML、中文分词、情感对话模型的框架上搭建的情感客服机器人其中由A I ML和中文分词构建的基础框架模型已经较为成熟有很多成功应用的实例如招生咨询机器人、图书馆问答检索机器人?。但总的来说基于AIML的中文知识库建设还处在起步阶段仅有少数领域的知识库而且知识库之间难以共享与融合本文构建的情感客服机器人的知识库大部分由人工录入效率偏低这也是目前大多数基于AIML的中文知识库构建普遍存在的问题。作者认为增强共享是解决的一条途径但更为关键的是找到A I ML知识库搭建的

paypal$10的代金券,选购美国VPS

paypal贝宝可撸$10的代金券!这两天paypal出了活动,本次并没有其他的限制,只要注册国区的paypal,使用国内的手机号和62开头的银联卡,就可以获得10美元的代金券,这个代金券购买产品需要大于10.1美元,站长给大家推荐几个方式,可以白嫖一年的VPS,有需要的朋友可以看看比较简单。PayPal送10美元活动:点击直达活动sfz与绑定卡的号码可以重复用 注册的邮箱,手机号与绑的银联卡必须...

华圣云 HuaSaint-阿里云国际站一级分销商,只需一个邮箱即可注册国际账号,可代充值

简介华圣云 HuaSaint是阿里云国际版一级分销商(诚招募二级代理),专业为全球企业客户与个人开发者提供阿里云国际版开户注册、认证、充值等服务,通过HuaSaint开通阿里云国际版只需要一个邮箱,不需要PayPal信用卡,不需要买海外电话卡,绝对的零门槛,零风险官方网站:www.huasaint.com企业名:huaSaint Tech Limited阿里云国际版都有什么优势?阿里云国际版的产品...

Digital-VM80美元新加坡和日本独立服务器

Digital-VM商家的暑期活动促销,这个商家提供有多个数据中心独立服务器、VPS主机产品。最低配置月付80美元,支持带宽、流量和IP的自定义配置。Digital-VM,是2019年新成立的商家,主要从事日本东京、新加坡、美国洛杉矶、荷兰阿姆斯特丹、西班牙马德里、挪威奥斯陆、丹麦哥本哈根数据中心的KVM架构VPS产品销售,分为大硬盘型(1Gbps带宽端口、分配较大的硬盘)和大带宽型(10Gbps...

客服机器人为你推荐
外网和内网什么是外网和内网?淘宝收费淘宝卖东西收多少手续费百度抢票浏览器手机百度浏览器抢票版根本就没预约抢票。噱头而已!渗透测试web渗透测试有前途吗arm开发板想购买一个ARM开发板,选什么类型的好arm开发板单片机开发板与ARM开发板有什么不同?手机区号手机号码前怎样填写正确的国内区号?网站联盟百度网盟是什么,怎么加入数码资源网哪个网站可以直接在线做照片?功能要齐全的`ios7固件下载ios 7及以上固件请在设备上点“信任”在哪点?
泛域名 哈尔滨域名注册 免备案cdn 免费静态空间 警告本网站 私有云存储 web服务器的架设 idc资讯 股票老左 赞助 129邮箱 泉州移动 华为云盘 英国伦敦 阿里云免费邮箱 游戏服务器出租 服务器防火墙 阿里云手机官网 服务器硬件配置 创速 更多