舆情基于免疫机理的网络商务舆情监控系统研究

舆情监控系统  时间:2021-02-25  阅读:()

基于免疫机理的网络商务舆情监控系统研究

目录

1、细胞免疫学机理的引入

2、 网络商务舆情监控系统的构建

2. 1 网络商务舆情数据的采集

2. 2网络商务舆情的抗原识别及抗体提取

2. 3网络商务舆情监控系统的整体架构

3、小结

正文

摘要针对网购用户在线评价为主的网络商务舆情本文尝试引入细胞免疫机理借鉴细胞免疫学中的抗原、抗体概念将网络商务舆情中的负面信息视为抗原采用与细胞免疫系统相同的工作机制通过计算网络商务舆情负面信息抗原的特点来提取出抗体再利用

抗体来对网络商务舆情进行准确识别和控制帮助企业更加准确地掌握市场及用户状况为企业营销提供支撑

关键字商务舆情舆情监控免疫机理抗原抗体

据中国质量万里行2016年3月的投诉报告显示 2015年网购投诉仍居各行业投诉之首投诉量为23386例而与此同时在线商品评论的好评率常常接近100%但所售商品仍伴随着居高不下的投诉率或退货率[1] 。在电子商务领域 由于在线交易具有虚拟性、隐蔽性、发散性、渗透性等特点随之而来的网络商务舆情又有数据量大、高度分散、传染性强、随意性大等新的特点这些都迫切需要一个高效的网络商务舆情传播及控制系统为企业的在线商务运营收集各种舆情信息帮助企业应对当前复杂的网络信息传播状况应对日益严峻的电子商务方面的竞争态势。而目前针对网购用户在线评价为主的网络商务舆情研究不多传统的网络舆情监控主要针对的是大型门户网站及重要的论坛、社区、博客等[2] 对网络商务领域中的客户、产品等要素 由于信息量大且关键词不易确定传统的网络舆情监控效果不佳。

本文尝试引入细胞免疫学概念力求突破有限初始关键词以及有限指定网址的局限根据网络商务舆情的传播线路来自动产生抗体关键词及网址扩大信息解析及吸取的范围从而更加准确地开展网络商务舆情监控。企业也可以通过实时的网络商务舆情监督更加准确掌握产品和市场情况监控竞争对手和行业动态是企业市场营销决策的重要支撑。

1、细胞免疫学机理的引入

人类免疫系统经过生物进化被证明是有效的、适应性良好的防御系统。在生物免疫系统与网络商务舆情传播与控制系统的异同点分析的基础上研究建立网络商务舆情传播与控制人工免疫系统的可行性提出网络商务舆情风险的抗原识别机理揭示网络商务舆情的免疫接种机理。在免疫学概念中抗原是入侵者被机体识别后机体会产生反应来消灭不属于机体本身的抗原产生反应形成的物质就是抗体抗体就是来对抗抗原的物质。生物细胞免疫系统防御异物入侵的过程就是一个不断识别风险和处理风险的过程。免疫学研究已经证明每一个类型的抗体都有特定抗原决定基抗体与抗原之间的匹配模式越接近识别效果越好[3]

借鉴细胞免疫学中的抗原、抗体概念将网络商务舆情中的负面信息视为抗原借助细胞免疫系统的相同工作机制测算出网络商务舆情负面信息的相关特点 即抗原特点再根据抗原特点来找出最合适的抗体这个抗体体现的就是机体对负面信息的敏感反应可以用来准确地识别网络商务舆情抗原

本文的核心就是借鉴细胞免疫学机理从已知抗原中提取抗体再利用抗体来准确识别网络商务舆情中的不良信息抗原 增强商家的主动防御能力。其中最关键的技术就是对抗原的识别要对网络商务舆情的负面信息进行各种分类和比对从而产生多样抗体 以识别各类抗原。

2、 网络商务舆情监控系统的构建

2. 1网络商务舆情数据的采集

现有电商平台中的商品数据、评论数据的结构复杂均采用了Frame框架及JavaScr ipt动态写入内容或采用了Ajax技术实时自动刷新内容这些都是普通的数据抓取技术很难处理或无法处理的。先模仿人工通过电商平台的搜索引擎输入初始关键词从多个电商平台上获得初始关键词的相关商品搜索结果再通过这些商品的链接收集进一步的商品详情信息接着重点采集商品的各项用户评价信息尤其是负面评价信息最后对收集到的所有舆情数据进行进一步的清理和整理便于后面的抗原选定及抗体识别。

获取在线商品数据关键就是通过程序来发送网页请求从而获取相应页面的源码然后再对源码进行解析获取到需要的商品信息。观察H TML源码是非常重要的第一步决定了所需数据应该怎么获取。比如仔细查看淘宝搜索页面中某件商品的链接地址其H TML代码如图1所示。

该商品的链接地址是位于"detail_url":"后面的一串字符又以" "view_price"符号结束。把这两个看成是分隔符的话就可以取出该商品的链接地址了。接下来通过商品页面地址将该页所有源代码下载到本地再分析这些数据的组成。其中的用户评论数据是用JS脚本代码获取的在网页源码中研究script脚本代码从中得到JSON格式的用户评论如图2所示。

获取到JS ON格式的用户评论后就可以根据用户舆情数据的文本组成结构对舆情数据进行抽取实现基于网页结构的网络商务舆情数据的自动采集。

2.2网络商务舆情的抗原识别及抗体提取

对采集到的网络商务舆情信息挑选出一部分作为训练集 因为不同的产品对象其抗原及抗体均有差异 因此网络商务舆情的抗原识别及抗体提取应该针对不同领域、不同产品进行分别操作。本文的负面信息训练集主要来自于户外产品的差评从某购物平台上随机抽取并经过人工标注筛选后将其中的500条典型负面评价作为初始训练集。

先采用中科院发布的最新NLPI R 原ICTCLAS中文分词系统对这500条对负面信息抗原进行分词处理再通过语义角色标注

Semantic Role Labeling简称SRL进行语义分析提取出负面信息中包含的评价对象、特征、相应的情感词。如从某条负面信息中提取出评价对象为冲锋衣特征为材质相应情感词为不透气。为了抗体生成的准确性训练集中的负面信息抗原都包含有显式的评价对象、特征、相应的情感词内容。

接着就是要从这些评价对象、特征、相应的情感词内容中提取出抗体基本工作思路如下

●统计评价对象、特征、相应的情感词出现的频率

●计算情感词与评价对象、特征之间的关联关系

●将重点情感词设置为抗体备选

●计算抗体间相似度合并相似度高的抗体

●最终确定抗体主体。

具体的抗原识别及抗体提取过程如图3所示

2.3网络商务舆情监控系统的整体架构

免疫系统对抗原采取的不是以静制动的策略而是以变应变或者通过超变异产生尽可能多的抗体类型的策略 因为不同产品对象的负面信息及风险各不相同 网络商务舆情监控系统也是一个根据监控对象不同而随时自我调节的系统非常适合采用与免疫系统同样的策略进行舆情防御及免疫。将网络商务舆情负面信息作为抗原其抗原基因与抗体基因的结构类型一致 以抗体基因作为研究基础产生的则是网络商务舆情事件的非自体抗原基因库。 网络商务舆情负面信息特质基因则是互补性决定区的抗体基因 网络商务舆情负面信息的识别则依靠特质基因片段识别特定产品领域的网络商务舆情负面信息将免疫机理与网络商务舆情监控结合起来构成一个完整的网络商务舆情监控系统。

在抗体提取之前先进行目标对象的识别分类及该类训练集的准备再依据不同的训练集提取该类别对应的抗体接着基于抗体进行该类别对象的网络舆情监控然后根据不同的监控结果进行持续的抗

体优化最后通过持续地分类别网络舆情监控建立起一个完整的网络商务舆情监控系统并不断更新分类。具体的网络商务舆情监控系统整体架构如图4所示。

3、小结

传统网络舆情监控方法对电子商务领域的舆情识别效果不佳而网络商务舆情中不同产品对象的舆情特点不同恰好与免疫学中的机体免疫机理吻合。因此基于免疫学中的抗原、抗体原理将网络商务舆情中的不良信息视为抗原通过研究抗原特点找出抗体再通过抗体来识别未知的网络舆情可以有效的提升网络商务舆情的监控精度。

本文在抗原识别及抗体提取阶段采用的是目前比较经典的网络文本采集及文本分类识别技术 由于目前的文本识别技术尚不成熟抗体提取的精确性还有很大的提升空间。此外 网络商务舆情中的图片、声音信息的识别及监控也是后期需要进一步开展的工作。

BuyVM迈阿密KVM上线,AMD Ryzen 3900X+NVMe硬盘$2/月起

BuyVM在昨天宣布上线了第四个数据中心产品:迈阿密,基于KVM架构的VPS主机,采用AMD Ryzen 3900X CPU,DDR4内存,NVMe硬盘,1Gbps带宽,不限制流量方式,最低$2/月起,支持Linux或者Windows操作系统。这是一家成立于2010年的国外主机商,提供基于KVM架构的VPS产品,数据中心除了新上的迈阿密外还包括美国拉斯维加斯、新泽西和卢森堡等,主机均为1Gbps带...

限时新网有提供5+个免费域名

有在六月份的时候也有分享过新网域名注册商发布的域名促销活动(这里)。这不在九月份发布秋季域名促销活动,有提供年付16元的.COM域名,同时还有5个+的特殊后缀的域名是免费的。对于新网服务商是曾经非常老牌的域名注册商,早年也是有在他们家注册域名的。我们可以看到,如果有针对新用户的可以领到16元的.COM域名。包括还有首年免费的.XYZ、.SHOP、Space等等后缀的域名。除了.COM域名之外的其他...

阿里云金秋上云季,云服务器秒杀2C2G5M年付60元起

阿里云(aliyun)在这个月又推出了一个金秋上云季活动,到9月30日前,每天两场秒杀活动,包括轻量应用服务器、云服务器、云数据库、短信包、存储包、CDN流量包等等产品,其中Aliyun轻量云服务器最低60元/年起,还可以99元续费3次!活动针对新用户和没有购买过他们的产品的老用户均可参与,每人限购1件。关于阿里云不用多说了,国内首屈一指的云服务器商家,无论建站还是学习都是相当靠谱的。活动地址:h...

舆情监控系统为你推荐
eset用户名求ESET最新用户名和密码阿里云系统阿里云系统用起来怎么样主页改不了怎么改不了主页网站运营一般网站如何运营xp系统停止服务XP停止服务后该怎么办?虚拟专用网安卓手机的虚拟专用网设置是什么东西?怎么用?网站优化方案网站优化方案怎么写?三星s8什么时候上市三星s8什么时候上市 三星s8上市时间如何清理ie缓存怎么清理IE缓存网络虚拟机虚拟机网络怎么连接
网址域名注册 免费域名解析 促正网秒杀 最好的免费空间 shopex主机 申请免费空间和域名 512mb 备案空间 美国凤凰城 中国电信测速网站 防cc攻击 摩尔庄园注册 中国联通宽带测试 hdsky mteam ncp是什么 带宽测速 ubuntu安装教程 俄勒冈州 内存 更多