舆情基于免疫机理的网络商务舆情监控系统研究

舆情监控系统  时间:2021-02-25  阅读:()

基于免疫机理的网络商务舆情监控系统研究

目录

1、细胞免疫学机理的引入

2、 网络商务舆情监控系统的构建

2. 1 网络商务舆情数据的采集

2. 2网络商务舆情的抗原识别及抗体提取

2. 3网络商务舆情监控系统的整体架构

3、小结

正文

摘要针对网购用户在线评价为主的网络商务舆情本文尝试引入细胞免疫机理借鉴细胞免疫学中的抗原、抗体概念将网络商务舆情中的负面信息视为抗原采用与细胞免疫系统相同的工作机制通过计算网络商务舆情负面信息抗原的特点来提取出抗体再利用

抗体来对网络商务舆情进行准确识别和控制帮助企业更加准确地掌握市场及用户状况为企业营销提供支撑

关键字商务舆情舆情监控免疫机理抗原抗体

据中国质量万里行2016年3月的投诉报告显示 2015年网购投诉仍居各行业投诉之首投诉量为23386例而与此同时在线商品评论的好评率常常接近100%但所售商品仍伴随着居高不下的投诉率或退货率[1] 。在电子商务领域 由于在线交易具有虚拟性、隐蔽性、发散性、渗透性等特点随之而来的网络商务舆情又有数据量大、高度分散、传染性强、随意性大等新的特点这些都迫切需要一个高效的网络商务舆情传播及控制系统为企业的在线商务运营收集各种舆情信息帮助企业应对当前复杂的网络信息传播状况应对日益严峻的电子商务方面的竞争态势。而目前针对网购用户在线评价为主的网络商务舆情研究不多传统的网络舆情监控主要针对的是大型门户网站及重要的论坛、社区、博客等[2] 对网络商务领域中的客户、产品等要素 由于信息量大且关键词不易确定传统的网络舆情监控效果不佳。

本文尝试引入细胞免疫学概念力求突破有限初始关键词以及有限指定网址的局限根据网络商务舆情的传播线路来自动产生抗体关键词及网址扩大信息解析及吸取的范围从而更加准确地开展网络商务舆情监控。企业也可以通过实时的网络商务舆情监督更加准确掌握产品和市场情况监控竞争对手和行业动态是企业市场营销决策的重要支撑。

1、细胞免疫学机理的引入

人类免疫系统经过生物进化被证明是有效的、适应性良好的防御系统。在生物免疫系统与网络商务舆情传播与控制系统的异同点分析的基础上研究建立网络商务舆情传播与控制人工免疫系统的可行性提出网络商务舆情风险的抗原识别机理揭示网络商务舆情的免疫接种机理。在免疫学概念中抗原是入侵者被机体识别后机体会产生反应来消灭不属于机体本身的抗原产生反应形成的物质就是抗体抗体就是来对抗抗原的物质。生物细胞免疫系统防御异物入侵的过程就是一个不断识别风险和处理风险的过程。免疫学研究已经证明每一个类型的抗体都有特定抗原决定基抗体与抗原之间的匹配模式越接近识别效果越好[3]

借鉴细胞免疫学中的抗原、抗体概念将网络商务舆情中的负面信息视为抗原借助细胞免疫系统的相同工作机制测算出网络商务舆情负面信息的相关特点 即抗原特点再根据抗原特点来找出最合适的抗体这个抗体体现的就是机体对负面信息的敏感反应可以用来准确地识别网络商务舆情抗原

本文的核心就是借鉴细胞免疫学机理从已知抗原中提取抗体再利用抗体来准确识别网络商务舆情中的不良信息抗原 增强商家的主动防御能力。其中最关键的技术就是对抗原的识别要对网络商务舆情的负面信息进行各种分类和比对从而产生多样抗体 以识别各类抗原。

2、 网络商务舆情监控系统的构建

2. 1网络商务舆情数据的采集

现有电商平台中的商品数据、评论数据的结构复杂均采用了Frame框架及JavaScr ipt动态写入内容或采用了Ajax技术实时自动刷新内容这些都是普通的数据抓取技术很难处理或无法处理的。先模仿人工通过电商平台的搜索引擎输入初始关键词从多个电商平台上获得初始关键词的相关商品搜索结果再通过这些商品的链接收集进一步的商品详情信息接着重点采集商品的各项用户评价信息尤其是负面评价信息最后对收集到的所有舆情数据进行进一步的清理和整理便于后面的抗原选定及抗体识别。

获取在线商品数据关键就是通过程序来发送网页请求从而获取相应页面的源码然后再对源码进行解析获取到需要的商品信息。观察H TML源码是非常重要的第一步决定了所需数据应该怎么获取。比如仔细查看淘宝搜索页面中某件商品的链接地址其H TML代码如图1所示。

该商品的链接地址是位于"detail_url":"后面的一串字符又以" "view_price"符号结束。把这两个看成是分隔符的话就可以取出该商品的链接地址了。接下来通过商品页面地址将该页所有源代码下载到本地再分析这些数据的组成。其中的用户评论数据是用JS脚本代码获取的在网页源码中研究script脚本代码从中得到JSON格式的用户评论如图2所示。

获取到JS ON格式的用户评论后就可以根据用户舆情数据的文本组成结构对舆情数据进行抽取实现基于网页结构的网络商务舆情数据的自动采集。

2.2网络商务舆情的抗原识别及抗体提取

对采集到的网络商务舆情信息挑选出一部分作为训练集 因为不同的产品对象其抗原及抗体均有差异 因此网络商务舆情的抗原识别及抗体提取应该针对不同领域、不同产品进行分别操作。本文的负面信息训练集主要来自于户外产品的差评从某购物平台上随机抽取并经过人工标注筛选后将其中的500条典型负面评价作为初始训练集。

先采用中科院发布的最新NLPI R 原ICTCLAS中文分词系统对这500条对负面信息抗原进行分词处理再通过语义角色标注

Semantic Role Labeling简称SRL进行语义分析提取出负面信息中包含的评价对象、特征、相应的情感词。如从某条负面信息中提取出评价对象为冲锋衣特征为材质相应情感词为不透气。为了抗体生成的准确性训练集中的负面信息抗原都包含有显式的评价对象、特征、相应的情感词内容。

接着就是要从这些评价对象、特征、相应的情感词内容中提取出抗体基本工作思路如下

●统计评价对象、特征、相应的情感词出现的频率

●计算情感词与评价对象、特征之间的关联关系

●将重点情感词设置为抗体备选

●计算抗体间相似度合并相似度高的抗体

●最终确定抗体主体。

具体的抗原识别及抗体提取过程如图3所示

2.3网络商务舆情监控系统的整体架构

免疫系统对抗原采取的不是以静制动的策略而是以变应变或者通过超变异产生尽可能多的抗体类型的策略 因为不同产品对象的负面信息及风险各不相同 网络商务舆情监控系统也是一个根据监控对象不同而随时自我调节的系统非常适合采用与免疫系统同样的策略进行舆情防御及免疫。将网络商务舆情负面信息作为抗原其抗原基因与抗体基因的结构类型一致 以抗体基因作为研究基础产生的则是网络商务舆情事件的非自体抗原基因库。 网络商务舆情负面信息特质基因则是互补性决定区的抗体基因 网络商务舆情负面信息的识别则依靠特质基因片段识别特定产品领域的网络商务舆情负面信息将免疫机理与网络商务舆情监控结合起来构成一个完整的网络商务舆情监控系统。

在抗体提取之前先进行目标对象的识别分类及该类训练集的准备再依据不同的训练集提取该类别对应的抗体接着基于抗体进行该类别对象的网络舆情监控然后根据不同的监控结果进行持续的抗

体优化最后通过持续地分类别网络舆情监控建立起一个完整的网络商务舆情监控系统并不断更新分类。具体的网络商务舆情监控系统整体架构如图4所示。

3、小结

传统网络舆情监控方法对电子商务领域的舆情识别效果不佳而网络商务舆情中不同产品对象的舆情特点不同恰好与免疫学中的机体免疫机理吻合。因此基于免疫学中的抗原、抗体原理将网络商务舆情中的不良信息视为抗原通过研究抗原特点找出抗体再通过抗体来识别未知的网络舆情可以有效的提升网络商务舆情的监控精度。

本文在抗原识别及抗体提取阶段采用的是目前比较经典的网络文本采集及文本分类识别技术 由于目前的文本识别技术尚不成熟抗体提取的精确性还有很大的提升空间。此外 网络商务舆情中的图片、声音信息的识别及监控也是后期需要进一步开展的工作。

瓜云互联-美国洛杉矶高防CN2高防云服务器,新老用户均可9折促销!低至32.4元/月!

瓜云互联一直主打超高性价比的海外vps产品,主要以美国cn2、香港cn2线路为主,100M以内高宽带,非常适合个人使用、企业等等!安全防护体系 弹性灵活,能为提供简单、 高效、智能、快速、低成本的云防护,帮助个人、企业从实现网络攻击防御,同时也承诺产品24H支持退换,不喜欢可以找客服退现,诚信自由交易!官方网站:点击访问瓜云互联官网活动方案:打折优惠策略:新老用户购买服务器统统9折优惠预存返款活动...

华纳云E5处理器16G内存100Mbps688元/月

近日华纳云商家正式上线了美国服务器产品,这次美国机房上线的产品包括美国云服务器、美国独立服务器、美国高防御服务器以及美国高防云服务器等产品,新产品上线华纳云推出了史上优惠力度最高的特价优惠活动,美国云服务器低至3折,1核心1G内存5Mbps带宽低至24元/月,20G ddos高防御服务器低至688元/月,年付周期再送2个月、两年送4个月、三年送6个月,终身续费同价,有需要的朋友可以关注一下。华纳云...

PacificRack(19.9美元/年)内存1Gbps带vps1GB洛杉矶QN机房,七月特价优惠

pacificrack怎么样?pacificrack商家发布了七月最新优惠VPS云服务器计划方案,推出新款优惠便宜VPS云服务器采用的是国产魔方管理系统,也就是PR-M系列,全系基于KVM虚拟架构,这次支持Windows server 2003、2008R2、2012R2、2016、2019、Windows 7、Windows 10以及Linux等操作系统,最低配置为1核心2G内存1Gbps带宽1...

舆情监控系统为你推荐
站长故事部队里什么是站长?最低是什么级别?都有哪些级别啊?真正免费的网络电话谁知道哪个真正免费的网络电话啊?告诉我把3?太感谢了vista系统重装怎样重装vista系统天天酷跑刷积分教程天天酷跑积分怎么获得 天天酷跑刷积分方法bluestacksBlueStacks安卓模拟器官方版怎么用?arm开发板ARM开发板具体有什么作用?有什么商业价值?手机区号手机电话号码开头95共15位号码是什么手机号码?开机滚动条怎么减少开机滚动条?奇虎论坛奇虎是中国的吗?ejb开发EJB是啥玩意了
vps虚拟服务器 inmotionhosting webhosting 12306抢票助手 国外php空间 长沙服务器 国内php空间 网通代理服务器 数字域名 大容量存储器 宁波服务器 hostker ntfs格式分区 徐正曦 速度云 免费网页空间 中国电信宽带测速器 创建邮箱 移动服务器托管 宏讯 更多