舆情基于免疫机理的网络商务舆情监控系统研究

舆情监控系统  时间:2021-02-25  阅读:()

基于免疫机理的网络商务舆情监控系统研究

目录

1、细胞免疫学机理的引入

2、 网络商务舆情监控系统的构建

2. 1 网络商务舆情数据的采集

2. 2网络商务舆情的抗原识别及抗体提取

2. 3网络商务舆情监控系统的整体架构

3、小结

正文

摘要针对网购用户在线评价为主的网络商务舆情本文尝试引入细胞免疫机理借鉴细胞免疫学中的抗原、抗体概念将网络商务舆情中的负面信息视为抗原采用与细胞免疫系统相同的工作机制通过计算网络商务舆情负面信息抗原的特点来提取出抗体再利用

抗体来对网络商务舆情进行准确识别和控制帮助企业更加准确地掌握市场及用户状况为企业营销提供支撑

关键字商务舆情舆情监控免疫机理抗原抗体

据中国质量万里行2016年3月的投诉报告显示 2015年网购投诉仍居各行业投诉之首投诉量为23386例而与此同时在线商品评论的好评率常常接近100%但所售商品仍伴随着居高不下的投诉率或退货率[1] 。在电子商务领域 由于在线交易具有虚拟性、隐蔽性、发散性、渗透性等特点随之而来的网络商务舆情又有数据量大、高度分散、传染性强、随意性大等新的特点这些都迫切需要一个高效的网络商务舆情传播及控制系统为企业的在线商务运营收集各种舆情信息帮助企业应对当前复杂的网络信息传播状况应对日益严峻的电子商务方面的竞争态势。而目前针对网购用户在线评价为主的网络商务舆情研究不多传统的网络舆情监控主要针对的是大型门户网站及重要的论坛、社区、博客等[2] 对网络商务领域中的客户、产品等要素 由于信息量大且关键词不易确定传统的网络舆情监控效果不佳。

本文尝试引入细胞免疫学概念力求突破有限初始关键词以及有限指定网址的局限根据网络商务舆情的传播线路来自动产生抗体关键词及网址扩大信息解析及吸取的范围从而更加准确地开展网络商务舆情监控。企业也可以通过实时的网络商务舆情监督更加准确掌握产品和市场情况监控竞争对手和行业动态是企业市场营销决策的重要支撑。

1、细胞免疫学机理的引入

人类免疫系统经过生物进化被证明是有效的、适应性良好的防御系统。在生物免疫系统与网络商务舆情传播与控制系统的异同点分析的基础上研究建立网络商务舆情传播与控制人工免疫系统的可行性提出网络商务舆情风险的抗原识别机理揭示网络商务舆情的免疫接种机理。在免疫学概念中抗原是入侵者被机体识别后机体会产生反应来消灭不属于机体本身的抗原产生反应形成的物质就是抗体抗体就是来对抗抗原的物质。生物细胞免疫系统防御异物入侵的过程就是一个不断识别风险和处理风险的过程。免疫学研究已经证明每一个类型的抗体都有特定抗原决定基抗体与抗原之间的匹配模式越接近识别效果越好[3]

借鉴细胞免疫学中的抗原、抗体概念将网络商务舆情中的负面信息视为抗原借助细胞免疫系统的相同工作机制测算出网络商务舆情负面信息的相关特点 即抗原特点再根据抗原特点来找出最合适的抗体这个抗体体现的就是机体对负面信息的敏感反应可以用来准确地识别网络商务舆情抗原

本文的核心就是借鉴细胞免疫学机理从已知抗原中提取抗体再利用抗体来准确识别网络商务舆情中的不良信息抗原 增强商家的主动防御能力。其中最关键的技术就是对抗原的识别要对网络商务舆情的负面信息进行各种分类和比对从而产生多样抗体 以识别各类抗原。

2、 网络商务舆情监控系统的构建

2. 1网络商务舆情数据的采集

现有电商平台中的商品数据、评论数据的结构复杂均采用了Frame框架及JavaScr ipt动态写入内容或采用了Ajax技术实时自动刷新内容这些都是普通的数据抓取技术很难处理或无法处理的。先模仿人工通过电商平台的搜索引擎输入初始关键词从多个电商平台上获得初始关键词的相关商品搜索结果再通过这些商品的链接收集进一步的商品详情信息接着重点采集商品的各项用户评价信息尤其是负面评价信息最后对收集到的所有舆情数据进行进一步的清理和整理便于后面的抗原选定及抗体识别。

获取在线商品数据关键就是通过程序来发送网页请求从而获取相应页面的源码然后再对源码进行解析获取到需要的商品信息。观察H TML源码是非常重要的第一步决定了所需数据应该怎么获取。比如仔细查看淘宝搜索页面中某件商品的链接地址其H TML代码如图1所示。

该商品的链接地址是位于"detail_url":"后面的一串字符又以" "view_price"符号结束。把这两个看成是分隔符的话就可以取出该商品的链接地址了。接下来通过商品页面地址将该页所有源代码下载到本地再分析这些数据的组成。其中的用户评论数据是用JS脚本代码获取的在网页源码中研究script脚本代码从中得到JSON格式的用户评论如图2所示。

获取到JS ON格式的用户评论后就可以根据用户舆情数据的文本组成结构对舆情数据进行抽取实现基于网页结构的网络商务舆情数据的自动采集。

2.2网络商务舆情的抗原识别及抗体提取

对采集到的网络商务舆情信息挑选出一部分作为训练集 因为不同的产品对象其抗原及抗体均有差异 因此网络商务舆情的抗原识别及抗体提取应该针对不同领域、不同产品进行分别操作。本文的负面信息训练集主要来自于户外产品的差评从某购物平台上随机抽取并经过人工标注筛选后将其中的500条典型负面评价作为初始训练集。

先采用中科院发布的最新NLPI R 原ICTCLAS中文分词系统对这500条对负面信息抗原进行分词处理再通过语义角色标注

Semantic Role Labeling简称SRL进行语义分析提取出负面信息中包含的评价对象、特征、相应的情感词。如从某条负面信息中提取出评价对象为冲锋衣特征为材质相应情感词为不透气。为了抗体生成的准确性训练集中的负面信息抗原都包含有显式的评价对象、特征、相应的情感词内容。

接着就是要从这些评价对象、特征、相应的情感词内容中提取出抗体基本工作思路如下

●统计评价对象、特征、相应的情感词出现的频率

●计算情感词与评价对象、特征之间的关联关系

●将重点情感词设置为抗体备选

●计算抗体间相似度合并相似度高的抗体

●最终确定抗体主体。

具体的抗原识别及抗体提取过程如图3所示

2.3网络商务舆情监控系统的整体架构

免疫系统对抗原采取的不是以静制动的策略而是以变应变或者通过超变异产生尽可能多的抗体类型的策略 因为不同产品对象的负面信息及风险各不相同 网络商务舆情监控系统也是一个根据监控对象不同而随时自我调节的系统非常适合采用与免疫系统同样的策略进行舆情防御及免疫。将网络商务舆情负面信息作为抗原其抗原基因与抗体基因的结构类型一致 以抗体基因作为研究基础产生的则是网络商务舆情事件的非自体抗原基因库。 网络商务舆情负面信息特质基因则是互补性决定区的抗体基因 网络商务舆情负面信息的识别则依靠特质基因片段识别特定产品领域的网络商务舆情负面信息将免疫机理与网络商务舆情监控结合起来构成一个完整的网络商务舆情监控系统。

在抗体提取之前先进行目标对象的识别分类及该类训练集的准备再依据不同的训练集提取该类别对应的抗体接着基于抗体进行该类别对象的网络舆情监控然后根据不同的监控结果进行持续的抗

体优化最后通过持续地分类别网络舆情监控建立起一个完整的网络商务舆情监控系统并不断更新分类。具体的网络商务舆情监控系统整体架构如图4所示。

3、小结

传统网络舆情监控方法对电子商务领域的舆情识别效果不佳而网络商务舆情中不同产品对象的舆情特点不同恰好与免疫学中的机体免疫机理吻合。因此基于免疫学中的抗原、抗体原理将网络商务舆情中的不良信息视为抗原通过研究抗原特点找出抗体再通过抗体来识别未知的网络舆情可以有效的提升网络商务舆情的监控精度。

本文在抗原识别及抗体提取阶段采用的是目前比较经典的网络文本采集及文本分类识别技术 由于目前的文本识别技术尚不成熟抗体提取的精确性还有很大的提升空间。此外 网络商务舆情中的图片、声音信息的识别及监控也是后期需要进一步开展的工作。

御云(RoyalYun):香港CN2 GIA VPS仅7.9元每月起,美国vps仅8.9/月,续费同价,可叠加优惠

御云怎么样?炎炎暑期即将来临,御云(royalyun)香港、美国服务器开启大特惠模式。御云是新成立的云服务提供商,主要提供香港、美国的云服务器,不久将开启虚拟主机业务。我们的香港和美国主机采用CN2 GIA线路。目前,香港cn2 gia vps仅7.9元每月起,美国vps仅8.9/月,续费同价,可叠加优惠,香港云服务器国内延迟一般在50ms左右,是搭建网站的最佳选择,但是请不要用于违法用途。点击进...

无视CC攻击CDN ,DDOS打不死高防CDN,免备案CDN,月付58元起

快快CDN主营业务为海外服务器无须备案,高防CDN,防劫持CDN,香港服务器,美国服务器,加速CDN,是一家综合性的主机服务商。美国高防服务器,1800DDOS防御,单机1800G DDOS防御,大陆直链 cn2线路,线路友好。快快CDN全球安全防护平台是一款集 DDOS 清洗、CC 指纹识别、WAF 防护为一体的外加全球加速的超强安全加速网络,为您的各类型业务保驾护航加速前进!价格都非常给力,需...

Sparkedhost($8/月)美国迈阿密AMD Ryzen高性能VPS;免费100G高防

sparkedhost怎么样?sparkedhost主机。Sparkedhost于2017年7月注册在美国康涅狄格州,2018年收购了ClynexHost,2019年8月从Taltum Solutions SL收购了The Beast Hosting,同年10月从Reilly Bauer收购了OptNode Hosting。sparkedhost当前的业务主要为:为游戏“我的世界”提供服务器、虚拟...

舆情监控系统为你推荐
印章制作刻章需要什么证件天天酷跑刷积分教程天天酷跑积分怎么获得 天天酷跑刷积分方法安卓应用平台安卓手机下软件哪个网站好ios7固件下载ios 7及以上固件请在设备上点“信任”在哪点?xp系统停止服务xp系统停止服务怎么办ejb开发EJB是什么?网页打开很慢为什么我打开网页很慢网站优化方案一个网站进行优化的流程及步骤服务器连接异常lol为什么总是提示服务器连接异常声母是什么什么是声母,什么是音母?
域名注册中心 怎样注册域名 欧洲欧洲vps 阿里云邮箱登陆首页 59.99美元 表单样式 360抢票助手 青果网 合肥鹏博士 中国电信测速112 申请网页 新世界服务器 域名dns 空间首页登陆 石家庄服务器托管 lamp架构 镇江高防 海外加速 weblogic部署 rsync 更多