舆情基于免疫机理的网络商务舆情监控系统研究

舆情监控系统  时间:2021-02-25  阅读:()

基于免疫机理的网络商务舆情监控系统研究

目录

1、细胞免疫学机理的引入

2、 网络商务舆情监控系统的构建

2. 1 网络商务舆情数据的采集

2. 2网络商务舆情的抗原识别及抗体提取

2. 3网络商务舆情监控系统的整体架构

3、小结

正文

摘要针对网购用户在线评价为主的网络商务舆情本文尝试引入细胞免疫机理借鉴细胞免疫学中的抗原、抗体概念将网络商务舆情中的负面信息视为抗原采用与细胞免疫系统相同的工作机制通过计算网络商务舆情负面信息抗原的特点来提取出抗体再利用

抗体来对网络商务舆情进行准确识别和控制帮助企业更加准确地掌握市场及用户状况为企业营销提供支撑

关键字商务舆情舆情监控免疫机理抗原抗体

据中国质量万里行2016年3月的投诉报告显示 2015年网购投诉仍居各行业投诉之首投诉量为23386例而与此同时在线商品评论的好评率常常接近100%但所售商品仍伴随着居高不下的投诉率或退货率[1] 。在电子商务领域 由于在线交易具有虚拟性、隐蔽性、发散性、渗透性等特点随之而来的网络商务舆情又有数据量大、高度分散、传染性强、随意性大等新的特点这些都迫切需要一个高效的网络商务舆情传播及控制系统为企业的在线商务运营收集各种舆情信息帮助企业应对当前复杂的网络信息传播状况应对日益严峻的电子商务方面的竞争态势。而目前针对网购用户在线评价为主的网络商务舆情研究不多传统的网络舆情监控主要针对的是大型门户网站及重要的论坛、社区、博客等[2] 对网络商务领域中的客户、产品等要素 由于信息量大且关键词不易确定传统的网络舆情监控效果不佳。

本文尝试引入细胞免疫学概念力求突破有限初始关键词以及有限指定网址的局限根据网络商务舆情的传播线路来自动产生抗体关键词及网址扩大信息解析及吸取的范围从而更加准确地开展网络商务舆情监控。企业也可以通过实时的网络商务舆情监督更加准确掌握产品和市场情况监控竞争对手和行业动态是企业市场营销决策的重要支撑。

1、细胞免疫学机理的引入

人类免疫系统经过生物进化被证明是有效的、适应性良好的防御系统。在生物免疫系统与网络商务舆情传播与控制系统的异同点分析的基础上研究建立网络商务舆情传播与控制人工免疫系统的可行性提出网络商务舆情风险的抗原识别机理揭示网络商务舆情的免疫接种机理。在免疫学概念中抗原是入侵者被机体识别后机体会产生反应来消灭不属于机体本身的抗原产生反应形成的物质就是抗体抗体就是来对抗抗原的物质。生物细胞免疫系统防御异物入侵的过程就是一个不断识别风险和处理风险的过程。免疫学研究已经证明每一个类型的抗体都有特定抗原决定基抗体与抗原之间的匹配模式越接近识别效果越好[3]

借鉴细胞免疫学中的抗原、抗体概念将网络商务舆情中的负面信息视为抗原借助细胞免疫系统的相同工作机制测算出网络商务舆情负面信息的相关特点 即抗原特点再根据抗原特点来找出最合适的抗体这个抗体体现的就是机体对负面信息的敏感反应可以用来准确地识别网络商务舆情抗原

本文的核心就是借鉴细胞免疫学机理从已知抗原中提取抗体再利用抗体来准确识别网络商务舆情中的不良信息抗原 增强商家的主动防御能力。其中最关键的技术就是对抗原的识别要对网络商务舆情的负面信息进行各种分类和比对从而产生多样抗体 以识别各类抗原。

2、 网络商务舆情监控系统的构建

2. 1网络商务舆情数据的采集

现有电商平台中的商品数据、评论数据的结构复杂均采用了Frame框架及JavaScr ipt动态写入内容或采用了Ajax技术实时自动刷新内容这些都是普通的数据抓取技术很难处理或无法处理的。先模仿人工通过电商平台的搜索引擎输入初始关键词从多个电商平台上获得初始关键词的相关商品搜索结果再通过这些商品的链接收集进一步的商品详情信息接着重点采集商品的各项用户评价信息尤其是负面评价信息最后对收集到的所有舆情数据进行进一步的清理和整理便于后面的抗原选定及抗体识别。

获取在线商品数据关键就是通过程序来发送网页请求从而获取相应页面的源码然后再对源码进行解析获取到需要的商品信息。观察H TML源码是非常重要的第一步决定了所需数据应该怎么获取。比如仔细查看淘宝搜索页面中某件商品的链接地址其H TML代码如图1所示。

该商品的链接地址是位于"detail_url":"后面的一串字符又以" "view_price"符号结束。把这两个看成是分隔符的话就可以取出该商品的链接地址了。接下来通过商品页面地址将该页所有源代码下载到本地再分析这些数据的组成。其中的用户评论数据是用JS脚本代码获取的在网页源码中研究script脚本代码从中得到JSON格式的用户评论如图2所示。

获取到JS ON格式的用户评论后就可以根据用户舆情数据的文本组成结构对舆情数据进行抽取实现基于网页结构的网络商务舆情数据的自动采集。

2.2网络商务舆情的抗原识别及抗体提取

对采集到的网络商务舆情信息挑选出一部分作为训练集 因为不同的产品对象其抗原及抗体均有差异 因此网络商务舆情的抗原识别及抗体提取应该针对不同领域、不同产品进行分别操作。本文的负面信息训练集主要来自于户外产品的差评从某购物平台上随机抽取并经过人工标注筛选后将其中的500条典型负面评价作为初始训练集。

先采用中科院发布的最新NLPI R 原ICTCLAS中文分词系统对这500条对负面信息抗原进行分词处理再通过语义角色标注

Semantic Role Labeling简称SRL进行语义分析提取出负面信息中包含的评价对象、特征、相应的情感词。如从某条负面信息中提取出评价对象为冲锋衣特征为材质相应情感词为不透气。为了抗体生成的准确性训练集中的负面信息抗原都包含有显式的评价对象、特征、相应的情感词内容。

接着就是要从这些评价对象、特征、相应的情感词内容中提取出抗体基本工作思路如下

●统计评价对象、特征、相应的情感词出现的频率

●计算情感词与评价对象、特征之间的关联关系

●将重点情感词设置为抗体备选

●计算抗体间相似度合并相似度高的抗体

●最终确定抗体主体。

具体的抗原识别及抗体提取过程如图3所示

2.3网络商务舆情监控系统的整体架构

免疫系统对抗原采取的不是以静制动的策略而是以变应变或者通过超变异产生尽可能多的抗体类型的策略 因为不同产品对象的负面信息及风险各不相同 网络商务舆情监控系统也是一个根据监控对象不同而随时自我调节的系统非常适合采用与免疫系统同样的策略进行舆情防御及免疫。将网络商务舆情负面信息作为抗原其抗原基因与抗体基因的结构类型一致 以抗体基因作为研究基础产生的则是网络商务舆情事件的非自体抗原基因库。 网络商务舆情负面信息特质基因则是互补性决定区的抗体基因 网络商务舆情负面信息的识别则依靠特质基因片段识别特定产品领域的网络商务舆情负面信息将免疫机理与网络商务舆情监控结合起来构成一个完整的网络商务舆情监控系统。

在抗体提取之前先进行目标对象的识别分类及该类训练集的准备再依据不同的训练集提取该类别对应的抗体接着基于抗体进行该类别对象的网络舆情监控然后根据不同的监控结果进行持续的抗

体优化最后通过持续地分类别网络舆情监控建立起一个完整的网络商务舆情监控系统并不断更新分类。具体的网络商务舆情监控系统整体架构如图4所示。

3、小结

传统网络舆情监控方法对电子商务领域的舆情识别效果不佳而网络商务舆情中不同产品对象的舆情特点不同恰好与免疫学中的机体免疫机理吻合。因此基于免疫学中的抗原、抗体原理将网络商务舆情中的不良信息视为抗原通过研究抗原特点找出抗体再通过抗体来识别未知的网络舆情可以有效的提升网络商务舆情的监控精度。

本文在抗原识别及抗体提取阶段采用的是目前比较经典的网络文本采集及文本分类识别技术 由于目前的文本识别技术尚不成熟抗体提取的精确性还有很大的提升空间。此外 网络商务舆情中的图片、声音信息的识别及监控也是后期需要进一步开展的工作。

41云,服务器8折优惠券,200G TCP防御

41云怎么样?41云是国人主机品牌,目前经营产品有国内外云服务器、CDN(高防CDN)和物理机,其中国内外云服务器又细分小类有香港限流量VPS、香港大带宽VPS、香港弹性自选VPS、香港不限流VPS、香港BGP线路VPS、香港Cera+大带宽机器、美国超防VPS、韩国原生VPS、仁川原生VPS、日本CN2 VPS、枣庄高防VPS和金华高防VPS;物理机有美国Cera服务器、香港单程CN2服务器、香...

青云互联19元/月,美国洛杉矶CN2GIA/香港安畅CN2云服务器低至;日本云主机

青云互联怎么样?青云互联美国洛杉矶cn2GIA云服务器低至19元/月起;香港安畅cn2云服务器低至19元/月起;日本cn2云主机低至35元/月起!青云互联是一家成立于2020年的主机服务商,致力于为用户提供高性价比稳定快速的主机托管服务。青云互联本站之前已经更新过很多相关文章介绍了,青云互联的机房有香港和洛杉矶,都有CN2 GIA线路、洛杉矶带高防,商家承诺试用7天,打死全额退款点击进入:青云互联...

Sharktech:鲨鱼机房1Gbps无限流量美国服务器;丹佛$49/月起,洛杉矶$59/月起

sharktech怎么样?sharktech鲨鱼机房(Sharktech)我们也叫它SK机房,是一家成立于2003年的老牌国外主机商,提供的产品包括独立服务器租用、VPS主机等,自营机房在美国洛杉矶、丹佛、芝加哥和荷兰阿姆斯特丹等,主打高防产品,独立服务器免费提供60Gbps/48Mpps攻击防御。机房提供1-10Gbps带宽不限流量服务器,最低丹佛/荷兰机房每月49美元起,洛杉矶机房最低59美元...

舆情监控系统为你推荐
斗转星移明星合成图片斗转星移范冰冰合成图印章制作word里如何制作公章?主页改不了为什么我电脑的主页改不了了?淘宝收费淘宝交易收取的费用是多少51自学网站谁能给我免费学习的网站吧 谢谢了安卓应用平台app应用平台有哪些 应用平台哪些开机滚动条开机滚动条太多怎么办?iphone6上市时间iphone6什么时候上市,价格是多少?电子商务网站模板电子商务网站模板有免费的吗?电子商务网站模板哪里有?电子商务网站模板怎么找?分词技术怎样做好百度分词技术和长尾词优化
淘宝抢红包攻略 便宜服务器 cpanel sub-process 网站实时监控 日本空间 qq数据库 好看qq空间 100m免费空间 免费智能解析 绍兴电信 购买国外空间 cloudlink web服务器搭建 双线asp空间 万网空间 阿里云邮箱个人版 apnic 网络速度 中国域名根服务器 更多