舆情网络舆情分析系统的研究与设计(建筑设计范文)

舆情系统  时间:2021-02-25  阅读:()

封面

《网络舆情分析系统的研究与设计》Word格式可编辑可修改

精心整理放心阅读欢迎下载

文档信息

网络舆情分析系统的研究与设计

目录

一、 网络舆情分析系统的总体模型概括

二、 网络舆情信息的预处理技术手段

三、 网络舆情分析系统的语义分析技术

四、结语

正文

网络舆情分析系统的研究与设计

施敏

摘要 网络舆情是指在一定的社会空间内通过网络围绕中介性社会事件的发生、发展和变化 民众对公共问题和社会管理者产生和持有的社会政治态度、信念和价值观。随着科技的发展政府迫切需要更好地监控与引导网络本文通过研究现今网络舆情分析系统的技术特征并根据需要介绍了网络舆情分析系统的一种可行模型能够提高网络舆情分析的准确性和灵活性有效促进我国网络舆情分析工作的迅速发展

关键字 网络舆情 网页文本结构化文本分类文本聚类

互联网的高速发展使网络信息越来越难以处理所以传统的以人工分类为基础的处理方式已完全不能够适应如此规模的网络信息量得处理工作。作为一个新的研究课题对网络舆情的监控和分析必须建立在高科技的现代信息技术当中从而能够及时面对网络舆情并第一时间对其进行主动控制和疏导。

一、 网络舆情分析系统的总体模型概括

网络舆情分析系统根据用户的不同需求对特定种类的以网络为载体的新闻和消息在收集后通过网页净化、词频统计等手段对信息进行有效的预处理活动并将预处理的所得结果入库并通过数据挖掘算法对信息进行分析最后会得到一定时期内网络所出现出现的热点信息并对其进行追踪得到事件的详细信息。

输入输出层面

输入层指互联网搜索、数据源等。随着网络在获取信息方面的便捷性和灵活性的提高许多信息平台如博客、新闻和政府网站都成为网络舆情的监控源。输出层一般来说指的是前端展示输出对于网络舆情分析系统来说其输出程序主要根据用户需要提供信息其信息的种类呈现出多样化的特点。

业务处理层面

网络舆情系统信息采集以及预处理方式

网络舆情监控系统需要在了解用户需求的前提下设定所需主题或目标并利用人工和自动相结合的信息采集手段完成信息收集的任务。 网络舆情信息预处理是网络舆情信息分析系统的准备阶段能够对网页当中的信息进行数据清洗和分类处理后形成格式化的数据然后上传到数据库并进行信息过滤滤除无关信息保存重要信息。

网络舆情数据存储

舆情数据存储主要包含数据入库、 网页快照与附件存储等舆情数据需要在收集后保存在相应的数据库中并需要根据不同种类的信息类型对数据库进行相应的分类。

网络舆情语义分析

网络舆情语义分析作为整个系统最重要的模块能够挖掘出在信息预处理模块中所获得的信息所运用的技术主要有追踪热点、关联分析与趋势分析等能够有效实现网络舆情监控和热点追踪的功能。保证了整个系统基于用户需求即使进行策略调整使整个系统达到运行的最佳状态。

二、 网络舆情信息的预处理技术手段

模板配置法、 网页的文本结构化信息处理法等方法是主要的网络舆情信息数据的预处理方法但模板配置法需设定每个信息源的网站模板使工作量和维护量过大而网页的文本结构化信息处理法利用页面结构分析与智能节点分析转换的方法在自动抽取数据后有效识

别与清除网页内的无效内容所以一般来说 网络舆情系统采用文本结构化处理方法。

Web网页一般包括关注内容和掺杂内容两部分。关注内容是网页的主要内容在一个网页当中其新闻内容、帖子内容等都属于网页的关注内容而掺杂内容指的是诸如搜索条、广告灯与主体内容无关的信息要素。首先利用HTM L网页标签树实现网页净化有效地降低网页结构的复杂性缩减网页空间从而节省后续分析过程的时间和空间花费。

三、 网络舆情分析系统的语义分析技术

网络舆情分析系统语义分析技术主要对各项新闻热点敏感话题等进行分析是整个网络舆情系统的最关键技术是影响网络舆情信息分析结果是否准确的重要手段。对已完成预处理之后的网络舆情信息进行分析和处理产生相应的分析结果库。而算法库以及算法调度和线程处理是语义分析模块的主要工作

算法库管理

算法库能够有效地为每一处理线程生成一种恰当的算法供算法调度程序进行使用在接收管理员的设置和查询要求之后将所设置的特定信息和各种特殊信息要求存储到算法配置信息库中并进行恰当的管理。

算法调度

算法调度主要负责进程的分配以及多线程的管理工作是整个舆情分析的动力构成。通过各种手段控制线程的运行。而且系统为每个用户的个人进程进行控制并可以为一个用户同时处理多个不同的进程。

线程处理

每一个的线程处理就是一次进行文本分类或文本聚类的过程其中包括了权值向量的生成、特征选择或特征抽取、文本分类或文本聚类。首先需要通过算法库确定其中各个部分恰当的算法每个部分根据其特征采用一种特定的算法。并帮助用户根据自身的特定需要进行处理结果的查询并利用恰当的手段和表现方式将这些分析后的所得结果展现给需要查询的用户。

四、结语

本系统的最大优点便是能够灵活搭配算法和自由处理的架构真正实现分析和追踪热点的效应真正实现了热点追踪与分析。随着网络系统的发展若本系统能够大量投入运用将成为各个级别部门的重要网络舆情监控工具并创造大量的经济效益和社会效益。

参考文献

[1] Jianping Zeng Shiyong Zhang Chengrong Wu Jianfengdictive Model for Internet Public .  -11 2007。

[2]王娟.网络舆情监控分析系统构建[J] 长春理工大学学报

2007 4

[3]孟春艳.用于文本分类和文本聚类的特征抽取方法的研究[J] 微计算机信息. 2009(3)

[4]胡学钢董学春谢飞.基于词向量空间模型的中文文本分类方法[J] .合肥工业大学学报(自然科学版) . 2007 10

[5]许鑫章成志李雯静.国内网络舆情研究的回顾与展望[J] .情报理论与实践. 2009 3

“网络舆情分析系统的研究与设计”文档源于网络本人编辑整理。本着保护作者知识产权的原则仅供学习交流请勿商用。如有侵犯作者权益请作者留言或者发站内信息联系本人我将尽快删除。谢谢您的阅读与下载

青云互联19元/月,美国洛杉矶CN2GIA/香港安畅CN2云服务器低至;日本云主机

青云互联怎么样?青云互联美国洛杉矶cn2GIA云服务器低至19元/月起;香港安畅cn2云服务器低至19元/月起;日本cn2云主机低至35元/月起!青云互联是一家成立于2020年的主机服务商,致力于为用户提供高性价比稳定快速的主机托管服务。青云互联本站之前已经更新过很多相关文章介绍了,青云互联的机房有香港和洛杉矶,都有CN2 GIA线路、洛杉矶带高防,商家承诺试用7天,打死全额退款点击进入:青云互联...

vdsina:俄罗斯VPS(datapro),6卢布/天,1G内存/1核(AMD EPYC 7742)/5gNVMe/10T流量

今天获得消息,vdsina上了AMD EPYC系列的VDS,性价比比较高,站长弄了一个,盲猜CPU是AMD EPYC 7B12(经过咨询,详细CPU型号是“EPYC 7742”)。vdsina,俄罗斯公司,2014年开始运作至今,在售卖多类型VPS和独立服务器,可供选择的有俄罗斯莫斯科datapro和荷兰Serverius数据中心。付款比较麻烦:信用卡、webmoney、比特币,不支持PayPal...

10gbiz:香港/洛杉矶CN2直连线路VPS四折优惠,直连香港/香港/洛杉矶CN2四折

10gbiz怎么样?10gbiz在本站也多次分享过,是一家成立于2020的国人主机商家,主要销售VPS和独立服务器,机房目前有中国香港和美国洛杉矶、硅谷等地,线路都非常不错,香港为三网直连,电信走CN2,洛杉矶线路为三网回程CN2 GIA,10gbiz商家七月连续推出各种优惠活动,除了延续之前的VPS产品4折优惠,目前增加了美国硅谷独立服务器首月半价的活动,有需要的朋友可以看看。10gbiz优惠码...

舆情系统为你推荐
spgnux思普操作系统怎么样怎么在qq空间里添加背景音乐怎样在qq空间里免费添加背景音乐?腾讯文章腾讯罗剑楠是何许人也?系统分析员系统分析员的工作内容什么是云平台什么是家庭云平台?blogcnblogcn网页无法正常显示,直接跳转http://www.7t7t.com/7?怎么在图片上写文字如何用美图秀秀在照片上写字购买流量买流量怎么买火狐flash插件崩溃火狐Flash插件经常崩溃关闭qq相册图标如何关闭QQ相册图标之后保留空间相片
虚拟主机99idc 中文域名 过期备案域名查询 国内免备案主机 hawkhost优惠码 美元争夺战 512au evssl证书 国内加速器 免费mysql 静态空间 亚马逊香港官网 南通服务器 万网空间购买 怎么建立邮箱 网站在线扫描 yundun 空间购买 西安主机 lamp怎么读 更多