网络舆情监测:理论与实践
字体: 16 + -

分析研判篇_第十章 网络舆情传播态势统计与定量分析

第十章 网络舆情传播态势统计与定量分析

第一节 网络舆情传播态势分析概述

网络舆情不同于传统媒体统治信息传播时代的舆情。与传统媒体时代比,网络舆情规模大、形成和变化速度快、互动性强、不确定性和不可控性也强。跟踪、统计、分析网络舆情对于掌控社会舆情具有举足轻重的作用。然而,面对浩瀚的网络内容,如何对信息进行处理、分析,找出舆情传播规律,是网络舆情分析师面临的难题。为解决这些分析难题,各种网络分析方法应运而生。其中,内容分析法因其与网络舆情的传播规律高度吻合而使用较为广泛。

内容分析法(content analysis)是一种对研究对象的内容进行分析,透过现象看本质的科学方法。内容分析法起源于二战时期的传播学领域,主要奠基人为美国传播学家h·d·拉斯维尔和伯纳德·贝雷尔森。贝雷尔森对内容分析法做出被学界广泛认同的定义:内容分析法是一种对具有明确特性的传播内容进行的客观、系统和定量的描述的研究技术。他将内容分析法定义为一种对具有明确特性的传播内容进行的客观、系统和定量的描述的研究技术。

网络舆情具有可视性、可读性和可测量的特征。针对某一舆情事件,分析要素包括热点的新闻和微博、话题的热度、事件发展的时间轴和重要节点、文本倾向分析和媒体观点摘录等。其中,热点新闻可以使用百度指数的数据、各门户网站热点排行数据等;热点微博可以通过新浪微博“微指数”和腾讯微博的相关数据;话题热度可以根据新闻页面、论坛页面或者微博页面的参与数、转发数、评论数、阅读量等指标进行统计;时间轴和发展节点可以通过门户网站专题,或者以时间作为排序依据对百度新闻的搜索结果进行排序。还可以根据微博参与数、微博总数、评论合计、转发合计、转评总数等指标综合判定意见领袖的活跃度。此外,利用一些舆情系统,可自动对相关数据进行抓取,并将相关数据以图表等方式清楚直观地进行展示,从而为得出相关结论提供有力支撑。

分析网络舆情的传播态势,一般需要经历以下实施步骤:

1.确定研究的主题或假设。网络舆情传播态势研究的主题都是确定的,要么是针对单一的舆情事件,要么是针对具有一定共性的舆情现象等。

2.确定研究样本的范围。网络舆情传播态势研究都需要确定样本选取范围,可以是单一的新闻报道、社交媒体,也可以是全部新闻来源,还可以是某类型的新闻来源等。另外,网络舆情的产生都具有特定的时间范围,进行网络舆情研究必然会对时间范围进行限定。

3.从总体中选择合适的样本。对于浩瀚的网络信息,必须对内容进行抽样,其参考指标包括信息来源、时间段等。

4.选择和限定分析单元。分析单元是实际需要统计的东西,它是内容分析的最小单位。在网络舆情分析中,分析的单元包括网民、观点、时间、报道数量、网络参与、评论数量等。

5.建立量化系统。将内容分析法运用于网络舆情研究,包括报道、参与数量、媒体、网民各类观点比例及倾向性分析等,都需要进行定量分析。

6.分析数据。

7.解释结论。

第二节 网络舆情传播速度的统计与定量分析

当前网络舆情传播速度之快、波及面之广、影响力之大,远远超出人们的想象。有些本来只是一般性事件,一经互联网的传播,最后迅速演变升级成为群体性突发事件。与传统舆论相比,网络舆情的受众和传播主体更加分散,形成速度更快,内容更丰富。针对同一舆情事件,在不同的传播平台的响应速度及发酵速度不一,将网站新闻数据、论坛数据、博客数据、微博数据等进行对比,可以分析出舆情热点在不同舆论场的传播速度和广度,从而掌握哪些舆论场更易于传播哪类舆情。

当前,专家学者对网络舆情传播的各个阶段各有主张,他们从不同的视角出发提出了“三阶段”、“四阶段”、“五阶段”和“六阶段”模型。这些模型清晰地反映出了网络舆情在传播过程中所显示出来的阶段特性。但实际上,这些模型只是说法不同,主要阶段都大同小异。我们认为,任何一个网络舆情,它都不会凭空而来,也不会突然消解,均有其发生、发展和淡化的过程。分析舆情的传播速度,就是分析舆情的这一发展周期。

要对舆情的传播速度进行统计和定量分析,我们需要设计出便于统计和计量的舆情传播指标。同时,网络舆情通过网络媒介传播并对受众产生影响,网络舆情对受众影响力的大小取决于舆情要素的内容和区域社会的和谐程度。因此,舆情传播一般应包括如下要素 :

第一,舆情发布者指标。舆情发布者指标主要衡量舆情发布者所受到的关注程度,比如一些具有号召力的网民、意见领袖等。具有号召力的网民和意见领袖的发言一般具有较高的回复率,他们的观点和判断对其他网民有较大的影响力。此外,该要素还包括发布相关信息的时间、发布平台等内容。

第二,舆情性质指标。舆情信息本身的特性对舆情的传播至关重要,不同类别的舆情信息的传播途径及关注度不一样。例如,针对突发事件、群体性事件、政府负面事件、一般社会热点事件等不同类型的舆情,网民关注群体、关注度、舆情的传播媒介等都有或多或少的不同。

第三,舆情受众指标。舆情受众指标包括以下三个子指标:一是衡量舆情对网民造成情绪影响的程度,包括正面的和负面的;二是网民对舆情的参与频率。这一指标主要通过在一段时间内,网民浏览与点击、评论某舆情事件的次数;三是网络分布度子指标,指网民的分布范围和密集程度。

第四,舆情传播所处阶段指标。该指标主要在于确定网络舆情所处的传播阶段,比如是初始阶段还是中期兴盛阶段,抑或是消解阶段等。阶段指标也可以在一定程度上用来判断舆情的影响程度。

第五,区域社会的和谐程度指标。由于舆情是针对特定区域的特定事件的,该事件在网络舆情的引导和刺激下能否进一步发展为公共安全事件,取决于舆情的推动、事件本身的意义以及该事件发生地域的社会和谐程度。

2014年4月,甘肃兰州发生自来水苯含量超标事件。由于受事件影响的居民较多,加之是民众关注度极高的食品安全领域,事件引发严重的社会不满情绪。按前述各指标,本舆情传播进程便可进行追踪和量化:

舆情发布者指标:4月11日上午,新华网率先报道兰州自来水苯超标一事,当天被网络媒体转发140余次,成为事件初期的重要新闻传播源。之后,各网络媒体、平面媒体、电视媒体等纷纷跟进,网民也纷纷通过新闻跟帖、论坛、微博、博客、微信等方式进行消息发布或发表评论。对该指标的分析,主要是要包括消息初发时间、初发媒体源的数量、新闻报道类数量、评论性数量,网民在各阶段的参与数量、评论数量等。

舆情性质指标:本次事件为公共卫生事件,该类事件舆情的传播速度因受事件影响的民众范围、影响程度、政府应对措施等不同而有差别,因此在后续分析中要抓住主要指标。

舆情受众指标:情绪影响方面,

可以通过对媒体的观点进行分类、对网民观点进行抽样统计,分析舆情的情绪影响。本事件中,多数媒体、网民对兰州官方的应对速度提出质疑。网民对舆情的参与频率方面,可按舆情的发展阶段及不同平台网民浏览、点击及评论某舆情事件的次数进行统计。网络分布度方面,可从网民学历、年龄、职业、地域等方面进行统计。

舆情传播所处阶段指标:这一指标可根据媒体报道评论数、网民参与及评论数、事件发展阶段等方面进行确定。媒体报道数方面,比较简单的办法就是通过“百度指数”进行统计。但相关数据会因关键词选择的不同而产生差异,因而并不太精确。要对媒体报道数据进行较为精确的统计,可使用“百度新闻”高级搜索功能对相关主题按日期进行统计。对兰州水污染事件,搜索2014年4月11日至16日的媒体报道数,可统计出相关数据并绘制成图表。

图10-1 4月11日至16日兰州水污染事件媒体报道数走势

从上述图表可以看到,该事件的发展阶段分别为:4月11日为事件初发、12日至13日为发展、14日为**、15日开始逐渐消解。

而网民评论数方面,可综合利用门户网站相关消息的网民参与及评论数、微博消息转发及评论数来综合判断。例如,上述舆情事件中,综合统计各大微博消息数,可得如下图表。

图10-2 4月11日至16日微博关注数走势

从上述图表可以看出,网民关注度并不一定和媒体关注度同步。当相关消息尚未通过媒体广泛传播时,微博网民已经对事件给予高度关注。因此,在进行舆情应对时,针对不同的舆情平台传播特点,其应对方法也应有差异。

区域社会的和谐程度指标:这一指标可通过对舆情的参与程度、媒体、网民的观点倾向等进行把握。媒体观点的统计可选取有代表性的主流媒体观点进行统计。而针对网民观点,要统计海量网民观点,比较可行的办法就是进行网民观点抽样。在兰州水污染事件中,可抽取一定数量的网民观点,将各观点进行分类,并计算出该类观点在所抽样网民中所占的比例,即可直观了解网民和谐程度这一指标。通过抽样分析可以发现,在该事件中,多数网民对官方的处置措施提出批评,并对当前社会安全事故频发表示担忧。

第三节 网络舆情传播范围的统计与定量分析

近年来,随着微博、微信等新媒体及移动互联网的发展和普及,人们通过网络发表自己的观点见解的途径越来越多。众多涉及政府治理、重大突发的热点事件,被媒体及广大网民关注并形成广泛热议。

网络舆情的产生和变动总是在一定的时间和空间内进行的。舆情一旦形成,总要存在一段时间,并在个人以及社会环境因素的影响下不断变化和发展。为统计网络舆情的传播范围,我们引入“网络舆情时空”这个概念。“网络舆情时空”应该是“舆情时空”在互联网上的延伸和拓展。同时,网络舆情的形成和变化也要受到现实社会和网络空间的双重影响。

要对网络舆情的传播范围进行统计及量化,可以根据研究的目的,从不同的维度进行。

一是网络舆情的时间维度。这是各类舆情研究常用的指标,它体现网络舆情传播的持续时间。通常将网络舆情的发展按酝酿、发生、发展、**、消亡来进行划分的,都是以时间为线的。但是,单独这一指标仅能反映出舆情传播的持续时间,无法表达舆情传播的广度、深度等内容。

二是网络舆情的强度。这一指标反映媒体和网民对事件的关注度,通常按一定的时间段内媒体报道评论数,网民参与、关注、评论数等进行统计定量。网络舆情的“量”,即指向某一舆情客体的舆情信息的数量。数量从侧面反映了舆情的强度、倾向以及发展态势,大量且集中反映某一社会问题的舆情信息无疑是舆情信息工作关注重点。

三是网络舆情的空间维度。这一指标包含多个子指标。首先是媒体和网民的地域划分。针对特定的舆情,不同地域的媒体和网民关注度是不一样的。其次是媒体、网民关注的平台划分。媒体有中央媒体与地方媒体、门户网站与其他网站、专业网站与大众网站等划分方法。网民有新闻网站参与跟帖与论坛、博客、微信、qq等社交媒体消息、“大v”与普通网民等划分方法。从相关数据的统计上可以追寻到舆情传播的一些规律并对舆情的走势进行预测。

网络舆情往往与网民社会生活中相关的法律、道德、自然灾害、战争等方面事件较为紧密,尤其是涉及到法律、道德等方面的信息在网络上传播和发酵的广度和深度更为明显。为对舆情热点进行跟踪,可以使用城市舆情热点地图的方法。它是借助网络舆情指数的成果,列举在固定时间段内与某一城市相关的舆情总量和舆情特征。在意见领袖分析中,可通过微博参与数、微博总数、评论合计、转发合计、转评总数等指标综合判定意见领袖的活跃度。同时,依据已有的数据开展舆情事件特征的交叉分析,如分析群体性事件中意见领袖的作用。相关数据来源可采用包括百度数据、微博指数,甚至淘宝指数等在内的广泛数据。此外,重点门户网站也是舆情热点的重要来源。重点门户网站是网上信息发布和交流的重要平台,这里可以提供大量的、及时的新闻事实和评论,在信息传播、社会影响等方面的效果已经超过传统媒体。特别是大多门户网站都设立了新闻热点排行,关注新闻热点排行可以迅速查找近期网络热点。

2015年3月底,重庆市发生因病人不满新的医改方案而堵路抗议的事件。3月25日起,重庆全市各级公立医疗机构正式实施《重庆市医疗服务项目价格(2014年)》。医改共对六大类7886项医疗服务项目进行了价格调整。然而仅仅实施了数天,就引发数百名尿毒症患者及家属集体抗议。4月1日,重庆市卫计委、市物价局喊停实施了7天的医疗调价,要求各医疗机构退还新旧版本差价中患者多支付的费用;对调减项目少收的费用,由医院记账处理。

从时间维度来看,这一事件虽然3月底才发生,但酝酿期却从3月13日开始。2015年3月13日,重庆公布《重庆市医疗服务项目价格(2014年)》,然而,这一与广大民众息息相关的重大政策出台,并没有较大范围地征求民众意见。而且,相关报道均强调新的价格体系中,是遵循了“总量控制、结构调整、有升有降、增减平衡”的原则,广大民众并不知晓具体哪些项目升、哪些降。相关信息未充分地公开,为后期舆情事件的发生埋下了隐患。3月25日新的价格标准执行后,民众的普遍感受是各类医疗价格大幅度上涨。一些需要长期进行治疗的病人群体,如尿毒症患者等更通过各种社交媒体纷纷表达不满和无奈,但并未引起足够重视。3月31日发生尿毒症病人群体堵路抗议后,事件在各社交媒体开始发酵。4月1日,新浪网将《重庆晨报》3月26日一篇题为《医疗调价第一天 医事通挂号暂停》的文章改名为《重庆媒体:市民理解医改后收费》刊出,在网上引起轩然大波,媒体纷纷转载,网民则纷纷吐槽,将舆情事件引向**。4月2日,重庆官方宣布新价格体系暂停实施,并以“答记者问”的形式向公众公布,舆情迅速平息,但网上的相关情况应该还会持续一

段时间。通过“百度指数”查询关键词“重庆医改”2015年3月至4月间的网民搜索数及媒体报道数,可得如下图表。

图10-3 通过“百度指数”查询关键词“重庆医改”2015年3月至4月间的网民搜索数及媒体报道数

从图10-3可以看出,重庆医改舆情事件的持续时间为3月30日开始, 3月31日即达**,4月2日起因重庆相关部门迅速采取措施,舆情快速趋于平缓。但因事件本身的**性及抗议人群的“完全胜利”,4月3日至4月10日媒体关注度仍不时创造高湖,处于震荡期。4月10日之后舆情逐步消解,但至4月20日仍未完全消散。

从舆情强度来看,由于本地媒体受到控制,未对相关事件进行报道,但社交媒体却充斥相关消息及图片。因此,在4月1日前,舆情在媒体上的强度非常小,报道数非常少。但在社交媒体上,虽然相关消息不断被删除,但网民的关注度一直居高不下。4月1日开始,外地媒体对事件进行报道,一些门户网站将相关消息置顶,引发全国媒体及网民的关注**。对相关数据的统计,可以从百度指数、新浪微指数,各门户网站网民参与、评论数,各社交媒体发帖、转发、评论数来统计,相关数据可直观反映舆情的强度。通过新浪“微指数”搜索关键词“重庆医改”,可得图10-4。

图10-4 通过新浪“微指数”搜索关键词“重庆医改”

结合前述“百度指数”相关图表,可以看出,与媒体关注强度不同,网民关注强度在4月1日瞬间达到高湖后,4月2日之后迅速回落。这是因为,网民更多的是关注自身利益,在自身诉求得到解决的情况下,关心热度就迅速降低了。而媒体不同,媒体会根据事件本身的性质对事件背后的消息及存在的问题进行深挖,导致出现4月1日、3日、7日、10日4个**。

空间维度方面,从地域上看,由于相关措施仅在重庆实施,故最先关注的是重庆本地网民。之后,媒体的关注主要是重庆以外的媒体,网民则迅速遍及全国。从平台上来看,4月1日前主要是社交媒体,4月1日之后各网络媒体及社交媒体均参与进来。通过“百度指数”关键词“重庆医改”查询“人群画像”,可得如下图10-5。很明显,重庆网民对事件的关注度最高,其他各省则差距不大但都比重庆少得多。

图10-5 通过“百度指数”关键词“重庆医改”查询“人群画像”

第四节 网络舆情总体评价度的统计与定量分析

舆情信息是民众思想状况(态度、意见、看法、要求等)的一种反映方式。网络舆情的产生是一种复杂的,表现为“刺激—反应”的心理过程。公共事务含有的刺激性信息激发了公众对某一具体议题的情绪、意愿、态度和意见,并包含行为反应倾向。它们不是简单的叠加,是按照从浅显到深刻、从感性到理性、从内隐到外显的顺序发展的。在现有舆情传播研究中,往往更多的是关注舆情本身的传播情况,少有关注媒体、网民的观点立场。

现实生活中的舆情强度往往通过语言、行为等方式来体现。在互联网这个虚拟空间中,舆情强度往往是靠网络言论的措辞、语气、含义等来传达。而网络行为方式,例如网络侵犯行为,则显示了更大的舆情强度。网络舆情强度一般通过观察法、网络访谈和座谈法、网络调查法等得到较为直观的了解。运用内容分析等方法,可以对舆情信息的分布、强度和倾向进行更为深入的分析。对网络舆情总体评价度的统计与定量,我们引入如下指标:

一是网络舆情的热度。网络舆情热度是指当突发事件发生后,网络媒体和网民对事件的报道、讨论以及政府或者网络监管部门提供的引导机制在网络上所形成的突发事件舆情高涨程度。网络舆情的热度不仅仅体现在时间维度上,同时还体现在不同地域网民对突发事件的关注强度。该指标是围绕网络舆情事件产生的一系列新闻报道、网民讨论、政府关注的程度,也可以是参与舆情话题的网民人数占有的比例。在舆情事件发生后,网民的围观、点击、传播及评论均会对网络舆情事件产生一定的影响,导致事件向着积极或者消极方向发展。对这一指标的统计与定量,可以从报道数量、报道集中度、网民参与数、政府介入度等进行分析。

二是观点的倾向性。该指标是针对某一个舆情主题所表达的观点立场。对于媒体和网民的观点倾向,往往是靠舆情主体发表网络言论时的措辞、语气、行为模式等来表示。其中,一些富含情感倾向的词语(如“愤怒”、“绝望”等)或网络示威、网络侵犯等行为则表征着更大的舆情强度。一般来说,该指标需通过人工抽样进行统计,通过抽取来自各平台的观点,根据观点进行分类并计算相关观点数及占总数的比例。也可通过计算机自动抓取技术,通过设定一定的字符、概念及主题等有利或不利的信息数目,衡量各方面的力量对比和倾向。如果是比较简单的观点分类,则可将民众的思想状况分为三类:正面的态度、反面的态度、中立。其中,反面的态度将一些**词包含进去,比如涉及个人隐私的负面舆情信息的内容**度就很高。在实际的舆情信息中,民众就某一热点舆情可能持有支持、反对、中立等多种态度观点,并发生碰撞。不同倾向支持者发表各自观点和看法,并形成了多方的讨论的局面。此外,可以直接在网上设置相关调查话题,对网民观点倾向进行定量统计。新华网、人民网、新浪网、腾讯网等网站在近年全国“两会”期间,专门进行关于民众关注热点的网络舆情问卷调查。一些网站还针对国家重大事件和社会热点,进行网络调查。

三是网民类型分布。该指标用于评价网民观点的价值性。例如,对于同一网络事件,低学历的网民更多的可能是情绪的宣泄,而拥有较高学历的网民则偏重于冷静的思考和建议。因此,对于关注某一舆情事件的所有网民,可以从学历上将其观点所占的权重进行调整。此外,在学历鉴别存在困难的情况下,可以按网民观点的表达方式将网民分成“暴民”、“愤青”、“草根”、“公知”、“旁观”等类型。显然,某一舆情事件中“暴民”、“愤青”类网民即使占比较高,其观点也不能因此被认定为主流,其权重应作适当下调。

2012年9月10日,日本政府确定了钓鱼岛“国有化”方针,11日完成“购岛”协议。我国国内舆论一片哗然,从官方主流媒体到商业性质的网络媒体,从中央领导人到普通民众对“购岛”行动表示强烈的不满、抗议和谴责,纷纷发出“钓鱼岛是中国的、坚决捍卫国家领土主权”的声音。从9月16日至18日,中国内陆多个城市爆发反日示威游行。该事件对中日关系造成严重影响,时至今日中日关系仍未完全解冻。在这一事件中,媒体、网民一致对日本进行强烈谴责。但是,有众多的学生群体在网上借此煽动中日仇恨,煽动对日本公民、企业进行攻击。然而,我们不能就此认为绝大多数民众煽动暴力行动。这是因为,发表这类议论的多为青年学生,他们在关注此类新闻的网民中占有较大的比例,愿意通过网络表达自己的观点。而大量具有理性思考的网民,并不一定通过网络表达了自己的意见。因此,对舆情评价度的分析统计中,要针对不同的网络平台进行综合分析,理清各类观点的强度。

(本章完)