
微博平台网络议程设置研究:以“江歌案”为例
2024-11-01 07:02 浏览:106
摘要
(一)数据抓取
本文通过基于python编程语言的网络爬虫技术,多线程从WAP端模拟登录抓取数据。新浪微博关键词检索方式分为“实时”和“热门”两种。由于新浪微博在一种搜索条件下只能展示100页内容,并且通过实时检索得到的内容以时间倒序排序,故而按最小时间检索单位“天”进行检索,爬取的微博发布时间多限于夜晚,对数据所代表的社会群体造成较大影响。因此,本文采取“热门”搜索方式,以“江歌”为关键词,以最小单位“天”为检索单位,检索2017年11月9日至2018年1月7日之间的热门微博,爬取所有热门微博及其下按热度排序得到的前10页热门评论内容,共计得到6585条热门微博和222482条热门评论。热门微博与热门评论的时间分布如图2所示。
在爬取热门微博内容的同时,我们同时爬取了发布热门微博的账号主体信息,包括账号的微博认证信息与个人简介。该信息用于划分四类主体的网络议程,下文将详细说明。
(二)舆情分期
本文参照网络舆情传播Logistic 模型(兰月新,夏一雪,刘冰月&刘茉,2018),1对抓取数据量进行建模。通过在Matlab中对每日数据量进行拟合,我们发现Logistic模型能够成功拟合数据:当前30天为一组、后三十天为一组时拟合结果误差最小,SSR(sum of the square of the residues)2为1.61。原始数据及拟合曲线如图3所示。
因此,本文以第30天为分界,将研究时间跨度分为两个阶段;阶段1对应五个舆情传播时期,阶段2对应三个舆情传播时期。舆情传播分期时间节点如表1所示,具体舆情传播分期时间段如表2所示。
(三)各方主体网络议程的建构
1.账号主体的划分
因微博提供身份认证,且经过认证的身份会注明在个人简介中,因此本文依据爬取的个人简介信息对用户进行分类,将微博平台上各方主体分为四类,分别是:传统媒体、新闻门户网站及新闻客户端、自媒体、公众。我们通过浏览热门微博所对应的所有主体信息,分别确定了传统媒体、新闻门户网站及新闻客户端、自媒体的划分标准。
传统媒体的划分标准为:(1)经过认证;(2)个人简介中同时含有“官方微博”及以下任意 “报”“刊”“电台”“电视台”“卫视”“广播”“杂志”关键词之一。随后,我们将个别不满足以上条件但属于传统媒体的账号主体归入其中,共有两类:其一,经过个人认证,且个人简介中同时含有“官方微博”及以下任意“《每日经济新闻》”“CGTN旗舰评论类栏目《世界观察》”“亞太日報”“南风窗”词汇之一;其二,经过个人认证,个人简介中含有以下任意“参考消息”“中央电视台北美分台” “河南电视台都市频道”关键词之一。
新闻门户网站及新闻客户端的划分标准为:(1)经过认证;(2)个人简介中含有“官方微博”及以下任意“大公网”“财经网”“AI财经社”“华商网”“北青网”“宜宾新闻网”“未来网”“东方网”“财新网”“界面”“中国互联网新闻中心”“中金在线”“FT中文网”“观察者网”“半岛网”“山东重点新闻网站”“鲁网”“察网”“环球网”“腾讯”“搜狐网”“搜狐新闻”“ZAKER”“壹读传媒”“封面传媒”“网易新闻”“台湾网络媒体NOWnews”“香港文匯網”“新加坡南洋視界網”“一点资讯”“36氪”“中读”“凤凰”“澎湃”关键词之一。随后,我们将个别不满足以上条件但属于新闻门户网站及新闻客户端的账号主体归入其中,其需满足以下条件:(1)经过认证;(2)个人简介中含有“澎湃新闻”。
自媒体的划分标准仅有一种,为:(1)经过认证;(2)个人简介中含有“博主”和“自媒体”关键词之一。其中,“博主”需通过新浪微博的兴趣认证,其标准中包括近30天阅读量≥1万、有指定领域;“自媒体”需满足“持续贡献固定领域内容”“发布20篇头条文章或20条视频微博”。二者都以自己生产内容为主,故而均归为自媒体。
公众主体共有两类:(1)未被认证的热门微博所对应的账号主体;(2)所有热门评论对应的账号主体。因爬取评论对应账号主体时间成本过高,同时评论并不会在个人微博主页显示,身份影响因素较小,故而本文在此默认热门评论账号主体为公众。
依据以上标准,我们对所有热门微博及热门评论的内容进行归类,共得到32个包含原始文本的数据集,分别对应八个舆情分期中四类用户主体。
2.网络节点的建立
我们通过ROST CM6 软件(沈阳,2008)对60天内所有微博及评论的文本内容进行分词;随后,基于python语言对分词结果进行词频统计。由于对分词结果整体进行词频统计得到的词频较高的词语掺杂有大量无实义的助词及代词,指向意义并不明确,故而我们在词频统计时仅选择分词结果中长度大于等于二的词语,并从词频前600的词语中选择词汇以建立网络节点。通过对该600个词语进行分析,我们最终确定170个共计12类具有明确指向意义的词汇类目,分别为:牵涉人物、人际关系、国家、司法、事件梗概、案件细节、观念标准、身份群体、舆论、情绪表达、价值判断、媒体。
3.网络议程的建构
随后,我们基于python语言,在32个数据集中逐条对微博、评论内容进行关键词的“共现”统计,将统计结果转化为12×12的矩阵形式:矩阵的行(列)代表某一词汇类目,行与列交叉形成的单元格的格值代表词汇类目共现的次数。例如:归属于“司法”词汇类目中的“庭审”与归属于“观念标准”词汇类目中的“道德”同时在一条微博或评论中出现1次,则对“司法”所在行(列)与“观念标准”所在列(行)的两个交叉单元格的格值加1;若在一条微博或评论中,归属于“司法”词汇类目的“庭审”“证词”各出现1次,归属于“观念标准”词汇类目的“道德”出现1次,则该两个单元格格值加2。表3即为阶段1缓解期公众网络议程所对应的矩阵,其中C行(列)与F列(行)交汇处单元格格值为52,表示“国家”属性的词汇与“案件细节”属性的词汇在阶段1缓解期同时在一条微博或评论中出现了52次。
三、数据分析
度中心性(degree centrality)是指与某节点直接相连的点的数目(Freeman, 1978)。度中心性越高,表明该节点与其他节点联系越强,越处于网络中心。度中心性因细致考察了节点之间的关联,能够为研究者提供节点背后的更大语境,较统计频次而言提供了更为全面的衡量显著性的方式(Guo, 2015:16)。就总体而言,在“江歌案”舆情传播的第一阶段,牵涉人物是四类主体探讨的中心,进入缓解期后,司法重要程度大幅上升,甚至在饱和期首次超过了牵涉人物;进入阶段2后,司法中心地位进一步提高,案件细节和国家逐渐向中心位置靠拢。公众在两个阶段始终以牵涉人物为中心,三类媒体的议程重点则呈现出不同程度的由牵涉人物向司法的转移。司法在不同阶段中占据中心位置的差异也说明了本文舆情阶段划分的合理性。
图4、图5分别是阶段1、阶段2爆发期自媒体网络议程,二者反映了司法、案件细节和国家词汇所代表节点的度中心性的提高。
本文RQ1为:“江歌案”在微博平台传播过程中,公众的网络议程与各类型媒体的网络议程分别是什么?
对于公众而言,由表5可知:牵涉人物始终处于公众探讨的中心;阶段1缓解期开始,司法进入公众视野,占据重要位置;人际关系自阶段1缓解期后逐渐远离讨论中心。该结果表明:公众对于江歌案的探讨虽始终以牵涉人物为中心,但随事件不断推进,司法在讨论中的中心地位逐渐提高,人际关系被逐渐边缘化。此外,价值判断在多数时期占据较为中心的位置。
与公众议程中司法在阶段1缓解期内迅速上升的热度相比,三类媒体议程中司法的中心地位均出现较早且上升平稳。同时,处于三类媒体议程中心的节点及其顺序更为多变。
对于传统媒体而言,阶段1萌芽期至缓解期的讨论中心为牵涉人物,此后为司法,讨论中心由前者转移至后者。与其他两类媒体相比,传统媒体更注重对媒体有关概念的讨论;人际关系在其议程中不断被边缘化,未出现上升趋势。
对于新闻门户网站及新闻客户端而言,自阶段1爆发期开始司法逐渐向议程中心靠拢,但未出现议程中心从牵涉人物向司法的转移;事件梗概在阶段1萌芽期短暂占据议程中心后中心性不断下降;人际关系出现短暂上升后同样被边缘化。与其他两类媒体相比,新闻门户网站及新闻客户端更注重对案件细节和国家有关概念的讨论。
如表9所示,微博平台“江歌案”舆情传播各时期内,除阶段1爆发期新闻门户网站及新闻客户端议程与公众议程不具有显著相关性外,其余各时期各新闻媒体网络议程均与公众网络议程显著相关,整体来看,相关系数从中等相关为主(阶段1萌芽期至阶段1潜伏期)过渡至高相关为主(阶段1爆发期至阶段2缓解期)再至极高相关为主(阶段2饱和期)3。在阶段1爆发期过后,各新闻媒体网络议程与公众网络议程的相关系数有明显上升。
该结果表明,在微博平台上,随着“江歌案”舆情的不断发酵,公众网络议程与传统媒体、新闻门户网站及新闻客户端、自媒体的网络议程渐趋一致。
值得注意的是,在本研究八个舆情分期中,公众与自媒体的网络议程相关程度始终高于传统媒体和新闻门户网站及新闻客户端的相关程度,其自阶段1爆发期开始便基本处于极高相关的水平。
为回答RQ3,即在微博平台传播过程中各类型媒体间网络议程的相关程度,我们对以下八组议程进行QAP相关检验:(1)1-1-a、1-1-b、1-1-c;(2)1-2-a、1-2-b、1-2-c;(3)1-3-a、1-3-b、1-3-c;(4)1-4-a、1-4-b、1-4-c;(5)1-5-a、1-5-b、1-5-c;(6)2-1-a、2 -1-b、2-1-c;(7)2-2-a、2-2-b、2-2-c;(8)2-3-a、2-3-b、2-3-c。结果详见表10。
对于阶段1而言,除萌芽期外,传统媒体与新闻门户网站及新闻客户端的相关系数均为每组议程相关系数的最高值,且自媒体与传统媒体、新闻门户网站及新闻客户端的相关系数均较低。对于阶段2而言,自媒体与传统媒体、自媒体与新闻门户网站及新闻客户端网络议程的相关系数有所上升,但是,自媒体与传统媒体议程的相关系数始终为三组相关关系中最低值。该结果表明传统媒体与新闻门户网站及新闻客户端的议程较为相似,而自媒体与二者有较大差异。此外,该结果同RQ2的结果共同说明了公众与三类媒体对于江歌案的探讨随舆情不断发酵而渐趋统一。
a=传统媒体,b=新闻门户网站及新闻客户端,c=自媒体;
*** p < 0.001, ** p < 0.01, * p < 0.05
本文采取交叉时滞相关分析(Cross-lagged Correlation Analysis)的方法,以Rozelle-Campbell baseline4作为判定标准,来探究在微博平台“江歌案”舆情传播中,哪一类型媒体议程更能预测公众议程(RQ3)。与传统相关性检验中分析同一时间段变量A与变量B的关系不同,交叉时滞相关分析针对的是两个不同时间点的两个变量,也即时间点1的A变量与时间点2的B变量的关系以及时间点2的A变量与时间点1的B变量的关系。以A设置B议程为例,需要满足以下两个条件:其一,r(A1, B2)>r(B1, B2),其二,r(A1, B2)> Rozelle-Campbell baseline。与此类似,若B设置A议程,则r(B1, A2)>r(A1, A2),且r(B1,A2)> Rozelle-Campbell baseline(Tedesco, 2005)。结果如图6、图7、图8所示。
就传统媒体与公众的网络议程而言,传统媒体对于公众的时滞相关系数(如:阶段1潜伏期传统媒体与阶段1爆发期公众的网络议程相关系数)均小于公众主体自身间的时滞相关系数(如:阶段2爆发期公众网络议程与阶段2缓解期公众网络议程),但绝大多数超过了Rozelle-Campbell baseline值;同时,公众对于传统媒体时滞相关系数均小于传统媒体自身间的时滞相关系数,但其中逾半数的公众对于传统媒体的时滞相关系数超过了Rozelle-Campbell baseline值。因此,公众与传统媒体自身的连续性议程并未受到来自对方施加的影响,彼此间不存在议程设置的关系。
对于新闻门户网站及新闻客户端与公众网络议程而言,新闻门户网站及新闻客户端对于公众的时滞相关系数均小于公众主体自身间的时滞相关系数,但绝大多数超过了Rozelle-Campbell baseline值;同时,公众对于新闻门户网站及新闻客户端的时滞相关系数均小于传统媒体自身间的时滞相关系数,但其中逾半数的公众对于新闻门户网站及新闻客户端时滞相关系数超过了Rozelle-Campbell baseline值。因此,公众与新闻门户网站及新闻客户端自身的连续性议程亦未受到来自对方施加的影响,彼此间不存在议程设置的关系。
而本文在检验自媒体与公众议程设置效果时得到了不同的发现:在自媒体与公众网络议程的七组检验中,有四组检验结果表明公众设置了自媒体的议程——阶段1萌芽期的公众网络议程设置了阶段1潜伏期自媒体的网络议程(r(1-1-d, 1-2-c)>r(1-1-c, 1-2-c), r(1-1-d, 1-2-c)> Rozelle-Campbell baseline=0.64),阶段1潜伏期公众的网络议程设置了阶段1爆发期自媒体的网络议程(r(1-2-d, 1-3-c)> r(1-2-c, 1-3-c),r(1-2-d, 1-3-c)> Rozelle-Campbell baseline=0.823),阶段1爆发期公众的网络议程设置了阶段1缓解期自媒体的网络议程(r(1-3-d, 1-4-c)>r(1-3-c, 1-4-c),r(1-3-d, 1-4-c)> Rozelle-Campbell baseline=0.79),阶段2爆发期公众的网络议程设置了阶段2缓解期自媒体的网络议程(r(2-1-d, 2-2-c)>r(2-1-c, 2-2-c),r(2-1-d, 2-2-c)> Rozelle-Campbell baseline=0.88)。同时,超过Rozelle-Campbell baseline的自媒体对于公众的时滞相关系数仅在四组交叉时滞检验中出现,比例少于传统媒体和新闻门户网站及新闻客户端;然而,绝大多数公众对于自媒体时滞相关系数均超过了Rozelle-Campbell baseline。该情况与传统媒体、新闻门户网站及新闻客户端的议程设置检验结果恰好相反,表明自媒体对于公众的影响力不及其余两种媒体类型,而公众对于自媒体的影响程度却高于其对其它两种媒体的影响;并且,公众在部分舆情传播时期设置了自媒体的议程。
进一步观察发现,公众对于自媒体具有议程设置效果的舆情分期均出现在阶段1、阶段2的较早时期里。因两个阶段对应拟合函数的固有增长率r不同,因此可以将“江歌案”在这两个阶段的舆情传播看作是两个不同“事件”的舆情传播。而公众在这两个“事件”的舆情传播较早分期里,均设置了自媒体的网络议程。这或许说明了微博平台上自媒体的运作机制:在事件发酵初期,自媒体根据公众舆论来调整其信息发布。
四、结语
本文以“江歌案”为研究背景,运用网络议程设置理论对于微博平台上公众议程与传统媒体、新闻门户网站及新闻客户端、自媒体议程间的关系进行探究。通过基于python语言的网络爬虫技术,我们共计获取了新浪微博平台上自2017年11月9日至2018年1月7日间关于“江歌案”的6585条热门微博和222482条热门评论。随后,根据网络舆情传播Logistic 模型,我们对每日信息量进行建模,依据拟合结果将研究时段共分为阶段1、阶段2,分别含五个、三个舆情分期;并通过对整体微博及评论文本进行词频分析及统计,确定了议程的各个“属性”,也即网络议程所对应社会网络中的各个节点。
本文得到了以下研究发现:(1a)公众对于江歌案的探讨始终以牵涉人物为中心,价值判断在多数时期占据较为中心的位置;随事件不断推进,司法在讨论中的中心地位提高,人际关系被逐渐边缘化;(1b)传统媒体讨论中心由牵涉人物转至司法;人际关系随舆情发酵而不断被边缘化;与其他两类媒体相比,更注重媒体有关概念的讨论;(1c)在新闻门户网站及新闻客户端讨论中司法逐渐向议程中心靠近,但未存在议程中心的转移;事件梗概、人际关系随舆情发酵不断被边缘化;与其他两类媒体相比,更注重案件细节和国家有关概念的讨论;(4a)在自媒体议程中,司法逐渐向议程中心靠近,不存在议程中心的转移;人际关系的中心地位呈先上升后下降的趋势;与其他两类媒体相比,更注重对于人际关系、价值判断的讨论;(2)微博平台上,随着“江歌案”舆情的不断发酵,公众网络议程与传统媒体、新闻门户网站及新闻客户端、自媒体的网络议程渐趋一致,公众与自媒体议程最为相似;(3)“江歌案”各舆情分期内,传统媒体与新闻门户网站及新闻客户端的议程更为相近,而自媒体与两者差别较大;(4)公众在阶段1、阶段2的较早舆情分期中设置了自媒体的网络议程,该发现解释了公众与自媒体议程相近的原因;同时,三种类型媒体均不能设置公众的议程。 以上就是本篇文章【微博平台网络议程设置研究:以“江歌案”为例】的全部内容了,欢迎阅览 ! 文章地址:http://lanlanwork.gawce.com/quote/7956.html
行业
资讯
企业新闻
行情
企业黄页
同类资讯
网站地图
返回首页 阁恬下移动站 http://lanlanwork.gawce.com/mobile/ , 查看更多
