首页范文网络传播数据分析十篇网络传播数据分析十篇

网络传播数据分析十篇

发布时间:2024-04-25 18:54:02

网络传播数据分析篇1

关键词计算机网络传播方法发展现状

中图分类号:tp311.13文献标识码:aDoi:10.16400/ki.kjdkx.2016.11.073

abstractalongwithourcountryeconomicdevelopmentlevelunceasingenhancement,thecomputertechnologyhasbeenrapiddevelopmentandapplicationofcomputernetworkcommunicationwiththetimelinessandconvenienceofveryhighinformation,hasbecomethesubjectoftoday'seraofinformationdissemination.Butthecomputeritselfhasvirtualsexisverystrong,theinformationstoredtherearegoodandbad,somefalseorbadinformationwillnotonlyaffectthequalityofinformationdissemination,itwillbringbadatmosphereinsociety.Forthis,computernetworkcommunicationisakindofcommunicationwaythatadvantagesanddisadvantagescoexist,onlytofaceuptoitscurrentdevelopmentsituation,reasonableanalysisandresearchtothepresentsituationcanmakethecomputernetworkspreadthehealthyandsustainabledevelopment.

Keywordscomputernetwork;communicationmethods;developmentsituation

S着计算机的普及,依托于计算机的网络传播成为了主要的信息传播途径,比起传统的传播媒介,网络传播更能显示出覆盖面大、速度快以及信息丰富等特征。此外,计算机网络依托于大数据的急速衍生和发展,很多计算机衍生出来的产品都是在创造大数据,比如,医疗卫生、环境卫生、电子商务以及影视节目、科技航天等都蕴含着储量丰富的大数据,大数据下的计算机网络已经成为带动国民经济发展的主体。为此,做好对大数据背景下计算机网络发展现状的研究显得非常有必要。

1计算机网络传媒媒介的现状

1.1计算机网络传播媒介的优势

(1)信息传播的覆盖面非常广。互联网是由各个局域网络连接而成的,能够在世界范围内实现信息的传播和共享,凭借着因特网的强大科技力量可以使信息传递到世界上的任何角落中的计算机当中,无论是在地球上的任何地点,只要存在计算机网络就能够实现信息传播,不会受到时间或者空间的限制,速度和信息容量超过了任何一种传播媒介。

(2)计算机网络传播信息的速度较快。通过计算机能够实现信息的远程传递,并且其具有非常高的便利性和高速性。这一点比起电视、广播、报刊等具有明显优势。因为报纸、杂志等传播媒介在传播时要进行远距离的邮递,花费的时间较长,但是计算机却可以省去邮递的费用,使信息能够得到及时、快速、连续的传播。比如,新浪网是一种信息播出量较多的网站,每天24小时都会连续播出不同类型的信息,每隔5分钟就会滚动出一些新闻信息,大大满足了网民的需求,网民可以第一时间了解到最新的新闻资讯。根据相关的资料显示,我国会有约百分之七十的人选择观看新闻信息。为此,新浪网成为了吸引网民最多的网站。

(3)计算机网络存储的信息非常丰富。传统的传播媒介信息容量非常有限,并且很多的信息都相对固定,单一,而计算机网络则依靠强大的内存有非常高的信息传播功能。首先,计算机信息容量丰富不只表现在信息存储量大的方面,更表现在信息内容的多样性方面。这是因为计算机网络中的信息来源是不同的,不同的信息机构都可以被计算机检索到,还有很多网站上的信息机构,有的信息甚至来源于网民,由此可见,无论是机构还是个人都能够提供信息。

依然以新浪网为例,新浪网能够为网民提供世界各地的新闻,每天的网页浏览量可以达到200万次,在全球具有超过600万的访问记录。丰富的新闻资源是企业网络传播途径所不能比拟的。

(4)计算机网络信息传播有互动性特征。计算机网络除了具有强大的信息传播能力以外还具有非常强大的互动,比起传统的传播媒介,计算机网络传播媒介彻底改变了网民被动式观看或者是倾听的局面,而是能够主动去查看信息或者是传播信息。比如,网民可以通过论坛或者是贴吧等一些平台实现互动。可以说计算机网络完全突破了一点对多点的传播,实现了多点对多点的传播。

1.2计算机网络传播媒介的不足

即使计算机网络已经突破了传统传播媒介的一些不足,实现了信息传播领域的变革,改变着人们的生活方式,但是计算机网络传播也存在一些不足,主要表现在以下几个方面。

(1)网民的知识水平存在差异。传统的传播媒介,比如电视广播对于受众的知识水平要求不是很高,有很多的受众通过电视上的声音也能了解到新闻资讯,但是计算机网络系统硬件和软件非常多,要想浏览完网上的资讯需要一些基本的网络知识作为辅助。很多的中老年人因为文化水平有限,会更加依赖传统的传播媒介,比如,报纸、电视、广播等,可见,具备网络知识的网民会更加喜欢应用计算机网络,为此,要想实现计算机网络传播媒介的普及,就要提高受众的网络知识水平。

(2)计算机网络传播需要有配套的设备。在人们使用传统的传播媒介时,比如,报纸传播媒介只要受众认字就可以,而传播媒介受众需要的设备是一台收音机,但是计算机网络传播媒介下,受众除了需要一台电脑以外,还需要有连接网络的网线、局域网络等。只有各项基础设备都具备时才可以顺利上网。但是在一些较为贫困的地区,受地区经济的制约,当地没有配套的网络设施,电脑数量非常有限,在这种情况下计算机网络传播的普及受到了制约。为此,要想使计算机真正实现普及就要做好对边远贫困地区的扶持。

(3)计算机网络传播在网络建设过程中需要花费大量资金。在计算机网络开通以后,为了保持其稳定运行,必须每年花费一定数量的资金进行维护和建设。以国外的网络建设为例,英国在启动了网络广播以后,各费用加在一起超过了200万英镑,美国网络建设的投入在300万美元以上。因为我国的计算机网络较国外起步较晚,发展相对较慢,为此,用于网络建设的资金非常有限,并且资金问题的解决也相对较为困难。

鉴于上述原因,为了解决资金问题,除了政府的扶持以外,很多的网络媒体企业都会通过广告以及电子商务等解决资金问题,但是随着行业的饱和,网站的资金投入不能与收益产生正比。以我国的新浪为例子,新浪网的运行模式很多地方都是参考着美国的一些网站,广告费用非常高,每个月的支出可以达到300~400万,而每个月广告收入只有200万元。可见,即便是经营状况良好的网站也存在一定困难和风险。

(4)受上网费用的制约。计算机网络区分其他传统媒介的标志之一就是有上网费用,由于上网费用较贵,在城市的每一个家庭中这笔费用每年也是不小的开支,某种程度上很多网民如果不是很需要的话不会安装电脑,这在一定程度上制约了网络传播的发展。很多单独生活的老年人更不会选择应用电脑获取资讯,因为报纸报刊的订阅费用非常少,能够满足老年人心理预期。

2针对计算机网络传播的发展建议

2.1加强信息管理,构建良好的网络环境

通过以上的论述可以知道,网络传播具有便捷性、高效性以及互动性特征,这在一定程度上会使网络监管出现疏漏。一般来说,网络传播实现的途径非常简单,只需要一台电脑和网线,但是对其监管却存在一定难度。在网络中信息的容量是非常巨大的,但是这些信息中还掺杂着一些不良信息或者违法信息,这些信息在进入到了社会中会直接影响社会风气,阻碍和谐健康的网络信息环境的构建,尤其是这些信息一旦进入到校园中会对学生学习和身心健康产生不利影响。我国虽然在严厉打击网络上的违法犯罪现象,但是在网络上依旧会存在一些不健康的信息,为此,必须加强网络传播的监管力度,还要制定与网络信息传播相关的规范制度,以此使企业或者是个人都能够明确监管的权利和义务,对于网络上的不良信息严厉打击。

2.2做好网络技术的安全保护,提高网络信息传播的安全性

安全性是计算机网络传播的前提和重要条件,如果计算机网络在传播过程中受到了病毒的侵害会造成信息的损害,比如,常见的黑客、计算机病毒等,严重的会导致系统的瘫痪,使信息传递受到阻碍,威胁到信息的安全。一般来说,信息的者在信息或者是传递信息过程中容易出现损害,甚至是篡改,从而使信息的安全性不能得到保障,与信息的有所违背,免于受损的信息也有可能感染到系统中的病毒。为了提高电脑的安全性就要做好电脑的保护,可以从技术上进行防范,比如在电脑中安装专门的杀毒软件等,可以对电脑中的顽固病毒进行查杀。此外,在应用电脑的过程中也要时刻提高安全防范意识,有安全隐患的软件尽量不要下载,从而减少病毒入侵的机会。

要想实现计算机网络传播的安全性,还要对信息传播的过程进行监督,各级部门或者单位都要做好网站维护工作,可以对网站进行设置,阻止不健康信息的进入。总之,计算机网络传播在发展中可能会不可避免地遇到一些障碍,但是很多问题都是可以预防的,只要在日常工作和生活中努力做好网络传播安全防范工作,就能够使计算机网络传播更加健康地发展。

3结语

本文主要对大数据时代下计算机网络传播发展的现状进行了分析,可见,计算机网络传播有很多的优点,但同时也存在一些不足,只有正视其在发展过程中面临的问题,并对问题做好防范就可以使计算机网络传播在健康安全的背景下普及。

参考文献

[1]高峰.基于内容安全的局域网监控系统(CSBLan)的设计与实现[D].电子科技大学,2010.

[2]谭晓虹.计算机网络环境下的高职校园文化建设[J].管理观察,2014(15).

[3]冯丽,杨琳琳,陈镱文等.基于中国知网的《西北大学学报》(自然科学版)网络传播历史分析[J].西北大学学报(自然科学版),2010.38(1).

网络传播数据分析篇2

关键词信息传播;社交媒体;逻辑回归;信息转发预测

DoiDoi:10.11907/rjdk.162439

中图分类号:tp302

文献标识码:a文章编号文章编号:16727800(2017)002000403

0引言

互联网的发展及移动智能终端的普及,对人们的生产生活产生了重大影响,越来越多的人选择通过网络渠道表达自身的利益诉求和对社会事件的意见与看法。因此,以网络为媒介的网络舆论成为公众舆论的主要形式之一。研究社交网络中的信息传播机制,有助于各级政府部门更好地了解与把握社情民意,对有效引导和管理社会舆论、化解舆情危机具有重要意义,因而受到众多学者的广泛关注。

已有诸多学者从事在线社交网络的信息传播分析与建模。曹玖新等[1]以新浪微博为研究对象,对各种可能影响用户转发行为的因素进行统计、分析,并建立数学模型。基于微博网关注关系拓扑,利用概率级联模型对给定微博的转发路径进行预测,为预测微博的影响范围提供依据。周东浩等[2]结合网络结构特点、节点内容属性、历史传播数据等信息,提出了一个基于随机游走模型的传播能力排序算法DiffRank,选择传播能力最强的topk个节点作为观察节点来检测网络中可能出现的信息传播。刘继等[3]对网络舆情传播模式中单关键点型、多关键点型、链式型传播模式进行分析,对网络结构中的强势节点和桥节点的作用进行了讨论。李洋等[4]介绍了微博信息的传播过程,通过介绍微博信息传播的定性研究工作,揭示微博信息传播的特点;并从3个不同的角度(以信息为中心、以用户为中心、以信息和用户为中心)对微博信息传播工作进行探索,最后展望了微博信息传播预测研究的问题与挑战。韩佳等[5]针对在线社交网络中信息传播模式的形式特点,结合传染病动力学原理,提出了在线社交网络中的信息传播模型,分析了不同类型的用户在网络中的行为特征以及影响信息传播的主要因素。王超等[6]结合传染病动力学的SeiR模型,建立了适用于社交网络的信息传播模型。该模型基于社交网络用户的行为特征,分析了社交网络的传播机理和网络参数对信息传播过程的影响,得出了动力学演化方程组,揭示了信息传播随时间的演化规律。郭海霞[7]针对新型社交网络开放平台来研究社交网络中信息传播问题,就其传播方式、传播行为、传播路径和传播特点进行了分析研究,同时以新浪微博为例,在分析大量实例的基础上,讨论了信息传播的几种主要模型及特点。其他学者[810]也进行了相关研究工作。

本文提出基于逻辑回归的用户转发行为预测模型,并在twitter数据集上进行实验分析与评价。相关研究结果表明,该模型能够较好地预测用户的信息转发行为,帮助政府各部门了解并控制网络舆论,同时为相关研究领域提供参考。

1基于逻辑回归的信息转发预测模型

1.1逻辑回归模型构建

逻辑回归模型是一种预测分类模型,假设训练集为train,测试集为test,对于数据集train中的每个记录,分类结果是y=1或y=0,其中,y=1表示用户转发某篇推文,y=0表示用户未转发某篇推文。逻辑回归模型可以对测试集test的每一个记录进行预测,判断其是否转发某篇推文。因此运用逻辑回归模型解决问题时,首先运用训练集构建逻辑回归模型,然后针对测试集对分类结果进行预测。逻辑回归方程如式(1):

2实验与分析

2.1实验数据

本文所用的数据为twitter中某篇推文在2012年7月1日到7月7日之间的传播数据,数据包括4个部分:转发网络(Retweetnetwork)、回复网络(Replynetwork)、提及网络(mentionnetwork)、关注网络(FollowingFollowernetwork),数据描述如表1所示。

2.2评价指标

运用Fmeasure和RoC曲线来评价逻辑回归模型。式(6)中α是调节系数,准确率(precision)和召回率(recall)可通过混淆矩阵计算得出。

F1=1+α2×recall×precisionα2×recall+precision(6)

RoC曲线是以灵敏度tpR为纵坐标,以特异度FpR为横坐标,绘制成曲线形式。RoC关注的两个指标可用式(7)、式(8)计算得到。tpR=tptp+Fn(7)

FpR=FpFp+tn(8)

其中,tp表示预测转发并且实际转发,Fn表示预测未转发但是实际转发,Fp表示预测转发但是实际未转发,tn表示预测未转发并且实际未转发。

aUC值是RoC曲线下方面积的大小,其取值范围介于0.5~1.0,aUC值越大表示模型判断力越强。如果模型较好,则其RoC曲线呈凸形,即aUC大于0.5;否则若为凹形,说明模型分类结果不理想。

2.3实验结果与分析

运用逻辑回归模型对测试集进行预测,然后对预测结果进行评价。以0.5为界限划分结果,当概率pi>=0.5,认为该节点转发推文,当概率pi

3结语

本文构建了基于逻辑回归的信息转发预测模型并实现了模型参数求解,提出了基于逻辑回归的信息转发预测算法。运用Fmeasure和RoC曲线对逻辑回归模型进行评价,同时将该模型应用在twitter数据集上进行实验分析,相关结果表明,本文设计的逻辑回归模型能够很好地预测用户的转发行为。

参考文献参考文献:

[1]曹玖新,吴江林,石伟,等.新浪微博网信息传播分析与预测[J].计算机学报,2014(4):779790.

[2]周东浩,韩文报.DiffRank:一种新型社会网络信息传播检测算法[J].计算机学报,2014(4):884893.

[3]刘继,李磊.基于微博用户转发行为的舆情信息传播模式分析[J].情报杂志,2013(7):7477.

[4]李洋,恒,刘挺.微博信息传播预测研究综述[J].软件学报,2016,27(2):247263.

[5]韩佳,肖如良,胡耀,等.在线社交网络中信息传播模式的特征分析[J].计算机应用,2013,33(1):105107.

[6]王超,杨旭颖,徐珂,等.基于SeiR的社交w络信息传播模型[J].电子学报,2014(11):23252330.

[7]郭海霞.新型社交网络信息传播特点和模型分析[J].现代情报,2012,32(1):5659.

[8]ZHanGJ,tanGJ,LiJ,etal.whoinfluencedyou?predictingretweetviasocialinfluencelocality[J].aCmtransactionsonKnowledgeDiscoveryfromData,2015,9(3):126.

网络传播数据分析篇3

目前学术界对危机事件信息传播的研究,主要是运用心理学、社会学、管理学和计算机科学等领域的理论和方法来分析信息传播的主体特性、环境因素、过程、情感倾向、引导政策和热点主题挖掘等等,而对各种关系复杂、规模庞大的危机事件的网络信息传播群体和传播机制研究较少。由于互联网传播信息的快捷和方式多样,使得传播群体呈现出更为复杂化和动态化的特征,传统方法更难从互联网海量信息中发现潜藏的群体特征和行为规律,特别是在对危机事件的事态发展状况的预测和控制上捉襟见肘。这主要是,传统方法对3个重要问题研究不足:(1)如何从危机事件的网络传播特性出发,抽取网络信息的传播群体?(2)如何分析这些传播群体的结构和行为演变规律,并提出相应的组合干预措施?(3)如何发掘传播群体中的重要角色和持不同观点的派系,以对危机事件进行更好的引导和控制?

信息在人与人之间的流动性和舆情观点的形成容易受他人的影响,说明可以使用社会网络(Socialnetwork)的方法来研究危机信息在互联网上的传播。因此,本文将提出一个基于社会网络的危机信息传播研究框架,将危机信息在网络上的传播群体作为主要研究对象,将危机信息传播的主体、传播渠道、传播行为和影响因素等要素有机整合到一个框架体系内来,预期在对危机信息传播的规律及控制方法上有实质性的突破,以寻求对上述3个问题的解答。同时,本研究框架将为政府科学、高效、有序地分析和管理危机信息提供决策参考,提高政府对危机事件的预测能力和应急处理能力。

近年来,不少学者从社会学[1-2]、政治学[3]、传播学、生态学[4]等角度对互联网上信息传播的引导和控制进行了研究;还有学者从互联网危机信息的采集[5-6]、内容分析[7-8]、舆情监控系统[9]等方面来研究信息传播的预测和监控技术。这些研究为危机事件的网络信息传播提供了有价值的理论成果,但是较少涉及到各种关系复杂、规模庞大的传播群体,使得难以有效监控和分析这些群体的信息传播行为,难以及时有效地从传播主体和传播途径上提出具体的危机应急处理方案。

社会网络的方法从危机信息的传播群体这个角度入手,通过对传播群体的特征、结构和行为机制的解析来研究危机信息的传播与控制,成为一个可能的突破口。首先,对危机信息传播的主体即网民所构成的群体进行社会网络建模,以数学形式描述群体关系,便于理解其内在机理并进行特征分析,也为不同传播渠道上的各类舆情传播动力学行为研究提供了基础平台;其次,利用社会网络分析方法(Socialnetworkanalysis,Sna)对群体进行结构测度,可以研究群体的结构对群体功能或者群体内部个体的影响,并帮助角色挖掘和派系分析,探寻危机信息传播的关键人物和骨干网络;最后,在网络模型上的群体动态演变行为则反映了危机信息传播群体的演变过程,它从一定程度上揭示了危机信息传播的规律。因此,本文认为:以危机事件的网络信息传播群体为主要研究对象,运用社会网络的结构分析范式来对不同传播渠道上的危机信息传播网络和传播行为开展研究,可以很好的理解和解释危机信息传播规律。据此建立了基于社会网络的危机信息传播的研究框架(如图1所示)。

1.1危机事件的发展过程

危机事件的持续时间是指从危机潜伏到危机结束所经历的时间。根据网络中危机信息的扩散模型分析,持续的时间越长,危机信息源就越多,越容易产生新的信息,引发群体的恐慌和盲从[10]。StevenFink在1986年提出了危机信息传播的四段论模式:危机潜伏期、危机突发期、危机蔓延期和危机解决期[11]。

由于危机事件本身的发展存在一个过程,所以对于危机信息在互联网上的传播也存在阶段性,不同的危机期所传播的信息在数量和质量上有明显的不同。所以,需要将危机事件的发展过程引入到基于社会网络的危机信息传播框架上来,对各个危机阶段的信息源、信息类型、信息传播特点进行研究。

1.2传播主体

危机事件信息在互联网上的传播,主要涉及三类传播主体:

1.2.1普通网民

互联网环境下的各类新媒体和自媒体的出现,使得网民在危机事件的信息传播中,既是信息传播者也是信息接受者。受众从媒体途径知情信息与议题,并积极给予自己的内容表达,将其体验内容与议题发送到媒体上,给予后续受众。可以发现这是一种“多对一,一对多”的关系,形成的传播系统比链式反应更迅猛[12]。

1.2.2把关人

“把关人”的概念是由美国社会心理学家、传播学四大先驱之一的库尔特・卢因率先提出的。他指出,在群体传播过程中存在着一些把关人(gatekeeper),只有符合群体规范或把关人价值标准的信息内容才能进入传播的渠道。在危机事件的信息传播中,主要的把关人是政府、媒体和互联网服务运营商。政府作为把关人的主要作用是及时地权威、公正的信息,满足公众信息需求。因为,在公共危机中,公众最希望在第一时间获得有关信息,如果公众无法从政府渠道获取,各种流言就会通过多种渠道迅速传播。流言的传播具有快速性、失真性、放大性的特点,可能引发社会的普遍恐慌,加剧事态的恶化[13]。同时,政府还应对舆论进行引导和控制,制止谣言的传播扩散。媒体作为把关人的主要作用是通过环境守望、舆论缓释和社会反思来对公共危机信息进行监督[13],对社会不良情绪进行减压。互联网服务运营商主要指互联网基础设施服务商(如中国电信)和软件服务商(如新浪、腾讯),他们在政府的监管和引导下,针对危机事件中出现的不良信息和非法用户,通过禁止发言、关闭评论、封锁帐号等行为,有效制止网络谣言。

1.2.3造谣者

在危机事件的传播中,还存在一些不法分子在互联网上散播谣言,加重危机事态,对社会带来重大的负面影响。如何识别出这些不法分子的重要人物(如谣言传播的始作俑者),或是群体(如网络水军),成为亟待解决的问题。

1.3传播渠道

危机事件的信息传播以大众传播为主,互联网上传播渠道主要有即时通讯工具(如QQ、mSn)、电子邮件、门户网站、网络论坛以及社交网络(如新浪微博、人人网)等等。这些传播渠道不仅有传统的网络媒体,更多的是新兴的自媒体,使得用户获取信息的方式多样化,能让用户自己快速的生成信息并在多个渠道上同时传播。所以,不仅需要对单一的传播渠道进行研究,还需要描述和表示危机事件信息传播过程中各种渠道之间的相互作用和影响。

1.4传播行为

危机事件信息扩散网络中,各个行为主体对于危机事件的认识和倾向的不同导致了他们不同的行为(如、评论、转发等),这些行为成为了这些主体具有与其它主体连接的驱动力。网络的形成依赖于众多主体的连接决策,危机中的公众是由于个人通过观察他人的行为来调整自身预期而产生一致的群体行为。目前有关危机事件信息传播网络的研究较少考虑主体的这种策略行为以及传播网络形成演化如何受主体策略行为的影响,因此难以解释危机事件的信息扩散和观点演化的内在驱动力,从而也无法根据宏观层次上网络结构的变化来提供对微观层次上主体行为的引导控制建议。所以,需要研究解决如何定量刻画主体传播行为的问题,并实现对主体策略行为和网络结构相互影响的整合。

1.5影响因素

根据传播说服理论,影响信息传播意愿和效果的因素可划分为三大类:来源特征、传播内容特征和接受者特征。危机事件信息传播也属于信息传播的一类,所以其影响因素也可以考虑分为如下三类:

1.5.1来源特征

来源特征的专业性、可靠性和客观性3个维度均影响危机信息的传播意愿和传播效果。在来源特征的研究中,谣言扩散理论认为来源可信度对受众的再传播和扩散谣言的行为意愿具有正向的影响[14]。来源的专业性是指信息发送方让信息接收方所感受到的能够提供正确信息与表现出专业行为的能力。客观性是指接受者对传播者的公开性、公正性和中立性(不带有主观偏向)的评价与感知[14]。

1.5.2传播内容特征

危机事件的信息传播内容特征主要是危机事件的类型、危机编码和解码、信息格式以及噪声。不同类型的危机事件,其对外传播的动力差异较大,比如公共性很强的危机事件容易被公众关注,并且易于迅速传播[15]。危机编码指危机处理组织对外公布危机信息所采用的方式、策略等内容。危机解码是公众对危机信息进行解读的过程。解码过程受到公众的背景信息的影响。危机编码和解码的好坏会直接影响危机事件的信息接受效果[15]。信息格式是指文字、图片、音频、视频等不同的类型,有着不同的传播速度和吸引度。噪声是妨碍危机信息传播并能够造成信息失真的干扰因素,它存在于危机传播中的任一环节。如不准确的沟通语言、难以辨认的字迹、不合实际的举止、小道消息、谣言等,这些都属于噪声。噪声能够降低危机信息传递的有效性,使得危机发送与危机接收之间产生较大的差异[15]。

1.5.3接收者特征

每个接收者受到个体特质(如职业、教育程度、年龄等)、心理因素(如危机恐惧感知、对政府媒体信任倾向、防备心态等)和社会环境等因素的制约,进而影响他们接受信息的效果。根据CnniC的报告[16],2011年6月,中国网民规模达到485亿,中国互联网已经走过高学历人群普及阶段,大专及以上学历人群网民普及率已经超过90%,互联网正在向高中、初中等学历人群扩散,低学历人群的网民不断增加。同时,低年龄层的网民数量也大幅增加。这使得在危机事件中,网民缺乏社会经验,考虑问题不成熟,更容易冲动,产生群体极化,互联网也容易出现庸俗、灰色的言论。

2.基于社会网络的危机信息传播的研究框架的分析步骤和主要内容本框架以危机事件的网络信息传播群体为主要研究对象,运用社会网络的结构分析范式来开展研究,最终目的是为了理解和解释危机信息传播网络以及构建基于这些网络结构之上的传播行为。因此,本框架的分析步骤是通过采用“结构一功能主义”的系统观点对传播网络进行整合分析:首先,对危机事件的发展过程、信息传播渠道和影响因素进行了分析,掌握危机信息传播的特征;其次,从结构角度来研究传播主体所形成的传播网络,剖析网络结构、关系和个体的要素组成及要素间作用机制;再次,从系统表征与功能作用入手,分析特定的传播网络结构下的传播行为。最后,利用实例数据和原型系统对理论进行检验。具体的分析步骤和主要内容如图2所示:图2如何建立基于社会网络的危机信息传播框架

2.1危机信息的传播特征和影响因素

危机信息传播具有信息来源广泛、信息流巨大、渠道多样、传播迅速等特点。首先,应与各级政府、组织和机构紧密合作,获取危机案例,并通过网络获取大量的各类危机事件的网络信息传播的具体案例,建立数据集和事例集。然后,利用真实危机事件的数据分析、时空分析和事件演化分析方法,剖析危机事件的发展过程及对应的关键要素、信息传播的渠道特征、路径规律等,为危机事件网络信息传播规律和控制模式奠定基础。最后,通过实证的方法研究危机信息传播的影响因素(来源特征、传播内容特征和接受者特征)。

2.2危机信息的传播主体研究

2.2.1危机信息传播的主体网络构建

危机事件在不同的生命阶段和传播渠道中,表现出各异的传播网络结构和特征。因此,需要研究危机事件网络信息传播中行为主体(网民)的特征、行为模式,以及主体间的关系搭建的内在驱动力。以此为基础,针对不同粒度级别的危机事件信息扩散网络进行抽取,并结合危机事件特殊的信息传播特征,研究传播网络的节点分布状况、链接关系,引入合适的参数,实现节点特征的形式化描述和链接关系表达式,提出支配网络化过程的算法,从而构建危机事件信息扩散的主体网络模型,作为下一步研究的基础。

2.2.2危机信息传播的重要角色挖掘

实施对网络关键节点的有效引导,可以更好的控制危机事件的信息传播。Sna首次出现于20世纪30年代末,它用于描述和测量行动者之间的关系或通过这些关系流动的各种有形或无形的东西,如信息、资源等[17]。因此,作为分析信息交换的一种方法和系列化的技术手段[18],Sna可以适用于互联网信息传播的研究。Sna对网络结构的分析主要分为基于代数模型的定量分析和图论的图形分析[18]。Sna已有的基于个体分析的主要指标有:程度、中心度、结构空洞等,它们反映了整个网络的规模、聚合程度和有效性;已有的基于整体分析的主要指标有:网络密度、网络中心度、网内亲近度、网外亲近度等,它们反映了整个网络的规模、聚合程度和有效性。因此,需要针对危机事件的特征,使用Sna方法和UCinet软件,设计一套动态的综合测度算法来测度危机事件信息扩散网络中节点(集)的重要性,并据此来对危机信息扩散网络中的重要角色进行分类及其特征研究,探寻危机事件信息传播的发起人、意见领袖、把关人等关键人物。

2.2.3危机信息传播的派系分析

随着危机事件在网络上的传播,持相近观点的人容易聚集成一个个群体,并不断发展成独立的派系。这些派系极大的左右着网络主流观点,影响危机事件的事态发展,特别是“网络水军”和敌对组织更需要我们进行识别和控制。Sna已有对小群体(clique)、同位群(block)、社会圈(socialcircle)以及网络中识别群结构的算法的分析方法,比如层次聚类算法(hieraticalclusteringalgorithm)和谱分析(spectralanalysis)方法以及基于边的介数的方法等[19-20]。因此,需要在Sna方法的基础上,研究网络的聚集系数和分层结构特征,提出基于分层聚类的危机事件信息传播网络的群识别算法,进行信息传播的骨干社团挖掘。还可以研究网络不同群规模分布下的群体压力、群体极化、群体互动,以及其对个体态度和观点的塑造和演变。

2.3危机信息的传播渠道研究

2.3.1危机信息的传播渠道整合

危机信息传播渠道不再是单一的网络,而是多种网络的结合。但目前的研究局限在单一信息传播渠道(如博客、电子邮件、网络论、p2p系统等)上,并不能很好地反映危机事件本身传播的特征规律。因此需要考虑危机信息传播途径的多平台、异构性等特点,引入合适的参数,来描述和表示危机信息传播过程中各类传播渠道之间的相互作用和影响。

2.3.2危机信息传播的关键路径控制

危机信息传播有多种扩散渠道和扩散路径,需要根据Sna的方法和信息流特征,对实际网络信息进行数据分析和仿真实验,分析信息扩散的路径规律,建立一套有效的探寻危机信息传播的关键路径的算法,从而有效地阻断、截流危机事件的网络谣言,对网络信息进行正确的疏通引导,提高政府的网络信息控制能力。

2.4危机信息的传播行为研究

综合复杂网络模型和传播模型对危机事件的信息在互联网上的扩散过程进行网络动力学建模,建立危机事件的信息扩散模型,并将危机信息传播的重要实际特征如主体行为机制、信息扩散过程中的时延情况、多路径扩散的冲突情况等纳入到信息扩散模型中来。用计算机仿真的方法,研究信息扩散过程中的重要参数(初始节点分布、活跃节点比例、传播率、危机程度等),把握信息扩散控制的关键所在。此外,建立网络结构和主体行为机制的动态耦合模型,着重考察信息扩散主体的态度倾向、下级传播节点选择策略和实时动态反应这些微观行为机制对危机事件信息扩散网络结构和扩散行为的影响,以优化危机事件预警的信息模式和增强危机信息传播的引导控制能力。

3.总结

本文综合运用社会网络理论、传播理论和信息行为学等理论和方法,将危机事件信息传播的主体、传播渠道、传播行为等要素有机整合到一个框架体系内来,预期在对危机事件的信息处理、实时监控、应急决策上有实质性的突破,具有重要的理论意义。同时,该框架对危机事件的网络信息扩散与控制的研究既可以把握灾情、人群心理情绪等方面的变化,又可以对人群心理和行为的演化产生巨大的作用力,对于向人群传递事件真实情况、避免恐慌具有重要的意义。因此,本框架提出为政府科学、高效、有序地分析和管理互联网信息提供决策参考,提高政府对危机事件的预测能力和应急处理能力,具有重要的实际应用价值。

参考文献

[1]毕宏音.舆情视野中的网民上网行为分析[J].广西社会科学,2007,(4):157-160.

[2]张丽红.从网络舆情传播的角度谈文化安全[J].社科纵横,2007,(2):129-131.

[3]徐晓日.网络舆情事件的应急处理研究[J].华北电力大学学报:社会科学版,2007,(1):89-93.

[4]袁志秀.基于生态学的信息传播模式[J].情报杂志,2005,(3):14-16.

[5]赵颖斯,刘云.BBS舆情系统的数据采集方法[J].电信快报,2008,(12):22-24.

[6]albertoHF,Laender,Berthiera,etal.aBriefSurveyofwebDataextractiontools[C].aCmSiGmoDRecord,2002,31(2):84-93.

[7]黄晓斌,赵超.文本挖掘在网络舆情信息分析中的应用[J].情报科学,2009,(3):74-79.

[8]曾依灵,许洪波.网络热点信息发现研究[J].通信学报,2007,28(12):141-146.

[9]许鑫,章成志.互联网舆情分析及应用研究[J].情报科学,2008,26(8):1194-1204.

[10]魏玖长,张岩,任轶群.危机事件新闻报道数量的时间演变模式研究[J].图书情报工作,2009,52(11):57-74.

[11]FinkS.Crisismanagement:planningfortheinevitable[m].newYork:americanmanagementassociation,1986:34-36.

[12]顾明毅,周忍伟.网络舆情及社会性网络信息传播模式[J].新闻与传播研究,2009,16(5):67-73.

[13]李春华,龙厚仲.公共危机信息传播模式及其运行[J].中国人民公安大学学报:社会科学版,2010,(5):23-27.

[14]陈明亮,章晶晶.网络口碑再传播意愿影响因素的实证研究[J].浙江大学学报:人文社会科学版,2008,38(5):127-135.

[15]魏玖长,赵定涛.危机信息的传播模式与影响因素研究[J].情报科学,2006,24(12):1782-1785.

[16]CnniC.2011年中国互联网网民调查报告[eB/oL].,2012-01-17.

[17]BurtRS,minormJ.appliednetworkanalysis:amethodologicalintroduction[m].BeverlyHi11s:Sage,1983.

[18]Francescomartino,andreaSpoto.Socialnetworkanalysis:abrieftheoreticalreviewandfurtherperspectivesinthestudyofinformationtechnology[J].psychnologyJournal,2006,4(1):53-86.

网络传播数据分析篇4

基金项目:江苏省大学生创新创业训练计划项目:企业网络舆情预警机制,项目编号:201413989013Y;部级创新创业训练计划项目:媒体态度、网民属性、政府处置因素对公众舆情感知的影响研究,项目编号:SZDG2014030。摘要:运用社会网络分析方法,选取2014年“台湾地沟油”事件的新浪微博数据作为样本,分析个体位置角色指标和子群分析指标两方面,挖掘网络舆情“意见领袖”,关注子群间的弱联系。根据研究结果提出对企业网络舆情预警机制的建议。

关键词:网络舆情;社会网络分析;食品安全;企业预警;舆情预警

引言

随着互联网的高度普及,它已成为继报纸、广播、电视后的“第四媒体”,网络已成为人们发表言论的重要阵地。网络的高度自由,使公众可以发表各种观点和看法,形成网络舆情[1]。

近年来,在企业危机的各类事件中,网络正在演变为诱发、扩散、影响企业危机的重要因素。一些企业突发事件经过网络传播形成强大的“井喷型”舆情,而喷涌的网络舆情直接影响到企业发展和存续[2]。可见,企业对网络舆情处理不当,可能导致人们对企业产生不信任感。因此,企业制定网络舆情预警机制是在新形势下提高企业预警能力,推动企业良性发展的重要途径。

1、研究设计

1.1食品安全问题网络舆情概述。目前,我国食品安全事件屡屡发生,形势不容乐观。一些食品安全舆情事件经过网络迅速传播,直接影响到企业发展。如2014年“上海福喜肉”事件导致上海福喜食品有限公司所有相关产品被停止销售、使用;2014年台湾“地沟油”事件导致强冠企业等多家企业卷入法律责任的漩涡。在这些食品安全网络舆情中,企业对食品安全网络舆情处理不当,引起公众对企业的认同危机。

企业作为食品安全网络舆情的“主角”,如果不能积极应对,可能引发网民对整个食品供应链的恐慌。不仅使涉事企业在声誉、生产经营、证券市场的信用资本在短期内大量流失,甚至会产生整个行业巨大的负面效应[3]。

1.2数据收集与处理。在整理2014年食品安全网络舆情事件基础上,选取具有代表性的网络舆情事件,基于“台湾地沟油”事件食品安全事件,构造网络舆情传播网络。以新浪微博为数据搜集平台搜索台湾地沟油舆情事件,根据微博的转发关系:若成员a转发了成员B的信息,则代表a与B的联系为1;若成员B没有转发成员a,则B与a的联系为0。通过数据整理,构建349×349邻接“转发关系矩阵”,并生成“台湾地沟油”事件网络舆情传播网络关系图,对其生成的网络舆情传播网络进行可视化处理,如图1。

图1直观地展现了“台湾地沟油”事件网络舆情传播网络的结构。比较重要的4个节点编号分别是1(微博iD:王志安)、4(“陶蛋520”)、57(“西西福厮”)、67(“今晚报”)。由图看出,1、4、57、67这4个关键节点实现了此微博的信息贯通,传播范围不断扩大,网络舆情跨群体流动,社会影响不断加深。

2、实证分析

社会网络分析(Socialnetworkanalysis,简称Sna)是一种研究社会结构和社会关系需要的分析方法,用于分析某一特定范围内行动者的关系状况,寻找关系的特征以及发现关系对组织的影响。社会网络分析主要内容有中心性分析、结构洞分析、凝聚子群,上述指标按照用途可以划分为个体位置角色指标和子群分析指标两类。

2.1关键节点挖掘

2.1.1中心性。中心性是衡量个体位于网络中心程度的指标,反映个体在网络中的重要程度。中心性指标主要有3类,点度中心性、中间中心性和接近中心性。

a.点度中心性。点度中心性测量的是一个点与其它点发展交往关系的能力。如果一个行动者的点度中心性越大,说明该行为者处于中心位置,拥有较大的权力。计算“台湾地沟油”事件网络舆情传播网络的点度中心性(见表1)。

由表1可见,在该事件网络舆情传播网络中,点度中心性最大的为编号为1的行动者。该行动者处于传播网络的中心,说明其拥有的权力最大,信息资源掌控能力最强。而其他行动者的点度中心性普遍较低,仅仅充当舆情信息的受众,在舆情信息的传播在很大程度上要依靠编号为1的行动者。因此,企业在舆情预警和监控过程中要重点监控编号为1的这类处于传播网络中心的行动者。

b.接近中心性。接近中心性是行动者与网络中其他行动者的接近程度。如某个行动者的接近中心性的值越小,说明该行动者与网络其他行动者之间越接近,独立性越强,则在获取信息时越不易受其他行动者控制。计算“台湾地沟油”事件网络舆情传播网络的接近中心性(见表2)。

由表2可见,编号为1的行动者接近中心性的指标值最小。表明该行动者能通过最短的路径与其它行动者联系,具有较强的独立性。接近中心性指标值较小还有编号为4、143、67等的行动者,其他行动者的接近中心性都比较大,说明他们在接收和传递信息的过程中,对1号行动者的依赖性较大,因此,加强对编号为1的这类独立性强的行动者监控,是企业网络舆情预警的重点工作。

2.1.2结构洞理论分析。结构洞是一种定位网络舆情领袖的方法,是网络中控制舆情流动的“阀门”。舆情行动者在网络中占有的结构洞越多,其在舆情事件中占据的主导权越大。按照行动者的有效规模(由大至小)和限制度指标(由小至大)排名情况,整理结构洞指数结果如表3所示。

由表3可见,编号为1、143、67、4的行动者有效规模较大,说明网络冗余程度较低,该行动者在传播网络中的地位重要,对其他行动者控制力较强。同时,有效规模较大的4个行动者的限制度指标值都较小,表明这些行动者不易受其他行动者的控制,更易获取信息资源。另外,表中行动者的等级指数都较小,说明行动者约束性差别小。综合有效规模值、限制度值和等级指数值可见,编号为1、143、67、4的行动者在传播网络中占据较多的结构洞,可获取更多非冗余的信息资源,进一步扩大舆情传播范围。

2.2凝聚子群分析。迄今为止,并没有比较明确的“凝聚子群”的含义,大体上说,凝聚子群是满足如下条件的一个行动者子集合,即在此集合中的行动者之间具有相对较强、直接、紧密、经常的或者积极的关系[4]。

2.2.1成分分析。成分分析是建立在“子群内外关系”基础上的凝聚子群。成分是指满足以下条件的群体,群体内部成员之间存在关联,而群体之间没有任何联系[5]。对“台湾地沟油”事件网络舆情传播网络做成分分析,发现该事件网络舆情传播网络只有1个成分。表明该网络是连通的,网络中每个凝聚子群不仅内部存在关联,而且各子群之间也存在联系,即信息可以实现大范围流动。因此,企业网络舆情预警工作必须做到迅速有效,尤其在企业负面信息迅速传播前,企业应第一时间做出回应,从而减小其对企业的不利影响。

2.2.2k-核分析。k-核分析是建立在点度数基础上的凝聚子群。k值的大小标志k-核的松散程度,如果k值越大,表明k-核越紧密,反之,k-核越松散。对“台湾地沟油”事件网络舆情传播网络进行k-核分析(见表4)。

由表4可见,共有16个行动者k值最大(值为2),占据该事件舆情传播网络行动者总数4%,表明传播网络中行动者之间联系较松散,不存在联系紧密的凝聚子群,但是弱联系同样会影响子群间的信息传递。

3、结论与建议

基于对企业网络舆情预警的定量研究较为匮乏,对食品安全网络舆情的社会网络分析尚处于空白状态,本文搜集2014年“台湾地沟油”网络舆情的转发数据,构造“台湾地沟油”网络舆情传播网络,运用社会网络分析方法对此事件网络舆情传播结构和节点进行了深入研究,分析企业食品安全网络舆情网络结构并挖掘网络中的关键节点,得出以下结论:

(1)发挥“意见领袖”导向作用

通过中心性的测量,点度中心性较高、结构洞较多、接近中心性较低的行动者通常是舆情网络中的“意见领袖”,“意见领袖”是导致企业网络舆情持续传播的关键节点。因此,企业需认真挖掘“意见领袖”,加强与其密切合作。在企业出现消极网络舆情时,与“意见领袖”协调联系,改变其中心性和结构洞来发挥导向作用,引导网络舆情发展趋势。此外,企业应重点培养中高管理者成为“意见领袖”,使其占据结构洞核心位置,发挥小规模网络结构的优势,抑制消极网络舆情传播速度。

(2)重视网络子群弱联系

通过凝聚子群分析,发现该网络舆情传播网络是连通的。网络结构中各子群间以及子群内部成员间呈现出弱联系,即不存在紧密的凝聚子群,导致网络舆情传播较为松散。但是网络中弱联系同样会影响信息传递和舆情范围。因此,在监控网络舆情时,企业可适时引入舆情引导者,发挥弱联系的桥梁作用,使其引导或改变众多处于边缘的行动者观点,避免消极网络舆情在较短时间内的扩散和非理性集群行为的发生。

参考文献:

[1]王全兰.网络舆情信息采集及预警方法研究[J].管理工程师,2012,02:34-37.

[2]方付建,任一奇.企业舆情危机事件:诱因、态势与应对[J].情报杂志,2012,03:25-28.

[3]林萍,黄卫东,洪小娟.全媒体时代我国食品安全网络舆情构成要素研究[J].现代情报,2013,11:12-16.

[4]wasserman,S.,&FaustK..Socialnetworkanalysis:methodsandapplication[m].Cambridge:CambridgeUniversitypress,1994.

[5]平亮,宗利永.基于社会网络中心性分析的微博信息传播研究——以Sina微博为例[J].图书情报知识,2010(6):92-97.

作者简介:

董凯欣,本科,南京邮电大学通达学院,研究方向:网络舆情;

傅荧,本科,南京邮电大学通达学院,研究方向:网络舆情;

网络传播数据分析篇5

近年,随着具有短距线通信能力(如Bluetooth、wi-Fi、Zigbee等)的移动智能设(诸如智能手机、pDa、可设)的模普及,人们常生活中的信息可以几近完整地下,这不仅迚传统社会网络[1]及机会网络[2]信息感知、理和传播等领域的研究,也使得对人的真实社交情形迚行更加深О地研究以提出更加高的消息传播机制成为可能。随着移动互联网的兴起,作为社会网络和机会网络结合的产物,移动p2p社会网络[3]益受到研究学者的关注,成为线网络领域的一研究热点。移动p2p社会网络是一类节点间通过对等通信自组织组网形成的网络。该网络的节点是具有短距线通信能力的移动智能设。设虽法自主移动,Ξ赖其载(人)的社会性移动,设间可収生幵迚行信息交换,使这通信模式具有典型的社会性。移动p2p社会网络主要针对人的社会属性或人的移动性对网络动态性的影响、人的社会关系演化对网络形态演化的影响、如用人的社会性或移动性提升网络消息传播率等面内容[4]迚行研究。移动p2p社会网络的关研究不仅可应用于传统社会网络所涉及的瞬态社交网络、基于情景的移动社交、基于个性的广推送等面[5],还对城市划、疫情扩散、社会关系掘与分析等领域有重要指导意[6]。如今这个社交活动从娱乐化向工具化过度的时代,移动p2p社会网络疑具有良好的研究前景和应用价值。而“追踪、収现对消息传播有关键作用的节点”这类问题,一是该领域的热点问题。移动p2p社会网络是杂网络的一,一面该类网络节点数目众多,另一面该类网络节点因具有杂的社会属性而使节点的移动模式杂多变,最终导致节点具有较的动态性。移动p2p社会网络中,节点间几乎不存完整的端到端径,节点不Ξ定的基础设施,采用“存储-携带-转収”的数据传输模式,用智能设的短距通信接以自组织的式与其它设収生而交换信息。由于节点各自的社会性上存差异,导致节点的移动性不同幵有不同的模式,最终使不同节点有不同的消息传播与消息获取能力。如这类网络中収现消息传播的关键节点,幵用其提升网络消息传播率成为研究学者们普关注的问题。已有的杂网络研究工作[7][8]中,学者借助社会网络分析法(Socialnetworkanalysis,Sna)提出诸如Katz中心度、节点度中心性等测度用于衡节点信息传播过程中的重要性。这些研究多通过加历史数据将网络抽象为一张静态网络理,因此这些法未能完П现网络的重要——网络动态性与时变演化性。实际场景中,由于人的频繁社会活动使得节点间的关系随时间不动态变化,用加的法会造成重要信息的缺,法准确刻画网络的演化过程。如1所示,随着时间推移及网络演化,从拓扑角度看,节点a或节点B都能够将消息逐地、间接地传给节点F,是节点F却不能将消息传给节点a或节点B;而使用传统的加刻画网络后,从其拓扑结看,节点a或节点B与节点F间存可达径,表示节点a或节点B与节点F可迚行双向信息传。出现这错误是由于加中未能现网络演化的时向性。移动p2p社会网络是网络拓扑随时间不变化的时变动态网络,为准确刻画其拓扑演化过程,本文用时间演化模型(timeevolvingGraph,teG)对其迚行建模分析。teG模型将动态演化的网络抽象为随时间不变化的一系列拓扑快照序列,每个快照刻画一个时间间隔内的网络状态。需要说明的是,快照间时间间隔的选取法是目前仍定论的问题[9],本文一面据经验值,一面据具的网络情景选取应的时间单迚行拓扑快照的划分。节点间传一个消息等于节点间产生或传一个影响,节点可对其他节点产生的总影响为节点的影响力[7],而节点的中心性是表示节点影响力的常用测度[8]。本文使用节点的中心性测度作为其网络中传播消息时的关键程度的衡指标。传统基于通(walk)的节点中心性分析法,因静态网络不涉及时间因素,实质为只计算间维度上的所有长度通(可理解为是一张快照上的通)的加权和。与不同,本文同时考虑间维度和时间维度上的所有长度通(即动态通,包含只涉及某一快照的通和涉及多个快照的通)的加权和现某一节点对网络中其余节点的影响力。用通而不是“径(path)”或“最短径(theshortestpath)”迚行计算是因为移动p2p社会网络中的节点动态性较,节点间难以长时间维持稳定的通信链,而消息每个节点上的存储一般具有一定时长的生存期,节点会充分用每次的机会迚行最功率的信息传输保证将更多的消息传出去。这数据传输模式必然导致消息传过程中会经过重的节点或重的边,而通恰可以正确刻画这消息传径。另外,本文考虑对不同长度动态通迚行不同程度衰减的同时也考虑节点间的前后关系以及消息的实时性,用时间衰减因子对等步长产生时间对久进的动态通迚行更程度地衰减。这样做的原因于节点对网中其他节点产生的“影响”应随时间推移逐渐变得不再重要,即网络中的“消息”的影响力应随时间推移而衰减。本文针对移动p2p社会网络这类动态时变网络,借助Sna分析法幵结合静态物理学中计算粒子间性势能的“林函数”法,将静态网络中基于中心性指标的分析法扩展到移动p2p社会网络,用衰减因子分刻画消息的用随传播径长度衰减及随时间推移衰减这自然性,用节点的历史信息,提出一节点传播能力的化分析函数,刻画节点对时性消息的对传播能力。本文考虑消息的实时性,一面有助于化分析节点传播实时消息的能力,一面通过历史数据对一段时间内的节点消息传播能力迚行综合考虑,可识出“最近较活跃”的节点,将其作为实时性消息传播的关键节点从网络中众多节点中选出。基于真实trace数据的实验表明,本文法可快速准确计算出各节点的消息传播关键程度,且用本法选出的关键节点作为消息传播的起始节点时,网络的消息覆盖速率明显提升。另外由于本文所述法考虑消息时个维度上所有可能的传播径,因此也可用于有预测网络的演化和不同节点未传播或获取消息时的对重要程度。某些的网络环境下,且衰减因子取值恰时,本文法的预测准确度最可达近90%。

2相关研究工作与现状

移动p2p社会网络由机会网络和社交网络结合而产生,是具有显著的拓扑动态性和演化性的一类杂网络。杂网络领域已有的研究工作[10][11]等用于研究人的移动性问题。基于这些工作,[12][13]提出基于节点不同连接机制的机会消息传法。是由于人移动性具有不可预知性使得网络高度动态性,移动p2p社会网络中研究拓扑演化律以及収现消息传播的关键节点成为一类具战性的问题。随着针对该领域的研究的增多,准确刻画网络形态的问题受到更多的关注。[14]提出随机的概念,然而由于随机的边独立性,使其不能很好地应用于动态网络分析,而[15]提出的时间演化模型则受到普的关注。该模型不同于静态论与随机,向网络中引О时间因素,将动态演化的网络沿时间向刻画为离散的拓扑快照序列。该模型可用于邻快照间研究拓扑演化性幵可单一快照内研究节点的间拓扑关系。针对网络内的关键节点収现问题,许多研究用Sna分析法提出基于中心性的研究法[7][8],提出诸如度中心性、Katz中心性等测度。中心性度法最是基于静态网络提出的,所以幵不接适用于移动p2p社会网络这类动态网络。移动p2p社会网络中,因节点具有的个社会性差异,使得其消息传播能力上也存一定的差异,研究工作[16]针对该问题用真实数据验证这一点,是幵未提出有的分析模型或关键节点収现法。已有的研究[17]将基于通的中心性分析法从静态网络中扩展到动态网络中,用Katz中心度衡节点的影响力。是该法的数对快照拓扑形态的Ξ赖性较且不具有性,幵不易于用。研究工作[18]针对email网络研究消息随时间传播应减的情ъ下提出评估节点传播能力的法。上述工作多基于通以及中心性的概念对节点的影响力或消息传播能力迚行度,其缺陷主要集中于个问题:1)上述有些工作基于静态网研究,不适用于动态网络分析;2)有些工作幵未考虑网络演化的时间因素,即消息的实时性或节点间产生影响的先后关系。本文为尽改正上述缺陷,网络动态性、节点间消息传烈Ξ赖于机会的移动p2p社会网络中,将传统的静态网络分析法扩展到动态网络的同时,充分考虑消息的实时性及节点间产生影响的先后顺序,提出移动p2p社会网络中传播实时消息的关键节点収现法,幵用真实环境采集的trace数据对该法迚行验证。

3系统建模

3.1静态网络中节点的中心性

G(V,e)表示一个包含n个节点m边的权简单静态,V定为节点集合且Vn,e定为节点间连边的集合且emm,nZ。G对应的nn维邻接矩阵表示为a(i,jV)ijΑ,节点i,j间存连边时1ija,否则0ija。由于G为权简单静态,0iia。本文用通而不是“径”或“最短径”迚行计算是因为移动p2p社会网络中的节点因其载的社会性而具有高度动态性,节点间几乎不存完整端到端径,幵且难以长时间维持通信链的稳定。节点采用“存储-携带-转収”的数据传输模式,而每个节点一般只一定时长的消息生存期内携带该消息,节点会充分用每次的机会迚行最功率的信息传输保证将更多的消息传递出去。这数据传输模式必然导致消息传过程中会经过重的节点或重的边。“径”或“最短径”不存重的边或点,而通却可以正确刻画这消息传径。现给出静态网络中通的定。

3.2动态演化网络中节点的中心性刻画

移动p2p社会网络是动态性的一类网络,节点的社会性移动使节点间的连边不产生和消。为最程度捕捉网络的动态演化性,本文用时间演化模型对该类时变网络迚行建模和分析,使用中心性指标作为判节点关键程度的Ξ据,幵将传统的基于通的中心性计算法扩展到时变网络中。此首先给出时间演化的定。

4实验验证

4.1实验数据

为验证本文提出的传播实时消息的关键节点収现法的有性,本节我们采用CRawDaD[19]提Ν的于真实环境采集的trace数据对我们提出的法迚行若干验证。本文选取基于常用线通信接Bluetooth与Zigbee于真实环境采集的数据迚行实验。Bluetooth接是较常用的通信接,Zigbee虽然不是智能终端的标准配置,由于它通信连接耗时更短(毫级)、通信耗能更等点使其具有良好的应用前景。这短距通信接的物理性使这接采集的数据可以较准确的刻画移动p2p社会网络的网络情形,且这通信接是移动p2p社会网络消息传输较为理想的选,具有较的应用前景。本节实验所用的数据集具为:1)2009年SigComm会议期间,100个持有HtCs620手机的用用Bluetooth接的数据;2)2008年安德鲁学校内27名携带传感器的人员79内通过Zigbee接的信息。组数据用不同的通信接,分展示会议场景及校场景这不同的数据采集环境的不同网络性。针对这具有差的数据集迚行实验,可验证本文法具有普适用性。表1列出实验数据的基本信息。

4.2不同节点的消息传播效率

网络中不同个的社会属性щ定其对消息具有不同的传播能力。本文提出传播实时消息的关键节点収现法,找到幵用这些关键节点提升网络的消息传播率。为验证这一目的,本实验首先用本文的法针对各个数据集分找到消息传播时关键程度最与最的个节点,后分将这个节点作为消息传播的源节点,网络中迚行洪泛(flooding)。由于移动p2p社会网络中节点间是间歇性连通的,洪泛式因具有冗余分収等性,使其对动态网络具有较好的自适应性,可以比较准确地刻画基于通的消息分収,本实验选取洪泛式迚行消息传播。另外,研究工作[20]表明:2-copy(对同一消息而言,节点对其至多转収2次)与副本洪泛式的网络覆盖速率几近同,所以本实验用2-copy洪泛式消息传播过程中的网络开销。为使实验结果更加,本实验计算出网络覆盖率的平情ъ,与定节点为消息源时的网络覆盖率迚行对比。从2给出的实验结果可看出:用本文法选出的关键程度最的节点作为消息源迚行消息传播的速率明显是最快速的。该实验结果清晰表明,用本文提出的法作为传播实时消息的关键节点的収现法,可以提升网络的消息覆盖速率。网络消息覆盖速率提升,表示实时性消息可快速地被传给网络中的各个节点。

4.3路径因子

对节点传播能力排名的影响本实验针对径因子对节点关键程度排名的影响迚行讨论。用于对具有不同长度的动态通迚行衰减,使得“短动态通对计算节点传播能力的贡献度较,长动态通对计算结果的贡献度较”。实际中,一面可据网络的动态程度,一面可据需要传播的消息的具性按照经验值设定的具取值。本实验中,我们针对各个数据集随机选取网络中的某一节点作为测节点,考察分取(0.1,0.3,0.5)时,该节点网络中的关键程度的排名变化情ъ。如前文所述,时间间隔的选取问题是仍未有定论的问题。迚行本节及后关实验时,我们首先据数据集的网络性,按照已有研究[9]对时间间隔的设置法,将Sigcom的时间间隔设为4.08时、Sassy的时间间隔设为1。另外本节将时间衰减因子取0,表示此实验暂不考虑时间因素只考察径因子对节点传播能力排名的影响。本实验随机选节点(Sigcom中选中节点15,Sassy中选中节点5),应用本文提出的法计算节点的消息传播能力排名。实验结果如3所示,横坐标表示各个快照的产生时间,坐标表示节点该时刻的关键程度(消息传播能力)排名,随着取值变,节点关键程度排名变化更加剧烈,幵最终趋于平稳。这是由于本法考虑节点可产生的所有长度的动态通,幵且的取值变时,不同长度动态通间的贡献度差异会缩,的取值变时,不同长度动态通间的贡献度差异会变,所以取值变时,节点关键程度的计算结果会受到较的影响,最终导致节点关键程度排名变化较剧烈,幵且时间累到一定程度时,节点的排名受历史的影响而趋于平稳。4.4时间因子对节点传播能力排名的影响本实验考察增加时间因素后,时间衰减因子对节点关键程度排名的影响。为保持一致性,本实验用前一实验针对各数据集随机选出的节点继续迚行测(Sigcom中选中节点15,Sassy中选中节点5)。从前实验的结果可看出,不考虑时间因素时,取值较,节点的排名变化较不明显。所以本实验中将各个数据集设为0.5,每个数据集中分取(0.1,0.5,1)测节点关键程度排名的变化趋势。

5结束语

网络传播数据分析篇6

由于这种技术占用带宽资源少,便于管理目前广泛应用于互联网与通信专网中,许多网络厂商纷纷提供能支持ip组播技术的产品,目前网络设备多样,网络环境复杂,我们并不能保证网络上每一台设备都能够具有组播功能,如何通过这些不支持组播的设备进行数据传输也是我们应该关注的问题。

[关键词]ip;组播路由;GRe封装

中图分类号:tn929.5文献标识码:a文章编号:1009-914X(2015)44-0328-01

1引言

ip组播是利用一种协议将ip数据报从一个源传送到多个目的地,并且任何给定的链路至多用一次。所以与单播(unicast)相比,有效提升了网络的利用率。

本文主要分析在多种设备混合组网环境下的组播业务传输.本网络出口路由器(R1)在通过帧中继设备如北电mSS多业务交换机与外部网络进行通信时,由于该设备不支持组播路由pim-Sm协议,在组播到达路由器R1时组播业务将就此终止,导致组播业务无法正常使用,因此我们在路由器R1与对端路由器R2端建立GRetunnel,使两端路由器之间形成一个GRe隧道,从而实现组播报文的传输,最后着重分析了此方案中利用GRe封装技术实现组播报文传输时可能出现的问题,并提出了改进的措施。

2组网环境

以通信专网为例网络分为内网和外网两大部分。内、外网通过帧中继mSS连接,核心交换机和路由器之间配置动态路由oSpF。广域网2个路由器分别和mSS设备三层互联,广域网采用静态路由进行连接。内网视频服务器到外网一层会议室、二层会议室进行正常的高清视频会议直播,广域网出口带宽为10mbps。

3实现方案

由于广域网带宽的限制,目前视频服务器向外网传输的单路视频流量为8mbps,如果使用单播传输广域网带宽为10mbps因此仅能满足一个会议室的会议需求。因此目前的网络并不能满足业务需要。目前可以有以下2种方案实现会议的正常进行。

3.1视频服务器图像压缩实现

摄像头采集会议现场高清图像发送到内网视频服务器上,服务器对接收到的数据进行压缩处理,将图像由高清转为标清,从而达到降低图像带宽的目的。

3.2配置GRetunnel实现

第2种方案利用GRetunnel的封装与解封装功能将组播报文传输在不支持组播路由的设备上,使组播报像单播一样传输。

GRetunnel主要功能以及工作流程:

①系统收到需要封装的数据报称为净荷,净荷首先被加上GRe协议封装,成为GRe报文;再被封装在ip报文中,这样ip层就可以完全负责此报文的转发;

②解封装过程和加封装过程相反。从tunnel接口收到ip报文,检查目的地址,当发现目的地就是此路由器时,系统去掉此报文的ip报头,交给GRe协议模块处理;GRe协议模块完成相应的处理后,去掉GRe报头,再交由组播协议模块处理,组播协议模块象对待一般数据报一样对此数据报进行处理。

网络链路中的交换机和路由器的配置方案如下

①内网CS1连接摄像机与视频服务器,外网CS2连接两个会议室视频终端并采用三层方式组网,用户网段与互联地址网段一同在oSpF中;

②内外网路由器上分别配置对本网内汇聚交换机的组播路由pim-Sm和tunnel隧道;选择封装形式为GRe封装。配置到mSS的三层互联;

③在R1、R2上配置源地址为loopback地址,目的地址为对方loopback地址的tunnel指向并添加静态路由把所有组播数据的下一跳设置为tunnel地址;

④在广域网mSS设备上做虚电路将两个网段配置静态路由,使其内部进行连接,两个网段具备互通性;

3.3使用GRetunnel方案的具体分析

本文提出的第二种方案是配置GRetunnel,使两端建立起由GRe协议封装的隧道.帮助组播数据能够通过无组播路由协议的mSS,组播数据报在进入GRe隧道时路由器将其封装成GRe数据报文再封装ip报文进行隧道内传输,当到达对端路由器后再将GRe数据报文剥离,还原组播数据包.组播数据报到达组播路由最末端设备时再根据组播用户的情况复制分发报文,达到最终目的[2]。

①在第一种情况中,mSS不支持配置pim-Sm组播路由配置,因此组播数据到达路由器出口时被丢弃,视频服务器只能使用单播进行传输,两个会议室需要两个视频流量共16mbps,超出了广域网带宽。因此视频数据拥塞,视频会议无法正常进行;

②在第二种情况下,将视频服务器视频流调整为组播方式,组播数据包仅会向自己本组接受者传送数据包,交换机通过目的地址(组播ip地址)进行区分[3],当配置好GRetunnel之后,路由器R1和R2相当于直接相连,视作mSS设备不存在,当一楼开启视频业务时组播会根据用户端的iGmp信息找到组成员的位置,组播进行反向路径检查建立组播路由表,确定组播数据流入流出的接口[4],当二楼发启请求后处理流程与一楼相同。组播数据到达CS2交换机后根据组播路由表在交换机上再复制一份数据给二层用户。这样广域网链路上就只有一路8mbps数据存在,出口不拥堵,业务正常使用。

如果链路上除了视频组播数据还有其他日常办公数据的话,可以根据业务的主次进行网络中的QoS配置[4]。优先级标签可以在GRe封装中重新标记出来,因此可以按照优先级进行数据包调度,本文就不再继续阐述。

4结束语

本文对实现在带宽有限并且中间设备不支持组播路由的情况下提出了2种方案。第1种方案采用单播方式传输需要对图像进行压缩。第2种方案是组播结合GRetunnel技术实现数据包的封装。其中本文还对第2种方案在实际运用中可能遇到的问题进行了分析并提出了添加QoS配置的改进措施。

合理的利用网络技术可以使有限的网络资源实现更好的用户体验,保证网络的可靠性、有效性。

参考文献

[1]王钊.基于internet应用层组播在流媒体中的应用[J].现代电信科技,2006,38(1):49-51.

[2]唐琴.GRe隧道技术在大型企业网中的应用[J].电脑知识与技术:学术交流,2008(8):800-802.

[3]许卫国.单播、广播、组播解析[J].网管员世界,2005(10):153-153.

网络传播数据分析篇7

论文关键词:网络信息;信息安全;信息传播;保障体系

随着网络信息资源越来越丰富,垃圾信息和不健康信息也在迅速增加,计算机病毒、垃圾邮件、网络攻击、系统漏洞、网络窃密、网络违法犯罪、著作权保护等问题日渐突出,而监管体制机制又相对落后。如何让优秀的、积极的、先进的信息占领网络传播阵地,如何构建网络信息传播保障体系,是世界各国都面临的紧迫课题。然而,国内外对此问题的研究还比较少,不够完善。本文在分析了构建网络信息传播保障体系应遵循的原则的基础上,结合分析研究实际情况,提出并系统地分析了网络信息传播保障体系的结构框架及其工作流程图。

1构建网络信息传播保障体系遵循的原则

1.1实用性原则

构建网络信息传播保障体系的最终目的是“用”,应本着旨在破解网络信息传播存在的难题的目的,向此目标努力,尽可能发挥体系的重要作用,注重体系实施的实际效用。因此,要运用系统工程的观点、方法,结合实际情况,分析网络信息传播存在的问题,制定具体措施。

1.2平衡性原则

网络信息传播具有的强大的威力和威胁就是信息的自由性。所以,在构建网络信息传播保障体系的过程中,应考虑在管理和控制网络信息的传播时要保持信息的“自由”与“平衡”,即尽量保持信息“自由”与“管理”的平衡。

1.3多层性、多样性原则

任何安全保护措施都不是绝对安全的,都可能被攻破,所以网络信息传播保障不应只依赖一种安全机制,应建立多层安全机制、多种防御体系,各防御层及体系相互补充保护,相互支撑以达到尽可能安全的目的。

1.4整体性、综合性原则

一个保障体系包括个人、设备、软件等环节,它们在网络信息传播安全中的地位和影响作用,只有从系统的整体角度去看待和分析,才可能获得有效、可行的措施。

而且网络信息传播保障体系又是一个复杂的系统工程,需要各种保障方法和工作程序的综合协调一致。为了实现网络信息传播全方位保障,建立网络信息传播保障体系必须考虑技术保障、管理保障、法律保障、人才保障、主观认知保障的综合作用,同时,通过全社会的共同努力,实现与提升信息安全防护与保障能力。

1.5协调性、协同性原则

网络信息传播保障体系构建的重要前提和基础是网络信息开放共享,而在信息的开放共享和保密的法律法规不健全的情况下,如果将部分信息公开披露,既缺乏相应的法律依据,同时又会带来一系列实际问题。因此在网络信息传播保障体系构建的过程中,要注意解决网络信息的披露与保密之间的矛盾,坚持网络信息开放共享和保密相协调的原则。

网络信息传播保障体系的构建不是哪一个体单独努力就能完成的,它是一个复杂的社会系统工程,需要政府、企业、社会团体、个人及司法等多方协调配合、全方位努力。网络信息传播保障体系构建的过程中坚持政府、企业、个人分工合作、协同作战是个非常重要的原则,必须明确各自的地位和作用。

2网络信息传播保障体系结构框架及工作流程图

构建网络信息传播保障体系是一个巨大复杂的系统工程,不仅仅是购买技术或开发信息安全技术的问题,而是一个体系建设过程,这个体系主要包括检测体系,安全防护体系和管理体系,主要内容有政策、法律法规建设、管理、技术、产品、人才培训、资金保障、领导重视、人们的认知观念等内容。在构建保障体系的过程中,认知是前提,技术是基础,管理是生命线,法律是保证,还要需要政策、资金、人才的支持。网络信息传播保障体系结构框架见图1。

网络信息传播保障体系个各体系之间、体系的各个组成部分之间是如何相互配合协调工作的呢?本文根据申农通信系统模型原理,借鉴国内外对信息安全保障体系模型的研究成果,提出网络信息传播保障体系工作流程图,见图2。

3网络信息传播保障体系结构框架及工作流程图分析

下面分别从检测体系、安全防护体系和管理体系三个方面,依照网络信息传播保障体系工作流程的顺序,结合网络信息传播保障体系结构框架中各个要素,对网络信息传播保障体系结构框架及工作流程图进行分析阐述。

3.1检测体系

检测中心数据库主要存储两大类信息记录:黑客、病毒等的入侵记录,网络信息传播保障体系的安全策略。

3.1.1黑客、病毒等的入侵记录

构建网络信息传播保障体系首先要对网络信息传播进行风险分析与评估,遵守相关的规章制度、合同、法律等安全标准,将历史性和新出现的黑客人侵记录以及病毒、垃圾信息等记录形成相应的安全策略,并存储于检测中心的数据库中。从信源发出的网络信息进入保障体系时,首先要通过监测体系得检测,如果该信息与检测中心数据库中的某信息特征匹配,则予以拦截;反之,数据库中无此相似记录,则要通过保障体系的安全防护体系的进一步检测防护。

3.1.2安全策略的规划

网络信息传播是一个动态的循环的过程,所以安全策略的制定注定是一个循序渐进、不断完善的过程。因为不可能制定一个安全策略就能够永远符合、完全适应某个网络环境和信息系统的需求,所以设计时要充分考虑其动态性和可操作性。

3.2安全防护技术体系

安全防护体系对网络信息进行检测,如果发现为异常的信息则给予拦截,反之则再由管理体系进行检测。安全防护技术体系主要应用信息安全技术对网络信息进行防护。

(1)基于pki/pmi的信任体系和授权体系:公钥基础设施技术(pki)以公开密钥技术为基础,以数据及密性、完整性、身份认证和行为的不可否认为安全目的。

(2)访问控制机制:包括防止非法用户的非法访问和合法用户的非授权访问2个方面。

(3)防火墙:防火墙系统主要目标是控制人、出一个网络的权限,它迫使所有的连接都通过防火墙,以便接受检查。

(4)入侵检测系统:对透过防火墙的攻击进行实时检测并及时做出相应的反应。

(5)安全审计系统:网络安全审计系统是一种基于信息流的数据采集、分析、识别和资源审计封锁软件。通过实时审计网络数据流,根据用户设定的安全控制策略,对受控对象的活动进行审计。

(6)网络病毒防治体系:针对网络上病毒、蠕虫、木马和恶意代码的危害性大并且传播迅速的现状,网络信息传播保障体系应采用相应的整改措施。

随着现代信息技术的不断发展进步,安全防护技术体系也会随之更新,它是网络信息进入网络信息传播保障体系的一个重要“门槛”。

3.3管理体系

检测体系和安全防护体系均采用必要的信息安全技术对网络信息给予硬性的安全防护,管理体系则在人的参与下对网络信息进行管理,对于技术不能发现和拦截的网络信息,则通过人为手段进行防护。根据信息的接受者的反馈,如果得到他们的满意,达到了预期的目标,则网络信息安全保障体系取得实效;反之,则通过事故响应及补救机制给予补救,并修改网络信息传播保障体系。

3.3.1法律法规制度体系

政策、法律法规等的建立规范必须建立在支持和鼓励网络信息传播健康发展的前提下,通过立法和监督,打击和淘汰违规网络信息传播者,创建的良好的信息法制环境,做到有法可依,有法必依,更好地维护网络信息传播的发展。

(1)网络信息传播立法。如今,网络立法应更加注重于对网络信息安全即对网络信息传播行为的规范。网络信息传播立法,在网络有害信息的责任认定问题及可操作性等立法质量上,尚存在有待改进的地方。如何发挥网络媒体传播优势,使公民的言论自由得以充分实现,同时又不至危害国家、社会和个人的合法权益,应该是网络信息传播立法的根本所在。

在立法原则上,我国的网络立法与其他国家一样,就是承认现行的传统法律原则都适应于网络传播环境。“互联网立法的前提就是承认现行的传统的法律原则都应该适用于互联网空间。互联网没有也不可能改变现实社会基本制度以及受这个制度保护的基本社会关系。互联网上的虚拟世界是从现实世界生成的,并且无时不在对现实世界发生影响,所以虚拟世界说到底还是现实世界的一部分,虚拟世界里的关系无非是现实世界的社会关系的延伸,仍然要受现实世界中现行法律的规范和调整”。

网络信息传播法制的主要内容:“从事互联网信息服务实行许可备案制度;开办互联网电子公告服务实行专项申请、备案制度;互联网站从事登载新闻业务实行审批制度;网络信息传播禁载内容;网络服务提供者的义务、责任等”。

(2)网络信息传播规章制度。网站信息安全的管理,除了采用必要的技术措施以外,还需要建立健全管理制度,落实信息安全管理责任。网络信息传播安全管理规范包括:确定安全管理等级和安全管理范围;制定有关网络操作使用规程和人员出入机房管理制度;制定网络系统的维护制度和应急措施等。

(3)网络道德规范。网络道德规范体系,对思想境界不同的个体,设立层次不同的规范,结合网络的特点对传统道德规范进行适当改造再植入网络空间,如诚信规范、公平规范、平等规范等都可以经过改造后成为网络信息传播中重要的道德规范。如诚信规范的建立,传播及使用网络信息就有了一把诚信评判的标尺,使得我们可以更好的对网络信息活动参加者的诚信程度进行评价和判断。同时,也就树立了开展网络信息活动的行为准则,促使人们在网络信息活动过程中更好的遵守网络信息活动规则,可以有效减少诚信缺失现象的发生。另外,网络道德规范还必须推陈出新,适应网络的发展。

3.3.2网络“把关”体系

任何网络信息传播活动都是一个信息搜集、加工、的过程,这个过程离不开人的劳动,无法由某一技术或者程序自动完成。而传播活动中只要有人的参与,就一定会有人为因素的影响,网络“把关入”作用也就不可能消失。因此作为传播者个人或者组织机构的“把关人”作用也始终存在于网络信息传播过程之中。

网络中的把关体系主要从宏观层面的把关和微观层面的把关进行。

(1)宏观层面的把关。宏观层面的把关,仍是政府的直接把关。网站进行信息传播,实际是获得了网络行政主管部门给予的权利。例如,对于恶意网站要用技术手段对其“封杀”。

(2)微观层面的把关。微观层面的把关,即一个网站的把关以及受众的把关。对信息内容的把关,主要工作有:①分析传播内容短期或中长期的发展趋势;②研究传播内容是否符合有关法规和政策;研究传媒借助传播内容实现的宣传策略、宣传方法以及某一方使用的宣传战术;③了解和解决科技、文化等特殊信息在传播中的问题和困难,兼及受传者的类型和数量等。

3.3.3事故响应及补救机制

安全的相对性注定了事故的发生是不可避免的,因而建立一个事故响应小组,建立数据备份、制定不同的紧急响应计划和操作流程,能够对发生的事故再第一时间作处理,努力将损失降到最低点。

当黑客、病毒或垃圾信息等成功传播到信宿或对系统造成破坏时,此时网络信息传播保障体系的补救机制将采取补救措施,补救措施包括:使用杀毒软件查杀病毒,使用备份系统对丢失或损害的数据进行恢复,或使用临时的动态站点替代当前被破坏的信息系统等。之后,再将这些病毒、垃圾信息、系统漏洞和脆弱点等形成分析报告,反馈给检测中心数据库,进行必要的总结回顾,修改安全策略,更新网络信息传播保障体系。补救机制是整个保障体系中一个不可忽视的环节,是减小损失和实现持续发展的重要措施。

网络传播数据分析篇8

doi:10.19366/j.cnki.1009-055X.2016.06.007

演化经济学不再假设个体是理性的,认为理性是成功策略在人群中的传播[1],由此非常多的管理问题就可以抽象为流动的管理[2],了解传播过程是提高效率的先行步骤,这里涉及对传播物、传播媒介及它们之间的动力学过程的理解。[3]已有大量实证研究表明人际间的网络关系会影响传播效率[4-7],由于是截面数据,还原网络结构与传播效率的动力学过程有一定难度,进入到大数据时代后,网络时间序列数据的获得使研究传播的动力学过程成为可能。[8-10]

目前对于网络结构影响传播的解释大致可分为两类:一类从传播物的认知类型来理解,复杂认知的传播物有别于简单认知的传播物,在群组内得到快速传播,而在群组间的传播速度则变得非常慢,这与简单认知的传播物的代表――病毒的匀速传播有非常大的区别[11-12];另一类是从网络的社团结构来解释传播效率,社团结构会形成社团环境,一是会过滤传播物,二是社团内通过增加曝光率来提高传播物的采纳,这样传播物的传播速度会因为社团发生很大的改变,导致传播行为的不均匀性。[13]

此外,从行为者个体层面来看,是否采纳创新或者什么时候采纳创新是一个复杂的问题,会受到诸如传播物特点、个体特质、个体在社会网络中的位置,以及个体可能接触到的社交圈子(如有多少朋友已采纳创新)等多种因素的影响。这些影响因素难于事先测量并加以预测,故而在大多数的实证研究中,都只能进行事后的观察和归纳。

本文试图从企业家社会网络的社团结构及其结构演化过程还原创新的扩散,观察社团结构如何造成扩散行为的不均匀性,然后结合数据挖掘工具归纳社团中个体成员间的同质性程度对扩散效率的影响。

一、企业家协会创新扩散绩效及网络结构分析

某企业家协会有在册企业家502人,企业家根据所交纳年费分为H、m、L和n四个级别。协会每年定期或不定期组织开展包括行业调研、对外交流、文化培训、工业旅游等各项活动,旨在通过丰富的活动促进企业家之间的交流和互动,增强企业家对协会的价值认同感,培养会员的忠诚度。

(一)创新扩散绩效

协会自2011年以来,在企业家群体中推广一项创新增值服务,免费为企业家提供上市和融资方面的知识培训和政策咨询。该项创新服务经过连续5年的推广,累计采纳人数占全部会员的36.5%,每年新增采纳者和累计采纳者的情况如表1所示。

根据扩散曲线的经验法则,任何采纳率表现为先增速后减速的扩散过程[14],当一阶拐点出现在累计采纳者的人数约占最终采纳者人数的50%时,认为扩散过程已受到社会接触传播效应的控制,达到可以触发连锁效应的临界量。[15]从这个意义上说,协会所提供的这项创新服务还未达到临界值,为促成服务临界值的达成,我们构建了企业家社会网络并对此网络的特点进行分析。

(二)企业家社会网络结构分析

基于企业家参与活动的历史记录,构建企业家―群组网络。网络节点包括企业家和群组两类节点,如果企业家i隶属于群组j且参与群组活动,就在企业家和群组节点之间创建连边。对企业家―群组网络进行投影,可以得到企业家互动关系网络和群组关系网络。在企业家互动关系网中,节点为企业家,节点之间的连边代表两个企业家同属于一个群组。群组关系网络中,节点为群组,节点之间的连边代表两个群组间的重叠关系,边的权值代表重叠的企业家人数。

图1描述了网络的演化过程,2011年网络中存在3个规模比较小的连通子图。从企业家互动关系网络的定义看,同属于一个群组的成员自然就成为社会网络中的小集团,2011年的企业家互动关系网有3个连通子图、5个小集团,其中两个连通成分各由2个交叠的小集团组成;小集团成员与小集团外的成员相比,彼此之间相互连接、共同参与活动、有紧密和频繁的互动。2012―2015年,随着新成员的加入,网络规模不断增长;企业家互动关系网络中的小集团规模也逐渐增加,同时涌现出更多占据小集团重叠位置的成员(Broker),如节点50、23、18、53等,伴随着这些弱连带关系的涌现,相互孤立的网络成分逐渐演化为一个规模较大的连通子图。

(三)企业家互动关系网络的集团特征分析

网络的“中心性”会对传播物的传播范围和传播速度产生影响,点度中心性测量一度传播的范围;中间中心性会对组间传播产生影响;接近中心性影响传播物传播的持久性。表2为各时期企业家互动关系网络的“节点中心性”的异动。由于不同时期的网络规模不同,故采用标准化的数值进行对比。从点度中心性来看,企业家互动关系网络中没有度值特别大的中心节点。从中间中心性看,即存在处于网络边缘的节点(值为0),也涌现出控制权增大的节点(从可控制5%的节点增长到可控制20%左右的节点)。接近中心度的增长也较为明显,显示网络中信息传递的有效性在增大。

从网络的连通性来看,网络密度保持在0.2~0.3之间;效率采用网络中每个成分为了保持连通性必须具备的最少连接数,来反映网络保持连通性的程度,效率指数自2013年后维持在0.7左右;由于网络中最大连通子图的出现,扩散系数也在2013年开始从0.3快速增长到0.9。从网络的中心趋势程度来看,网络中心性指标都在0.35以下,整体没有呈现出中心趋势;但是随着小集团交叠成员的出现,网络接近中心势指数有较大幅度的提升。

此外,最大连通子图的网络平均聚类系数维持在0.94左右,网络直径在2~5之间,说明网络中存在许多闭合的三元组合,以及很短的路径。根据社会学的相关研究,社会网络通常具备两个基本特征:同质性(人们与自己兴趣相投的人建立关系)和弱连接(这些连接能让人们与网络中较远的人建立关系)。同质性产生了许多三元关系,而弱连接产生广泛的分支结构,不仅使社会网络逐渐连通为更大的社会网络,也提供了可以通过几步就到达许多节点的短路径。

二、基于社团结构的创新扩散绩效分析

该企业家协会在招募会员的过程中,具有地域和熟人的社会特征。企业家进入协会后,根据其参与协会职务或事务不同区分为不同的会员级别,此外也可根据共同爱好组成不同的兴趣小组,我们将这些特征视为协会内的社团结构。基于这些社团结构,对上市和融资方面的知识培训课程的传播特点做了分析。

(一)地域社团

按地域即城市进行统计,发现来自GZ的企业家有143人,其中有73人(51%)采纳了创新;来自SZ的企业家有171人,其中有20人(12%)成为采纳者;来自FS的企业家有47,其中有22人(47%)采纳创新;来自DG的21人中有10人(48%)成为采纳者;其余13个城市的企业家人数在5~20人之间,采纳者比例在10%~50%不等。因此从创新扩散绩效来看,大多数地区的最终采纳者比例均没有超过潜在可能接受创新人数的半数。

(二)会员级别社团

协会会员级别呈金子塔结构,越高级别的人数越少。按会员级别来统计创新采纳的情况,结果显示:H级别的会员有76人,其中有45人(59%)采纳了创新服务;m级别的会员有120人,其中有64人(53%)是采纳者;L级别的会员153名,其中有39人(25%)成为采纳者;n级别的会员有163,仅有31人(10%)采纳了创新服务。由此可见,在更高等级的H和m会员中,创新扩散过程已经达到了临界值,可能会触发连锁效应;而在低等级的L和n会员中,则还需要采取更为有效的推广策略和激励措施。

(三)兴趣小组社团

协会鼓励企业家自发组织形成小组,并以小组的形式开展活动。截至2015年,已经形成了5个具有一定规模和影响力的社团,分别是mD、Hp、XJ、SD和tD。社团形成背景不尽相同:最大的社团Hp具有很高的地缘属性特征,约9成的企业家来自同一城市;XJ、SD和tD的地缘特征不明显,但同属相同的兴趣爱好;SD和tD社团成员间具有排他性,SD成员偏爱嵌入Hp和mD社团中,而tD成员则有可能嵌入到XJ、Hp和mD社团中。由于“桥式人物”的存在,协会内的兴趣小组社团不仅逐渐演化为一个大的连通网络,而且涌现出个体之间彼此连接、存在紧密互动关系的小集团结构(见图1)。

按兴趣小组社团来统计创新采纳的情况,如表3所示:在参与兴趣小组社团的102个企业家中,创新采纳的平均采纳率达到74%,远高于协会502个企业家群体的36.5%的采纳率;规模小的社团如tD的采纳率甚至达到90%以上。数据表明,在个体成员间接触和互动频繁的社团中,创新的观念更容易扩散。

根据创新扩散的二阶段理论,即一项创新首先被少数人接受,随后人数迅速增加,等到有大量人员接受创新时,人数增长速度反而放缓,最后新增人员的数量迅速下降,传播过程逐渐停止。结合兴趣小组社团的扩散过程和扩散曲线分析:不同社团的创新扩散速度和过程存在差异:有些社团在不同时期新增采纳者人数变动大(如mD社团);有些社团经过2~3个时期后累积采纳者百分比就超过50%的临界值(如SD社团)。如图3所示。

三、影响个体采纳创新的因素分析

根据第二部分的分析思路,按地域、会员级别、兴趣小组构成的群体均属于协会组织内的社团结构,为探索个体隶属社团是否影响个体对创新的采纳,我们利用数据挖掘中的分类方法,尝试从个体参与社团和采纳创新的行为数据中归纳影响个体采纳创新的主导因素。

(一)影响个体采纳创新的关键因素分析

分析模型1的数据样本为该协会已在册企业家共502人,其中采纳者179人、非采纳者323人。根据企业家是否采纳创新,创建以“采纳者”和“非采纳者”作为类标签的预测变量;解释变量包括企业家加入协会时间、所属地域、会员级别、是否加入兴趣小组社团。运算结果显示,影响企业家是否采纳创新的因素依重要性排序分别是:企业家是否加入兴趣小组、企业家加入协会时间、企业家所属地域。

分析模型2的数据样本为加入兴趣小组社团的企业家共102人,其中采纳创新的74人、没有采纳的有28人。同分析模型1,根据企业家是否采纳创新,创建以“采纳者”和“非采纳者”作为类标签的预测变量;解释变量包括企业家所属地域、会员级别、加入兴趣小组时间、隶属的兴趣小组。对于嵌入到多个兴趣小组社团的企业家,对应每个兴趣小组生成一条数据记录,共119条记录。

模型2的运算结果显示:①影响企业家是否采纳创新产品的第一要素是加入兴趣小组社团的时间,2010―2013年期间加入兴趣小组社团的企业家共68人,采纳率为87%即59人采纳创新,2014―2015年期间加入兴趣小组社团的企业家共34人,采纳率为44%即15人成为采纳者。②在2014―2015年期间加入兴趣小组社团的34人中,影响采纳创新的因素是会员级别,28名级别为H或m的成员中有54%成为采纳者;而6名级别为L和n的成员全部为非采纳者。③在级别为H或m的28名企业家中,加入SD社团的3人都不是采纳者,而加入其他社团的有25人中,有60%的成员即15人采纳了创新。综合起来,影响企业家个体是否采纳创新的影响因素中,按重要性程度排序分别为:加入兴趣小组社团的时间、会员级别、以及所隶属的兴趣小组社团。

(二)社团形成与演化的影响因素分析

在前面的分析中,我们发现社团结构对个体创新采纳行为产生影响。更进一步,我们探索了企业家社会网络中社团形成与演化的影响因素,采用的方法为关联分析,数据集为102个企业家。关联规则“XY”的右边项“Y”为社团、左边项“X”为成员属性;属性特征包括地域、会员级别、加入群组的时间、采纳创新的时间等。指定最小规则支持度为15%、最小置信度为80%、提升度大于1等条件作为识别有效强规则的最小阈值。采用R语言提供的apriori算法进行规则识别,结果显示:

(地域=GZ)(社团=Hp)规则支持度=31%、置信度=87%、提升度=2.7

(地域=FS)(社团=mD)规则支持度=29%、置信度=97%、提升度=2.5

(地域=GZ、会员级别=m)(社团=mD)规则支持度=18%、置信度=86%、提升度=2.7

(地域=FS、会员级别=m)(社团=mD)规则支持度=16%、置信度=94%、提升度=2.3

企业家社会网络中的最大的两个社团Hp和mD,都表现出很强的地缘属性特征:Hp组中有32人(除1人外)来自GZ;mD组中有30人(除10人外)来自FS。来自GZ的企业家、会员级别为m的,有21人选择加入Hp组;来自FS的企业家、会员级别为m的,有17人选择加入mD组。其中,来自FS的50号企业家尽管在2014年才成为会员,但很快成为连接Hp和mD两大社团的桥式人物。

四、结论

网络传播数据分析篇9

随着互联网的普及,论坛、微博、微信等新媒体已经成为人们获取和信息的重要渠道,而微博已经成为舆情传播的主要平台,研究微博上舆情信息的传播情况具有重大社会意义,文章基于话题研究微博信息的传播特点。首先,通过对话题传播过程中新增用户数和参与话题用户的累计概率分布的统计,研究用户对话题转发的参与度,总结出话题传播过程,包括产生期、爆发期和衰亡期;接着利用话题中用户的转发关系,整理出话题传播的拓扑结构,通过测量传播拓扑结构中的平均路径、网络直径和聚类系数,并与无尺度网络进行比较,对话题传播拓扑结构进行进一步的分析,总结出传播网络具有小世界特性,这些特性能够加快话题在网络中的传播速度并扩大传播范围。文章研究话题传播的拓扑结构,为研究网络上的微博舆情提供了基础。

关键词:

微博;话题;信息传播;拓扑结构

引言

随着互联网和互联网终端的迅速普及,涌现出了许多便捷的互联网应用,如电子商务、社交网络、微博等。从美国的twitter到我国的新浪、腾讯,微博在中国乃至全世界迅速普及。据统计,中国的微博总注册量已经超过5亿人次,每天更新的信息量已经超过1亿条。微博流行的原因主要在于它让人们信息的门槛大大降低,任何人都可以发表内容而且不必具有专业的文学撰写水平,这满足了大众快速交流分享信息的需要。作为一种实时的交流、信息分享工具,用户可以在任何时候任何地点微博信息,和他人互动,此外微博用户还可以关注其他用户,使得微博平台成为了一个巨大的社会化网络。微博的普及、海量的信息以及庞大的用户群体,使得它也成为了一种实时信息来源工具,并且成了一种有着巨大社会影响力的社会媒体,近几年一些重要的社会热点话题都是由微博平台率先报道出来的。研究话题在微博平台上传播的过程和形成的网络拓扑结构,是对微博平台上用户行为、用户影响力等进行研究的基础。目前对微博平台上拓扑结构的测量和研究很多,GUo[1]等人对新浪微博上的用户进行分析,发现用户网络拓扑结构有很强的动态性,用户关注间的关系表现出马太效应;微博用户网络中存在着影响力巨大的用户,这些用户成为“核心”,这些核心加速了话题在微博网络上的传播。wanG[2]等人对微博上的信息传播进行研究,提出了一个微博的信息瀑传播模型,测量了微博的转发数分布,指出其分布情况可以用一个广延指数模型来表示。CHa[3]等人通过对入度、转发和引用的对比研究,发现用户的转发行为主要受微博自身价值的影响,而且对于名人和微博大V的微博应用明显要多于其他人。weBBeRLeY[4]等人对微博传播的深度和范围进行了研究,其目标针对一条微博,传播深度表示其最长的转发路径;传播范围表示其参与转发的用户群体数量;他们通过twitter的数据进行验证,实验结果显示一条微博的平均最长转发路径为1.8,表示大多数消息被转发2次左右;平均转发规模在六左右,这和6度空间理论比较符合。平亮[5]等人基于网络中心性对微博平台上信息的传播进行研究,通过分析微博用户的点度中心度、中介中心性和接近中心性三个属性,证明了点度中心度可以衡量用户传播和获取信息的能力,中介中心性表示用户控制信息传播的能力,接近中心性能够衡量信息传播到其他用户的速度,这几个参数都可以间接用来表示用户的个人影响力大小。miSLoVe[6]等人对Flickr、Youtube、LiveJournal和orkut四种社交网络的拓扑结构进行研究,对社交网络的幂率特性、小世界特性以及无标度属性进行了验证。CHa[7]等人在miSLoVe的基础上对Flickr上的图片拓扑结构进行研究,发现其中的信息传播需要依靠关键节点,并且时间可能较长。CHenG[8]等人对Youtube进行了测量,分析了上面的用户行为特征、社会网络拓扑结构等,总结出了Youtube特有的统计行为方式。GUo[9]等人在对三种不同的共享型网络(博客、书签共享、知识问答网)上的用户行为进行测量研究时,发现用户的使用时间长短不服从指数分布,用户的贡献服从广延指数模型而不是服从幂率分布,证明了这种共享型网络并不是由少数核心节点所支配。CHUn[10]等人利用用户之间的交互信息,如留言、评论等进行研究,发现利用这些信息形成的网络结构特征与好友关系形成的拓扑结构相似,并且二者的分布极为相似,得到了与mislove相同的结论。袁毅[11]对微博的用户网络结构、信息传播路径以及影响因素进行研究,他们跟踪一条微博,采集所有相关的评论数据和用户数据,同时获取相关用户的好友关系。研究将信息传播归为3种类型:偶发型、偶遇机会型和强势节点呼应型。其中的强势节点越早加入转发过程,越有利于信息的扩散;另外,一个用户的微博转发数量与该用户的粉丝数有一定的相关性。本文通过跟踪腾讯微博话题,采集相关话题下的所有用户数据,根据用户间话题数据的转发关系,整理出话题在整个网络上传播的拓扑结构,测量话题传播拓扑结构的性质,总结拓扑结构的特征。相比于传统的通过好友关系和跟踪一条微博形成的网络拓扑结构,这种通过转发关系建立的拓扑结构更加完整,能够展现出整个话题的扩散速度和范围,更有利于舆情信息的监测和控制。

1微博数据采集

1.1微博爬虫设计

为了获取实验数据,本文针对腾讯微博设计了一款微博主题爬虫,根据特定主题获取微博网络上的微博信息和用户信息。本文设计实现的腾讯微博数据爬取系统从功能上主要分为api爬虫、web爬虫以及分布式控制三个模块。其中,api爬虫模块通过微博平台的开放api实现对微博用户信息的采集,主要用于获取用户的个人好友关系、转发关系等;web爬虫通过程序模拟浏览器进行web页面浏览的过程,用于获取用户的微博信息,主要是对特定页面的源代码信息进行解析,进而获取相应的微博数据,该模块主要采集微博内容信息和微博相关属性信息;分布式控制模块按照指定的分布式任务分配策略从数据库中读取关键字,控制爬虫的爬取策略和速度。api爬虫和web爬虫以数据库作为信息交互的媒介,通过为这两个爬虫设置合适的线程数来达到两者之间的供需动态平衡。爬虫系统的设计框架如图1所示。为了采集微博平台的话题传播信息,并保证数据的安全性,爬虫系统部署在四川大学网络与可信计算研究所的科研网络环境中,该科研网络利用文伟平[12]等人和王永娟[13]等人的的信息安全风险评估技术对网络安全性进行评估,并根据评估结果对网络进行改造升级,从软件层面保证数据信息的安全性;其基础设施安全防护借鉴卿斯汉[14]所论述的身份鉴别过程,加强基础设施保护措施,从硬件层面保证数据安全性。程序运行的服务器配置为:microsoftwindowsServer2003enterpriseedition;intel(R)Xeon(R)CUpe55062.3gHz;8G内存。为了提高数据的采集效率,爬虫系统采用了分布式的爬行策略并行爬行。为了避免爬虫系统被腾讯微博平台识别为恶意程序而被封禁,保证爬虫系统的连续运行,爬虫系统的爬行间隔设置为5分钟。数据的采集时间为2014年7月至9月,系统持续跟踪了这段时间内的所有话题。图1爬虫系统设计框架

1.2数据采集结果

系统每天监测排名前10的话题,由于每天的话题有重复,在数据采集期间一共获取话题数量207个,获取与所有话题相关的微博信息超过870万条,用户总量超过400万。首先对话题的性质进行分析,通过统计发现,话题主要分为娱乐性质、社会性质和其他性质。娱乐性质的话题主要和娱乐界的事件、人物相关,例如某个明星开演唱会等;社会性质的话题主要和社会事件、人物相关,例如某地发生灾害或者草根爆料事件等;除了这两种话题之外的其他话题属性比较模糊,所占比例很小。表1是这3种性质话题的统计结果。从表1中可以看出,社会性的话题数量占比为17.39%,而娱乐性话题的数量占比为73.91%,用户比例表示相应话题下所有参与话题讨论或转发的用户占采集用户总量的百分比。在话题数量差距巨大的前提下,参与话题的用户数量却基本相同,甚至社会性的话题参与人数还要略高于娱乐性的话题。从话题的平均持续时间可以分析出原因,对于娱乐性的话题,其平均持续时间为4天,比第三性质的话题持续时间还短,远小于社会性话题持续时间,说明用户群体虽然对娱乐性质的话题关注度较高,但是没有持续跟踪的热情,但是对社会性质的话题有很高的持续跟踪热情。话题在持续发展的过程中,随着其影响范围逐渐扩大,会吸引更多用户参与其中,这和话题的传播特点有关。根据采集的数据,从中选择了“云南昭通市鲁甸县地震”和“江苏昆山工厂发生爆炸”这两个社会性的话题微博数据作为实验数据集,对话题传播的特点进行分析,测量话题传播过程中通过转发形成的拓扑结构。

2话题传播的拓扑结构

2.1话题传播的特点

微博平台是由关注与被关注的机制连接起来的社交关系网络,是人们在现实生活中社交关系在互联网上的映射和扩大。信息在微博上的传递大多数是通过转发方式来实现的。微博上话题传播的第一个特点是话题传播的间接性,信息不直接传递给用户,而是首先通过几个微博用户进行转发,然后关注这些用户的粉丝会选择性地对这些信息进行转发,这样经过层层转发,信息间接地传递给受众。根据YanG[15]等人对twitter的研究发现,其中有接近25.5%的内容是从朋友的推文中转发而来。在采集到的腾讯微博中去除个人心情相关的博文,只统计和话题相关的博文,统计结果显示,转发博文所占比例的平均值高达54.7%。但是话题转发率高,并不代表该话题就可以大范围地传播以及产生巨大影响,话题能否产生巨大影响和话题本身以及受众的偏好有直接关系。根据研究人员对Facebook用户群体的研究[16],发现许多有影响力的用户更倾向于彼此之间进行关注,这个现象说明社交网络存在明显的同质性。同质性[17]是指有相似特征的用户之间形成好友关系的倾向,即通常所说的“物以类聚,人以群分”。有些话题与娱乐明星或者体育等相关,在关注这些人的圈子里,这方面的话题可以大量转发和传播,但却不能在整个微博网络平台上产生广泛关注,因为这些话题不能吸引圈子外其他人的兴趣。相比之下与社会性相关度高的话题,能够吸引更多人的兴趣。而且微博网络被证明符合六度空间理论。KwaK[18]等人对twitter的转发路径研究表明,超过90%的转发路径长度都小于6,所以这类话题能够在微博平台上引起广泛的关注和讨论,传播范围更大。微博话题信息传播的另一个特点是具有很强的时效性,即话题从产生到消亡的持续时间较短,不能长时间地保持很高话题热度。话题的热度发展趋势可以分为产生期、爆发期和衰亡期,但是在产生期到爆发期之间可能会出现一个短暂的静默期,同时在爆发期后也可能进入静默期,在受到一些条件的刺激后,再次进入爆发期。其中话题在静默期表现为话题的热度基本维持不变或者是变化率很小;在爆发期时表现为话题的热度呈现线性增长,话题迅速扩散,用户参与话题的数量也呈线性增长趋势;进入衰亡期后,热度迅速下降,参与话题的总用户量达到稳定,变化率基本维持不变。根据从腾讯微博平台采集的数据,针对“云南昭通市鲁甸县地震”和“江苏昆山工厂发生爆炸”两个话题的数据进行分析,采用用户的参与度来衡量微博话题的热度。图2为两个话题每日新增用户数量统计,话题持续时间较短的是“工厂爆炸”,它的发展是一个典型的话题发展过程,从话题产生后直接进入到爆发期。图3是两个微博话题参与用户数的累计概率分布。从图3可以看出,前3天的新增用户量占了近90%,说明话题的传播处于爆发期。然后迅速进入衰亡期,持续时间只有一个星期,衰亡也非常迅速,充分体现了话题传播的时效性。云南地震话题的持续时间较长,它的发展是一个非典型的过程,首先它的热度持续了较长时间,超过了3个星期,而且它有两个爆发期,从图3中看出,前3天和第8~12天这两段时间的新增用户所占比例分别接近40%和30%,说明这两个时间段话题的传播正处于爆发期。两个爆发期中间还有一个短暂的静默期,从话题产生开始就迅速增长,其第一个爆发期持续了3天多,这和地震的黄金救援72小时时间基本吻合,这段时间内用户关注数量增长非常快。接下来新增用户数量逐渐减少,趋于平缓,然后就进入了静默期。如果这个时期没有其他的因素进行刺激,那么话题就有可能慢慢进入消亡期,热度逐渐消退。但是话题却再次被激活了,从静默期又一次进入了爆发期,因为这段时间内发生了较大余震,并且许多救援问题凸显,导致许多用户又开始关注这一话题,于是进入了第二个爆发期,新增用户量又开始剧增。第二个爆发期后,由于事件中的所有问题都得到了妥善处理,没有新的刺激点,用户的关注度也逐渐下降,新增用户数量逐渐减少,直至趋于稳定,然后话题就逐渐进入消亡期,热度逐渐消退。话题的发展趋势和事件的发展及处理过程非常吻合。

2.2话题传播的拓扑结构形态

微博话题通过转发的方式进行扩散,从一个或少数的用户开始,到被大量的用户发现并进行转发,最后进行大规模传播甚至扩散至整个微博平台,转发方式是用户获取和传播信息的主要途径。通过获取话题中有转发标志的微博用户,并标注出话题在这些用户中传播的路径,得到了话题的转发树,表示话题在传播时的拓扑结构。图4表示的是“昆山工厂爆炸”话题转发树的拓扑结构,表示的是用户之间的转发关系,一条线表示一个转发关系。其中包含许多不同的“类”,这些类是若干个节点的集合,在这些类的内部,各个节点之间联系紧密,而各个类之间则仅仅通过少数的几条边相连接。从图4可以看到各个点之间的联系,而且很容易看出网络的整体传播结构。形态。第1种形态是在关注朋友圈子里面的小范围传播,如图4中的a)部分的简单转发结构所示,话题微博仅仅被用户的直接好友大量转发,短时间内话题的转发量和用户参与数迅速增加,但是之后就不会再继续向外扩散,形成了一个小范围的扩散结构。第2种形态如图4中的c)部分的简单转发结构所示,话题微博也只是被用户的直接好友转发,但是参与数量很少,只有一个或几个,即使转发之后话题微博也难以向外扩散,很快就停止传播。图4中的两个简单转发结构表示的就是这种形态有共同的特点,就是扩散的用户多但是路径很短,扩散范围小,而且传播速度较慢。第3种形态就是图4中的b)部分所展示的方式,话题的传播路径相对较长,参与转发的用户数量很多,话题的传播范围很广,我们将针对这种传播范围广的转发树来进一步研究。

2.3话题传播拓扑结构的性质

网络平均路径长度[19]指网络中所有节点对之间最短路径的平均值;而网络直径则是指网络中任意节点对之间最短路径的最大值。这两个值可以用于描述网络的信息传输速率、传输范围等特性。节点的聚类系数[19](ClusteringCoefficient)表示一个节点与邻居之间相互连接的紧密程度,刻画了网络中节点的集团化程度;而网络的平均聚类系数是所有节点聚类系数的平均值,刻画整个网络的聚类特性。网络中的一个节点i有K条边将它和其他节点相连,这K个节点就是节点i的邻居,在这K个节点之间最多可能有K(K-1)/2条边。而这K个节点之间实际存在的边数e和总的可能存在的边数之比就定义为节点i的聚类系数,如公式(1)所示:很明显,Ca≤1。当且仅当所有节点都为孤立节点时,Ca=0。当且仅当网络是全局耦合的时候,即网络中任意两个节点都直接相连时,Ca=1。为了测量传播过程中拓扑结构的性质,本文利用分析工具产生随机网络与实际获取的社交网络数据进行对比,产生一个无尺度的复杂网络[20],模拟用户社交网络。首先要生成一个eR随机网络,这是erdos和Renyi最开始研究的随机复杂网络模型,对一个节点数n>>1的复杂网络,任一条边都以相同的概率p连接任意两个节点,这就是一个典型的n个点,有pn(n-1)/2条边的eR随机图。对于大型的稀疏网络,p值非常小,表达起来及其不方便。因此,在产生eR随机网络时,利用一个更直观的概念:节点的平均度d,它的值定义为:………………………………………………(3)公式(3)中p为连接概率,v为节点数目,m为该复杂网络中最多可能存在的边数。先前产生的eR网络没有考虑到许多复杂网络的实际特性,其中有两个重要的特征,复杂网络具有动态增长和优先连接特性。动态增长是指在实际的复杂网络中网络的规模是不断变化甚至扩大的;优先连接是指新加入进来的用户,更倾向于与那些具有较大连接度的节点相连。基于这两个特性,在eR网络的基础上构造无尺度网络。1)增加网络规模:每一步向网络中增加一个新的节点,同时向网络中添加k条边。2)优先连接:边所连接的两个节点是在所有的节点(包括新增加的节点和原网络所有节点)中以某个概率来选择。其中,各节点被选择的概率的大小pr(v)与节点的度有关,具体计算如公式(4)所示:其中,|e|表示原网络中总的边数(也就是原网络中各节点的度之和),|v|为节点数,而indeg(v)和outdeg(v)分别表示节点v的入度和出度,α、β和γ分别为三个常系数,且α+β+γ=1。利用上述的方法产生了两个分别包含50000和80000个节点的无尺度随机网络,用于和从真实社交网路获取的数据进行对比。从36个话题中随机抽取8个话题,这些话题包含的用户规模都比随机无尺度网络大一些。分别测量它们的拓扑结构,计算它们的平均路的径长度、网络直径和网络的聚类系数进行对比。表2中是部分无尺度网络与话题传播拓扑结构参数对比。从表2可以看出,微博话题传播拓扑结构与随机无尺度网络相比,其平均路径长度基本相同,但是网络直径要远小于随机无尺度网络,这说明实际拓扑结构中的节点间联系更加紧密,聚集系数的测量结果也证明了这一点,测量结果中实际网络的聚集系数的最小值0.2009要远远大于随机无尺度网络聚集系数的较大值0.000071。如果一个网络有较小的平均路径长度和较高的聚类系数,则可以成为小世界网络,从测量结果分析,话题传播形成的转发结构网络具有明显的小世界特性。与新浪微博和人人网的拓扑特征参数对比,他们的平均路径长度、网络直径和聚类系数都很接近,说明话题传播形成的拓扑结构与新浪微博和人人网的网络关系拓扑结构具有相同的网络性质。在这个转发网络中,网络的平均路径相对很短,但是网络的聚类系数很大,说明在整个传播网络中,用户间的联系更为紧密,这十分有利于信息的传播,而且网络的小世界特性会加速信息的传播过程,话题信息在用户之间进行层层转发,多次转发,从核心的用户逐渐向外扩散,用户参与数呈爆发式增长,话题传播范围越来越广。因此研究话题传播拓扑结构对研究如何进行舆情监控、网络监管以及研究用户的影响力具有重大意义。

3结束语

舆情信息的监管是当前网络安全监管的重要内容之一,微博已经成为了舆情信息传播的重要平台。为了研究舆情信息在微博上的传播模式和特点,本文利用爬虫程序从微博网络上获取话题数据以及相应的用户数据,通过对用户参与转发的过程进行分析,总结出了话题传播的一般规律和特点,并结合实际情况进行了验证。然后利用话题中用户间的转发关系,绘制出了话题传播的几种主要拓扑结构,对其中的大规模转发拓扑结构进行了深入的分析,并根据无尺度网络的定义,利用社交网络分析软件pajek生成两个无尺度网络,通过真实的转发网络与利用分析工具模拟生成的随机复杂网络进行对比,测量其平均路径长度、网络直径以及聚类系数等参数,总结出了转发网络形成的拓扑结构具有明显的小世界特性。研究结果对网络舆情监控有一定的应用价值。本文主要针对微博社交网络上的话题传播过程进行了研究,目前的研究工作只利用话题中参与用户的转发关系来构建网络的拓扑结构,没有对用户的转发行为和用户关系进行进一步的研究。用户的个人行为对话题的传播也具有一定的影响力,用户的个人影响力能够加快话题的传播速度和扩大话题的传播范围,因此下一步的研究将是在话题传播拓扑结构的基础上,研究用户的行为和用户的影响力,发现网络中影响力大的用户,研究这些用户对话题传播过程的影响作用。

参考文献:

[5]平亮,宗利永.基于社会网络中心性分析的微博信息传播研究——以Sina微博为例[J].图书情报知识,2010(6):92-97.

[11]袁毅.微博客信息传播结构、路径及其影响因素分析[J].图书情报工作.2011(12):26-30.

[12]文伟平,郭荣华,孟正,等.信息安全风险评估关键技术研究与实现[J].信息网络安全,2015(2):7-14.

[13]王永娟,郝家宝.网络信息安全的威胁与防范技术研究[J].中国管理信息化,2015,18(20):146.

[14]卿斯汉.关键基础设施安全防护[J].信息网络安全,2015(2):1-6.

[19]张赛,徐恪,李海涛.微博类社交网络中信息传播的测量与分析[J].西安交通大学学报.2013,47(2):124-130.

[20]樊鹏翼,王晖,姜志宏,李沛.微博网络测量研究[J].计算机研究与发展,2012,49(4):691-699.

网络传播数据分析篇10

【关键词】双语;网络;结构;建设

本世纪网络传播的盛况正在从真正意义上阐释麦克卢汉在上个世纪的论断:我们很快地接近人的延伸的最后阶段——意识的技术模拟阶段。在这个阶段,知识的创造性过程将被集体地、共同地延伸至整个人类社会。

在今天的网络时代,大容量的存储媒介资源以功能各异、形式多样的应用系统对数字信息进行综合采集、存储、传输、处理和利用,最终通过无处不在的网络平台给我们提供了赖以任意交流的广阔空间。“意识的技术模拟”深入到了所有可以深入的空间,这是原先的传统媒体所无法企及的。“每一项历史性的突破都是在某种需要的驱动下实现的”[1],网络传播是我们在现代社会推进下对现代技术充分依赖而演化出的传播要求,它对技术的依赖度超过了以往任何一种传播媒介。因此,技术在网络传播中改变着以往的传播趋向,同时也在固化传播中的核心要素。

与以往的传播媒介相比较,网络传播技术的层级传递不可避免,甚至于更加明显。新疆是双语背景最为突出的地区之一,是一个颇有代表性的研究技术与语言在网络传播中显现出的特质的取样地域。通过对以技术为主导的双语背景下的网络发展过程进行考察,可以更加清晰地看到,技术传递的结果导致传播群体的层级聚合。

上世纪90年代,在网络传播已经成为世界性普遍依赖的大众传播媒介的时候,新疆少数民族文字计算机输入法处在研发时期,技术障碍阻止了新疆少数民族网络的发展进程。新疆网络发展经历了一个潜伏期和一个加速期。当这一技术障碍被突破之后,新疆网络的使用空间被完全打开,网络普及出现了一个爆发式的回补空缺的增量。新疆从2004年开始出现用户自创网站,新疆个人网站从当年的16个,在两年中激增到352个,增长了20多倍。目前,新疆已备案网站主体12467个,备案网站13754家,其中外地接入网站数量由2009年底的75%下降为当前的63%。

“意识的技术模拟”在我们用数字化作标识的空间里,其实字符原有的解读功效依然如故。双语背景下的差异性字符在解读功能的基础上增大了文化聚合的能量。如果我们对两种语言和几种语言在网络传播过程的功效做一个对比研究,其呈现出的流动性及聚合性的速度和作用与网络群体形成的关联度在增强,而不是弱化。少数民族语言文字网络在有些传播方向上,跨地域传播的趋势超过了其他文字符号的传播。新疆地缘的特殊性决定了新疆少数民族语言文字网络传播的跨境潜在的势能。

2010年,新疆社科基金项目《网络管理与网络舆情分析》课题组对新疆网民群体特征调查显示,网民群体的集合特征及群体聚合系数处在不断变化中,但它不是此消彼长,而是不同程度地处在同一上升通道。此项调查包括互联网普及率、网民基本概况、网民上网偏好3个方面的内容。通过对调查数据进行分析,我们可以看到新疆网民的以下几个特点:

1.在今天电脑和网络资讯费用与社会普遍可自由支配收入的比差逐渐下降的背景下,家庭网民用户的增长占有绝对的主导趋势,已经改变了6年前的网民结构状况。对被访用户电脑使用地点的分析表明,在家里、单位和网吧使用电脑的用户分别占56.83%、33.69%、9.48%。总体上在家中使用电脑的人群占了很大比重,但乌鲁木齐的情况有所不同,在单位使用电脑的比例略高于在家中使用的比例。

2.网络对报纸、广播、电视三大传统传播媒介的传播形式做了一个集合式的运用。从符号解读的角度分析,网民文字符号解读的能力要求比报纸低,又比广播、电视要高。从网民学历结构来看,其中持有大专学历的网民上网时间最长达到了30.28%,持有研究生学历的网民却只有1.10%。这是一个非常值得注意和研究的数据。

3.全疆只有26.36%的网民表示喜欢上疆内网站,其中克拉玛依市网民较多,占62.50%。乌鲁木齐64.1%的网民热衷上疆外网站。网络在提供海量信息的同时,降低了信息的选择性;传统媒体传播的信息量有限,但提高了信息的选择性。

4.以城市为主体的网民群体的单一结构正在被二元结构取代。在国家不断完善农村信息高速公路建设过程中,农村网民逐步增加。遍布全疆15个地区的新疆兴农网,设有农业科技、农经信息、供求热线等10多个栏目,已发展注册会员10万个(包括涉农单位、乡镇企业、专业农户等),并由此辐射组建农副产品交易中心网站。政府发展网络的主观目的是以信息服务的手段促进农村的经济发展,它潜在地会带来网络示范效应,使一部分群体形成网络依赖,带动这一区域的网民数量的激增。

从以上4个新疆网民群体特征分析网民结构和群体聚合,可以形成网络分析的基本数据。对新疆网民状况的调查显示,新疆的网络结构具有区域性特点,与全国的网民结构相比较,大的走向是一致的,但在具体状况和细微之处,还是有相当的差异性。与传统媒体非常相似的明显特征之一是双语对网络群体的自然分割。这种分割并没有因为网络的任意性和无距离传播而缩小分割的程度,而是受双语因素势能作用引导出了深度转移。