首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >ucinet网络分析实例(网络分析app)

ucinet网络分析实例(网络分析app)

作者头像
全栈程序员站长
发布于 2022-08-01 00:07:24
发布于 2022-08-01 00:07:24
3.8K0
举报

大家好,又见面了,我是你们的朋友全栈君。

ucinet介绍

UCINET为菜单驱动的Windows程序,可能是最知名和最经常被使用的处理社会网络数据和其他相似性数据的综合性分析程序。与UCINET捆绑在一起的还有Pajek、Mage和NetDraw等三个软件。UCINET能够处理的原始数据为矩阵格式,提供了大量数据管理和转化工具。该程序本身不包含 网络可视化的图形程序,但可将数据和处理结果输出至NetDraw、Pajek、Mage和KrackPlot等软件作图。UCINET包含大量包括探测凝聚子群(cliques, clans, plexes)和区域(components, cores)、中心性分析(centrality)、个人网络分析和结构洞分析在内的网络分析程序。UCINET还包含为数众多的基于过程的分析程序,如聚类分析、多维标度、二模标度(奇异值分解、因子分析和对应分析)、角色和地位分析(结构、角色和正则对等性)和拟合中心-边缘模型。此外,UCINET提供了从简单统计到拟合p1模型在内的多种统计程序。

ucinet使用技巧

ucinet的安装我觉得不用多说,因为不论是csdn本站,还是百度里面都有很多的资源可以下载,一般都是英文版,所以我就不从开头介绍了。另外就是虽然很多东西当初用过并且记得,但等过了一段时间后,再次看这个功能其实很可能英文单词的意思都已经忘了,就记得如何去使用。所以这里,我直接以一个案例的方式进行演示:

1.数据导入: Ucinet的数据输入方式有多种:初始数据(Raw)、Excel数据和数据语言数据(Data Language,DL)。Ucinet处理的Excel数据最多只能有255列。就好像我记得excel的最大存储数据为104万左右,超过就会提示显示不全。ucinet它导入数据步骤为输入路径:数据>输入> Excel矩阵:

当然,这里只是为了测试是否这个数据可以被ucinet所引用,不会有什么乱码或者其它格式问题,另外如果中途选择了什么其它操作,那么除了上述的打印外,还将生成了一个新的excel文件位于上面的路径。

2.可视化数据分析

网络密度指的是网络中各个成员之间联系的紧密度,可以通过网络中实际存在的关系数与理论上可能存在的关系数相比得到,成员之间的联系越多,该网络的密度越大。整体网的密度越大,该网络对其中行动者的态度、行为等产生的影响可能越大。计算的时候最好将多值关系数据转换成二值关系数据。将多值关系数据转换成二值关系数据路径:变换→对分。

在对原始数据进行二值化处理以后,所有的权值变为了0和1(即是否有关联),这样计算出来的结果是普通的中心度。想要得到加权网络的中心性,只需要在矩阵数据中保留权值,不进行二值化计算即可,和之前的唯一区别在于计算公式中的0与1变成了具体的权值。

我们这里也可以进行二值化,将上述的频次转换成只有0、1变量的数据,我这里不转了,依据的公式一般是: H i j = { 1,    if    x i ∈ N k ( x j )    or    x j ∈ N k ( x i ) 0,    otherwise    } H_{ij}=\left\{ \begin{matrix} \text{1,}& \,\,\text{if\,\,}x_i\in N_k\left( x_j \right) \quad \,\,\text{or\,\,}x_j\in N_k\left( x_i \right)\\ \text{0,}& \,\,\text{otherwise\,\,}\\ \end{matrix} \right\} Hij​={ 1,0,​ifxi​∈Nk​(xj​)orxj​∈Nk​(xi​)otherwise​} 其中 N k ( x i ) N_k\left( x_i \right) Nk​(xi​)表示数据集中距离 x i x_{i} xi​最近的 k 个邻居的集合。

然后我们需要将excel文件转换成ucinet能识别的类型,即.h结尾的文件,这里有很多种转换的方式,我比较喜欢的是打开一个矩阵,然后将数据导入,这里它会提示imported success,然后将其以.h文件保存到桌面,然后就可以开始可视化了。

最后进入netdraw直接可视化,选项为Net- Draw >Open > Ucinet Dataset > Network:

这里我们可以在右边栏看到可选框,可以根据喜好改变点的大小颜色以及线的粗细,另外就是去除某个点对整体图的影响,检测整个系统的波动性和稳定性,这个我记得我之前都是做层次分析法或者PCA用的,但在网络里自己也没试过这个。

我主要试的是图上面的工具栏,可以选择中心性的网络可视化,即centrality measures:

选择任何一个图都会根据其改变,比如我选择closeness:

然后关于上述的区别,也就是我接下来要总结的,但只是做一个粗略总结。

3、社会网络分析技术

首先如果数据不是非结构化数据,并且它的缺失值与异常值都在合理范围内(关于上述两者的概念,我在另一篇博客有提:kaggle(一):随机森林与泰坦尼克),那么我们可以做一个相关性分析,相关系数公式即为: p i j = E ( y i y j ) − E ( y i ) E ( y j ) ( [ E ( y i 2 ) − ( E ( y i ) ) 2 ] ⋅ [ E ( y j 2 ) − ( E ( y j ) ) 2 ] p_{ij}=\frac{E\left( y_iy_j \right) -E\left( y_i \right) E\left( y_j \right)}{\sqrt{\left( \left[ E\left( y_{i}^{2} \right) -\left( E\left( y_i \right) \right) ^2 \right] \cdot \left[ E\left( y_{j}^{2} \right) -\left( E\left( y_j \right) \right) ^2 \right] \right.}} pij​=([E(yi2​)−(E(yi​))2]⋅[E(yj2​)−(E(yj​))2] ​E(yi​yj​)−E(yi​)E(yj​)​ 可以根据它得到相关系数权值矩阵,以此去判断一些指标权重密度还有啥的,不过ucinet基本都封装好了,我在这里提一下,因为我下面的数据基本都是围绕这个来弄,

社会网络分析技术主要有网络密度、中心性分析、凝聚子群分析、核心-边缘分析等,这里对涉及到的前三种方法作简单介绍。

中心性(centrality)是度量整个网络中心化程度的重要指标,在城市群网络中,处于中心位置的城市更易获得资源和信息,拥有更大的权力和对其他城市更强的影响力。网络中心性又可以分为点度中心度、接近中心度和中间中心度三个指标。

度数中心性(Degree)

中间中心性(betweenness)

接近中心性(Closeness)

绝对点度中心度

C A D i = d ( i ) = ∑ j X i j C_{ADi}=d\left( i \right) =\sum_j{X}_{ij} CADi​=d(i)=j∑​Xij​

C A B i = ∑ j < k b j k ( i ) = ∑ j < k g j k ( i ) / g j k C_{A B i}=\sum_{j<k} b_{j k}(i)=\sum_{j<k} g_{j k}(i) / g_{j k} CABi​=j<k∑​bjk​(i)=j<k∑​gjk​(i)/gjk​

C A P i − 1 = ∑ j d i j C_{A P i}^{-1}=\sum_{j} d_{i j} CAPi−1​=j∑​dij​

相对点度中心度

C R D i = d ( i ) / ( n − 1 ) C_{RDi}^{}=d\left( i \right) /\left( n-1 \right) CRDi​=d(i)/(n−1)

C R B i = 2 C A B i / [ ( n − 1 ) ( n − 2 ) ] C_{RBi}^{}=2C_{ABi}^{}/\left[ \left( n-1 \right) \left( n-2 \right) \right] CRBi​=2CABi​/[(n−1)(n−2)]

C R P i − 1 = 2 C A P i − 1 / ( n − 1 ) C_{RPi}^{-1}=2C_{APi}^{-1}/\left( n-1 \right) CRPi−1​=2CAPi−1​/(n−1)

图的中心势

C A D = ∑ i ( C A D max ⁡ − C A D i ) ( n − 1 ) ( n − 2 ) C R D = ∑ i ( C R D max ⁡ − C R D i ) n − 2 \begin{array}{l}{C_{A D}=\frac{\sum_{i}\left(C_{A D \max }-C_{A D i}\right)}{(n-1)(n-2)}} \\ {C_{R D}=\frac{\sum_{i}\left(C_{R D \max }-C_{R D i}\right)}{n-2}}\end{array} CAD​=(n−1)(n−2)∑i​(CADmax​−CADi​)​CRD​=n−2∑i​(CRDmax​−CRDi​)​​

C B = 2 ∑ i ( C A B max ⁡ − C A B i ) / [ ( n − 1 ) 2 ( n − 2 ) ] = 2 ∑ i ( C B B max ⁡ − C R B i ) / ( n − 1 ) C_B=2\sum_i{\left( C_{AB\max}-C_{ABi} \right)}/\left[ \left( n-1 \right) ^2\left( n-2 \right) \right] =2\sum_i{\left( C_{BB\max}-C_{RBi} \right)}/\left( n-1 \right) CB​=2i∑​(CABmax​−CABi​)/[(n−1)2(n−2)]=2i∑​(CBBmax​−CRBi​)/(n−1)

C C = ∑ i ( C R C max ⁡ ′ − C R C i ′ ) ( n − 2 ) ( n − 1 ) ( 2 n − 3 ) C_{C}=\frac{\sum_{i}\left(C_{R C \max }^{\prime}-C_{R C i}^{\prime}\right)}{(n-2)(n-1)}(2 n-3) CC​=(n−2)(n−1)∑i​(CRCmax′​−CRCi′​)​(2n−3)

上表摘自SNA(社会网络分析)——三种中心度总结,这张表里的有些公式和我之前建模用过的差不多,不外乎就是中间有进行过变式,就比如我之前喜欢写 n 3 − 4 n 2 + 5 n − 2 = ( n − 1 ) 2 ( n − 2 ) n^{3} – 4n^{2} + 5n -2 = \left( n-1 \right) ^2\left( n-2 \right) n3−4n2+5n−2=(n−1)2(n−2),然后中间具体怎么推导的,例如betweenness可以看我给的参考链接2,我不是专门研究的我也不太清楚。我们还可以来看一下相关的图,对于上述三种情况的文字对比图:

然后我们就可以用ucinet软件做出上述三种关系,这里只做一个,因为步骤操作都是基本一致的,选择network ——> centrality ——> Degree ,就可以得到Degree centrality

closeness centrality:

然后关于betweenness centrality,一般都是选择Node betweenness ,其它两种linesHierarchically Reduction 我也没有在实际建模中用过,不太清楚有啥具体意义,而且这两种没有显示完各个点中心性值后的探索性分析的表格,关于一些平均值、方差、标准差等,所以这里直接拉到第一个就行了。

关于上述三张表所能给出的信息,我们都可以通过分析他们按高位降序排序的指标来进一步得出结果,其中还是以Degree centrality为例,因为我没有进行二值化,或者说排除一些其它类型的指标,另外就是当时晚上时间匆忙,现在第二天是接着昨晚的写,一般如果数据做了处理,当我们做了这个中心性后,Num值的区间都是在0 ~ 100之间,排在最前的Num一定是在95%左右再降序,这样才能根据降序来定义最后的指标区别,这里倒是有些无法判断。其余两个中心性的解释根据公式和网络分析图结合起来说明更加有真实性与连贯性,在建模中,这就是基本的网络分析了。

4、凝聚子群分析

凝聚子群是满足如下条件的-一个行动者子集合,即在此集合中的行动者之间具有相对较强、直接、紧密、经常的或者积极的关系。城市网络凝聚子群是用于揭示和刻画城市群体内部子结构状态。找到城市网络中凝聚子群的个数以及每个凝聚子群包含哪些城市成员,分析凝聚子群间关系及联接方式,这都可以从新的维度考察城市群网络的发展状况。

利用ucinet软件中的CONCOR法进行凝聚子群分析。CONCOR是-种迭代相关收敛法( convergent correlation或者convergence of iterated correlation)。它基于如下事实:如果对-一个矩阵中的各个行(或者列)之间的相关系数进行重复计算(当该矩阵包含此前计算的相关系数的时候),最终产生的将是一个仅由1和-1组成的相关系数矩阵。进一步说我们可以据此把将要计算的一些项目分为两类:相关系数分别为1和-1的两类(刘军,2009)[4]。

这个我不太记得具体有啥作用了,找自己之前写过的网络分析法中很少用凝聚子群,但确实用过所以我现在才有一个大致的印象,然而怎么解释已经忘了,都过了一年多了,所以尴尬了,还是在这里记录一下吧,下次记起来回来补。

凝聚子群分析结果:

凝聚子群分析结果:

总结

其实抛开一些太专业性的东西不讲,本篇博文写得挺爽的,很久没有敲过这么多文字以及再次以一种建模的心理完成对ucinet的一些基本操作介绍,起因是一个建模群的网友问我网络分析里的一些技巧,还有他用python做的话好不好做,于是我去搜了一下,找到了本篇的第一篇参考文献,看了下python确实可以做但比较麻烦,我没用过,而ucinet的话,脑子一闪,发现这不就是我大学一直在用的东西嘛,伴随着的还有spss statistics、spss modeler、MATLAB、PS、灰色系统软件、yaahp等等各种零零碎碎的东西,突然就有些怀旧,虽然刚出来不久,由大学学的电气跨进计算机的道路,终是专业化了,但想想曾经大二一年里在建模路上的摸爬滚打,每次和队友完成一篇篇论文到获奖的喜悦,也终是我如今很难获取到的了。所以,且行且珍惜吧,end。

参考与推荐: [1]. 六个主要的社会网络分析软件的比较

[2]. 网络的介数中心性(betweenness)及计算方法

[3]. SNA(社会网络分析)——三种中心度总结

[4]. 《社会网络分析法》(刘军 译)

[5]. 薛萍. 基于社会网络的研究型高校优势学科方向发展预测研究 [D]. 导师: 朱凌. 浙江大学,2014

[6]. 社会网络分析方法简介

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/127388.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年4月1,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
“你朋友圈的真面目,大数据都知道!”——用社交网络分析看透人情世故
今天咱们就来聊聊一个特别“接地气”的技术话题——社交网络分析,看看大数据是怎么“看透”你的人际关系网的。
Echo_Wish
2025/04/30
1620
“你朋友圈的真面目,大数据都知道!”——用社交网络分析看透人情世故
六个主要的社会网络分析软件的比较
UCINET为菜单驱动的Windows程序,可能是最知名和最经常被使用的处理社会网络数据和其他相似性数据的综合性分析程序。与UCINET捆绑在一 起的还有Pajek、Mage和NetDraw等三个软件。UCINET能够处理的原始数据为矩阵格式,提供了大量数据管理和转化工具。该程序本身不包含 网络可视化的图形程序,但可将数据和处理结果输出至NetDraw、Pajek、Mage和KrackPlot等软件作图。UCINET包含大量包括探测 凝聚子群(cliques, clans, plexes)和区域(components, cores)、中心性分析(centrality)、个人网络分析和结构洞分析在内的网络分析程序。UCINET还包含为数众多的基于过程的分析程序,如 聚类分析、多维标度、二模标度(奇异值分解、因子分析和对应分析)、角色和地位分析(结构、角色和正则对等性)和拟合中心-边缘模型。此外,UCINET 提供了从简单统计到拟合p1模型在内的多种统计程序。
全栈程序员站长
2022/08/31
3.4K0
社会网络分析相关概念概述
互惠性指的是网络中成员之间的关系是否具有相互性,也就是说任何一对成员之间是否相互“选择”,是否为邻接点。
用户8870853
2021/07/27
1.6K0
基于Python的社交网络分析与实践
社交网络分析(Social Network Analysis,简写为SNA),又称为社会网络分析,是指基于信息学、数学、社会学、管理学、心理学等多学科的融合理论和方法,为理解人类各种社交关系的形成、行为特点分析以及信息传播的规律提供的一种可计算的分析方法。社交网络是由多个节点及其关系所组成的集合,节点通常代表个人或组织,节点之间的边则代表他们的联系或交互。社交网络分析涉及的理论很广泛,有网络科学、复杂网络分析、图神经网络等。
Coder-ZZ
2024/07/25
9620
基于Python的社交网络分析与实践
知识图谱之社交网络分析(SNA)之python处理
将G = nx.Graph() 改为 G = nx.DiGraph()即进行有向图,表示不同的边
学到老
2019/01/25
3.9K0
知识图谱之社交网络分析(SNA)之python处理
基于networkx分析Louvain算法的社团网络划分
一个图G = (V, E)由一些点及点之间的连线(称为边)构成,V、E分别计G的点集合和边集合。在图的概念中,点的空间位置,边的区直长短都无关紧要,重要的是其中有几个点以及那些点之间有变相连。
用户7886150
2020/12/24
3.8K0
关系网络理论︱细讲中介中心性(Betweeness Centrality)
中介中心性(Betweeness Centrality),又叫中间中心性,中间性,居间中心性等等。以下是学者们对中介中心性的解释。 中介中心性主要是由美国社会学家林顿·弗里曼(Freeman,1979)教授提出来的一个概念,它测量的是一个点在多大程度上位于图中其他“点对”的“中间”。他认为,如果一个行动者处于多对行动者之间,那么他的度数一般较低,这个相对来说度数比较低的点可能起到重要的“中介”作用,因而处于网络的中心,根据这个思路就可以测量点的中间中心性。[1] 居间中心性建立在以下假设基础上,即一个人如果可把持传播通道的话,则他可能会获得更大的权力。在下图中,节点D很明显处于一个权力位置——节点A、B、C与E、F、G之间所有的信息流通都要通过D。这种传播瓶颈的位置可能是危险的,无论如何——它也可被解释为相当大的压力。居间中心性的另一个重要作用就是它能够分辨出谁是“跨界者”(boundary spanners)——那些在两个或多个团体中扮演着不可或缺的桥梁作用的个体。比如:一个在计算机科学学术世界和音乐世界的跨界者,而我则是在计算机科学方面(获得了博士学位)和长期从事爵士和摇滚伴奏领域的跨界者。[2] 点的中心性是一个用以量化点在网络中地位重要性的图论概念。中间中心性是常用来进行中心性测度的指标,它是指网络中经过某点并连接这两点的最短路径占这两点之间的最短路径线总数之比。
悟乙己
2019/05/26
23.4K0
基于Python的社交网络分析与图论算法实践
社交网络分析和图论算法在理解和分析复杂网络结构方面发挥着重要作用。本文将介绍如何使用Python和相关库进行社交网络分析,并实现一些常用的图论算法。我们将涵盖从网络构建和可视化到基本的算法应用的全过程。
一键难忘
2024/10/08
7920
【观点】社会网络分析:探索人人网好友推荐系统
image.png 最近四五年间,互联网行 业似乎总是绕不开社交网络这个概念。无论是旗舰级别的传说中的facebook、LinkedIn,还是如雨后春笋般冒出来 的各种团购和微博网站,全都或多或少地体现着SNS(社会网络服务)的特色。这些五花八门的产品,在丰富我们业余生活的同时,也为研究者提供了大量珍贵的 数据。以往只能依靠有限的调研或模拟才能进行的社会网络分析(SNA),现在具备了大规模开展和实施的条件。国内著名而典型的SNS网站“人人网”,最近 依靠上市新闻重新赢得了大家的关注。本文基于人人网的好友
小莹莹
2018/04/19
1.2K0
【观点】社会网络分析:探索人人网好友推荐系统
相关性网络节点度分析
承接前一篇文章,接下来我们利用复杂网络理论对相关网络数据进行深入的分析。在网络分析中的节点度(node degree)是指和该节点关联的边的条数,或者说连接的个数,又称关联度;显然网络节点越多,节点度越大,为了去除网络规模的影响,使得不同网络可以相互比较,可以使用度中心性(degree centrality)概念。度中心性是在网络分析中刻画节点中心性的最直接度量指标,其值为该节点节点度除以该节点最大可能节点度,也即该节点实际连接数占与其他节点可能连接总数目的比例,如下所示:
SYSU星空
2022/05/05
2.6K0
相关性网络节点度分析
PCA模型
主成分分析是指将数据中相关性很高的属性 / 变量转化成彼此相互独立或不相关的新属性 / 变量,利用较少的新属性 / 变量(主成分)去解释原来数据中的大部分属性 / 变量的一种降维方法。
hotarugali
2022/03/16
9270
AAAI'21「华为」图异构多行为推荐方法
用户与商品之间会存在许多行为,比如点击,购买,加购等。这些异构多关系数据可以提供结构良好的信息,作者认为以往的工作没有很好地捕获用户和商品之间的高阶(high-hop)关系,因此本文提出了 Graph Heterogeneous Collaborative Filtering (GHCF) 。为了探索高阶异构用户-项目交互,本文利用图神经网络学习节点和关系的表征。此外,为了充分利用整个异构数据,在多任务学习框架下执行先进的高效非采样优化。
秋枫学习笔记
2022/09/19
2700
一文带你入门图论和网络分析(附Python代码)
本文从图的概念以及历史讲起,并介绍了一些必备的术语,随后引入了networkx库,并以一个航班信息数据集为例,带领读者完成了一些基本分析。
数据派THU
2018/08/14
3.3K0
一文带你入门图论和网络分析(附Python代码)
寻找网络中的hub节点
其实转录组走到现在我总觉得少了点什么东西,后来才想起来是cytospace寻找hub基因
生信菜鸟团
2023/09/27
1.8K0
寻找网络中的hub节点
关于图计算&图学习的基础知识概览:前置知识点学习(Paddle Graph L)系列【一】
关于图计算&图学习的基础知识概览:前置知识点学习(Paddle Graph Learning (PGL)) 欢迎fork本项目原始链接:关于图计算&图学习的基础知识概览:前置知识点学习(Paddle
汀丶人工智能
2022/11/18
9620
相关性网络的子群划分
接下来我们进行实例分析,首先构建两个相关网络,一个区分正、负相关,另一个不区分正、负相关(负的连接在很多算法中是没有现实意义的),具体如下所示:
SYSU星空
2022/05/05
6101
相关性网络的子群划分
排列组合的一些公式及推导(非常详细易懂)[通俗易懂]
分类计数原理:做一件事,有\(n\)类办法,在第\(1\)类办法中有\(m_1\)种不同的方法,在第\(2\)类办法中有\(m_2\)种不同的方法,…,在第\(n\)类办法中有\(m_n\)种不同的方法,那么完成这件事共有\(N=m_1+m_2+…+m_n\)种不同的方法。
全栈程序员站长
2022/09/20
4K0
m 序列(最长线性反馈移位寄存器序列)详解
递推关系式又称为反馈逻辑函数或递推方程。设图2所示的线性反馈移位 寄存器的初始状态为
timerring
2023/06/27
1.8K0
m 序列(最长线性反馈移位寄存器序列)详解
关于图算法 & 图分析的基础知识概览
网址:https://learning.oreilly.com/library/view/graph-algorithms-/9781492060116/
机器之心
2019/05/17
3.3K0
【ICML+NIPS过去12年数据】机器学习被引次数最高作者Top 20
【新智元导读】为了研究AI研究领域的最新趋势,Kakao AI 研究小组对2005年至2016年期间ICML和NIPS发表的6163篇科学论文进行了分析,从累积引用,作者合作网络以及论文关键词等多个角度分析了AI和机器学习的趋势和变化。 最近,有关人工智能(AI)的研究在各个领域都取得了显著的成果。这主要归功于长期以来一直致力于这个研究领域的AI研究人员的努力。如果根据引用次数、参与人数、接受论文数量和历史记录来看的话,关于AI的最重要的学术会议就是ICML(International Conference
新智元
2018/03/22
1.6K0
【ICML+NIPS过去12年数据】机器学习被引次数最高作者Top 20
推荐阅读
相关推荐
“你朋友圈的真面目,大数据都知道!”——用社交网络分析看透人情世故
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档