通过NoteExpress+UCINET+NetDraw实现CNKI中国知网文献关键词共现绘图及分析

所需软件

NoteExpress 3.2.0.7409 or higher

UCINET 6.695 or higher

思路

方法1:直接通过NoteExpress实现知网文献关键词共现+绘图。

方法2:NoteExpress计算关键词共现矩阵后,导入UCINET分析,并通过NetDraw绘图。

步骤

一、获取文献列表

e.g.以"基本公共服务均等化""责任"为关键词检索CSSCI期刊,共84条结果。

逐页选取参考文献,并导出。

导出,保存为NoteExpress格式,保存至本地。

二、导入NoteExpress

NE新建文献库后,导入刚才保存的文献题录文件。

导入后:

三、NoteExpress整理题录数据

Ctrl+A全选题录,点击工具栏"数据分析"。

选"关键词"-"下一步"。

点">>"-"下一步"。当然,此时可以选择把哪些关键词加入分析。如果关键词过多,可以按需要只选择前面频率多的。

NE给出了三种分析工具——词频云图、词共现次数矩阵、词共现关系图。

其中,词频云图的结果:

可以以词云的方式展示关键词词频。字体越大的词频越高。

词共现关系图的结果:

颜色越红似乎表示出现频率越高,连线表示共现情况。

以上两种分析结果均可点击右下角"保存图片"保存。

如果需要将数据导入UCINET分析,可选"词共现次数矩阵",将结果保存至本地CSV文件。

四、关键词共现矩阵转为UCINET数据文件

用Excel打开刚才保存的CSV,全选数据,复制。

打开UCINET软件,Data菜单-Data Editors-Excel Matrix Editor

将刚才复制的数据粘贴到里面,然后保存为UCINET数据文件##h、##d。

五、数据分析及绘图

计算关键词中心度:

UCINET中心度计算路径如下:

选择##h数据文件路径,即可算出各类中心度。可根据需要选择中心度计算方式。

NE生成的关键词共现矩阵为加权矩阵(Valued data),使用默认设置,或全转为二值数据(Binarize all data)皆可。

点OK,即可计算出各类中心度。

NetDraw绘图:

从UCINET打开NetDraw。

打开刚才的##h数据文件。

点击OK后,即可完成初步绘图。

如何按中心度展示点的大小?

点击Analysis-Centrality measures

在Set Node Sizes by中,选择一种确定节点尺寸的中心度参数。

点OK:

可看出中心度较大的节点会变大。

但此图节点太多,太乱,如何改变布局?或者筛掉一部分节点?

可以点击Layout-Principal Components,以主成分布局展示。

重要节点变得清晰多。

当然也可以尝试Layout里面的其他布局。

或者,可以在NetDraw中打开##h文件时,直接过滤掉一部分数据。

只导入共现次数大于1的节点(可以尝试不同的数值)。

以Scaling/Ordination布局并以中心度确定节点大小后,是这样的,似乎更清晰一些:

当然,也可以直接在NE中排除掉出现频率低的关键词。

可视化方式不止一种,以能抓住关键信息为准。