分析与可视化Twitter社交网络
1. 构建Twitter网络
在构建Twitter网络时,我们首先要处理额外的边,这些边通常是错误产生的结果,在将数据转换为图对象之前,需要移除这些重复的边。之后,我们可以着手构建补充脚本,以便从给定的种子用户快速生成网络结构,并对这些图进行一些基本的结构分析,从而发现其中的本地社区结构。
我们使用R语言来完成这项任务,这里介绍一种在命令行运行R脚本的替代方法。通常我们在R控制台中编写和运行代码,但当需要多次使用不同输入执行同一任务时,编写一个在命令行运行并从标准输入获取输入的程序会更方便,这时可以使用R安装包自带的Rscript命令行程序。
以下是构建Twitter网络的代码示例:
library(igraph)
source('google_sg.R')
user <- 'johnmyleswhite'
user.net <- read.graph(paste("data/",user, "/", user, "_net.graphml", sep = ""), format = "graphml")
这里我们加载了igraph库和之前编写的函数,由于无法生成新的Twitter网络数据,所以加载了之前为John的Twitter网络抓取的数据。
对于Windows用户,如果无法在DOS shell中运行此脚本,可以直接设置user变量为想要构建网络的Twitter用户,然后像以前一样运行脚本。
接下来,我们将种子用户传递给twitter.snowball函数,由于这里我们关注的是种子
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



