Python + Neo4j(安装)可视化分析漫威十年人物关系图谱

目录

1 数据爬取

1.1 漫威人物关系图谱网站

1.2 爬取人物关系数据

2 Neo4j的安装及服务启动

2.1 Neo4j下载安装

2.2 开启Neo4j服务

3 数据准备

3.1 加入列名

3.2 放入本地Neo4j的import文件

4  数据可视化

4.1 加载"names_message.csv"文件

4.2 加载"relation_message.csv"文件

4.3 查看人物关系图谱

4.4 筛选人物关系


CSV 文件 GitHub 地址:https://github.com/leungll/Marvel-File

1 数据爬取

1.1 漫威人物关系图谱网站

1. 网址传送门:

https://graphics.straitstimes.com/STI/STIMEDIA/Interactives/2018/04/marvel-cinematic-universe-whos-who-interactive/index.html

注:网站被墙,因此很多朋友反应网站打不开,但是用梯子是可以访问的。另外,我会将爬下来的 csv 文件的 github 地址直接贴在下文中,有需要的朋友可以自取。

2. 网站介绍:网站是基于 Graph 技术开发的,主要是关于漫威人物、漫威电影的图谱。

3. 网站一览

首页:

 人物关系:

点击头像,可看到人物的详细信息:(钢铁侠!!

漫威宇宙系列电影:

1.2 爬取人物关系数据

注:浏览器推荐使用 Google Chrome

1. 打开 F12 调试,选择  “Network”(注意是在首页)

2. 关键词搜索( Ctrl + f ),输入“marvel-data.json”

3. 进入“marvel-data.json”,复制 json 接口的 URL

在这里,我们主要需要爬取的数据是 “characters” 与 “relationship”

 4. py

评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值