Windows 下载 北京大学开放研究数据平台 数据方法
前言
教程都具有时效性,未来可能会过期。成文日期 2022年2月15日 21:30:19
问题
win10系统,用谷歌浏览器,注册并登陆到平台,点击数据包的下载按钮,下载数据包到后边就重头开始了,无限循环,猜测方法不对。
文档
搜来搜去在网上找到一个文档。
https://guides.dataverse.org/en/latest/api/auth.html
看来北大这个平台使用了dataverse,它提供了通过API下载文件的方法,一共有2种方式来通过API下载,教程本身适用于linux,鉴于我不太会在windows使用curl,没有研究。
大意就是下载时可以把API key传过去。

方法
打开北大开放研究数据平台右上角自己用户名,弹出下拉菜单,点击API令牌,生成一个令牌,这就是上面图中提到的API_TOKEN。
随后我去浏览器下载记录找到了之前下载失败的URL,例如
https://opendata.pku.edu.cn/api/access/datafile/6595?gbrecs=true
这个是 高德地图兴趣点POI(Point of Interest)数据之一
准备一个记事本,组装一下指令,组装好的指令长这样
Invoke-WebRequest -Uri “https://opendata.pku.edu.cn/api/access/datafile/6595?gbrecs=true&key=xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx” -OutFile “D:\Data\2018-POICSV-1.rar”
这里需要注意,xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx就是API_TOKEN,替换成自己的
D:\Data\2018-POICSV-1.rar 是存盘文件夹和文件名。
再右键win10的Windows图标按钮,打开power shell,把刚刚拼装好的指令粘贴进去,回车。
大概会出现这样的效果,耐心等候。如果有多个文件需要下载,可以再多开powershell 运行组装好的指令。

下载完毕后,到之前设置的存盘路径查看。


2012





