首先说知乎收藏夹批量下载工具

以下载 这才是我喜欢的知乎 这个收藏夹为例 https://www.zhihu.com/collection/19918379

知乎cookie放在cookie.txt文件总有人问我 cookie 到底是什么?,打开工具zhihu_collection_down 输入https://www.zhihu.com/collection/19918379 和页数(默认输入1),每次下载500条数据,如果要继续下,修改页数再次下载。

下载的回答,文章,视频在zhihu目录下,下载的视频在video目录。

下载完成后转换合成pdf依赖工具wkhtmltopdf ,需要将wkhtmltopdf.exe加入环境变量。

最后生成的pdf合集大小115MB,点击左侧标题书签可以跳转到对应内容,效果见网盘 https://pan.quark.cn/s/8522433ad346

顺便导出了知乎收藏夹列表目录excel,数据包含类型,标题,链接,创建时间,更新时间,简介 ,评论数,赞同数和页数(超过500条数据第2次下载的时候输入的最大页数)。

下载所有知乎回答以渤海小吏为例:

下载的所有回答html内容,文件名为回答日期加标题。

接着将html批量转换pdf 。

再将所有回答内容pdf合成一个pdf文件,大小106MB,效果见网盘https://pan.quark.cn/s/8522433ad346

每个回答都有原知乎回答链接,点击左侧书签跳转到对应回答。

所有知乎回答的文字导出txt ,大小只有2MB。

下载所有知乎文章以半佛仙人为例 :

下载的所有文章html内容,文件名为回答日期加标题。

接着将html批量转换pdf。

再将所有pdf合成一个pdf文件,大小57MB,效果见网盘 https://pan.quark.cn/s/8522433ad346

每篇文章都有原知乎文章链接,点击左侧书签跳转到对应回答。

所有知乎文章的文字导出txt ,大小只有2MB。

685

被折叠的 条评论
为什么被折叠?



