如果从抖音页面自带的下载功能下载的视频,带有水印,且有的视频本身不允许下载。如果要下载无水印的视频,可以利用爬虫技术,对页面的HTML代码进行分析。python环境下,利用requests框架容易获取到页面的HTML源码,但视频播放部分是通过页面的js脚本动态加载的,因此无法获取到视频的真正播放地址,通过脚本分析,可以解析出接口提交参数,但是难度很大。本文利用selenium框架,可以避免繁琐的脚本分析,通过简单的HTML代码解析,即可获取到视频播放的真实地址。
selenium框架是一个自动化测试框架,它采用模拟浏览器的各种事件,来操作网页。要正确使用selenim框架,必须下载相应的浏览器驱动程序。这里采用google的chrome浏览器,因此先要下载和当前浏览器版本匹配的驱动程序。笔者使用的chrome浏览器是131版本。
因此去下载相应的chromedriver驱动程序。这里是131版本的下载地址:
https://googlechromelabs.github.io/chrome-for-testing/#stable