使用Python爬取YY小视频

最新推荐文章于 2024-04-27 15:36:51 发布

COMEO

最新推荐文章于 2024-04-27 15:36:51 发布

阅读量316

点赞数

CC 4.0 BY-SA版权

分类专栏： Python 文章标签： python

本文链接：https://blog.youkuaiyun.com/COMEO/article/details/107583858

Python 专栏收录该内容

3 篇文章

订阅专栏

import threading
class ShortVideoDownload(threading.Thread):
        def __init__(self,downloadurl,downloadDir,filename):
            threading.Thread.__init__(self)
            self.downloadurl = downloadurl
            self.downloadDir = downloadDir
            self.filename = filename
            import os
            self.fullpath = os.path.join(self.downloadDir,self.filename)
        
        def run(self):
            import requests
            import os

            if not os.path.exists(self.downloadDir):
                os.makedirs(self.downloadDir)
                print("\n",self.downloadDir," 不存在，已经创建(^---^)")
            if os.path.exists(self.fullpath):
                print("\n",self.fullpath," 已经存在")
                return 
            
            headers={"user-agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36"} 
            response = requests.get(url=self.downloadurl,headers=headers)
            error = 10
            while not response.ok  and error:
                response = requests.get(url=self.downloadurl,headers=headers)
                error -= 1
                import time
                import random
                time.sleep(random.randint(0,3))
            
            if not response.ok:
                print("\n",self.downloadurl,"获取失败，亲稍后重新尝试（^---^）")
                return 
            
            with open(self.fullpath,mode="wb") as fp:
                fp.write(response.content)
                
            print("\n",self.fullpath," 写入完成（^---^）")

class YYShortVideo(threading.Thread):
    
    def __init__(self,page):
        threading.Thread.__init__(self)
        self.url = "https://api-tinyvideo-web.yy.com/home/tinyvideos"
        self.params={'data':'{"uid":2580941092,"page":%s,"pageSize":10}'% page}
        self.headers={"user-agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36"}
        
    def run(self):

        import requests
        response = requests.get(url=self.url,params=self.params,headers=self.headers)
        error = 10
        while not response.ok  and error:
            response = requests.get(url=self.downloadurl,headers=headers)
            error -= 1
            import time
            import random
            time.sleep(random.randint(0,3))
    
        if not response.ok:
            print("\n",self.url,"获取失败，亲稍后重新尝试（^---^）")
            return 
        
        self.videoJsonData = response.json()['data']['data']
        
        self.saveVideos()
        
    def saveVideos(self):
        threadList=[]
        for each in self.videoJsonData:
            if each["resdesc"].find("舞") == -1:
                print("\n",each["resdesc"]," 不包含舞字，进行下一个(^---^)")
                continue
            threadProcess = ShortVideoDownload(each["resurl"],"./ShortVideo",each["resdesc"]+".mp4")
            threadProcess.start()
            threadList.append(threadProcess)
        for eachThread in threadList:
            eachThread.join()

YYthreadList=[]
begin=1
end=11
for i in range(begin,end,1):
    YYthreadProcess = YYShortVideo(i)
    YYthreadProcess.start()
    YYthreadList.append(YYthreadProcess)
for eachThread in YYthreadList:
    eachThread.join()
print("Videos全部保存完成，亲(^---^)")