requests_html爬取表情包

博客围绕表情包爬取展开,但具体内容缺失。推测可能涉及爬取表情包的方法、技术等信息技术相关内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


```#进行爬取https://fabiaoqing.com/biaoqing
import requests
import os
from requests_html import HTMLSession#必须使用session = HTMLSession()
session = HTMLSession()
os.makedirs('C:/表情包',exist_ok=True)
path='C:/表情包/'
a=0
fail=0
def save(respone,name):
    with open(path+name+'.jpg','wb') as f:
        f.write(respone)
def savegif(respone,name):
    with open(path + name + '.gif', 'wb') as f:
        f.write(respone)
def src(i):
    r=session.get('https://fabiaoqing.com/biaoqing/lists/page/'+str(i)+'.html')
    for i in range(1,46):
        div=r.html.find('#bqb > div.ui.segment.imghover > div:nth-child('+str(i)+') > a > img',first=True)
        # print(div.find('img'))#直接定位到img标签,具体分析,获取相应的数据
        try:
            print(div.attrs['data-original'])#获取到地址
            print(div.attrs['title'])#获取到title
            title=div.attrs['title']
            link=str(div.attrs['data-original'])
            print(link)
            connet=requests.get(link)
            if (link[-3:]=='jpg'):
                save(connet.content,title)
            else:
                savegif(connet.content, title)
            # with open(path + title + '.jpg', 'wb') as f:
            #     f.write(connet.content)
        except:
            print("没有定位到超链接")
            global fail
            fail=fail+1
        global a
        a=a+1
        print('在下载第d%张'%a)#下载了多少个
    print('失败d%张'%fail)

for i in range(0,201):
    src(i)



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值