python爬取TED演讲视频(代码)

环境: windows+python3.6+pycharm(非必须)

引用的python库/模块:requests, bs4, os, random,you-get

准备知识:requests的应用,BeautifulSoup的find_all(),os.system(“cmd命令”),you-get

爬取步骤:

1.对于爬虫,我习惯都用上ip代理池,虽然有的网站没有反爬虫策略,但是用上也无大碍。将ip代理池封装为一个模块可以随时调用

直接贴代码:get_ip.py

import requests
from bs4 import BeautifulSoup
import random

head = {
    'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 6.0 x64; en-US; rv:1.9pre) Gecko/2008072421 Minefield/3.0.2pre',
    'ue': 'utf-8',
}

def get_ip_list():                                   # 从IP代理网站1直接爬取大量的ip
    url = 'http://www.xicidaili.com/nn/'           &nb
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值