提升python运行速度的一些技巧

在大数据时代,Python作为广泛使用的编程语言,其简洁的语法和丰富的库深受喜爱。然而,Python的执行速度较慢。文章提供了五个优化技巧,包括选择合适的数据库结构、利用内置函数和库、避免循环重复计算、使用代理IP进行反爬以及正确设置HTTP代理来提高效率。

大数据时代,Python 是目前使用最广泛的编程语言之一,它是一种解释型高级通用编程语言,具有广泛的用途,几乎可以将其用于所有事物。其以简单的语法、优雅的代码和丰富的第三方库而闻名。python除了有很多优点外,但在速度上还有一个非常大的缺点。虽然Python代码运行缓慢,但可以通过下面分享的5个小技巧提Python运行速度。 1、选择合适的数据库结构,使用正确的数据结构对python脚本的运行时间有显着影响。 2、善用强大的内置函数和第三方库,如果你正在使用python并且仍在自己编写一些通用函数,那建议可以试试 Python提供的库和内置函数来帮助你不用编写这些函数。 3、避免循环重复计算,如果你有一个迭代器,必须用它的元素做一些耗时计算,比如匹配正则表达式。你应该将正则表达式模式定义在循环之外,因为最好只编译一次模式,而不是在循环的每次迭代中一次又一次地编译它。只要有可能,就应该尝试在循环外进行尽可能多的运算,比如将函数计算分配给局部变量,然后在函数中使用它。 4、访问目标网站过程中多做反爬措施,尤其是一些比较有价值的网站对IP的要求很严。在访问的过程中需要加上高质量的IP。代理有很多的选择,比如使用隧道模式的代理。这里我们示例的亿牛云爬虫代理IP,简直的代理IP的添加方式如下:

Plain Text

#! -- encoding:utf-8 --

​ import requests

​ import random

​ # 要访问的目标页面

​ targetUrl = “http://httpbin.org/ip”

​ # 要访问的目标HTTPS页面

​ # targetUrl = “https://httpbin.org/ip”

​ # 代理服务器(产品官网 www.16yun.cn)

​ proxyHost = “t.16yun.cn”

​ proxyPort = “31111”

​ # 代理验证信息

​ proxyUser = “username”

​ proxyPass = “password”

​ proxyMeta = “http://%(user)s:%(pass)s@%(host)s:%(port)s” % {

​ “host” : proxyHost,

​ “port” : proxyPort,

​ “user” : proxyUser,

​ “pass” : proxyPass,

​ }

​ # 设置 http和https访问都是用HTTP代理

​ proxies = {

​ “http” : proxyMeta,

​ “https” : proxyMeta,

​ }

​ # 设置IP切换头

​ tunnel = random.randint(1,10000)

​ headers = {“Proxy-Tunnel”: str(tunnel)}

​ resp = requests.get(targetUrl, proxies=proxies, headers=headers)

​ print resp.status_code

​ print resp.text

若有收获,就点个赞吧

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值