import re
import csv
from fake_useragent import UserAgent
from urllib.request import Request,urlopen
# 4种产品,16个地区,td的结构是:[产品_地区1--高可用版--金融版--基础版--]-[产品_地区2--高可用版--金融版--基础版-]-[产品_地区3-高可用版--金融版---基础版--]
#包含表头,高可用版16行数据,金融版6行数据,基础版4行数据.
# 数据单元总数=[7*(6+4)+8*16]*16=
url1='https://www.alibabacloud.com/price/pricing2.jsonp?comp=RdsIns&site=cn&lang=zh&callback=jQuery1111013988241812375368_1552283266015&_=1552283266016'
headers = {'User-Agent': UserAgent().random}
request=Request(url1,headers=headers)
#返回的response为字符串
str_response=urlopen(request).read().decode('unicode_escape')
#保存response结果
with open('aliyun_response.txt','a') as f:
f.write(str_response)
#读取
str_response = open('aliyun.txt').read()
#切片结果是60-2=58,形式为list :['mysql_QD ','mysql_BJ '。。。。'PPAS_US_WEST']
name_area_subs= re.split(re.compile('<div id="RdsInsTableTrans_',re.S),str_response)
with open('aliyun_price.csv', 'w') as csvfile:
writer = csv.writer(csvfile)
for i in rang
抓取阿里云产品明细
最新推荐文章于 2024-07-19 03:05:54 发布