简单爬取大型网站的在线翻译
from urllib import request,parse
import json
url="https://fanyi.baidu.com/sug"
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)Chrome/70.0.3538.110 Safari/537.36",
}
word=input("输入:")
data={
"kw":word,
}
#转换提交的内容
data_str=parse.urlencode(data)
#封装好url
req=request.Request(url=url,headers=headers,data=bytes(data_str,encoding="utf-8"))
#获取网页内容 是一个json格式
json_html=request.urlopen(req).read().decode("utf-8")
#转换json
html_dict=json.loads(json_html)
#打印查看
print(html_dict)
#这里是 提取内容排一下版
for i in html_dict["data"]:
# print(i)
n=0
for k,v in i.items():
if n == 0:
print("单词:",v)
else:
print("解释:",v)
n+=1
print()
后续内容待更新!!!