这是一个以http://item.jd.com/2957726.html为例的单页抓取案例
import urllib.request; #载入urllib.request,用于获取页面html源代码
from pandas import Series; #载入series包
from pandas import DataFrame; #载入dataframe包
from bs4 import BeautifulSoup; #载入beautifulsoup包
import json; #载入json包
response = urllib.request.urlopen('http://item.jd.com/2957726.html'); #获取html源代码
html = response.read(); #将源代码转入html
soup = BeautifulSoup(html); #解析html
data = DataFrame(columns=['Feature', 'Property']) #创建空白dataframe用于装载爬取信息
divSoup = soup.find(