一、项目背景与目标
近年来,随着“资管新规”落地,银行理财产品收益率波动较大,用户需要动态掌握不同银行产品的实时年化收益率、风险等级、投资期限等数据,来辅助投资决策。
本项目目标是:构建一个自动化Python爬虫系统,定时采集中国主要银行发布在官方网站或理财平台上的理财产品收益率数据,并保存至本地或数据库中供后续分析使用。
采集目标网站示例:
- 银行官网理财频道,如:中国银行、建设银行、招商银行
- 银行理财子公司官网,如:工银理财、招银理财
- 第三方理财产品集合平台,如银率网、天天基金网(理财频道)
二、技术栈选择(2025主流方案)
1. 请求与解析库
requests
:常规页面请求httpx
:支持异步请求BeautifulSoup4
:HTML解析re
:正则辅助提取json
:接口数据解析
2. 反爬处理与自动化模拟
Selenium
+ChromeDriver
:动态页面加载处理Playwright
:更高效的页