- 博客(5)
- 收藏
- 关注
原创 【作业】岭回归和LASSO回归
一、岭回归(一)解决的问题1、自变量个数多于样本量2、存在多重共线性(二)解决方法在线性回归模型的目标函数上添加一个的正则项(也称为惩罚项),从而使得模型的回归系数有解岭回归模型的目标函数表示为:为了使目标函数达到最小,只能通过缩减回归系数使趋近于0求目标函数最小值:先对其求导,再令导函数为0重点:一个对应一个,求出最优的,使得目标函数最小,则得到相应回归系数(三)python实现(k重交叉验证法确定值)import pandas as pdimport nu
2021-10-20 21:33:34
1548
1
原创 东方财富:网址和项目名称爬取
平安银行(000001)资金流向 _ 数据中心 _ 东方财富网 (eastmoney.com)#导包import requestsfrom bs4 import BeautifulSoupimport pandas as pd【第一步】下载页面的HTML构造函数download_all_htmls,下载页面的HTML1、用requests.get函数获取html网页(构造一个向服务器请求资源的url对象,返回的是一个包含服务器资源的Response对象)2、r.status_co
2021-10-17 23:55:36
653
原创 豆瓣电影:TOP250榜单爬虫
#导包import requestsfrom bs4 import BeautifulSoupimport pandas as pd第一步:下载所有页面(共10个)的HTML【1】构造分页数字列表page_indexs【2】构造函数download_all_htmls,下载所有列表页面的HTML1、先添加请求头headers(爬取的网站有反爬虫机制,要向服务器发出爬虫请求,需要添加请求头headers。不然响应状态是418,正常情况应该是200。)2、利用for循环取到页面列表中.
2021-10-17 23:40:13
1537
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人