
Python 数据分析
文章平均质量分 84
「已注销」
这个作者很懒,什么都没留下…
展开
-
Python- 简单的线性回归模型
在Python中使用线性回归算法 Scikit-Learn 涵盖了主流的机器学习算法,我们先介绍常用的几个库: lienar_model:线性模型算法库,包括Logistic回归算法等; neighbors:最邻近算法库; naive-bayes:朴素贝叶斯算法库; tree:决策树算法; svm:支持向量机算法; neural_network:神经网络算法。 如下,简单解释线性回归算法。其数学表达式如下: y^=Wx\boldsymbol{\hat y} = \boldsymbol{W} \bolds原创 2021-06-16 09:13:04 · 898 阅读 · 0 评论 -
Python数据分析-PCA
Handwritten digits from sklearn.datasets import load_digits digits= load_digits() digits.keys() dict_keys(['data', 'target', 'target_names', 'images', 'DESCR']) digits.images.shape (1797, 8, 8) digits.images[0,:,:] array([[ 0., 0., 5., 13., 9., 1原创 2021-05-21 14:37:00 · 335 阅读 · 0 评论 -
基于 Scrapy-Redis 全国房源信息抓取系统
基于 Scrapy-Redis 全国房源信息抓取系统 摘要 近几年,人们对房源信息的关注度越来越高。如何对全国房源信息进行灵活高效的采集并存储,对全国房源信息的分析工作起到重要作用。文中在分析房天下站点特征结构的基础上采用 Python 开源框架 Scrapy 搭配 Redis 数据库,设计实现了一套抓取速度快、扩展性高的分布式爬虫系统,获取的数据具有良好的实时性和准确性,为后续分析工作提供了有力的数据支撑。 关键字 :Scrapy 框架;Scrapy-Redis;分布式爬虫;可视化 前言 爬虫技术,无论是原创 2021-05-18 01:11:37 · 681 阅读 · 1 评论 -
Python数据分析(一):Basic、numpy、matplotlib和pandas介绍
Basic knowledge conditionals if elif else mark= 56 if mark>= 69.5: print("distribution") elif mark>= 59.5: print("merit") elif mark>= 50.0: print("pass") else: print("Fail") pass Loops for while break numbers= [1,2,3,4,5,6]原创 2021-05-16 21:40:12 · 344 阅读 · 0 评论