
学习笔记
文章平均质量分 92
DRAmonster
争取每一自然月发布一篇,加油
展开
-
练习过程中遇到的一些小问题
词云图wordCloud官方文档from wordcloud import WordCloud, STOPWORDS# 各参数意义:background_color设置背景,wordcloud = WordCloud(background_color='black', stopwords=STOPWORDS, max_words=200, max_font_size=100, random_state=17, w原创 2020-12-16 19:17:46 · 312 阅读 · 1 评论 -
决策数和k近邻分布
决策树决策数是分类与回归问题常用的方法之一。构建决策树熵熵是一个在物理、信息论和其他领域中广泛应用的重要概念,可以衡量获得的信息量。对于具有N种可能状态的系统(这个系统理解为决策树不同的特征顺序可以组成不同的决策树)而言,熵的定义如下:熵可以描述为系统的不确定程度,熵越高,系统的有序性越差,反之亦然。熵可以帮助我们高效的分割数据,例如帮我们找出将哪一个特征当做根节点比较好。玩具示例这个示例能够很好地解释熵如何有利于构建决策树模型的。这里有9个蓝球和11个黄球,如果随机选择一个球,这个球是转载 2020-12-04 20:32:40 · 475 阅读 · 0 评论 -
利用python数据分析(2)
利用python进行数据分析首先要导入数据,一般导入数据使用的是下面命令:import pandas as pd# 通过pd读取的文件是Dataframe格式的文件pd.read_csv('文件路径')原创 2020-11-27 13:40:25 · 901 阅读 · 0 评论 -
RNN神经网络
RNN神经网络RNN网络是一种基础的多层反馈神经网络,该神经网络的节点定向连接成环。相比于前馈神经网络,该网络内部具有很强的记忆性,它可以利用内部的记忆来处理任意时序的输入序列。循环网络的概念循环网络是一种对序列数据有较强的处理能力的网络。在网络模型中不同部分进行权值共享使得模型可以扩展到不同样式的样本,比如CNN网络中一个确定好的卷积核模板,几乎可以处理任何大小的图片。将图片中分成多个区域,使用同样的卷积核对每一个区域进行处理,最后可以获得非常好的处理结果。同样的,循环网络使用类似的模块(形式上相转载 2020-10-21 18:58:56 · 3293 阅读 · 0 评论 -
机器学习
监督学习监督学习的定义:给算法一个数据集,其中包含正确分数,并用此来预测新的数据集的分数。监督学习分为:回归问题(regression):设法预测连续值的输出。分类问题(classification):设法预测一个离散值的输出。在实际应用中,我们希望可以处理无穷多的特征(features),特征量过多也可能会导致内存溢出,在支持向量机(SVM)算法中提供一种数学方法来处理无穷多的特征。第一个学习算法:线性回归首先定义一些常用的符号:m:表示训练集的数量x:表示输入的特征变量y:表示输原创 2020-09-05 10:39:42 · 1252 阅读 · 0 评论