
机器学习算法基础
文章平均质量分 61
Sunshine_502
这个作者很懒,什么都没留下…
展开
-
xgboost参数原理详解,适合入门新人
sklearn集成方法bagging常见变体(按照样本采样方式的不同划分)Pasting:直接从样本集里随机抽取的到训练样本子集Bagging:自助采样(有放回的抽样)得到训练子集Random Subspaces:列采样,按照特征进行样本子集的切分Random Patches:同时进行行采样、列采样得到样本子集sklearn-bagging学习器BaggingClassifierBaggingRegressor参数可自定义基学习器max_samples...原创 2021-01-22 22:37:33 · 5319 阅读 · 1 评论 -
NLP结巴分词,特征关键词提取
安装 全自动:easy_install jieba 或者 pip install jieba 或者pip3 install jieba手 动:jieba 目录放置于当前目录或者 site-packages 目录半自动:下载http://pypi.python.org/pypi/jieba/、解压、运行python setup.py install算法 基于统计词典,构造前缀词典;基于前缀词典对句子进行切分,得...原创 2021-01-15 17:11:16 · 1055 阅读 · 0 评论 -
Python将多维数组转换为一维
Python将二维数组/多维数组转换为一维分类专栏:Python文章标签:二维数组转一维Python将二维数组/多维数组转换为一维方法1:flatten 方法2:reshape+concatenate 方法3:sum() 方法4:列表推导式 方法5:operator 方法6:itertools方法1:flattenimport numpy as npmulArrays = [[1,2,3],[4,5,6],[7,8,9]]print(list(np.array(mul...原创 2020-11-04 11:14:53 · 14607 阅读 · 0 评论 -
改进后的朴素贝叶斯测试怀孕结果
import pandasimport mathimport numpy##读取训练数据 特征部分(机器人传感器收集的112个顾客气色,气味,脉象,体温等特征X=pandas.read_csv('train_X.csv')#读取训练数据 实际结果部分(上述112位顾客真实的怀孕状态,0代表女娃,1代表男孩,2表示没有怀孕y=pandas.read_csv('train_y.csv')class NavieBayes(object): def fit(self,x,y):原创 2020-10-16 17:03:06 · 268 阅读 · 0 评论 -
朴素贝叶斯之连续性数据预测怀孕结果
import pandasimport mathimport numpy##读取训练数据 特征部分(机器人传感器收集的112个顾客气色,气味,脉象,体温等特征X=pandas.read_csv('train_X.csv')#读取训练数据 实际结果部分(上述112位顾客真实的怀孕状态,0代表女娃,1代表男孩,2表示没有怀孕y=pandas.read_csv('train_y.csv')class NavieBayes(object): def fit(self,x,y):原创 2020-10-16 10:09:47 · 389 阅读 · 0 评论 -
朴素贝叶斯之文本分类
import numpyfrom numpy import *def getDataSet(): """ 加载训练数据, postingList是所有的训练集, 每一个列表代表一条言论, 一共有8条言论 classVec代表每一条言论的类别, 0是正常, 1是有侮辱性 返回 所有言论和类别 :return: """ postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'原创 2020-10-16 10:07:25 · 141 阅读 · 0 评论 -
朴素贝叶斯分类工作流程(离散数据,连续数据)
朴素贝叶斯分类工作原理数学基础1.条件概率设A,B 是两个事件,则表示在事件A发生的条件下,事件B发生的概率。其中P(A)不能为0,就是要求A是有可能的事件。2. 联合概率表示两个事件共同发生的概率。A与B的联合概率表示为 P(AB) 或者P(A,B),或者P(A∩B)。3. 朴素贝叶斯因为 P(B|A)=P(AB)/P(A) 》P(AB)=P(B|A)P(A)所以 P(A|B)=P(AB)/P(B) = P(B|A)P(A)/P(B)即 P(A|B)=P(B|A)P(A)/P(B)原创 2020-10-16 10:04:17 · 4488 阅读 · 0 评论