
机器学习
文章平均质量分 66
Hhhy云帆
Keep simple things simple.
展开
-
pandas 报错
E:\Anaconda3\python.exe C:/Users/yunfan/Desktop/5.25/data_after.pystr_date= ('2000', '11', '5')编号: YL1:ylrq 2000/11/5 未找到str_date= ('2017', '5', '13')Traceback (most recent call last): File "E:\...原创 2018-05-30 01:49:03 · 7207 阅读 · 5 评论 -
pandas查询数据
pandas查询数据通过布尔索引有针对的选取原数据的子集、指定行、指定列等。 我们先导入一个student数据集: student = pd.read_csv(‘C:\Users\admin\Desktop\student.csv’) 查询数据的前5行或末尾5行 student.head() student.tail()查询指定的行studen...原创 2018-05-23 17:01:38 · 2298 阅读 · 0 评论 -
pandas 根据列的值选取所有行
# 选取等于某些值的行记录 用 == df.loc[df['column_name'] == some_value]# 选取某列是否是某一类型的数值 用 isindf.loc[df['column_name'].isin(some_values)]# 多种条件的选取 用 &df.loc[(df['column'] == some_value) & df['other_...原创 2018-05-23 16:40:17 · 11150 阅读 · 0 评论 -
pandas 删除某列空值
import pandas as pd# 删除含有空数据的全部行df4 = pd.read_csv('4.csv', encoding='utf-8')df4 = df4.dropna()# 可以通过axis参数来删除含有空数据的全部列df4 = df4.dropna(axis=1)# 可以通过subset参数来删除在age和sex中含有空数据的全部行df4 = df4.dr...原创 2018-05-15 17:53:39 · 28592 阅读 · 1 评论 -
pandas查询数据
pandas查询数据这里的查询数据相当于R语言里的subset功能,可以通过布尔索引有针对的选取原数据的子集、指定行、指定列等。我们先导入一个student数据集:student = pd.io.parsers.read_csv(‘C:\Users\admin\Desktop\student.csv’) 查询数据的前5行或末尾5行student.head() student.tai...原创 2018-07-30 11:54:09 · 2023 阅读 · 0 评论 -
tf.keras损失函数总结
tf.keras损失函数一览keras.losses.mean_squared_errorkeras.losses.mean_absolute_errorkeras.losses.mean_absolute_percentage_errorkeras.losses.mean_squared_logarithmic_errorkeras.losses.squared_hingekera...原创 2019-02-26 15:54:08 · 6650 阅读 · 0 评论 -
TensorFlow Datasets简介
公共数据集为机器学习研究的快速发展提供了动力,但仅仅将这些数据集放入机器学习管道仍然太困难了。 每个研究人员都经历了编写一次性脚本以下载和准备他们使用的每个数据集的痛苦,这些数据集都具有不同的源格式和复杂性。今天,我们很高兴推出TensorFlow Datasets(GitHub),它将公共研究数据集公开为tf.data.Datasets和NumPy数组。 它完成了获取源数据并将其准备为磁盘上...原创 2019-03-19 16:06:39 · 7580 阅读 · 0 评论 -
Models/Tutorials/image/mnist模块源码分析之(一)
# Copyright 2015 The TensorFlow Authors. All Rights Reserved.## Licensed under the Apache License, Version 2.0 (the "License");# you may not use this file except in compliance with the License.# Y...原创 2018-07-20 12:07:08 · 320 阅读 · 0 评论 -
Import error with mpl_toolkits.mplot3d报错
引入以下即可import importlibimportlib.import_module('mpl_toolkits.mplot3d').__path__原创 2018-07-03 10:15:23 · 3273 阅读 · 0 评论 -
统计学习方法
李航老师《统计学习方法》statistical learning methods总结原创 2017-05-20 11:22:25 · 687 阅读 · 0 评论 -
浅谈Machine Learning
哲学通常告诉我们通过“是什么,为什么,怎么办”来认识问题,这是我们大脑认识问题的思维逻辑过程。“是什么”是通过定义来揭示事物的本质属性,“为什么”是探究事物的因果关系,揭示其形成的原因。“怎么办”是我们通过问题,找到如何解决它的科学方法和思路,下面我们也从这几方面来认识Machine Learning。1.机器学习定义 首先从其定义入手,机器学习(Machine Learning, ML)是一门原创 2017-05-20 14:18:28 · 727 阅读 · 0 评论 -
machine learning key word (part two)
machine learning key word (part two)error rate:错误率accuracy:精度error:误差training error:训练误差(或“empirical error:经验误差”)test error:测试误差generalization error:泛化误差overfitting:过拟合underfitting:欠拟合model selection:原创 2017-07-02 18:10:31 · 424 阅读 · 0 评论 -
machine learning key word (part one)
machine learning:机器学习常用术语(one part) learning algorithm:学习算法 instance/sample:示例/样本 example:样例 label:标记 attribute/feature:属性/特征 attribute value:属性值 attribute space:属性空间 sa原创 2017-07-02 18:09:01 · 347 阅读 · 0 评论 -
scikit-learn实现决策树
参考scikit-learn v0.19.0, 此处使用鸢尾花数据实现决策树#!/usr/bin/python# -*- coding:utf-8 -*-import numpy as npimport pandas as pddef main(): #预处理 from sklearn.datasets import load_iris iris = load_iris原创 2017-09-05 12:08:56 · 538 阅读 · 0 评论 -
sklearn之train_test_split()解析
train_test_split()是sklearn.cross_validation模块中用来随机划分训练集和测试集,以Iris数据集为例。有以下四个特征 - sepal length in cm - sepal width in cm - petal length in cm - petal width in cm 分为3个类别: - Iris Setosa - Ir原创 2017-08-23 16:16:19 · 57727 阅读 · 1 评论 -
scikit-learn简介
scikit-learn 的六大功能scikit-learn的基本功能主要被分为六大部分:分类,回归,聚类,数据降维,模型选择和数据预处理。分类是指识别给定对象的所属类别,属于监督学习的范畴,最常见的应用场景包括垃圾邮件检测和图像识别等。目前Scikit-learn已经实现的算法包括:支持向量机(SVM),最近邻,逻辑回归,随机森林,决策树以及多层感知器(MLP)神经网络等等。需要指出的是,由于S原创 2017-08-29 20:08:19 · 676 阅读 · 0 评论 -
机器学习方差和偏差权衡(Understanding the Bias-Variance Tradeoff)
当我们讨论预测模型时,预测误差可以分解成我们关心的两个主要的子部分:由于“偏差”导致的误差和由于“偏差”导致的误差。 在模型将偏差和方差最小化的能力之间进行权衡。 了解这两种类型的错误可以帮助我们诊断模型结果,避免过度或不合适的错误。 1. Bias and Variance 理解不同的误差来源如何导致偏差和方差有助于我们改进数据拟合过程,从而产生更准确的模型。我们用三种方式来定义偏差和方差:概原创 2017-12-01 17:26:37 · 775 阅读 · 0 评论 -
深度强化学习简要概述(A brief Survey of deep reinforcement learning)
深度强化学习简要概述作者:Kai Arulkumaran, Marc Peter Deisenroth, Miles Brundage, Anil Anthony Bharathpaper地址: A brief Survey of deep reinforcement learning摘要深度强化学习(DRL)将为人工智能领域带来革命性的变化,并代表着朝向构建对视觉世界...原创 2018-03-09 23:52:42 · 12564 阅读 · 1 评论 -
数据与特征处理
特征处理 1.数值型幅度调整/归一化统计max、min、mean、std离散化Hash分桶每个类别下对应的变量统计值histogram(分步情况) 2.类别型one-hot编码哑变量Hash与聚类处理 3.时间型 4.文本类 5.统计类 6.组合特征...原创 2018-07-03 10:14:30 · 330 阅读 · 0 评论 -
AI和机器学习发展历程
Developments in machine learning and AI原创 2017-05-22 23:05:52 · 604 阅读 · 0 评论