乐观的摸摸头2017-优快云博客

原创 Tensorboard

一.问题汇总1.tensorboard标量图中的鬼线 Tensorflow中标量汇总图的图像，绘制了两条橙色线。根据图例，一个对应于实际值（幻影线），另一个对应于平滑值（主线）。平滑是随时间（x轴），不超过每个迭代多个值。当损失可能非常不稳定时，这会产生更一致的曲线。如果您想要查看每个时间步骤的实际损失值，请关闭平滑滑块。2.tensorboard无法显示的...

2019-08-23 16:46:21 425

转载 linux关于bashrc与profile的区别(转)

/etc/profile，/etc/bashrc 是系统全局环境变量设定~/.profile，~/.bashrc用户家目录下的私有环境变量设定当登入系统时候获得一个shell进程时，其读取环境设定档有三步1首先读入的是全局环境变量设定档/etc/profile，然后根据其内容读取额外的设定的文档，如/etc/profile.d和/etc/inputrc2然后根据不同使用者帐号，去其家目录...

2018-12-24 17:05:02 1109

原创 python : copy() & deepcopy()

在高级语言中，变量是对内存及其地址的抽象。对于python而言，python的一切变量都是对象，变量的存储，采用了引用语义的方式，存储的只是一个变量的值所在的内存地址，而不是这个变量的只本身。 1. copy() 浅拷贝：不管多么复杂的数据结构，浅拷贝都只会copy一层 >>> import copy>>> c...

2018-08-08 11:14:54 250

原创 python 正则匹配中文字符

正则匹配中文，固定形式：\u4E00-\u9FA5 # -*- coding:utf-8 -*-import re'''python 3.5版本'''words = 'study in 山海大学'regex_str = ".*?([\u4E00-\u9FA5]+大学)"match_obj = re.match(regex_str, words)if match_ob...

2018-08-02 16:06:03 2865

原创 python 格式化输出

python格式化输出有两种方式：百分号和formatformat的功能要比百分号方式强大，其中format独有的可以自定义字符填充空白、字符串居中显示、转换二进制、整数自动分割、百分比显示等功能是百分号方式不能相比的1.百分号方式#!/usr/bin/env python# -*- coding: UTF-8 -*-s1 = "i am %s, i am %d years o...

2018-08-02 16:04:55 349

原创机器学习：sklearn.svm.SVC 参数说明

1.参考文献：SVM基本原理 https://www.cnblogs.com/vipyoumay/p/7560061.html2.sklearn.svm.SVC()参数参数：l C：C-SVC的惩罚参数C?默认值是1.0C越大，相当于惩罚松弛变量，希望松弛变量接近0，即对误分类的惩罚增大，趋向于对训练集全分对的情况，这样对训练集测试时准确率很高，但泛化能力弱。C值小，对误分类的...

2018-07-30 17:18:17 3074

翻译机器学习：Stacking融合模型

一.参考文献知乎(必读)：Kaggle机器学习之模型融合（stacking）心得 MrLevo520的Blog: Stacking Learning在分类问题中的使用 Blog：Stacking Models for Improved Predictions Blog：KAGGLE ENSEMBLING GUIDE(注脚) Blog：如何在 Kaggle 首战中进入前 10% Gi...

2018-07-30 17:13:09 2185 1

翻译 python3中内建函数map（）与reduce（）

map（）的使用 map（）的使用方法形如map(f(x),Itera).对，它有两个参数，第一个参数为某个函数，第二个为可迭代对象。如果不懂什么是函数，不懂什么是可迭代对象没关系，记住下面的例子就可以了：1 >>> def g(x):2 return 3 * x3 4 >>> l=map(g,[1,3,4,5,7,10])5 &g...

2018-07-30 16:59:13 185

原创 python 数据处理——Numpy

1.Numpy之array用法ndarray：N维数组对象（矩阵），所有元素必须是相同类型。ndarray属性：ndim属性，表示维度个数；shape属性，表示各维度大小；dtype属性，表示数据类型。创建ndarray数组from numpy import *a1 = [0,1,2,3,4,5] #一维数组a2 = [[0,1,2,3,...

2018-07-30 16:55:47 379

原创 python可视化——matplotlib绘制条形图方法

1.首先要绘制一个简单的条形图import numpy as npimport matplotlib.pyplot as pltfrom matplotlib import mlabfrom matplotlib import rcParamsfig1 = plt.figure(2)rects =plt.bar(left = (0.2,1),height = (1,0.5),wid...

2018-07-30 16:19:40 6039

翻译 python数据可视化——matplotlib

1、绘制简单折线#a.pyimport matplotlib.pyplot as pltsquares=[1,4,9,16,25]plt.plot(squares)plt.show()#函数plot()尝试根据数字绘制出有意义的图形#plt.show()打开matplotlib查看器，并显示绘制的图形2、修改标签文字和线条粗细1）使用参数linewidth决定plot()...

2018-07-30 15:15:46 1025

原创算法：快速排序稳定性

快速排序(Quick Sort)使用分治法策略它的基本思想是：选择一个基准数，通过一趟排序将要排序的数据分割成独立的两部分；其中一部分的所有数据都比另外一部分的所有数据都要小。然后，再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。快速排序流程：(1) 从数列中挑出一个基准值。(2) 将所有比基准值小的摆放在基准前面，所有比基准值大的摆在基...

2018-07-27 11:40:53 11372

原创算法初级：二分查找

二分查找又称折半查找，它是一种效率较高的查找方法。二分查找要求：线性表是有序表，即表中结点按关键字有序，并且要用向量作为表的存储结构。不妨设有序表是递增有序的。/*折半查找*/int Binary_Search(int a*,int n,int key){ int low,high,mid; low=1; /*定义最底下标为记录首位*/ ...

2018-07-27 10:35:34 535

原创 sql ：case when & if 表达式

CASE WHEN 及 SELECT CASE WHEN的用法一，已知数据按照另外一种方式进行分组，分析。有如下数据:(为了看得更清楚，我并没有使用国家代码，而是直接用国家名作为Primary Key)根据这个国家人口数据，统计亚洲和北美洲的人口数量。应该得到下面这个结果。解决这个问题，你会怎么做？生成一个带有洲Code的View是一个解决方法，但是这样很难动态的改变统计...

2018-07-26 14:35:13 21125 2

转载 sql

--数据库多表的连接查询一、外连接1.左连接 left join / left outer join左外连接包含left join 左表里的所有行，若左表在右表没有匹配，则结果中对应行的右表部分全部为空select * from student left join course on student.ID =course.ID 2. 右连接 right join/ right　out...

2018-07-25 16:29:22 177

原创机器学习：matplotlib包

1. 在python的matplotlib库中分别可用bar、barh、plot函数来构建它们，再使用xticks与yticks（设置坐标轴刻度）、xlabel与ylabel（设置坐标轴标签）、title（标题）、legend（图例）、xlim与ylim（设置坐标轴数据范围）、grid（设置网格线）等命令来装饰图形作者：博观厚积链接：https://www.jianshu.com/p/5a...

2018-07-24 15:07:39 223

转载机器学习: dropna()

清理无效数据df[df.isnull()] #返回的是个true或false的Series对象（掩码对象），进而筛选出我们需要的特定数据。df[df.notnull()]df.dropna() #将所有含有nan项的row删除df.dropna(axis=1,thresh=3) #将在列的方向上三个为NaN的项删除df.dropna(how='ALL') #将全...

2018-07-11 10:07:07 3100

原创机器学习：pandas 库drop()函数,astype()函数

1.drop函数的使用（1）drop函数的使用：删除行、删除列print frame.drop(['a'])print frame.drop(['Ohio'], axis = 1)12drop函数默认删除行，列需要加axis = 1（2）drop函数的使用：inplace参数采用drop方法，有下面三种等价的表达式：1. DF= DF.drop('column_name', axis=1)；2...

2018-07-11 10:04:49 5446

原创机器学习：to_csv函数

1.to_csv函数重要参数：path_or_buf，columns 参数详解： http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_csv.htmlexample:[source]

2018-07-11 09:58:40 2506

原创机器学习：pandas的Dataframe

1.字典转化为Dataframe一个key只有一个value的字典如果直接转化成数据框会报错1 pd.DataFrame(my_dict)2 ValueError: If using all scalar values, you must pass an index应该做如下转换1 pd.DataFrame.from_dict(my_dict,orient='index').T2. 字典转化为S...

2018-06-29 21:02:17 265

原创机器学习：Spyder使用单独窗口画图

参考：http://www.datastudy.cc/article/3cfc3aff3b2c5948b938456e00376276https://www.cnblogs.com/JZ-Ser/p/8124099.html 1. 在菜单的 Tools中，我们选择 Preferences 菜单，弹出设置窗口。 2.选择 IPython Console 的配...

2018-06-29 09:53:09 16447 3

原创机器学习：pandas库

1.Dataframe单列的数据变换map()函数，apply()函数：df[c[1]].map(lambda x : x+1)df[c[1]].map(func)df[c[1]].apply(func)def cardnumToPlace(item): result = re.match(r'^([0-9]{2})[0-9]+.*',item).group(1...

2018-06-28 14:40:35 197

原创机器学习：文本文件读取

a和a+、w和r有什么区别？ 1. r 打开只读文件，该文件必须存在。 2. w 打开只写文件，若文件存在则该文件内容覆盖。若文件不存在则建立该文件。 3. a 只能写，若文件不存在，则会建立该文件，如果文件存在，写入的数据会被加到文件尾。 a+ 读写，若文件不存在，则会建立该文件，如果文件存在，写入的数据会被加到文件尾后，即文件原先的内容会被保留。...

2018-06-27 11:05:38 949

原创机器学习：python 文本读取操作

1.readlines() 整文件读取，返回列列表 strip用于去除字符串的首尾字符，lstrip用于去除左边的字符，rstrip用于去除右边的字符。例：with open('read.txt','r') as f: for line in f.readlines(): item = line.rstrip('\n').split(';')...

2018-06-26 21:58:55 430

转载机器学习：IDE anaconda Spyder

Spyder——科学的Python开发环境2017年08月10日 21:26:14阅读数：4511 刚开始接触Python的时候，网上找到的资料基本上上来就是介绍Python语言，很少有对开发环境进行讲解的，但如果在学习的过程中不断练习，这样效率会更高，所以特意将一个Python的开发环境Spyder自带的入门教程翻译出来，希望可以帮助到和我有同样困惑的你。个人水平有限，会有...

2018-06-25 20:34:07 5722

转载机器学习：sklearn实战-乳腺癌细胞数据挖掘

sklearn实战-乳腺癌细胞数据挖掘https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share 医药统计项目联系QQ：231469242 如果样本量太小，数据...

2018-06-25 20:28:11 4622

转载机器学习：模型评估-sklearn中的评估函数

1.介绍有三种不同的方法来评估一个模型的预测质量：estimator的score方法：sklearn中的estimator都具有一个score方法，它提供了一个缺省的评估法则来解决问题。Scoring参数：使用cross-validation的模型评估工具，依赖于内部的scoring策略。见下。Metric函数：metrics模块实现了一些函数，用来评估预测误差。见下。2. scoring参数模型...

2018-06-25 20:24:48 9057 2

原创机器学习：特征工程 pandas 模块（一）

1.DataFrame类型数据操作函数df = DataFrame() #创建DataFrame对象df.dtypes #查看各行的数据格式df['列名'].astype(int)#转换某列的数据类型df.index #查看索引df.columns #查看列名df.values #查看数据值df.value_count() 列元素统计分布df.describe() #描述性统计...

2018-06-25 20:17:51 896

原创机器学习：特征工程 datetime 模块

1.to_datetime（）object转化为datetime类型例：pd.to_datetime(data[c[i]],format = '%Y-%m-%d')2.isoweekday() /dayofweek() 转化为星期几3.strptime() 字符串转化为datetime

2018-06-25 19:59:38 368

转载 Ubuntu中interfaces文件设置失效的问题！

**Ubuntu中interfaces文件设置失效的问题！**【Server版本】在UbuntuServer版本中，因为只存有命令行模式，所以要想进行网络参数设置，只能通过修改/etc/network/interfaces。具体设置方法如下： (1) UbuntuServer 修改 IP地址打开/etc/network/interfaces sudo vim/etc/network/i

2017-09-21 13:43:05 9733 1

原创 Ubuntu 15.10快速搭建本地源服务器

我们将使用APT-Mirror来实现。这里，我们将把默认的镜像包镜像到我们本地的服务器或个人电脑中，并且在你的本地或外置硬盘中，我们至少需要120GB或更多的可用空间才行。我们可以通过配置一个 HTTP或FTP服务器来与本地系统客户端共享这个软件仓库。实验环境：64位的Ubuntu15.10系统安装apt-mirrorsudoapt-get ins

2017-09-21 09:50:30 1087

乐观的摸摸头的博客