- 博客(32)
- 收藏
- 关注
原创 Tensorboard
一.问题汇总1.tensorboard标量图中的鬼线 Tensorflow中标量汇总图的图像,绘制了两条橙色线。根据图例,一个对应于实际值(幻影线),另一个对应于平滑值(主线)。 平滑是随时间(x轴),不超过每个迭代多个值。当损失可能非常不稳定时,这会产生更一致的曲线。如果您想要查看每个时间步骤的实际损失值,请关闭平滑滑块。2.tensorboard无法显示的...
2019-08-23 16:46:21
425
转载 linux关于bashrc与profile的区别(转)
/etc/profile,/etc/bashrc 是系统全局环境变量设定~/.profile,~/.bashrc用户家目录下的私有环境变量设定当登入系统时候获得一个shell进程时,其读取环境设定档有三步1首先读入的是全局环境变量设定档/etc/profile,然后根据其内容读取额外的设定的文档,如/etc/profile.d和/etc/inputrc2然后根据不同使用者帐号,去其家目录...
2018-12-24 17:05:02
1109
原创 python : copy() & deepcopy()
在高级语言中,变量是对内存及其地址的抽象。对于python而言,python的一切变量都是对象,变量的存储,采用了引用语义的方式,存储的只是一个变量的值所在的内存地址,而不是这个变量的只本身。 1. copy() 浅拷贝:不管多么复杂的数据结构,浅拷贝都只会copy一层 >>> import copy>>> c...
2018-08-08 11:14:54
250
原创 python 正则匹配中文字符
正则匹配中文,固定形式:\u4E00-\u9FA5 # -*- coding:utf-8 -*-import re'''python 3.5版本'''words = 'study in 山海大学'regex_str = ".*?([\u4E00-\u9FA5]+大学)"match_obj = re.match(regex_str, words)if match_ob...
2018-08-02 16:06:03
2865
原创 python 格式化输出
python格式化输出有两种方式:百分号和formatformat的功能要比百分号方式强大,其中format独有的可以自定义字符填充空白、字符串居中显示、转换二进制、整数自动分割、百分比显示 等功能是百分号方式不能相比的1.百分号方式#!/usr/bin/env python# -*- coding: UTF-8 -*-s1 = "i am %s, i am %d years o...
2018-08-02 16:04:55
349
原创 机器学习:sklearn.svm.SVC 参数说明
1.参考文献:SVM基本原理 https://www.cnblogs.com/vipyoumay/p/7560061.html2.sklearn.svm.SVC()参数参数:l C:C-SVC的惩罚参数C?默认值是1.0C越大,相当于惩罚松弛变量,希望松弛变量接近0,即对误分类的惩罚增大,趋向于对训练集全分对的情况,这样对训练集测试时准确率很高,但泛化能力弱。C值小,对误分类的...
2018-07-30 17:18:17
3074
翻译 机器学习:Stacking融合模型
一.参考文献知乎(必读):Kaggle机器学习之模型融合(stacking)心得 MrLevo520的Blog: Stacking Learning在分类问题中的使用 Blog:Stacking Models for Improved Predictions Blog:KAGGLE ENSEMBLING GUIDE(注脚) Blog:如何在 Kaggle 首战中进入前 10% Gi...
2018-07-30 17:13:09
2185
1
翻译 python3中内建函数map()与reduce()
map()的使用 map()的使用方法形如map(f(x),Itera).对,它有两个参数,第一个参数为某个函数,第二个为可迭代对象。如果不懂什么是函数,不懂什么是可迭代对象没关系,记住下面的例子就可以了:1 >>> def g(x):2 return 3 * x3 4 >>> l=map(g,[1,3,4,5,7,10])5 &g...
2018-07-30 16:59:13
185
原创 python 数据处理——Numpy
1.Numpy之array用法ndarray:N维数组对象(矩阵),所有元素必须是相同类型。ndarray属性:ndim属性,表示维度个数;shape属性,表示各维度大小;dtype属性,表示数据类型。创建ndarray数组from numpy import *a1 = [0,1,2,3,4,5] #一维数组a2 = [[0,1,2,3,...
2018-07-30 16:55:47
379
原创 python可视化——matplotlib绘制条形图方法
1.首先要绘制一个简单的条形图import numpy as npimport matplotlib.pyplot as pltfrom matplotlib import mlabfrom matplotlib import rcParamsfig1 = plt.figure(2)rects =plt.bar(left = (0.2,1),height = (1,0.5),wid...
2018-07-30 16:19:40
6039
翻译 python数据可视化——matplotlib
1、绘制简单折线#a.pyimport matplotlib.pyplot as pltsquares=[1,4,9,16,25]plt.plot(squares)plt.show()#函数plot()尝试根据数字绘制出有意义的图形#plt.show()打开matplotlib查看器,并显示绘制的图形2、修改标签文字和线条粗细1)使用参数linewidth决定plot()...
2018-07-30 15:15:46
1025
原创 算法:快速排序稳定性
快速排序(Quick Sort)使用分治法策略它的基本思想是:选择一个基准数,通过一趟排序将要排序的数据分割成独立的两部分;其中一部分的所有数据都比另外一部分的所有数据都要小。然后,再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。快速排序流程:(1) 从数列中挑出一个基准值。(2) 将所有比基准值小的摆放在基准前面,所有比基准值大的摆在基...
2018-07-27 11:40:53
11372
原创 算法初级:二分查找
二分查找又称折半查找,它是一种效率较高的查找方法。 二分查找要求:线性表是有序表,即表中结点按关键字有序,并且要用向量作为表的存储结构。不妨设有序表是递增有序的。/*折半查找*/int Binary_Search(int a*,int n,int key){ int low,high,mid; low=1; /*定义最底下标为记录首位*/ ...
2018-07-27 10:35:34
535
原创 sql :case when & if 表达式
CASE WHEN 及 SELECT CASE WHEN的用法一,已知数据按照另外一种方式进行分组,分析。有如下数据:(为了看得更清楚,我并没有使用国家代码,而是直接用国家名作为Primary Key)根据这个国家人口数据,统计亚洲和北美洲的人口数量。应该得到下面这个结果。 解决这个问题,你会怎么做?生成一个带有洲Code的View是一个解决方法,但是这样很难动态的改变统计...
2018-07-26 14:35:13
21125
2
转载 sql
--数据库多表的连接查询一、外连接1.左连接 left join / left outer join左外连接包含left join 左表里的所有行,若左表在右表没有匹配,则结果中对应行的右表部分全部为空select * from student left join course on student.ID =course.ID 2. 右连接 right join/ right out...
2018-07-25 16:29:22
177
原创 机器学习:matplotlib包
1. 在python的matplotlib库中分别可用bar、barh、plot函数来构建它们,再使用xticks与yticks(设置坐标轴刻度)、xlabel与ylabel(设置坐标轴标签)、title(标题)、legend(图例)、xlim与ylim(设置坐标轴数据范围)、grid(设置网格线)等命令来装饰图形作者:博观厚积链接:https://www.jianshu.com/p/5a...
2018-07-24 15:07:39
223
转载 机器学习: dropna()
清理无效数据df[df.isnull()] #返回的是个true或false的Series对象(掩码对象),进而筛选出我们需要的特定数据。df[df.notnull()]df.dropna() #将所有含有nan项的row删除df.dropna(axis=1,thresh=3) #将在列的方向上三个为NaN的项删除df.dropna(how='ALL') #将全...
2018-07-11 10:07:07
3100
原创 机器学习:pandas 库drop()函数,astype()函数
1.drop函数的使用(1)drop函数的使用:删除行、删除列print frame.drop(['a'])print frame.drop(['Ohio'], axis = 1)12drop函数默认删除行,列需要加axis = 1(2)drop函数的使用:inplace参数采用drop方法,有下面三种等价的表达式:1. DF= DF.drop('column_name', axis=1);2...
2018-07-11 10:04:49
5446
原创 机器学习:to_csv函数
1.to_csv函数重要参数:path_or_buf,columns 参数详解: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_csv.htmlexample:[source]
2018-07-11 09:58:40
2506
原创 机器学习:pandas的Dataframe
1.字典转化为Dataframe一个key只有一个value的字典如果直接转化成数据框会报错1 pd.DataFrame(my_dict)2 ValueError: If using all scalar values, you must pass an index应该做如下转换1 pd.DataFrame.from_dict(my_dict,orient='index').T2. 字典转化为S...
2018-06-29 21:02:17
265
原创 机器学习:Spyder使用单独窗口画图
参考:http://www.datastudy.cc/article/3cfc3aff3b2c5948b938456e00376276https://www.cnblogs.com/JZ-Ser/p/8124099.html 1. 在菜单的 Tools中,我们选择 Preferences 菜单,弹出设置窗口。 2.选择 IPython Console 的配...
2018-06-29 09:53:09
16447
3
原创 机器学习:pandas库
1.Dataframe单列的数据变换map()函数,apply()函数:df[c[1]].map(lambda x : x+1)df[c[1]].map(func)df[c[1]].apply(func)def cardnumToPlace(item): result = re.match(r'^([0-9]{2})[0-9]+.*',item).group(1...
2018-06-28 14:40:35
197
原创 机器学习:文本文件读取
a和a+、w和r有什么区别? 1. r 打开只读文件,该文件必须存在。 2. w 打开只写文件,若文件存在则该文件内容覆盖。若文件不存在则建立该文件。 3. a 只能写,若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾。 a+ 读写,若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾后,即文件原先的内容会被保留。...
2018-06-27 11:05:38
949
原创 机器学习:python 文本读取操作
1.readlines() 整文件读取,返回列列表 strip用于去除字符串的首尾字符,lstrip用于去除左边的字符,rstrip用于去除右边的字符。例:with open('read.txt','r') as f: for line in f.readlines(): item = line.rstrip('\n').split(';')...
2018-06-26 21:58:55
430
转载 机器学习:IDE anaconda Spyder
Spyder——科学的Python开发环境2017年08月10日 21:26:14阅读数:4511 刚开始接触Python的时候,网上找到的资料基本上上来就是介绍Python语言,很少有对开发环境进行讲解的,但如果在学习的过程中不断练习,这样效率会更高,所以特意将一个Python的开发环境Spyder自带的入门教程翻译出来,希望可以帮助到和我有同样困惑的你。个人水平有限,会有...
2018-06-25 20:34:07
5722
转载 机器学习:sklearn实战-乳腺癌细胞数据挖掘
sklearn实战-乳腺癌细胞数据挖掘https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share 医药统计项目联系QQ:231469242 如果样本量太小,数据...
2018-06-25 20:28:11
4622
转载 机器学习:模型评估-sklearn中的评估函数
1.介绍有三种不同的方法来评估一个模型的预测质量:estimator的score方法:sklearn中的estimator都具有一个score方法,它提供了一个缺省的评估法则来解决问题。Scoring参数:使用cross-validation的模型评估工具,依赖于内部的scoring策略。见下。Metric函数:metrics模块实现了一些函数,用来评估预测误差。见下。2. scoring参数模型...
2018-06-25 20:24:48
9057
2
原创 机器学习:特征工程 pandas 模块(一)
1.DataFrame类型数据操作函数df = DataFrame() #创建DataFrame对象df.dtypes #查看各行的数据格式df['列名'].astype(int)#转换某列的数据类型df.index #查看索引df.columns #查看列名df.values #查看数据值df.value_count() 列元素统计分布df.describe() #描述性统计...
2018-06-25 20:17:51
896
原创 机器学习:特征工程 datetime 模块
1.to_datetime()object转化为datetime类型例:pd.to_datetime(data[c[i]],format = '%Y-%m-%d')2.isoweekday() /dayofweek() 转化为星期几3.strptime() 字符串转化为datetime
2018-06-25 19:59:38
368
转载 **Ubuntu中interfaces文件设置失效的问题!**
**Ubuntu中interfaces文件设置失效的问题!**【Server版本】 在UbuntuServer版本中,因为只存有命令行模式,所以要想进行网络参数设置,只能通过修改/etc/network/interfaces。具体设置方法如下: (1) UbuntuServer 修改 IP地址 打开/etc/network/interfaces sudo vim/etc/network/i
2017-09-21 13:43:05
9733
1
原创 Ubuntu 15.10快速搭建本地源服务器
我们将使用APT-Mirror来实现。这里,我们将把默认的镜像包镜像到我们本地的服务器或个人电脑中,并且在你的本地或外置硬盘中,我们至少需要120GB或更多的可用空间才行。我们可以通过配置一个 HTTP或FTP服务器来与本地系统客户端共享这个软件仓库。 实验环境:64位的Ubuntu15.10系统安装apt-mirrorsudoapt-get ins
2017-09-21 09:50:30
1087
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人