- 博客(84)
- 收藏
- 关注
转载 孤立森林算法介绍
http://www.itheima.com/news/20191108/114529.htmliForest由t个iTree(Isolation Tree)孤立树组成,每个iTree是一个二叉树结构,其实现步骤如下:从训练数据中随机选择Ψ个点样本点作为子样本,放入树的根节点。随机指定一个维度,在当前节点数据中随机产生一个切割点p——切割点产生于当前节点数据中指定维度的最大值和最小值之间。以此切割点生成了一个超平面,然后将当前节点数据空间划分为2 个子空间:把指定维度里小于p的数据放在
2021-01-05 16:02:22
536
转载 excel中vlookup使用
https://jingyan.baidu.com/article/5bbb5a1b675cce53eba179de.html
2020-12-22 15:35:04
255
转载 jupyter notebook画图
%matplotlib auto#将图片内嵌在交互窗口,而不是弹出一个图片窗口import matplotlib.pyplot as pltimport numpy as np#将图片内嵌在交互窗口,而不是弹出一个图片窗口,如果屏蔽掉则弹出图片窗口# %matplotlib inlineX=np.linspace(-np.pi,np.pi,256,endpoint=True)#-π to+π的256个值C,S=np.cos(X),np.sin(X)plt.plot(X,C)pl
2020-11-18 23:56:54
3367
原创 相对时间&绝对时间相互转换
#相对时间转换为绝对时间:2020-02-03 07:05:05 -----》1462451334 df_data.loc[:, 'datatime'] = [time.mktime(time.strptime(str(x), "%Y-%m-%d %H:%M:%S")) for x in df_data.datatime]```#绝对时间转换为相对时间df_save2.loc[:, 'datatime'] = [tim
2020-11-15 21:40:42
4665
转载 pandas dataframe数据提取的方法
import numpy as npfrom pandas import DataFrameimport pandas as pddf=DataFrame(np.arange(12).reshape((3,4)),index=['one','two','thr'],columns=list('abcd'))df['a']#取a列df[['a','b']]#取a、b列#ix可以用数字索引,也可以用index和column索引df.ix[0]#取第0行df.ix[0:1]#取第0行df
2020-11-11 23:15:45
3494
转载 Jupyter中显示数据data时只显示省略号不显示完整数据
在开头导入pandas后加入以下:设置行不限制数量pd.set_option(‘display.max_rows’,None)设置列不限制数量pd.set_option(‘display.max_columns’,None)
2020-11-11 22:20:36
3539
原创 Environment install
1.在本地的conda里已经有一个AAA的环境,我想创建一个新环境跟它一模一样的叫BBBconda create -n BBB --clone AAA```2. 把当前环境迁移到另一台机器下2.1先安装canda-pack pip install conda-pack2.2 输入conda-pack把当前环境打包(如下图)2.3将lhyenv.tar.gz包拷贝到另一个节点的机器解压即可3.离线安装某个包3.1查看支持的包的名称3.2下载对应版本的包3.2.1 下载网
2020-11-05 09:43:06
177
转载 python使用sqlalchemy连接mysql数据库
sqlalchemy是python当中比较出名的orm程序。什么是orm?orm英文全称object relational mapping,就是对象映射关系程序,简单来说我们类似python这种面向对象的程序来说一切皆对象,但是我们使用的数据库却都是关系型的,为了保证一致的使用习惯,通过orm将编程语言的对象模型和数据库的关系模型建立映射关系,这样我们在使用编程语言对数据库进行操作的时候可以直接使用编程语言的对象模型进行操作就可以了,而不用直接使用sql语言。什么是sqlalchemy?sqlalc
2020-11-04 22:04:51
531
转载 机器学习-异常检测算法(一):Isolation Forest
异常检测 (anomaly detection),或者又被称为“离群点检测” (outlier detection),是机器学习研究领域中跟现实紧密联系、有广泛应用需求的一类问题。但是,什么是异常,并没有标准答案,“异常”的两个标准或者说假设:异常数据跟样本中大多数数据不太一样。异常数据在整体数据样本中占比比较小。为了刻画异常数据的“不一样”,最直接的做法是利用各种统计的、距离的、密度的量化指标去描述数据样本跟其他样本的疏离程度。而 Isolation Forest (Liu et al. 2011
2020-10-29 13:49:50
438
转载 enumerate()使用方法
enumerate()(单词意思是枚举的意思)是python中的内置函数enumerate(X,[start=0])函数中的参数X可以是一个迭代器(iterator)或者是一个序列,start是起始计数值,默认从0开始。X可以是一个字典。(注意观察下面的输出结果)a = {1: 1, 2: 2, 3: 3}for i , item in enumerate(a):print (i, item)Output:0 11 22 3b=[1,2,3,4,5,6]for i,item in en
2020-10-13 19:14:48
7276
1
转载 python中sys.stdin和sys.stdout用法
1sys.stdin.readline()import sys# sys.stdin.readline() 相当于input,区别在于input不会读入'\n'aa = sys.stdin.readline()bb = input('请输入:') print(len(aa))print(len(bb)) #结果i love DL请输入:i love DL1092.sys.stdout.write(‘hello’ + ‘\n’)sys.stdout.write(‘hello’
2020-10-13 18:53:27
394
原创 [作业]Day3-《青春有你2》选手数据分析
!!!作业说明!!!请在下方提示位置,补充代码,对《青春有你2》对选手体重分布进行可视化,绘制饼状图,如下图所示:不要求跟下图样式一模一样任务描述:基于第二天实践使用Python来爬去百度百科中《青春有你2》所有参赛选手的信息,进行数据可视化分析。# 如果需要进行持久化安装, 需要使用持久化路径, 如下方代码示例:#!mkdir /home/aistudio/external-libraries#!pip install matplotlib -t /home/aistudio/exte
2020-10-09 13:33:33
566
1
原创 Day3-人工智能常用Python库
Python被大量应用在数据挖掘和深度学习领域,其中使用极其广泛的是Numpy、pandas、Matplotlib、PIL等库。numpy是Python科学计算库的基础。包含了强大的N维数组对象和向量运算。pandas是建立在numpy基础上的高效数据分析处理库,是Python的重要数据分析库。Matplotlib是一个主要用于绘制二维图形的Python库。用途:绘图、可视化PIL库是一个具有强大图像处理能力的第三方库。用途:图像处理深度学习常用Python库Numpy库1.数组创建2.数.
2020-10-09 10:07:47
2241
原创 pandas 修改 DataFrame 列名
pandas 修改 DataFrame 所有列名为小写pandas 修改 DataFrame 列名①暴力②修改③修改④暴力(好处:也可只修改特定的列)⑤修改Python 字符串大小写转换pandas 修改 DataFrame 所有列名为小写pandas 修改 DataFrame 列名问题:有一个DataFrame,列名为:[‘a′,′a', 'a′,′b’, ‘c′,′c', 'c′,′d’, ‘$e’]现需要改为:[‘a’, ‘b’, ‘c’, ‘d’, ‘e’]有何办法?import pan
2020-10-08 15:09:31
5313
原创 百度AI入门课-day2作业
!!!作业说明!!!1.请在下方提示位置,补充代码,完成《青春有你2》选手图片爬取,将爬取图片进行保存,保证代码正常运行2.打印爬取的所有图片的绝对路径,以及爬取的图片总数,此部分已经给出代码。请在提交前,一定要保证有打印结果,如下图所示:深度学习一般过程:收集数据,尤其是有标签、高质量的数据是一件昂贵的工作。爬虫的过程,就是模仿浏览器的行为,往目标站点发送请求,接收服务器的响应数据,提取需要的信息,并进行保存的过程。Python为爬虫的实现提供了工具:requests模块、
2020-10-07 15:32:02
3366
原创 百度AI入门课-day1作业
作业一:输出 9*9 乘法口诀表(注意格式)def table(): #在这里写下您的乘法口诀表代码吧! for j in range(1,10): for i in range(1,j+1): #print(str(i)+str(*)+str(j)+"="+str(i*j),end='\t') #end='\t'表示前面的字符串以tab结尾 print('%d*%d=%d'%(i,j,i*j),end='\t')
2020-10-07 15:19:15
341
原创 百度AI入门课-day2(python基础)
文章目录1.math模块2.字符串2.1三引号3 列表获取第一个元素查询names里面有没有superman更简单的方法,来查询names里有没有superman3.1append方法3.2extend方法3.3 insert方法3.4列表元素修改,通过下标找到元素,然后用=赋值3.5列表元素删除3.6列表切片3.7列表排序默认升序降序1.math模块`import mathprint(math.ceil(4.1)) #返回数字的上入整数print(math.floor(4.9)) #返回
2020-10-07 11:47:47
959
原创 动力电池基本知识
多少Ah等于1度电光看AH不行,还要看电池电压,以常见的12v100ah电池为例,充满电后容电量是12*100=1200wh,相当于1.2度电的能量。
2020-10-06 16:25:12
5131
1
转载 python 字典与DataFrame之间的相互转换
字典转DataFramef = {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389,}fOut[12]: {'2012-06-08': 388, '2012-06-09': 388, '2012-06-10': 388, '2012-06-11': 389, '2012-06-12': 38.
2020-09-26 23:14:24
468
原创 svm
# -*- coding: utf-8 -*-"""Created on Sun Nov 10 15:48:52 2019@author: hongyangneng"""from sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import LabelBinarizerfrom sklearn.preprocessing import StandardScalerfrom sklearn
2020-08-25 00:15:40
180
原创 LSTMCLASS
import tensorflow as tfclass LSTM(object): """docstring for LSTM""" def __init__(self, n_batch, n_step, n_input, n_output, n_cell, lr): super(LSTM, self).__init__() self.batch = n_batch self.step = n_step self.n_
2020-08-25 00:14:55
268
原创 LSTM程序
import matplotlib.pyplot as plt# 支持中文plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号fig, ax1 = plt.subplots()#ax2 = ax1.twinx()# 按一定间隔显示实现方法# ax2.plot(200 * np.arange(len(fig_accura
2020-08-25 00:13:37
231
原创 LSTM程序
# -*- coding: utf-8 -*-"""Created on Tue Feb 18 13:44:21 2020@author: hongyangneng"""from sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import LabelBinarizerfrom sklearn.preprocessing import StandardScalerfrom sklearn
2020-08-25 00:12:15
574
原创 excel批量处理表格
import openpyxl # 酱酱的注释,看仔细喽,这是一个函数库openpyxl ,用pip install安装import redef Exceldivide(file_dir): wb = openpyxl.load_workbook(file_dir) # 打开原有的excel表 sheet = wb.get_sheet_by_name('Sheet1') tuple(sheet['A1':'C3']) wb.create_sheet('Sheet
2020-08-25 00:02:27
655
原创 python数据可视化
import matplotlib.pyplot as pltimport numpy as npx=np.arange(0,1,0.05)print(x)[0. 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95]#y=sin(2*pi*x)y=np.sin(2*np.pi*x)print(y)[ 0.00000000e+00 3.090169
2020-08-24 23:50:39
189
原创 PYTHON安装
1 Windows版本安装文档 (适用于win7,win8,win10)《Python+pip+VSCode 一键安装(推荐)》https://shimo.im/docs/lgqAaLT0dRMVCEcC/《Windows版本Python环境安装详细教程》https://shimo.im/docs/uBqiJ9Cd7hw7DyYb/《Anaconde 安装文档》https://prod.pandateacher.com/python-manuscript/user-install-manual/《w
2020-08-24 23:44:12
569
转载 在Eclipse下新建工程及打开已有工程
https://blog.youkuaiyun.com/xbb224007/article/details/80411567
2020-07-09 15:51:43
248
转载 zookpeeper选举机制
若进行Leader选举,则至少需要两台机器,这里选取3台机器组成的服务器集群为例。在集群初始化阶段,当有一台服务器Server1启动时,其单独无法进行和完成Leader选举,当第二台服务器Server2启动时,此时两台机器可以相互通信,每台机器都试图找到Leader,于是进入Leader选举过程。选举过程如下(1) 每个Server发出一个投票。由于是初始情况,Server1和Server2都会...
2020-02-10 13:50:46
130
原创 hive 学习
1.概念:Hive由Facebook开源,用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。本质是:将Hive SQL转化成MapReduce程序学好HIVE可以做数据仓库开发2.HIVE架构1、用户接口:ClientCLI(hive shell)、JDBC/ODBC(java访问hive)、W...
2019-12-26 21:55:37
742
原创 Hbase01
大数据数据库之hbase一、课前准备安装好对应版本的hadoop集群安装好对应版本的zookeeper集群二、课堂主题本堂课主要围绕hbase的基础知识点进行讲解。主要包括以下几个方面hbase的核心概念hbase的特点hbase的架构图hbase存储数据结构hbase的安装部署hbase shell命令基本操作三、课堂目标理解hbase的核心概念掌握hbas...
2019-12-26 21:55:15
208
原创 hadoop2.7.3分布式安装部署
说明:1.教程中出现字体加粗和加红的说明需要大家仔细阅读,按照步骤进行安装,都是比较重要的细节,如果有同学忘记或者跳过说明的步骤,环境大家的过程中问题会非常的多.2.本教程主要引导同学进行hadoop 2.x版本的安装,之所以还要进行hadoop2.x版本的安装,是我们现在市场中大部分很早的企业部署的是hadoop2.x,上课主要讲解hadoop2.x,经历的hadoop3.x版本的安装之后,...
2019-12-26 21:45:22
957
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人