- 博客(24)
- 收藏
- 关注
转载 数据处理(代码类)
数据探索1.异常值分析(描述性数据分析,箱线图)描述性数据可以帮助判断数据的分布结合业务来判断数据情况,箱线图可以找出异常值import pandas as pdcatering_sale ='../data/catering_sale.xls' #餐饮数据data = pd.read_excel(catering_sale, index_col = '日期') #读取数据,指...
2018-10-11 17:02:51
1301
转载 决策树算法(混淆矩阵,roc曲线)
#-*- coding: utf-8 -*-#构建并测试CART决策树模型import pandas as pd #导入数据分析库from random import shuffle #导入随机函数shuffle,用来打算数据datafile = '../data/model.xls' #数据名data = pd.read_excel(datafile) #读取数据,数据的前三列是...
2018-09-30 11:28:30
11095
转载 SQLServer中char、varchar、nchar、nvarchar的区别:
(1) 定义:char: 固定长度,存储ANSI字符,不足的补英文半角空格。nchar: 固定长度,存储Unicode字符,不足的补英文半角空格varchar: 可变长度,存储ANSI字符,根据数据长度自动变化。nvarchar: 可变长度,存储Unicode字符,根据数据长度自动变化。nvarchar(n) :包含 n个字符的可变长度 Unicode 字符数据。n 的值必须介于 ...
2018-09-27 15:25:27
167
转载 数据挖掘特征工程
作者:城东链接:https://www.zhihu.com/question/29316149/answer/110159647来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 1 特征工程是什么? 有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本...
2018-09-27 15:24:48
675
转载 数据库的存储过程
1.http://blog.sina.com.cn/s/blog_76b2c4810101b8qz.html 将常用的或很复杂的工作,预先用SQL语句写好并用一个指定的名称存储起来, 那么以后要叫数据库提供与已定义好的存储过程的功能相同的服务时,只需调用execute,即可自动完成命令。1.1 存储过程的优点1.存储过程只在创造时进行编译,以后每次执行存储过程都不需再重新...
2018-09-27 15:24:15
163
转载 数据库查询语言
2、 compute和compute by汇总查询 对年龄大于的进行汇总 select age from student where age > 20 order by age compute sum(age) by age; 对年龄大于的按照性别进行分组汇总年龄信息 sele...
2018-09-27 15:22:35
276
转载 TERADATA中函数的使用
CAST函数 转换函数,可以将字符型数据转为日期型或数据型,将整型转为浮点型,举例如下SELECT CAST('20140207' AS DATE FORMAT 'YYYYMMDD') ,CAST('07' AS FLOAT) ,CAST(15 AS FLOAT) ,CAST(18.987654 AS DEC(5,3))结果为2014...
2018-09-27 15:21:29
1613
原创 python数据分析与挖掘--数据探索--20180917
1.数据缺失: 常用处理方式 拉格朗日插入法.牛顿插入法.#拉格朗日插值代码import pandas as pd #导入数据分析库Pandasfrom scipy.interpolate import lagrange #导入拉格朗日插值函数inputfile = '../data/catering_sale.xls' #销量数据路径outputfile = '../tmp/sal...
2018-09-27 15:20:50
444
转载 视图
简介 转载地址:http://www.cnblogs.com/CareySon/archive/2011/12/07/2279522.html 视图可以看作定义在SQL Server上的虚拟表.视图正如其名字的含义一样,是另一种查看数据的入口.常规视图本身并不存储实际的数据,而仅仅存储一个Select语句和所涉及表的metadata. 视图简单的理
2016-12-07 16:15:26
352
转载 数据库的索引和数据库查询
1.查考网址:http://www.cnblogs.com/CareySon/archive/2011/12/22/2297568.html 2.好的10个查询习惯。 网址:http://www.cnblogs.com/CareySon/archive/2012/10/11/2719598.html 1.select* 不要在查询时使用查询全部,只会增加查询时间
2016-12-07 13:53:21
279
转载 数据库的存储过程
一、存储过程与函数的区别: 1.一般来说,存储过程实现的功能要复杂一点,而函数的实现的功能针对性比较强。 2.对于存储过程来说可以返回参数(output),而函数只能返回值或者表对象。 3.存储过程一般是作为一个独立的部分来执行,而函数可以作为查询语句的一个部分来调用,由于函数可以返回一个表对象,因此它可以在查询语句中位于FROM关键字的后面。二、存储
2016-12-06 15:19:15
183
原创 sql 中with as 的用法
with as 使用方法参考网址: http://jc-dreaming.iteye.com/blog/772030 with cte_tot as (select a.accountTemplateId id,count(b.id) num,convert(varchar(10),month(a.updateTime))+'月' date from
2016-11-25 13:51:57
772
原创 数据库中部分简单的
1.SELECT TOP 10 * FROM 表名 查询前10条记录declare @i int;--申明一个整形变量iset @i = 1;--设置初始值为1while(@i begin insert into t_userCard values () ;--开始插入 set @i = @i +1;--累加end
2016-11-24 15:49:51
291
转载 SQL 如何实现一条sql语句插入1000行数据
用SQL的可编程性,作为测试数据用是吧:declare @i int;--申明一个整形变量iset @i = 1;--设置初始值为1while(@i while循环给定一个循环结束条件小于1000begin insert into tb_user values('user_no'+cast(@i as varchar),'user_name'+cast(@i as
2016-11-24 14:44:25
10222
1
转载 excel数据透表的使用
参考网址:http://wenku.baidu.com/link?url=ipvgZiipIdiYszAJKIcqR9Z0_x_2rzOe0t4-IWMfVWiArrO5hdsvaf9NynGXKQhFlkvlD1v1xdJmxythSPOVJzQqJzPNkbo_Bos9QqQQdDa自己的知识点总结1.选择使用excel的透视表,只要是能快速的对数据进行分析处理。(使用透视
2016-11-23 15:14:07
1036
转载 tomcat 部署,配置 servlet 过程全记录。
1. 在tomcat的安装目录下 找到webapps 文件夹,在里面新建一个文件夹,这作为你的网站根文件夹,名字随意取, 本文叫做 serv 文件夹。位置为 /webapps/serv 通过 http://127.0.0.1:8080 /serv 可以访问到这个位置(现在没有文件,访问会出错)。可以写一个测试文件,index.html 放在这个文件夹下,通过 http:/
2016-11-15 10:43:07
351
转载 数据库数据去重方法
假设现在数据库中有一个人员表(user),表中包括 主键ID,,姓名、身份证号码、等字段。由于程序的的原因、好来发现表中有许多理论上重复的数据(即姓名、和身份证号相同的数据),现在要求根据身份证号码和姓名去除表中的重复数据。 该怎么做呢,这里有一个方案可以参考一下: select Max(ID) as Id,姓名,身份证号 from User group by 姓名,身
2016-11-03 08:41:15
629
转载 浏览器
1.网站地址:网站地址https://www.baidu.com/ 其中的https:为协议 www.baidu.com为域名2.IP地址与域名域名是指一个或一组计算机的名称,好比你寄信时写的地址,地址是大概位置可以不同的描述,你家却是独一无二的,这独一无二的是IP地址。一个IP地址可以对应多个域名,一个IP地址对应一个计算机,3.渲染引擎在取的内容之后的基本流
2016-10-25 17:16:15
189
转载 HTML
HTML1、对于中文网页需要使用声明编码,否则会出现乱码。2.声明文档类型。doctype 声明不分大小写。3、相关基本语句标题: h1~h6 段落: 链接: 图片:换行:或者水平线:或者注释:4.当显示页面时,源代码
2016-10-25 14:20:11
173
转载 数据库行转列
有些时候还是要用到行转列,比如下面的数据:一般的表结构大多会这么设计,通过关联查询就可以得出上面的数据(客运量就随便123了,非常时期以防恐怖分子)不用说,大家也明白要得到下面的数据:列数不多的话一般可以这样,也是网上比较经典的写法Select 时间,sum(case when 线路='1号线' then 客运量 end) As '1号线' ,s
2016-10-10 13:54:55
296
转载 window和Ctrl热键使用(常用)
1.常规基础快捷键 Ctrl+C 复制 Ctrl+V 粘贴 Ctrl+S 保存 Ctrl+A 全选 Ctrl+X 剪切 Ctrl+N 新建 Ctrl+O 打开 Ctrl+Z 撤销 Ctrl+W 关闭程序 Ctrl+Tab 窗口切换 Shift+Delete彻底删除2. Wi
2016-10-10 08:58:45
1052
转载 如何在数据库中轻松导入excel格式的文件
1)打开你的sql server,找到要导入数据的数据库,右键——〉任务——〉导入数据2)按照图示选择要导入的excel3)选择导入到哪个数据库
2016-10-09 16:15:24
643
转载 sql一张表数据导入另一张表
sql一张表数据导入另一张表 如果2张表的字段一致,并且希望插入全部数据,可以用这种方法:INSERT INTO 目标表 SELECT * FROM 来源表; 比如要将 articles 表插入到 newArticles 表中,则是: INSERT INTO newArticles SELECT * FROM articles; 如果只希望导入指
2016-10-09 15:55:32
2418
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人