- 博客(38)
- 收藏
- 关注
原创 【SQL】拼表法插入数据
实习过程中学到的一个SQL小技能,把它记录下来。很多时候我们想要在公司的hive表里插入数据,但是没有办法直接导入文件怎么办?拼表法就能解决这个问题。例如,我想要手动插入数据得到下图这样一张表:可以用下面一段代码实现:select *from(select 1 as aa,2 as ab,3 as ac,4 as ad,'拼表' as ae union allselec...
2019-04-26 17:52:52
639
原创 【LeetCode】数据库练习题
LeetCode上面公开的几道SQL题结果,欢迎大家讨论。(https://leetcode-cn.com/problemset/database/) 175. 组合两个表【简单】表1:Person(Id 是主键)+-------------+---------+| 列名 | 类型 |+-------------+---------+| Pers...
2018-08-20 00:08:15
1506
原创 【牛客】网易2018校园招聘数据分析工程师笔试卷
【牛客】网易2018校园招聘数据分析工程师笔试卷解析* 选择题根据牛客网下方讨论整理,三道大题未做,欢迎大家讨论并给予指正。(https://www.nowcoder.com/test/10730167/summary)一、选择题1、某二叉查找树的每个节点存放一个整数,中序遍历该树得到的序列为3,4,5,则该树的画法有多少种情况?答:5 2、字符串有5个字符q,w,...
2018-08-18 21:56:10
2911
原创 【牛客】网易2018实习生招聘笔试题——数据分析师实习生解析
【牛客】网易2018实习生招聘笔试题——数据分析师实习生解析* 选择题根据牛客网下方讨论整理,三道大题均为自己答案,欢迎大家讨论并给予指正。(https://www.nowcoder.com/test/10780714/summary) 第二道sql参考(https://bbs.youkuaiyun.com/topics/392421965?page=1)一、选择题1、有2堆宝石,A和B...
2018-08-18 18:51:37
16045
2
原创 【牛客】网易2018校招数据分析师笔试解析
【牛客】网易2018校招数据分析师笔试解析* 选择题根据牛客网下方讨论整理,三道大题均为自己答案,欢迎大家讨论并给予指正。(https://www.nowcoder.com/test/10778804/summary)一、选择题1、有2堆宝石,A和B一起玩游戏,假设俩人足够聪明,规则是每个人只能从一堆选走1个或2个或3个宝石,最后全部取玩的人获胜,假设2堆宝石的数目为12和13,请...
2018-08-18 00:18:35
14213
3
原创 【牛客】摩拜2018校招数据分析工程师笔试解析
【牛客】摩拜2018校招数据分析工程师笔试解析* 选择题都有正确答案,后面五道大题均是我的答案,欢迎大家讨论纠正!(https://www.nowcoder.com/test/11453292/summary)一、选择题1、在Shell编程中,下面哪个表示上一步所运行程序的返回值()答:$? 2、在SQL语言中,子查询是( ) 答:嵌入到另一个查询语句之中的查...
2018-07-23 10:44:46
3194
1
原创 【牛客】2018京东秋招数据分析工程师笔试解析
【牛客】2018京东秋招数据分析工程师笔试解析* 根据牛客网下方讨论整理(https://www.nowcoder.com/test/10630596/summary)一、选择1、有一个文件user.txt,每行一条user记录,共若干行,下面哪个命令可以实现“统计出现次数最多的前3个user及其次数”?答:sort user.txt | uniq -c | sort -rn | ...
2018-07-20 00:09:40
8613
原创 【牛客】剑指offer部分编程题(持续更新......)
【牛客】剑指offer部分编程题(持续更新......) 一、替换空格请实现一个函数,将一个字符串中的每个空格替换成“%20”。例如,当字符串为We Are Happy.则经过替换之后的字符串为We%20Are%20Happy。class Solution: # s 源字符串 def replaceSpace(self, s): # write c...
2018-07-16 23:25:21
561
原创 win10安装spark流程
win10安装spark流程说明安装步骤分为java,scala,spark和hadoop四步,以下是对我整个安装过程的记录。一、安装JDK官网下载了8u172版本。点击打开链接安装完毕以后,添加环境变量JAVA_HOME、增加环境变量path路径。打开cmd键入java -version,看到如下界面说明java安装成功。二、安装scala官网下载了msi格式,并安装成功。点击打开链接增加pat...
2018-05-12 15:38:56
4875
3
原创 python爬豆瓣影评&根据词频生成词云
python爬豆瓣影评&根据词频生成词云通过爬取豆瓣上正在上映的电影影评信息,并根据评论词频生成词云。一、需要的包import warnings # 防止出现future warningwarnings.filterwarnings("ignore")from urllib import request # 用于爬取网页from bs4 import BeautifulSoup a...
2018-05-06 10:11:50
6220
原创 python用matplotlib画条形图初探(单变量,双变量堆叠)
python用matplotlib画条形图初探(单变量,双变量堆叠)一、包import numpy as npimport matplotlib.pyplot as plt二、单变量(垂直)y = [5, 10, 15, 20, 25]index = np.arange(len(y))plt.bar(left=index, height=y, color='r', width=0.5) #...
2018-05-05 16:03:18
10474
原创 git远程操作入门
git远程操作入门 一、建立本地库新建文件夹 -> 改变目录 -> 初始化~/Desktop$ mkdir learngit~/Desktop$ cd learngit~/Desktop/learngit$ git initInitialized empty Git repository in C:/.../Desktop/learngit/.git...
2018-04-22 16:29:52
296
原创 周志华《机器学习》第四章决策树-调用sklearn.tree实现
周志华《机器学习》第四章决策树-调用sklearn.tree实现一、导入需要用的包import csv # 导入文件import pandas as pdfrom sklearn.feature_extraction import DictVectorizer # 用于生成哑变量from sklearn import tree二、导入数据1、利用csv导入数据melon = open(r...
2018-04-14 23:17:19
1075
1
原创 【TIPS】更改jupyter notebook工作空间
【TIPS】更改jupyter notebook工作空间一、打开任意工作目录,图片中显示的是C盘二、shift+点击右键,选择打开powershell窗口三、键入jupyter notebook四、在默认浏览器弹出home界面,显示的都是C盘的内容...
2018-04-14 18:06:36
672
原创 【TIPS】关于matplotlib包plt.show()画图中文字符乱码
关于matplotlib包plt.show()画图中文字符乱码%matplotlib inlineimport matplotlib.pyplot as pltyears = [1950, 1960, 1970, 1980, 1990, 2000, 2010]gdp = [300.2, 543.3, 1075.9, 2862.5, 5979.6, 10289.7, 14958.3]pl...
2018-04-11 21:29:30
1732
原创 markdown使用过程中遇见的问题(持续更新)
markdown使用过程中遇见的问题(持续更新)一、markdownpad2无法正确显示公式解决方法:需要在MarkdownPad2里加入 MathJax CDN,方法如下:工具→选项→高级→HTML Head编辑器,在打开的窗口里输入下面的内容:<script type="text/javascript" src="http://cdn.mathjax.org/mathjax/late...
2018-04-11 21:25:08
3370
原创 R使用过程中遇见的问题(持续更新)
R使用过程中遇见的问题(持续更新)一、无法安装包并返回如下信息cannot open URL 'https://cran.rstudio.com/src/contrib/PACKAGES'解决方法:更换镜像,使用国内镜像即可。tools-global options-packages-change选择一个距离最近的镜像,重新安装相关包即可。...
2018-04-10 23:08:59
729
原创 Regex Golf 正则表达式练习(持续更新)
Regex Golf 正则表达式练习初步接触正则化表达式,本文记录regex golf(alf.nu/RegexGolf)上题目答案,一些拙见,欢迎指正或给出更好的答案。一、Warmup二、Anchors三、It never ends法一:(?!\w)表示后面没有字母法二:法三:\b为边界匹配,后面不出现字母 \B为边界匹配,后面可接字母四、Ranges其实可以更简洁五、Back...
2018-03-18 15:43:24
7834
3
原创 python使用过程中遇见的问题(持续更新)
python使用过程中遇见的问题(持续更新)一、wordcloud安装问题在使用pip install wordcloud安装wordcloud过程中遇见如下问题即 error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visua...
2018-03-10 17:42:57
1110
原创 图灵程序丛书 —《数据科学入门》— Ch9-Ch10 获取数据、数据工作
Ch9-Ch10 获取数据、数据工作此系列记录《数据科学入门》学习笔记(停止)Chap 9 获取数据(只有9.2)9.2 读取文件9.2.1 文本文件基础# 'r'意味只读file_for_reading = open('reading_file.txt', 'r')# 'r'意味写入,会破坏已存在的文件file_for_writing = open('reading_file.txt'...
2018-03-09 21:09:49
474
原创 图灵程序丛书 —《数据科学入门》— Ch8 梯度下降法
Ch8 梯度下降法此系列记录《数据科学入门》学习笔记8.2 梯度下降的思想梯度下降法只能找到局部最优解,而不是全局最优解;当有多个全局最优解时,可以通过多尝试一些初始点来重复搜索;当一个函数没有最小点时,计算可能会陷入死循环。8.2 估算梯度def sum_of_squares(v): return sum(v_i ** 2 for v_i in v)# 单变量函数的导数可通过差商来定...
2018-03-08 17:54:59
616
原创 图灵程序丛书 —《数据科学入门》— Ch4-Ch7 线性代数、统计学、概率、假设与推断
Ch4-Ch7 线性代数、统计学、概率、假设与推断此系列记录《数据科学入门》学习笔记Ch 4 线性代数4.1 向量# 向量加减法def vector_add(v, m): return [v_i + w_i for v_i, w_i in zip(v, w)]def vector_subtract(v, m): return [v_i - w_i for v_i, w_i ...
2018-03-05 17:59:06
451
原创 图灵程序丛书 —《数据科学入门》— Ch3 可视化数据(matplotlib)
Ch3 可视化数据此系列记录《数据科学入门》学习笔记3.1 matplotlib%matplotlib inlineimport matplotlib.pyplot as pltyears = [1950, 1960, 1970, 1980, 1990, 2000, 2010]gdp = [300.2, 543.3, 1075.9, 2862.5, 5979.6, 10289.7, 149...
2018-02-27 16:54:42
429
原创 MySQL入门(终结)- 常用语句简单总结
MYSQL简单总结SQL的分类数据查询语言(DQL - data querylanguage):select(针对表中数据)数据操纵语言(DML - datamanipulation language):insert、delete、update(针对表中数据)数据定义语言(DDL - data definitionlanguage):create、drop、alter(针对表的结构)事务控制语言(...
2018-02-24 20:34:52
480
原创 MySQL入门(12)- 索引&视图&导入/导出
索引&视图&导入/导出此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、 员工表emp(empno工号、ename员工姓名、job职位、mgr...
2018-02-24 15:46:12
976
原创 MySQL入门(11)- 事务
事务此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、 员工表emp(empno工号、ename员工姓名、job职位、mgr直属领导工号、 ...
2018-02-24 15:40:20
376
原创 MySQL入门(10)- 存储引擎
存储引擎此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、 员工表emp(empno工号、ename员工姓名、job职位、mgr直属领导工号、 ...
2018-02-24 15:36:29
397
原创 MySQL入门(9)- 34道练习题(内含bjpowernode.sql数据)
34道练习题(内含bjpowernode.sql数据)此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末。* 该数据有三张表:部门表dept(deptno部门编号、dname部门名称、loc位置)、 员工表emp(empno工号、ename员工姓名、job职位、mgr直属领导工号、 ...
2018-02-24 10:07:47
12234
9
原创 MySQL入门(8)- 约束——主键约束&外键约束&级联更新/删除
约束——主键约束&外键约束&级联更新/删除此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、 员工表emp(empno工号、ena...
2018-02-23 11:12:36
1459
原创 MySQL入门(7)- 约束——非空约束&唯一性约束
约束——非空约束&唯一性约束此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、 员工表emp(empno工号、ename员工姓名、job职...
2018-02-23 11:00:53
3960
原创 MySQL入门(6)- 创建表、表的复制、增/删/改 表结构
创建表、表的复制、增/删/改 表结构此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、 员工表emp(empno工号、ename员工姓名、job职...
2018-02-23 10:49:09
1062
原创 MySQL入门(5)- 子查询&union&limit&case...when...then...when...then...end
子查询&union&limit&case...when...then...when...then...end此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、 ...
2018-02-23 10:27:25
827
原创 MySQL入门(4)- 连接查询、跨表查询
连接查询、跨表查询此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,我也没有,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、 员工表emp(empno工号、ename员工姓名、job职位、mg...
2018-02-21 21:03:10
1074
1
原创 MySQL入门(3)- 分组函数(count、sum、avg、max、min)&分组查询(groupby、orderby)
分组函数&分组查询此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、 员工表emp(empno工号、ename员工姓名、job职位、mgr...
2018-02-21 20:50:03
3180
原创 MySQL入门(2)- 排序&数据处理函数&日期处理函数
排序&数据处理函数&日期处理函数此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、 员工表emp(empno工号、ename员工姓...
2018-02-20 21:32:59
477
原创 MySQL入门(1)- SQL语句分类&查询语句
SQL语句分类&查询语句此系列记录PN视频学习笔记* 本博客涉及到的数据为bjpowernode.sql,数据见文末,SQL文见MySQL入门(9)文末。* 该数据有三张表,分别是部门表dept(deptno部门编号、dname部门名称、loc位置)、 员工表emp(empno工号、ename员工姓名、job职位、...
2018-02-20 21:21:46
760
原创 图灵程序丛书 —《数据科学入门》— Ch2 Python 速成
Ch2 Python 速成此系列记录《数据科学入门》学习笔记2.1 基础内容2.1.3 空白形式python使用缩进的形式分隔代码块,可利用‘Tab’键快速找到键入位置。for i in [1, 2, 3, 4, 5]: print(i) for j in [1, 2, 3, 4, 5]: print(j) print(i + j) prin...
2018-01-31 18:14:16
369
原创 图灵程序丛书 —《数据科学入门》— Ch1 导论
Ch1 导论此系列记录《数据科学入门》学习笔记1.3.1 寻找关键联系人1、定义users字典listusers = [ {'id': 0, 'name': 'Hero'}, {'id': 1, 'name': 'Dunn'}, {'id': 2, 'name': 'Sue'}, {'id': 3, 'name': 'Chi'}, {'id': 4, 'na...
2018-01-30 16:03:27
397
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人