
数据分析
文章平均质量分 92
Ego_Bai
这个作者很懒,什么都没留下…
展开
-
SQL排序函数基础详解 row_number()/rank()/dense_rank() over(partition by)
为了方便学习和测试,所有的例子都是在Oracle自带用户Scott下建立的。 我用了mysql的环境,借助以下语句进行建表和插入数据,以备后续练习使用create table EMP --创建表EMP( empno int(4) not null, ename VARCHAR(10), job VARCHAR(9), mgr ...原创 2018-08-10 19:33:12 · 8564 阅读 · 1 评论 -
Python——数据分析Pandas入门
pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析。它提供了大量高级的数据结构和对数据处理的方法。 pandas 有两个主要的数据结构:==Series== 和 ==DataFrame==。数据结构Pandas 中的数据类型 Pandas 基于两种数据类型,series 和 dataframe。 series 是一种原创 2017-10-24 17:25:30 · 1924 阅读 · 0 评论 -
Python 使用全局变量
今天在写以下Python代码时出现了问题。该段代码根据一些URL下载视频:#coding=utf-8def save_case_infos(case_urls): for case_url in case_urls: # some download code ... # 打印已下载的视频个数 # 希望访问全局变量 case_tot...原创 2018-08-27 16:18:42 · 543 阅读 · 0 评论 -
Impala和Hive的关系(详解)
Impala和Hive的关系 Impala是基于Hive的大数据实时分析查询引擎,直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。并且impala兼容Hive的sql解析,实现了Hive的SQL语义的子集,功能还在不断的完善中。 与Hive的关系 Impala 与...原创 2019-03-19 13:01:19 · 6623 阅读 · 0 评论