
dataframe
文章平均质量分 76
Neon_Light
这个作者很懒,什么都没留下…
展开
-
jinja2初次使用记录
官网: https://jinja.palletsprojects.com/en/2.11.x/安装: pip install Jinja2 or pip3 install Jinja2基础模块:基本使用:使用dataframe的数据填充html表格:用到的 templates.html<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <tit.原创 2020-08-31 19:03:41 · 883 阅读 · 0 评论 -
用写sql的思路写 pyspark
文章目录初始化:1. 查询筛选1.1 新增字段1.2 字段为list,包含子项2. group by 聚合2.1 想自定义聚合函数,3. 对数据结果排序4. join关联6. 窗口函数7. 加rank和排序8. 取topN10. 展开一个字段到多行初始化:from pyspark import SparkConf, SparkContextfrom pyspark.sql import HiveContextfrom pyspark.sql.utils import AnalysisExceptio原创 2020-05-09 21:37:01 · 467 阅读 · 0 评论 -
用写sql的思路写dataframe:把sql语法转化成dataframe语法
查询表 a_table如下:classnameprojectscore一班张三语文80一班张三数学90二班李四语文80二班李四数学90查询筛选select name,scorefrom a_tablewhere class='一班' and project='语文'a_table = pd.DataFrame(.........原创 2020-01-03 16:59:51 · 1684 阅读 · 0 评论