
大数据
杨杨little
这个作者很懒,什么都没留下…
展开
-
天天基金货币基金数据分析
import requestsimport jsonimport demjsonimport pandas as pdresp = requests.get('http://fund.eastmoney.com/data/Fund_JJJZ_Data.aspx?t=7&page=1,1000000&js=reData&sort=mui,desc')data = resp.textdata = data.replace('var reData=','')b = demjs原创 2021-05-07 00:01:50 · 327 阅读 · 0 评论 -
DataFrame行列求和,指定列求和,指定行求和
想统计某些公司在各个省份的xxdf = pd.DataFrame([['A公司', 1, 2, 3, 4, 5], ['B公司', 0, 0, 1, 0, 0], ['C公司', 2, 3, 4, 5, 0]], columns=['公司名', '北京', '江苏', '浙江', '上海', '广东'], index=None)df_sum = df.sum() # 全部列求和df_sum = df[['北京', '江苏', '浙江', '上海', '广东']].sum() # 指定列求和,默原创 2021-05-04 00:37:45 · 26204 阅读 · 0 评论 -
2020-09-20
import osfrom openpyxl import load_workbookfrom openpyxl.styles import Border, Font, Side, colorsimport datetimeimport pandas as pdimport numpy as npclass SQLList: sql_1 = pd.DataFrame(np.random.rand(3, 8)) sql_2 = pd.DataFrame(np.random.ra原创 2020-09-20 21:54:14 · 2141 阅读 · 0 评论 -
元数据采集
好迷茫啊~哎,那就写一篇流水账吧。总结总结吧。Oracle角色:dba,all,user。主要采集的是dba角色的视图,部分采集的是all。dba 数据库管理员角色user 当前用户all 介于两者之间主要采集了[objects, tables, tab_columns,]MySQLinformation_schema用户下的所有表HIVEhive的元数据以mysql或者oracle作为backend,所以实际是采集的mysql或者oracle的表。version,数据库相关:d原创 2020-07-22 23:11:27 · 2449 阅读 · 0 评论