
Python数据分析
文章平均质量分 97
heize19
这个作者很懒,什么都没留下…
展开
-
学术前沿趋势分析 数据分析实战 (三)
参加了天池的学术前沿趋势分析比赛,这个比赛主要对arXiv论文完成对应的数据分析,这里整理下完成task的思路及踩过的坑:下载数据集后的表结构如下:1 分类统计论文数量统计(数据统计任务):统计2019年全年,计算机各个方向论文数量1.1 数据导入先导包import seaborn as sns #用于画图from bs4 import BeautifulSoup import re import requests #用于网络连接,发送网络请求,使用域名获取对应信息import json原创 2021-05-02 21:10:29 · 760 阅读 · 0 评论 -
Mssql+Tableau电商数据分析实战(二)
最近把sql复习了第二遍,也熟悉了tableau,纸上得来终觉浅,在天池找了一个专题进行实践,并参考了一个实践项目的分析思路,数据来源:UserBehavior整个数据集解压之后有3.5G左右,包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的隐式行为(行为包括点击、购买、加购、喜欢),用于隐式反馈推荐问题的研究。导入mssql之后的基本的表结构如下:列名数据类型说明uidint序列化后的用户IDpidint序列化后的商品IDp原创 2021-04-24 22:02:27 · 1766 阅读 · 1 评论 -
python电商用户消费数据分析实战(一)
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Ma...原创 2019-11-17 23:26:32 · 3154 阅读 · 1 评论