数据闲逛人
18级双非本科学生
展开
-
Charles获取手机端小程序的数据注意事项
Charles是什么原创 2023-04-11 15:57:18 · 423 阅读 · 1 评论 -
【实习】一面日记 记录实习的点点滴滴
1w 字 一面日记 记录实习的点点滴滴原创 2022-12-07 14:52:13 · 921 阅读 · 0 评论 -
【需求】Python利用selenium抓取京东的地址数据
爬取收集京东地址数据(网页版京东)原创 2022-08-10 17:54:01 · 637 阅读 · 0 评论 -
【需求】Python利用selenium抓取顺丰的地址数据
收集顺丰的省市区数据原创 2022-08-10 17:44:20 · 1311 阅读 · 0 评论 -
Tableau 看板搭建小技巧
情景:在多个筛选器一起筛选的时候 第一步:先创建字段,设置index 第二步:再创建一个字段:page设置代码如下: 第三个:将page字段放上筛选器,并设置显示 情景:我想统计一个字段,在某个维度下统计去重后的某个维度数据(不是最小颗粒度的维度,例如不是唯一id列)。 遇到问题:在仪表板进行kk_tiny_category筛选时候,不会自动筛选掉,进行自动更新变化数字,即使在筛选器里面已经将筛选器设置为仅相关。 解决方法:将筛选器设置为添加到上下文 解决效果:完美解决...原创 2022-06-06 17:22:16 · 713 阅读 · 0 评论 -
【面试】insta360面试-12-26
💡 笔试交付邮箱:yumingliang@insta360.com温馨提醒:如有不诚信行为会直接取消资格。交付格式可以选用 sql 文件格式或者 word 文档格式,不要用 PDF 等不好复制代码的格式。SQL 等答案请先自行运行过再提交。以下 6 题选 4 题作答即可,如果你有能力完成全部,那会更棒:1、你之前数据分析的职业生涯或者项目中,是否有数据分析结果和预期结果不相符的情况。如有请说明背景,并且聊聊你是怎么处理的。微博与小红书水军识别模型的 参数定义2、Excel 处理exc原创 2022-05-19 23:19:10 · 1689 阅读 · 1 评论 -
【需求】DBeaver中使用with as,下面使用as出来的表却报错说不存在,ERROR: relation “new_dppp“ does not exist
bugbug如下:Navicat中同样的语句可以使用,但是DBeaver中却不能使用,折腾半天,终于把问题解决了,但是不知道为什么,可能是软件本身设置如此吧解决bug解决方法:不要有换行,猜测是换行是独立片段,没有联系(这估计是DBeaver的特性,Navicat中不会这样)拓展那么的就像换行,空着美观一点怎么办,可以解决,加注释行就可以解决了...原创 2022-05-07 09:45:17 · 1989 阅读 · 6 评论 -
python中构造出一个空的DataFrame,并在循环中不断往dataframe里面添加内容
这是管培期间的一个学习任务里面其中解决问题用到的方法关键是下面的result.loc()巧妙地利用len()获取dataframe数据长度import pandas as pd import numpy as np # 构造表格2数据data = pd.DataFrame({'product_num':['A','B'], 'kk_big_category':['美妆','食品'], 'kkv_big_catego原创 2022-04-20 17:32:33 · 5928 阅读 · 0 评论 -
【Bug】偶遇LAG函数,相见恨晚,告别拉链表中的left join,开启微妙时刻
前言背景是实习期间,需要完成一个拉链表,大概长下面这个样子需求:实现拉链表(对start_date列进行)在我没有遇见LAG函数之前,我在这里足足研究了一整个下午!!!现在想象都觉得难以想象,是我太菜了,我一直在想store_inventory_qty里面有重复,我怎么对start_date进行拉链呢?,一直group by什么都不是,row_number(),rank(),dense_rank(),都用上了,还是解决不了,一直在想,还在吐槽,sql没有python灵活啊,最后把问题归因到怎么对st原创 2022-04-12 12:12:05 · 376 阅读 · 0 评论 -
Input contains NaN, infinity or a value too large for dtype(‘float64‘).
what:建模之前数据预处理,用Smote处理样本不平衡问题,出现这个bugwhy:根据报错提示输入包含NaN、infinity或一个对dtype来说太大的值(‘float64’)经过sum(data.isnull().sum())然后查找最大df.max()找到原因处理掉就可以了...原创 2022-04-03 21:34:32 · 1232 阅读 · 0 评论 -
【面试】汇总一下最近的一些面试 寒冬
文章目录2 天长信息 已拒3 德科信息(5k-9k)已删5 海鼎(8-13k) 已删6 广州易方信息(10-15k 数据开发)7 数美科技(11-20k) 待面试8 甄明司法(7-12k) 已删9 邦盛科技(8k-12k) 一面过没联系10 雷象科技(7-10k) 已删11 babycare(11-17k)12 杨腾集团 已删13 骏聿科技(12k-15k)已删14 联和金融(8-12k)已删总结:2 天长信息 已拒背景:公路数据(100人以下) 数据挖掘工程师 6-11K·13薪 广州在校/应届原创 2022-03-24 10:09:48 · 1560 阅读 · 2 评论 -
【实习】一面数据是一家怎样的公司?实习六个月的工作感受,知无不言,有问题可以私聊
选择你喜欢的,喜欢你选择的,爱你所爱,遵循本心原创 2022-03-05 22:06:56 · 1335 阅读 · 0 评论 -
【旅游】澳门之旅---->从没有线城市到澳门见识一下世面
文章目录前言1 为什么来澳门?2 澳门之旅前言时间:2022-02-12地点:澳门喜来登大酒店为什么写这篇文章?因为现在有点无聊,又不想发朋友圈,但是又想有点东西记录一下自己的痕迹,所以你就看到了这篇文章1 为什么来澳门? 因为实习的公司的年会是来澳门举行所以我就来了哈哈哈2 澳门之旅...原创 2022-02-12 23:55:01 · 285 阅读 · 0 评论 -
取数时出现 Disk I/O的bug
废话不多说,直接上图解决方案INVALIDATE METADATA + Table namewhy:推测 数据冲刷一遍,类比我想到了电脑重启,底层原理不懂,望大神指点一二原创 2022-01-12 11:50:34 · 120 阅读 · 0 评论 -
如何优雅地在jupyter notebook中解决内存不够导致服务器蹦了的情况
文章目录前言问题来源解决过程总结前言 记录一下自己实习中遇到一个需求问题,内存不足,概括解决方法的核心就是: 以时间换空间问题来源 写这篇文章的目的是因为这两天遇到一个需求: 取数,其中到一步因为运行内存的问题一直卡住, 大概是这样user_idfan_list1[…贼多几百万] &nb原创 2021-11-17 15:59:09 · 6831 阅读 · 2 评论 -
python解压zip文件与压缩文件夹 删除文件夹-----jupyter服务器上使用
前言:第一次使用jupyter服务器有点不适不能上传文件夹,不删删除不为空的文件夹那想上传了一个文件夹里面包含数十个文件时,然后想将其进行修改,那又要一个个文件下载下来!???万幸发现可以将其压缩成zip文件,然后解压来使用,这样就好很多了1 解压文件夹import zipfilef = zipfile.ZipFile("./粉霜.zip",'r') # 原压缩文件在服务器的位置for file in f.namelist(): f.extract(file,"./粉霜")原创 2021-11-04 16:27:40 · 1275 阅读 · 0 评论 -
【实习】互联网从事人员(有数据分析的)的学历,专业是否对口的分析
前言 出于好奇,来到现在所在的公司实习,是互联网行业,无奈社畜人,好奇自己将来是怎么样子,自己的学历,能力将来1年,2年,5年大概会是怎么样?我哪里是比较欠缺需求学习的?我要怎么样才能过上自己想要的工作?数据分析是怎么样的?1-3年的数据分析薪资是怎么样的?数据分析的职业发展是怎么样的?做数据分析的人是怎么样子的? 带着种种疑问 在国庆期间我进行了一个完完整整的,单纯自发式探索学习,整理收集清洗现在所在公司的人员资料+网上的一些公开的资料,做出了一下的数据报告1 数原创 2021-10-04 17:56:11 · 227 阅读 · 0 评论 -
【实习】一面实习 harvest
1 发现很多时候下来 数据分析 最后都得有人工的部分, 因为数据已经没有规律了或所蕴含的规律 计算机处理的速度 比不上人2 不要做什么都得上代码 ,净弄些高级的东西, 最后让自己难受 解决需求的方法才是好方法...原创 2021-09-22 22:19:39 · 157 阅读 · 0 评论 -
【实习】一面数据面试面经
数据分析师(实习)数据科学组 & 数据资产组 | 连续实习2个月以上职位描述:▪ 与资深分析师合作,撰写、交付分析报告;▪ 协助维护公司内部数据,监控问题并跟进解决;▪ 负责与公司合作伙伴日常沟通和关系维护工作。技能要求:▪ 熟练使用 Excel 和 PowerPoint,能熟练使用 SQL 和 Tableau 者优先;▪ 大三、大四、研一、研二在校生,至少能实习2个月以上(请在简历上标明实习时长及一周几天);▪ 有良好的沟通能力,做事认真、负责、有耐心,有较强的服务原创 2021-08-30 11:31:57 · 1706 阅读 · 9 评论 -
【实习】我选择离职了
浩云是我人生中第二家实习公司,从5月19日入职到7月30日离职 我在学校机房学习的地方来到公司的工位靠窗挺好了,白天工作,晚上我一般都是自学自己的东西离职的原因是因为我觉得学到想要东西,我的职业规划是数据分析曲线救国往数挖走。在公司还是认识挺多小伙伴挺好的 这是上班最后一天和部门小哥小伙伴的吃的最后一顿散原创 2021-08-03 22:04:46 · 238 阅读 · 0 评论 -
我的一些面经
1.浩云科技:两个人 男1 自我介绍2 特征选择用什么方法方差 + 树模型SVM吗3 CNN4100 * 100 * 33 * 3 * 10 卷积核 图像大小5 关于图像识别的方法6 传统机器学习贝叶斯公式Bagging Boosting2.滴滴电商数据分析【滴滴数据分析实习生招聘 有22届转正hc】Base:北京总部方向:电商数据分析【职位描述】1)深入理解业务部门提出的数据分析需求,支持面向业务的数据服务;2)基于对业务的深度理解,能在指导下建立数原创 2021-08-03 21:35:08 · 170 阅读 · 0 评论 -
【实习】浩云科技5月19日-7月30日工作日志
目录1. 浩云日记填写要求第 1 周第 2 周第3周第 4 周第 5 周第 6 周第 7 周周一(6月28日)周二(6月29日)周三 (6月30日)周四、周五 (7月1日、7月2日)第 8 周周一 (7月5日)周二 (7月6日)周三 (7月7日)周四 (7月8日)周五(7月9日)第 9 周周一 (7月12日)周二 (7月13日)周五 (7月16日)第 10 周周一 (7月19日)第11周1. 浩云原创 2021-07-29 17:38:28 · 291 阅读 · 0 评论 -
【需求】pyqt5_tools\designer.exe不见了 找不到
文章目录1 参考这篇文章https://www.jianshu.com/p/8b992e47a0e4出现pyqt5_tools\designer.exe不见了一开始很纳闷,但是已经初入程序员的门槛的我,淡定地喝了口水,然后首先怀疑库版本的问题,进行重装pip install sip //pip install PyQt5 -i https://pypi.douban.com/simplepip install PyQt5-tools -i https://pypi.douban.co原创 2021-07-05 17:50:16 · 545 阅读 · 0 评论 -
【实习】unable to create directory permission denied 文件夹权限问题
1 单击文件夹,----->进入属性---->进入安全2 进入编辑3 设置权限4成功了总结 单纯的复制文件到服务器速度会很慢,例如这个要1小时 ,命令只有1分钟不到原创 2021-06-29 09:51:19 · 6725 阅读 · 0 评论 -
【感想】数据分析是在各行业中都是怎么应用的
文章目录背景数据分析的应用具体有哪些呢?投放传统投放互联网投放销售传统销售:互联网销售:电商零售运营传统运营互联网运营产品传统产品总结我的总结!!!以上是某网站拉取过来,大家按需参考背景随着大数据在各行各业的普及,用户的数据信息逐渐详细、透明,利用这些用户的行为数据来帮助实现更优的用户体验或者满足更多的用户需求,从而实现信息的价值变现,也就是提高衡量投放、运营、销售、产品等岗位的业绩指标,如用户的点击率、客单价等指标。对于企业而言,数据分析主要分为管理分析和经营业务分析,分析的整体思路在于明确业务场原创 2021-06-28 21:26:40 · 282 阅读 · 0 评论 -
【面试】面试题系列
面试题# 第一题data=[['A',10,'2020/12/1'],['B',2,'2020/12/2'],['A',5,'2020/12/1'],['C',21,'2020/12/4'],['B',19,'2020/12/1'],['C',5,'2020/12/6'],['C',1,'2020/12/7'],['A',8,'2020/12/2'],['A',8,'2020/12/3']]from pandas.core.frame import DataFramedef get_result(d原创 2021-06-01 14:06:07 · 135 阅读 · 0 评论 -
【感想】流水不争先,争的是滔滔不绝
Datawhale数据分析难的不是编程,而是统计与业务,这些东西很难学,只有实际的业务场景才能做。原创 2021-05-28 11:11:37 · 224 阅读 · 0 评论