- 博客(47)
- 资源 (1)
- 收藏
- 关注

原创 sql学习笔记
1.rank() ,dense_rank(), row_number()https://blog.youkuaiyun.com/weixin_43713105/article/details/106808261?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param2.inner joinhttps://www.w3school.com.cn/sql/sql_join_i
2021-01-28 20:58:52
1751
原创 浦发信用卡面经
一面:1、自我介绍。2、时事热点分享。二面:无领导小组形式。材料是互联网平台之间屏蔽链接行为。1、阅读材料。2、个人观点1min3、小组讨论15min(包括代表汇报3min)。
2022-01-01 13:26:34
387
原创 SQL笔试题目分享(二)
1.在电商中,流量漏斗是最基础的监控漏斗,因此希望你能够基于我提供的数据表和字段构建一个流量转化漏斗。可能会用到的数据表如下:曝光表exhibit:info_id(商品id),dt (日期),token(用户唯一标示)详情表visit:info_id(商品id),dt (日期),token(用户唯一标示)支付表pay:info_id(商品id),dt (日期),token(用户唯一标示),parent_order_id(订单唯一标示)请输出包含如下报表SQL:日期(2...
2021-10-28 12:13:26
565
原创 SQL笔试题目分享(一)
3、SQL 数据分析 某宝有一张订单表 ordr_list,共有三列:ordr_id(订单 id)-- bigint,uid(买家 id)-- bigint,create_time(下单时间)-- datetime,对于同一个买家,每个订单 的下单时间均不同。 写 SQL 求得每个用户最早下单的订单 id,每个买家一行;输出两列:uid(买家 id),ordr_id(最早下单的订单 id)-- 3、select uid,order_id from (select uid,order_id,row_
2021-10-28 12:08:55
908
1
原创 西山居数据分析2022笔试题目-excel部分
一、专业技能1、Excel技能用到的函数:vlookupindex+matchsumproductcountifsumifs第一列:分数第二列:队伍id第三列:队伍内排名第四列第五列第六列第七列
2021-10-28 12:01:17
1499
原创 便利蜂2022数据分析秋招一面凉经
1、看板相关。1.1 构建看板的主要指标有哪些?1.2 最重要的两个指标?2、异常分析2.1 假设以周为例,本周相比上周某一个指标上涨50%,怎么分析?2.2 如果用模型来监测异常,怎么做?用时间序列的线性回归模型。首先,模型构建。检验x和y之间是否存在线性相关关系。第二,计算残差,将原始值转化为残差,残差服从正态分布。第三,计算真实值减去预测值。标准化残差,(diff-均值)/标准差。看这个标准化后的数在几个标准差之内,判断是否异常。通常可以与1.96比较。3、
2021-10-28 11:48:24
522
原创 2022秋招蚂蚁金服面试
一、一分钟自我介绍。二、简历相关问题。1、实习中主要做的事情,从三方面来回答,工作内容、为谁工作、主要指标。对这部分人做了什么?结果:提升转化率、留存。2、ABtest的流程、原理、参数设置、主要关注的统计效果。分享了一个AB测试的项目3、我用到的主要工具、语言?分两块。一是hive sql用来取数;二是python、excel,用来数据可视化。4、sql问题4.1 数据库底层知识:主键是什么?主键是指,表中经常有一个列或者多列的组合,其值能够唯一地标识表中的每一
2021-10-28 11:28:37
1441
原创 SQL题目-次日留存率
题目解答-- 第一步 求日期间隔select a.user_id,a.log_date as log_d,date_diff(a.log_date,b.log_date) as day_difffrom userlogs aleft join userlogs bon a.user_id=b.user_id--第二步 算留存率 select log_d,count(distinct case when day_diff =1 then user_id else null en.
2021-09-21 12:32:08
1342
2
原创 MYSQL中substring_index()用法
牛客网题目统计每种性别的人数_牛客题霸_牛客网描述题目:作为牛客网的数据分析师,现在运营举办了一场比赛,收到了一些参赛申请,表数据记录形式如下所示,现在运营想要统计每个性别的用户分别有多少参赛者,请取出相应结果示例:user_submit查询:select SUBSTRING_INDEX(profile,',',-1) as gender,count(device_id)from user_submit a group by SUBSTRING_INDEX(profile,
2021-09-16 18:13:08
20756
原创 唯品会秋招数据分析笔试2022
有一份交易表sales,表的结构如下:字段 字段名称 示例 user_id 客户号(用户唯一标识) 123 phone 手机号码 13900000000 add_day 日期 2020-01-01 amount 销售额(元) 100 请根据以上信息(1)请计算2020年1月每天累计销售额。如:1月1日销售额为10万,1月2日销售额为50万,则1月1日累计销售额10万,1月2日累计销售额60...
2021-09-15 16:15:44
549
原创 字节数据分析2022秋招
数据科学家-商业战略一、自我介绍二、挖简历异常分析的case分享,详细追问有没有过B端分析的数据经验主要关注的指标有哪些?为什么转组?有什么不同?sql题1)用开窗函数2)时间函数select month(from_unixtime(unix_timestamp('20210801','yyyymmdd'),'yyyy-mm-dd'))...
2021-09-15 13:10:11
220
原创 2022秋招-京东-数据分析师笔试-编程题
一、题目描述有若干个数形成一个可重集合,它们中很多都想做一个中庸的数,即既不是集合中最大的(或之一),也不是集合中最小的(或之一)。显然,不可能满足所有数。好在还是有一些数并不介意这一点。你需要从这些数中选出一个可重的子集,该子集中介意成为最值的数都得到满足(指不能成为子集中的最值)。请计算可以取的最大可重子集的大小。输入描述第一行一个整数 n,1 <= n <= 100000后面 n 行,每行两个整数 x, y,x <= 1000000000,y 为 0 或 1。x 表
2021-08-21 22:04:48
2242
原创 斗鱼-暑期-数据分析面经-已offer
一面20210630自我介绍实习内容深挖负责什么项目,介绍一下反问什么组:增长分析-策略分析二面20210701自我介绍实习内容深挖ab实验的全过程指标异常分析hr面20210702是否想在武汉长期发展已拒,斗鱼特别希望人长期在武汉发展,不过组里的hc并不充分,hr无法保证。原因如下:1、比较倾向于在北方发展。2、转正hc并不充分。3、相对于一线大厂,斗鱼还是小了一些。...
2021-08-01 17:55:25
259
原创 异常值的识别与处理
参考链接:https://blog.youkuaiyun.com/weixin_39548776/article/details/112486403https://blog.youkuaiyun.com/xzfreewind/article/details/77014587
2021-07-06 18:03:03
158
原创 Python纵向合并多个excel文件
一、背景在学校里,我们往往会学习很多高深的模型和方法,面试中的考察也屡见不鲜,而到了实际工作中使用频率却相对较低,成天和office厮混。这就是所谓的“面试造火箭,工作拧螺丝”现象。此时,不要灰心,不要难过,记住:我有工资的。言归正传,用的较多的是excel文件。有时需要批量合并多个格式相同、仅仅是数据不同的文件,如果一直用鼠标点点点,不光浪费时间、消磨热情不说,而且还可能遇到excel文件太大,电脑崩溃的情况,只想go die。假如Excel欺骗了你,不要悲伤,不要心急,这就是你学..
2021-07-02 16:22:22
5793
4
原创 Python安装第三方库
pycharm安装参考链接:https://zhuanlan.zhihu.com/p/129651314cmd安装参考链接:https://blog.youkuaiyun.com/dss875914213/article/details/86500146
2021-07-02 16:20:08
166
原创 did双重差分法介绍
学习链接:https://zhuanlan.zhihu.com/p/48952513https://zhuanlan.zhihu.com/p/103412389
2021-04-09 18:04:32
1220
原创 阿里暑期数分面经-凉经
阿里一面ab实验是如何分桶的?依稀记得被怼的很惨阿里二面一面和二面差了10天。还以为自己挂了。给不懂数学和统计的人介绍分位数。二分位数。就是中位数。四分位数,就是刚才二分位数的二分位。假设检验的应用我如果这么说了可能表现更好一些吧。呜呜呜。ab实验的分组。对产品ux的迭代做ab实验。这时候做的假设检验就是假设对照组和实验组的实验效果没有差别。假设两个组之间的实验效果无差别。备择假设就是有差别。内连接和外连接的区别内连接就是取交集。外连接包括左外连接和右外连接...
2021-03-26 10:50:13
289
原创 数据挖掘与数据化运营实战 #读书笔记
数据挖掘与数据化运营实战 #读书笔记电子书链接:链接: https://pan.baidu.com/s/1l2hpC3V3bM8C3cfq--kOrw 提取码: yq27 复制这段内容后打开百度网盘手机App,操作更方便哦笔记链接:https://share.mubu.com/doc/Nv4ZpjiqwL...
2021-03-19 18:50:36
382
1
原创 统计学-假设检验部分 贾俊平 #读书笔记
贾俊平-统计学-假设检验笔记链接:https://share.mubu.com/doc/23rRpdVegf网课链接:链接: https://pan.baidu.com/s/1e5yWRndcaOHQ5-b4Z8e9Rg 提取码: ubyu 复制这段内容后打开百度网盘手机App,操作更方便哦电子书链接:链接: https://pan.baidu.com/s/1hzy-o1pFwpg1aCa8xhE1VQ 提取码: wjz8 复制这段内容后打开百度网盘手机App,操作更方便哦.
2021-03-18 11:26:04
487
原创 如何用数据分析思维找对象?没有对象的数据分析师不是好的打工人!
背景:众所周知,现在年轻人的单身率居高不下,天上掉下来一块砖头能砸到三四个单身狗,其中还有一个母胎solo。小编在看了一本数据分析相关的书之后,发现了找对象的秘籍和应用案例,简直拯救万千少男少女于单身的无底洞!要问这本书是什么?哒哒,就是它:《数据化管理:洞悉零售及电子商务运营》。有关这本书的读书笔记可见本博主上一篇博文。笔记链接:https://share.mubu.com/doc/zDQIvco_kf思维导图:结语:好的,看完了吗?(无辜的眼神)不准眼高手低。
2021-03-10 19:17:50
205
原创 数据化管理:洞悉零售及电子商务运营 #读书笔记
笔记链接:https://share.mubu.com/doc/bfFQo8glWf书籍链接:链接: https://pan.baidu.com/s/1qtAALAOexpzgqCtBhrXeaA 提取码: xvg4 复制这段内容后打开百度网盘手机App,操作更方便哦思维导图:彩蛋,如何找到女朋友?如何找到自己喜欢的女朋友?以战略的高度、策略的思维进行分析 必须要有可操作性 结合本书内容来思考一个合格的数据分析师,怎么能没有女朋友?现在,此时此刻,就用数据分析思维,
2021-03-10 18:56:08
760
原创 谁说菜鸟不会数据分析-入门篇 #读书笔记
谁说菜鸟不会数据分析-入门篇 #读书笔记笔记链接:https://share.mubu.com/doc/DUrEpY8GpL书籍链接: https://pan.baidu.com/s/1sP7kBQJvd2eEP0XEL6uteg 提取码: yknc 复制这段内容后打开百度网盘手机App,操作更方便哦...
2021-03-09 15:49:05
624
原创 快手内容运营-数据分析面试
一面 20201111一共有三面。三个部分一、自我介绍照着简历叙述即可。会针对简历中所体现的他感兴趣的部分提问。问了Python爬虫使用的多吗?回答:是的。问了sql使用的多吗?我说是自学的。二、题目(一)sql题目。快手使用的明细数据表。表格样式。uid 用户 pid 视频 date 时间 uid用户在date时间观看了pid视频。001 xyz 20201030 001 xyz 202010
2021-01-19 17:30:00
8189
原创 sql笔试题目
1.在电商中,流量漏斗是最基础的监控漏斗,因此希望你能够基于我提供的数据表和字段构建一个流量转化漏斗。可能会用到的数据表如下:曝光表exhibit:info_id(商品id),dt (日期),token(用户唯一标示)详情表visit:info_id(商品id),dt (日期),token(用户唯一标示)支付表pay:info_id(商品id),dt (日期),token(用户唯一标示),parent_order_id(订单唯一标示)请输出包含如下报表SQL:日期...
2020-11-11 16:14:55
427
原创 建议收藏,10个Windows系统装机必备软件,相见恨晚!
目录(一)录屏软件EV录屏(二)文字识别天若OCR文字识别高级完美版(三)截图悬浮软件SETUNA(四)文本编辑器sublime text(五)播放器爱奇艺万能播放器(六)思维导图类幕布(七)读英文文献神器知云文献翻译(八)电脑文件搜索神器everything(九)浏览器火狐浏览器(十)PDF阅读器福昕俗话说:工欲善其事必先利其器。一台属于自己的电脑,肯定有个人使用痕迹,用的好了就得心应手,流畅如飞。这10个软件,在学习、工
2020-11-08 22:41:32
3137
原创 我的mysql学习历程
目录零、学习过程一、书MySQL必知必会来源:功能:二、视频链接:资料来源:全部资料:软件:my words:三、刷题链接:my words:四、小结零、学习过程书为参考备用,看视频(下软件,跟着敲代码),刷题。一、书MySQL必知必会来源:链接: https://pan.baidu.com/s/1vb7wNDIBdyEcU3KCmjCQ6Q 提取码: bzds 复制这段内容后打开百度网盘手机App,操作更方便哦.
2020-11-08 21:02:02
351
原创 sqlzoo 刷题答案
网址:https://sqlzoo.net/wiki/More_JOIN_operations1.List the films where theyris 1962 [Showid,title]SELECT id, title FROM movie WHERE yr=19622.Give year of 'Citizen Kane'.select yr from movie where title='citizen kane';3.List all of t...
2020-11-08 20:37:43
296
原创 在公众平台1年内发出20+篇推文之后,数据分析小白学到了什么?
目录前言Python:re:selenium:自动登录自动下载selenium基础知识爬虫xpathPDF处理pandas--表格数据处理Stata:爬虫:merge--表格数据处理总结前言从2019年5月起,我开始在公众平台下学习软件。到2020年7月卸任,一年多的时间,我从对代码模糊向往的小白,变成了别人口中会写(一点点)代码的大神(不是)。感触很深,人走得太快,也要偶尔等一等自己的灵魂,回头看看走过的路,所以下面做一下总结。.
2020-11-07 14:38:46
315
原创 python更改文件名
一、文件重命名import osxlsbpath=r"F:\data"os.chdir(xlsbpath) #更改当前路径filelist = os.listdir(xlsbpath) # 该文件夹下所有的文件(包括文件夹)print(filelist) #文件夹中所有文件名old="last.xlsb" #旧文件名new="to.xlsb" #新文件名os.rename(old,new) #重命名直接修改文件名二、复制后命名#先复制再改名#pip install sh
2020-08-12 22:36:06
18005
1
原创 python返回上一个交易日
一、周一到周五微交易日,其他不处理#返回上一个交易日lastworkday,根据周一到周五为工作日(不考虑他,采用下一个方法)import time,datetime #时间date=datetime.datetime.today() #今天#print(date.today())w=date.weekday()+1#print(w) #周日到周六对应1-7if w==1: #如果是周一,则返回上周五 lastworkday=(date+datetime.timedelta(days=-
2020-08-12 22:28:50
4323
1
原创 python中时间戳和日期的转换
#时间戳和日期的转换import time,datetimeprint(datetime.datetime.today())print(time.time())print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(1494133686)))结果
2020-08-12 22:22:30
249
原创 python爬取公众号历史文章
文章来源学习网上以及自己修改。参考链接:https://blog.youkuaiyun.com/d1240673769/article/details/75907152目的'''爬取公众号的历史文章信息:标题、链接、发布时间步骤:登录某一公众平台(随意一个),在新建图文的超链接里搜索公众号,选择第一个对应的公众号,爬取这个公众号所有的历史消息。'''准备工作import osos.chdir(r'G:\公众号文章')from selenium import webdriver
2020-08-12 22:18:46
1069
原创 python删除列表中空字符
一、目的近期,处理数据中遇到了删除列表中空字符的需求。# -*- coding:utf-8 -*-'''目的:删除None和'''''二、数据table1=[['地区', None, None, '公司名称', '', '注册资本', '', '成立时间', '银监会批复时间'], [None, None, None, None, None, '(亿元)', None, None, None], ['', '福建', '', '福建省闽投资产管理有限公司', '15', None,
2020-08-01 12:08:49
2090
原创 养家之人:原来和平如此珍贵!Stata豆瓣影评爬取并画词云图
《养家之人》20年后约定在海边相见。--那时候我都认不出你了。--你可以把蓝宝石高价卖给我。今天看了《养家之人》,十分触动。所以爬了下豆瓣影评并且画了个词云图来看看。*豆瓣影评*一、单个网页获取时间、链接、标题*infix读入clearcap mkdir "G:/豆瓣影评" //创建目标文件夹cd "G:/豆瓣影评" //更改当前工作路径到此文件夹copy "https://movie.douban.com/subject/26...
2020-07-31 00:23:46
1493
1
原创 来搞一个小爬虫~基金经理人信息!
'''爬取天天基金网站,所有基金经理人以及所管的基金的信息。网址:http://fund.eastmoney.com/Data/FundDataPortfolio_Interface.aspx?dt=14&mc=returnjson&ft=all&pn=50&pi=1&sc=abbname&st=asc关键字:get方法。流程:先获取第一层的namenumber,然后对于每一个namenumber爬取第二层的fund的信息。结果文件:g:\\fund.
2020-07-10 22:14:23
1521
3
原创 2020年上半年过去了,来给日记画个词云图呀~
作为一个常年写日记的人,从笔记本、手机、电脑各处都要写呀写。今天一看,7月份了,今年的上半年结束了,突发奇想对我上半年的日记来做个词云图吧~~~废话不多说,直接来。一、准备工作把日记word文档转换为txt文本文档,以备之后进行分析。直接打开word文档,点击“文件”“另存为”,类型选择“txt”即可。寻找一张作为词云图背景的图片。图片需要基本轮廓。通常下载的图片为矩形,进行抠图处理即可。二、代码实操简介'''图形可视化:读入中文文档,进行分词,剔除停用词,
2020-07-02 00:15:05
514
stopwords.txt
2020-07-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人