- 博客(4)
- 收藏
- 关注
原创 Python使用正则表达式分离中英文数据_获取演员出演电影数量
获取演员出演电影数量目标:从中英文混合的‘主演’列中提取出演员中文名,并制作演员表(演员,出演电影数量)原数据截图:处理后截图实现代码import pandas as pdimport reinput_path = r'C:\Users\Administrator.DESKTOP-002ARSO\Desktop\tableau配套数据\中国电影网电影_data.xlsx'output_path = r'C:\Users\Administrator.DESKTOP-002ARSO\Des
2020-12-29 16:29:50
993
2
转载 python里的apply,applymap和map的区别
转自:[https://www.cnblogs.com/cymwill/p/7577369.html]apply 用在dataframe上,用于对row或者column进行计算;applymap 用于dataframe上,是元素级别的操作;map (其实是python自带的)用于series上,是元素级别的操作。如:>>> df = pd.DataFrame(np.random.randint(0,10,(4, 3)), columns=list('bde'), index=ra
2020-11-04 12:13:19
239
原创 MySQL数据分析2_tb用户行为分析
使用MySQL进行数据分析2_tb用户行为分析本文数据来源于:天池使用工具:MySQL,Excel1.简介用户行为是淘宝上用户行为的数据集,用于带有隐式反馈的推荐问题。该数据集由阿里巴巴提供。2.数据理解该数据集包括随机选择的约100万用户,以及这些用户在2017年11月25日至12月3日之间具有点击,购买,向购物车中添加商品和偏爱商品的行为,所有数据量超过1亿行,考虑到数据库运行时间,这里我就取了大概200W的值进行分析。字段理解如下:字段解释user_id用户编号
2020-09-24 01:07:35
369
原创 Mysql数据分析1_酒店预定需求分析
MySQL数据分析1_酒店预定需求分析本文所有数据来源于kaggle:Hotel booking demand使用工具:MySQL,Excel1.背景您是否想过一年中什么时候预定酒店房间?还是为了获得最佳每日房价而获得的最佳停留时间?如果您想预测酒店是否可能收到过多的特殊要求,该怎么办?该酒店预订数据集可以帮助您探索这些问题!2.提出问题1)酒店运营分析(城市酒店和假日酒店预订需求和入住率比较、客流量趋势、渠道等角度)2)用户分析(预定时长、入住时长、预定餐饮、特殊要求、出行人员结构、用户类型
2020-09-20 13:37:16
844
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人