
大数据分析师
文章平均质量分 65
TianCMCC
这个作者很懒,什么都没留下…
展开
-
Pandas 找出并查看数据中的重复行
dup_row = data.duplicated(subset=['用户编号', '统计日期'])data.insert(0, 'is_dup', dup_row)data[data['is_dup'] == True]原创 2021-11-27 15:05:38 · 16179 阅读 · 1 评论 -
大数据分析师实操(构建数据仓库)
1. 开启MySQL服务,(环境中已经安装mysql-community-server,可直接进行操作)操作环境: slave2rpm -aq | grep mysql-community-serverservice mysqld start systemctl status mysqld2. 根据生成初始密码,进入数据库进行操作操作环境: slave2grep "temporary password" /var/log/mysqld.log3. 设置密码安全策略, 强度为LOW操作环原创 2021-10-20 18:07:22 · 732 阅读 · 0 评论 -
大数据分析师理论知识解析(Part.1)
一. Apriori算法使用什么指标筛选项目集?A. 交易编号 B. 最小支持度 C. 最小信赖度 D. 购买数量解析: Apriori算法是一种关联规则算法,Apriori算法首先从项目集中找出所有的频繁项集(通过最小支持度筛选),再从频繁项集中找出符合最小置信度的项集,最终便得到有强规则的项集。Apriori算法的介绍二. SQL语言中,删除一个表中的所有数据,但保留表结构的命令?A. DELETE B. DROP C. CLEAR D. REMOVE解析:#原创 2021-10-18 01:31:15 · 1568 阅读 · 1 评论