自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

轻疯侠爱喝茶

数据挖掘工程师

  • 博客(10)
  • 问答 (2)
  • 收藏
  • 关注

原创 阿里云离线数仓

第一章 数仓概念数仓定义(Data Warehouse)为企业所有决策制定过程,提供所有系统数据支持的战略合辑说白了,公司所有的数据都可以汇聚到数据仓库里公司的数据来源- 日志采集系统- 业务系统数据库- 爬虫系统等 所有业务部门的数据都可以放入数仓,数据库就无法完成这样的功能数仓的好处可帮助企业改进业务流程,控制成本,提高产品质量数仓能做什么清洗,转义,分类,重组,合并,拆分,统计等数仓输出到哪里报表系统 → 用户画像 → 推荐系统 → 机器学习 → 风控系统第二章

2021-06-15 22:26:00 602

原创 Mysql表设计原则

数据库规范1.数据库设计基本规范所有的表使用InnoDB的索引2.字符集统一使用utf-8兼容性更好,避免字符集转化产生乱码转换可能导致索引失效如果存储emoj表情,则使用utfbmb4字符3.所有的表和字段都加注释4.控制单张表数据在500w以下5.如果不使用分区表可能造成很大混乱,不宜扩展和维护6.冷热数据分离,减小表宽度故名思议,冷数据就是没人访问货很少访问的数据,热数据就是大家都喜欢看的数据mysql每个表最多存储4096列,并且每一行数据不能超过85535个字节减

2021-06-15 12:53:15 282

原创 SWOT分析

SWOT分析企业的优势(strengths)企业的劣势(weaknesses)外部的机会(opportunities)外部的威胁(threats)真正的SWOT分析是整个战略分析枢纽式的工具研究一家企业的战略,要去分析外部的行业环境中观的竞争环境,要研究企业内部的资源和能力,然后把它们结合在一起这里所说的优势和劣势,来自于组织内部能力分析的结果,不是拍脑袋想出来这个企业有什么优势有什么劣势,而是根据前面的资源和能力的分析直接导出的结论外部的机会和威胁,是从行业分析和竞争分析导出的结论这就

2021-06-03 14:09:57 1769

原创 面试技巧——自我介绍

面试本质只有三个问题 1. can you do the job(考核能力) 2. will you love the job(考核意愿) 3. can we tolerate working with you(考核团队合作)为什么要你自我介绍? 面试官没有看你的简历。面试官通常不是做招聘的,所以当他来到面试的房间的时候非常可能并没有看你的简历。这个问题有什么坑?1. 要连贯,不要断断续续 如果断断续续会让你显得: ① 没有认真准备这场面试 ② 紧张环境下,你的沟通能力严重打折

2021-06-02 10:41:18 170

原创 SQL刷题(LeetCode-简单-196.删除重复邮箱)

deletefrom Personwhere Id in ( select Id from ( select Id, row_number() over(partition by Email order by Id) rn from Person ) t1 where rn>1 )使用窗口函数解题窗口函数可以解决什么问题?排名:每个班级按成绩来排名top N:找出每个学科排名前N的同学进行奖励总之:在每组内排名的问题.

2021-05-26 13:41:52 168

原创 SQL刷题(LeetCode-简单-183.从不订购的客户)

select c.`Name` as Customersfrom Orders as oright join Customers as con c.`Id` = o.`CustomerId`where o.`CustomerId` is null

2021-05-25 16:07:11 107

原创 SQL刷题(LeetCode-简单-182.查找重复的电子邮箱)

select p.`Email`from Person as pgroup by p.`Email`having count(*)>1对Email出现的次数进行计数,大于1的就说明重复了count(*)可以不出现在选择列表里

2021-05-25 15:11:38 154

原创 SQL刷题(LeetCode-简单-181.超过经理收入的员工)

select a.`Name` as Employeefrom Employee as a,Employee as bwhere a.`ManagerId` = b.`id`and a.`Salary` > b.`Salary` 使用自连接解题,根据筛选条件得到有经理的员工的经理的薪资,再比较员工和其经理的薪资。...

2021-05-25 14:36:06 118

原创 SQL刷题(LeetCode-简单-176.第二高的薪水)

select ifnull( (select distinct salary as SecondHighestSalary from Employee order by salary desc limit 1 offset 1) ,null)as SecondHighestSalary要点第二高的薪水可能为空,用ifnull解决。内层select语句形成了一个临时表.

2021-05-25 11:17:09 88

原创 SQL刷题(LeetCode-简单.175组合两个表)

两种代码执行性能有不小的差异第一种select p.`FirstName` ,p.`LastName` ,a.`City` ,a.`State`from Person as pleft join Address as aon p.`PersonId` = a.`PersonId`在这种方法中,查询列表规定了所查询字段的表名,性能如下:第二种select FirstName ,LastName ,City

2021-05-25 10:28:25 96

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除