- 博客(7)
- 资源 (1)
- 收藏
- 关注

原创 Maxcompute系列--持续更新
目录一、项目命令二、SQL开发三、python开发四、项目实战&巧学巧用4-1 用pyodps+odps sql实现钉钉机器人预警推送五、爬坑系列一、项目命令待更新。。。二、SQL开发待更新。。。三、python开发待更新。。。四、项目实战&巧学巧用4-1 用pyodps+odps sql实现钉钉机器人预警推送 在使用maxcompute中,我们发现整个数仓体系与外部没有交互,而恰好钉钉机器人支持我们讲数仓的信息通过机...
2021-09-28 10:41:58
135
原创 AI入门那么简单|3-非监督学习:探索未标记数据之美
这种算法基于对多个交易或记录之间关联性的分析,可以帮助我们发现事物之间的联系,进而提高商业效益。非监督学习是一项非常重要而且实用的技巧,它可以让我们发现数据中的隐藏信息,抽取最有价值的特征或者模式。一个示例是,假设我们有一个没有进行标签分类的音乐库,我们可以使用非监督学习来查找音频质量、相关性等相似性模式。然后,利用这些模式对音乐库中的歌曲进行分类和聚类,得到具有意义的组合。通俗点说,非监督学习就像是探险家拓荒者探索尚未被开发的新大陆一样,寻找未知的、隐藏在数据里的信息。鸡蛋, 牛奶, 豆腐, 苹果。
2023-05-18 19:28:57
393
1
原创 AI入门那么简单|2-机器学习基础
在本章节中,我们介绍了机器学习的三种主要类型、常见算法模型及数据预处理的重要性。我们还提供了一个简单的Python实现示例,帮助您更好地理解机器学习算法的实际应用。各位还想看人工智能的那些内容,可以关注作者并留言!
2023-05-05 16:44:04
401
原创 AI入门那么简单|1-人工智能简介
本章介绍了人工智能的基本概念,历史。介绍了机器学习和强化学习这两个核心技术,便于大家全面简单的理解人工智能。各位还想看人工智能的那些内容,可以关注作者并留言!
2023-05-03 16:58:52
983
原创 maxcompute时间日期函数整理
maxcompute的时间日期函数DATEADD按照指定的单位和幅度修改日期值datetime dateadd(date|datetime|timestamp <date>, bigint <delta>, string <datepart>)参数说明date必填。待转换的时间日期,可以是date、datetime、timestamp中任意一种delta必填。修改幅度,BIGINT类型。如果delta大于0,则增,否则减。
2021-10-21 19:23:17
9068
原创 阿里云maxcompute系列--用pyodps+odps sql实现钉钉机器人预警推送
场景我们在使用maxcompute进行数据处理,我们会需要对上下游的数据质量作一些规则校验,用以来识别是否有脏数据影响了我们的数据质量。而校验后,若是发现了脏数据,就需要第一时间通知到数据负责人,以便于数据质量负责人/数据运维角色的人员可以及时得知问题,让他们有充分的数据对数据进行处理,尽快修正数据问题;而且告知信息需要的是准确,有含义,才能让人更快定位原因。而监控数据并通知到数据质量负责人/数据运维的方式有很多,常见的有使用外置数据质量工具,但是工具类天生就很重,开发难度,后去运维对于小团队而言是1
2021-04-06 22:21:35
957
1
原创 blog-数据仓库维度建模系列--缓慢变化维(SCD)的思考(一)
缓慢变化维(Slowly Changing Dimensions)缓慢变化维是维度技术中用于描述维度变化情况的一种分类。什么是SDC?在现实的实施中先说一下缓慢变化维的概念。缓慢变化维(Slowly Changing Dimensions)指的是:维度中的某一个或某几个属性不是固定不变,会随着时间的推移发生低频次改变。打个比方,小李在魔都奋斗多年,成功买房落户,那么小李的户籍地址就会发生变化;如果把自然人当作数据分析时的一个维度,那么户籍地址属性的就是一类SCD。维度建模怎么处理SCD维
2021-04-01 21:18:51
917
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人