- 博客(19)
- 收藏
- 关注
原创 OpenClash 内核更新失败解决方法
OpenClash 是运行在ImmortalWrt上的插件,使用这个插件可以轻松的实现全家人kx上网。在更新插件中我遇到一个问题OpenClash 内核更新失败,主程序一直是未运行的状态。在全局设置中无法识别当前内核版本或者是不存在。固件刷新错误导致的问题。未更新官方给定的插件。
2023-05-11 08:46:11
19171
原创 坛经与禅宗的智慧-王德峰
菩提本无树明镜亦非台本来无一物何处惹尘埃——六祖慧能身是菩提树,心是明镜台时时勤拂拭末使惹尘埃——神秀《金刚经》的核心思想是:应无所住,而生其心。慧能的偈句达到了前四个字的境界。还没领悟本心。所以弘仁法师用鞋子把偈句擦掉的动作有禅意。因为慧能的偈句讲的是无的境界,但是不能停留在无的境界,未见本性。所以对说无的偈句再无一次,叫无无。语言的科学观点?西方科学对语言的理解是符号工具。错失了语言的本性,语言的本性是人为存在的家,人以语言之家为家,海德格尔说的,人在语言中了,人才有一个世
2022-04-13 22:49:27
1538
原创 浅谈UBT数据治理
1. 为什么UBT数据治理是重要的?互联网公司的数据构成分为两部分:订单数据和用户行为数据,而用户行为数据占据了非常重要的地位,例如是算法工程师要借助用户行为数据建立模型来上算法模型,例如是实时营销,推荐系统等,如果能做好算法底层数据的支持,算法就离不开底层数据的支撑者,例如是CDP平台各种营销需要各类的数据包只有做好了UBT治理,数仓就是数据工程的核心环节了2. 维度,属性,标签方法我们要规范我们的UBT数据就需要建立一套指标方法来描述用户的行为1. 指标我们要从多个角度来衡量用户的行为,例如访
2021-08-15 16:39:27
609
原创 202108- 数仓建模方法
博客内容来自上周听的一次方法论分析会,这里做一些提炼对我比较重要的观点:数仓不应该是业务驱动型,而应该是业务前置型维度退化不应该乱用,在某些场景下会变成维度冗余,应该充分调研维度,维度属性快照和拉链应该是成对出现的,因为业务方既要历史变化的数据,也需要当前最新的数据dws层(轻度汇总层),应该怎么解释这一层在数仓中的作用维度,维度属性,在不同业务场景下的变化1. 调研调研对象调研对象应该无限接近数据的使用方调研内容掌握业务流,数据流,以便于构建模型掌握业务方对数据的需求,建设数
2021-08-07 16:02:14
106
原创 sparksql-分组月度环比同比自动化
有一个需求是按月份统计环比和同比值,每次都取一遍非常麻烦,同时也容易出错,这里我把要取的数据报表化,这里提供一个模板,这个SQL写了我好久,经过对比数据发现,这样写是没什么问题的,这里提供一些注意事项同比环比的定义月份同比计算 (2021-01 - 2020-01) / 2020-01月份环比计算 (2021-02 - 2021-01) / 2021-01在计算同比的时候要注意order by要对月份和年份都要排序,原因是lead 中的order by只指定了一个排序规则,这里都要指定,
2021-06-17 23:41:44
1155
原创 最全SparkStreaming实践
最全SparkStreaming实践https://www.jianshu.com/p/3351821217c0
2021-01-17 22:48:44
129484
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人