
笔记
山上一棵松
分享转行经验、大数据开发经验,机器学习研究
展开
-
关于人工智能发现方向的畅想
深度学习模型的分布式计算和算法优化,开启了大模型时代。各行各业开启了自己的适配与探索。初步大模型的应用成了AI2.0时代技术代表。区块链+大模型,大模型与大模型相链接,共享信息,同时不可互相更改,组成超大通用模型,解决多领域信息共享问题。从而迈入大智能时代。各行各业发现自己的领域模型,基于物联网的智能终端推动生产力的飞跃。2.AI Agent时代 50年。3.大智能时代 100年。4.可能的时代 300年。1.AI 2.0时代。原创 2023-08-30 22:02:28 · 136 阅读 · 0 评论 -
从Spark源码分析如何使用antlr4解析SQL(一)
明确antlr4做了什么工作1.有两个语法文件:SqlBaseLexer.g4和SqlBaseParser.g4这两个文件在Spark源码的目录是:spark/sql/catalyst/src/main/antlr4/org/apache/spark/sql/catalyst/parserSpark SQL最新的源码地址:https://github.com/apache/spark/tree/master/sql2.两个语法文件的作用:Lexer用来规定所有的关键字;Parser用来规定SQL语原创 2022-03-27 11:17:32 · 3463 阅读 · 0 评论 -
flink程序设置kerberos认证——专业实用版
flink程序提交命令flink run -d -m yarn-cluster \ -yD security.kerberos.login.keytab=/path/your/user.keytab \ -yD security.kerberos.login.principal=your@HADOOP.COM \ -c com.your.class.Nameflink on yarn认证原理将keytab文件自动上传hdfs,由yarn管理,分发给每个executor缓存token,定原创 2021-02-19 13:11:16 · 4885 阅读 · 16 评论 -
关于flink on yarn只能提交一个job的问题
问题:第一个任务正常,随后的任务提交一直显示container分配成功后,没有启动task。仔细对比发现,两个任务的taskmanager的rpc端口一样。解决方法:官网解释如下:在使用cluster模式时,如果使用per job模式,不能手动设置cluster.id,每次提交任务时,会自动生成。检查配置参数,不要配置cluster.id就会解决...原创 2020-09-29 08:57:09 · 1371 阅读 · 0 评论 -
Hadoop3单个HA集群配置使用viewfs
viewfs的特点可以使用类似linux系统的挂载表,映射集群和hdfs文件系统的路径。例如:将/user/ 映射到集群cluster-1,将/data映射到cluster-2.在实际操作中,只需要直接使用hdfs dfs -ls /data 访问的就是集群cluster-2中目录。增加Nfly系统,可以链接一个目录到多个目录,实现同时写入多个文件系统。例如配置如下,当执行命令: hadoop fs -touchz viewfs://global/ads/z1 会在以下的目录中分别创建一个z1文件原创 2020-07-06 17:43:03 · 4240 阅读 · 0 评论 -
thymleaf select if判断
在bootstrap中使用thymleaf注意: 使用th:object时,需要将user对象放入model里,会生成默认值等于user对象里的默认值@RequestMapping("/adduser") public String toAdd(Model model) { User user = new User(); model.addAttribu...原创 2020-01-01 17:36:45 · 1488 阅读 · 0 评论 -
解决idea2019.3下载不了jar的问题
更新maven版本,然后重启,就可以了,报错一直显示的是解析不了maven仓库的地址,应该是新版本更换了解析方式,更新版本后就好了,我用的是3.2.1,更新成3.6.3就好了,也不知道改了啥。...原创 2019-12-28 21:53:00 · 3199 阅读 · 0 评论