- 博客(73)
- 资源 (1)
- 收藏
- 关注
原创 MaxCompute开发UDF和UDTF案例
Java开发MaxCompute的UDF和UDTF使用案例,更多详情可参考: https://help.aliyun.com/zh/maxcompute/user-guide/udfs-1/?spm=a2c4g.11186623.help-menu-27797.d_2_1_3_3.4a4b11c1MAtFZb
2025-06-03 22:47:44
984
原创 DataWorks通用资源组绑定的VPC配置NAT网关
Serverless资源组默认不具备公网访问能力,如果需要通过公网访问数据源或网络,请为Serverless资源组绑定的VPC配置公网NAT网关和EIP
2025-06-02 16:56:56
405
原创 DataWorks快速入门
DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。
2025-05-08 22:39:44
366
原创 StarRocks的执行计划和Profile
为优化 StarRocks 集群性能,管理员需要定期针对慢查询进行分析并优化,本文介绍如何分析SQL查询
2025-03-29 01:32:28
514
原创 Flink基础简介和安装部署
Flink是⼀个分布式,高性能,随时可⽤的以及准确的流处理计算框架,Flink可以对无界数据(流处理)和有界数据(批处理)进⾏有状态计算的分布式,⾼性能的计算框架。⽆界数据流:数据流是有⼀个开始但是没有结束;有界数据流:数据流是有⼀个明确的开始和结束,数据流是有边界的。
2025-03-23 00:33:29
1018
原创 Windows本地部署DeepSeek
访问 https://ollama.com/library/deepseek-r1 选择要部署的deepseek-r1, 这里我选择7B。复制命令在本地cmd窗口执行,等待安装完成即可。中间网络开小差了,重新执行了一次 安装成功。双击安装完Ollama,默认安装在C盘的。本案例使用Windows电脑。
2025-02-18 23:04:45
796
原创 ElasticSearch的Python Client集成
Python Client 链接阿里云ES的代码案例,参考了ES官方文档仅供学习参考使用
2024-11-10 10:56:42
450
原创 Hadoop-007-MapReduce&YARN的配置部署
分布式计算组件MapReduce和分布式调度组件YARN的配置, 部署 以及实测执行任务验证
2024-11-01 16:27:43
1036
原创 Hadoop-002-部署并配置HDFS集群
第一篇前期环境准备后, 本文主要是HDFS的部署完整配置, 直到搭建完成成功访问 http://hadoop-1:9870
2024-10-30 00:46:44
1314
原创 Hadoop-001-本地虚拟机环境搭建
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。本篇学习为主, 介绍Hadoop集群虚拟机的搭建,包括网络配置, 免密登录,JDK环境, 时间同步, 防火墙设置,SETLinux 等等, 实际场景可以先配置好一台服务器环境再克隆2台虚拟机, 或者直接购买云服务器来配置。参考黑马程序员公众号提供的视频和资料,非常感谢!
2024-10-22 12:39:43
628
1
原创 MQTT Topic通配符匹配规则
本文介绍了主题树的层级分隔符/的使用,以及多层通配符#和单层通配符+在匹配主题时的规则。多层通配符能匹配任意层数,而单层通配符仅匹配一层。注意,通配符不能用作发布者消息,且主题命名应避免特殊字符,如null,并保持在64k长度限制内。
2021-01-15 00:03:40
5112
1
原创 正则表达式的理解与应用
正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
2021-01-08 10:16:55
182
原创 ElasticSearch索引模板的使用
索引模板顾名思义就是创建索引的模板,模板中包含公共的配置(settings)和映射(Mapping),并包含一个简单触发条件,及条件满足时使用该模板创建一个新的索引。
2020-11-12 14:50:33
850
原创 Kafka Linux与Windows下的搭建
Kafka是一款流行分布式消息分布订阅系统。Kafka用于构建实时的数据管道和流式的app.它可以水平扩展,高可用,速度快。
2020-10-13 14:02:12
214
原创 Rocket MQ的集群架构
RocketMQ 是阿里巴巴集团自主研发的专业消息中间件,基于高可用分布式集群技术,提供消息订阅和发布、消息轨迹查询以及定时(延时)消息、资源统计、监控报警等一系列消息云服务,是企业级互联网架构的核心产品。
2020-09-14 09:20:14
188
原创 ElasticSearch生态和集群简介
ES通常以集群方式工作,这样做不仅能够提高,ES的搜索能力还可以处理大数据搜索的能力,同时也增加了系统的容错能力及高可用,ES可以实现PB级数据的搜索
2020-09-08 23:42:09
312
1
原创 ElasticSearch的部署与基础查询
ElasticSearch是一个基于Lucene的高扩展的分布式搜索服务器,支持开箱即用,隐藏了Lucene的复杂性,对外提供Restful 接口来操作索引、搜索。
2020-09-08 23:28:07
154
1
Big Data Tools插件依赖文件
2024-11-01
MAC-ElasticSearch-7.4
2020-09-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人