- 博客(11)
- 收藏
- 关注
原创 发送邮件示例代码
多种语言实现发送邮件功能Python实现发送邮件功能Shell实现发送邮件功能Python实现发送邮件功能#!/usr/bin/python# -*- coding: UTF-8 -*-# 首先导入email模块构造邮件from email.mime.multipart import MIMEMultipartfrom email.header import Headerfrom email.mime.text import MIMETextfrom email.mime.applicat
2021-01-27 14:23:29
588
原创 数仓分层结构
数据仓库(Data Warehouse)简写DW,在一般企业中,由下到上依次分为:DWD、DWB或DWM、DWS。第一层:数据明细层DWD(data warehouse detail):是业务层与数据仓库的隔离层。第二层:数据中间层DWM(date warehouse middle)或者叫DWB(data warehouse base):存储的是客观数据,一般用作中间层,可以认为是大量指标的数据层。第三层:数据服务层DWS(data warehouse service):基于DWB上的基础数.
2020-10-15 14:20:02
948
转载 替换系统自带yum源(针对执行yum出现未注册的情况)
文章转载自:https://blog.youkuaiyun.com/otmqixi/article/details/81564515我们安装好RHEL的Linux后,执行yum命令安装软件,如果是未注册的肯定会出现This system is not registered with an entitlement server. You can use subscription-manager to regi...
2019-05-02 10:07:37
1361
原创 解决错误:org.apache.hadoop.mapreduce.lib.input.InvalidInputException:
**错误信息:**Exception in thread “main” org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://192.168.127.11:9000/root/data/a.txt**描述:**找了老半天,网上也有说是9000端口被占用。其实都...
2019-01-11 23:22:29
5099
1
原创 Maxwell实时监听Binlog单机demo
文章目录需要环境配置Linux环境下MySQL开启Binlog配置Maxwell数据库权限创建数据库配置Kafka并启动Maxwell需要环境Linux环境MySQL (版本:5.7.19)kafka (版本:kafka_2.11-1.0.0)zookeeper (版本:zookeeper-3.4.10)Maxwell (版本:maxwell-...
2019-01-09 12:27:30
1038
翻译 Flume Agent吞吐量优化方法
译自:Scaling a flume agent to handle 120K events_sec – Data Collective – MediumApache Flume 是一种用来收集大量数据(如日志)的分布式服务。Flume agent 有三个组成部分:source, channel and sink.。简而言之,数据通过Channel从Source到Sink。Source生产数...
2019-01-05 15:49:28
3177
2
转载 大数据环境下该如何优雅地设计数据分层
最近出现了好几次同样的对话场景:问:你是做什么的?答:最近在搞数据仓库。问:哦,你是传统行业的吧,我是搞大数据的。答:......发个牢骚,搞大数据的也得建设数据仓库吧。而且不管是传统行业还是现在的互联网公司,都需要对数据仓库有一定的重视,而不是谈一句自己是搞大数据的就很厉害了。数据仓库更多代表的是一种对数据的管理和使用的方式,它是一整套包括了etl、调度、建模在内的完整的理论体...
2019-01-03 17:16:21
1102
转载 算法中时间复杂度概括——o(1)、o(n)、o(logn)、o(nlogn)
在描述算法复杂度时,经常用到o(1), o(n), o(logn), o(nlogn)来表示对应算法的时间复杂度。这里进行归纳一下它们代表的含义:这是算法的时空复杂度的表示。不仅仅用于表示时间复杂度,也用于表示空间复杂度。 O后面的括号中有一个函数,指明某个算法的耗时/耗空间与数据增长量之间的关系。其中的n代表输入数据的量。比如时间复杂度为O(n),就代表数据量增大几倍,耗时也增大几倍。比...
2018-11-18 19:39:14
8192
转载 Maven下载安装、Eclipse配置Maven详解
Maven下载安装的前提要保证已经配置好Java开发所需要的环境变量,即已经将jdk配置好。可以在命令行查看一下是否已经配置好。步骤...
2018-09-12 19:44:26
880
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人