
大数据
文章平均质量分 68
Emmitte
talk is cheap,show me the code
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
java调用ambari api示例
以查询ambari当前用户列表为例,展示java调用ambari api的demo原创 2023-04-09 11:16:09 · 50915 阅读 · 0 评论 -
flink-1.15.X编译Runtime web模块失败解决
本文通过修改flink-runtime-web中的pom文件与flink-runtime-web/web-dashboard中的package.json文件成功编译通过flink-1.15.0原创 2022-10-14 15:49:51 · 75181 阅读 · 0 评论 -
Ansible批量安装clickhouse集群(shell脚本方式)
Ansible批量安装clickhouse集群(shell脚本方式),帮助运维人员批量部署clickhouse集群。原创 2022-09-02 14:32:43 · 80065 阅读 · 2 评论 -
Ambari安装phoenix-hbase5.X(适配phoenix-queryserver)
phoenix-hbase4.15及5.X版本后,phoenix-hbase安装包中就不带phoenix-queryserver,phoenix-queryserver需要单独安装。本文将从手动安装跟Ambari安装两种方式出发适配phoenix-hbase高版本。原创 2022-03-07 14:47:28 · 112966 阅读 · 0 评论 -
ClickHouse在字节跳动的应用与实践
早期实践案例一:推荐系统实时指标案例二:广告投放实时数据运维经验Kafka接入ClickHouse的平台推断出Schema敏捷BI平台总结未来展望和计划欢迎关注“程序杂货铺”公众号,里面有精彩内容,欢迎大家收看^_^...原创 2021-04-08 10:49:18 · 158814 阅读 · 0 评论 -
ClickHouse踩坑指南
创建单表建议首选MergeTree引擎(ClickHouse中最强大的表引擎当属 MergeTree引擎及该系列(*MergeTree)中的其他引擎。),创建分布式表建议选择MergeTree + Distributed引擎,若保证高可用,建议选择ReplicatedMergeTree + Distributed引擎; 针对当前ClickHouse版本,Nullable(DateTime)不生效,插入空值报错; 在SQL解析方面,ClickHouse是大小写敏感的,这意味着SELECT a 和 SEL.原创 2021-03-17 10:33:40 · 166733 阅读 · 1 评论 -
ClickHouse与MySQL查询对比测试
环境表:字段属性:ID Int64,VALUE_DAY float,CENTER_NAME String,SERVICE_NAME String,IPCOUNT UInt8,M_DATE Date,M_TIME String,TYPE String,TYPE_MACHINE String行数:7938518表文件大小:719M配置:MySQL部署一台主机,创建一张表。CREATE TABLE `test` (`ID` bigint(20)原创 2021-03-02 16:08:37 · 167783 阅读 · 1 评论 -
Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate学习笔记
1.论文要点1.1英文 Conversion rate (CVR) prediction is an essential task for ranking system in industrial applications, such as online advertising and recommendation etc. For example, predicted CVR i...原创 2019-12-19 14:31:55 · 183220 阅读 · 0 评论 -
Redis集群配置参数及优化
Redis的主要参数配置在redis.conf文件中。1. conf 内存值2.bind ip默认情况下,如果没有指定“bind”配置指令,Redis将侦听服务器上可用的所有网络接口的连接。默认情况:bind 127.0.0.1实际配置:bind 本机ip3.protected-mode yes启用默认保护模式。只有当您确定您希望其他主机的原创 2018-01-12 15:39:28 · 57589 阅读 · 0 评论 -
Redis集群架构及对比
1.Redis3.0·优点a. 无中心节点b. 数据按照 slot存储分布在多个 Redis实例上c. 平滑的进行扩容/缩容节点d. 自动故障转移(节点之间通过 Gossip协议交换状态信息,进行投票机制完成 Slave到 Master 角色的提升)e. 降低运维成本,提高了系统的可扩展性和高可用性·原创 2018-01-12 15:32:11 · 50478 阅读 · 4 评论 -
协同过滤推荐算法(java原生JDK实现-附源码地址)
协同过滤推荐算法(java原生JDK实现-附源码地址)一、项目需求1.需求链接https://tianchi.aliyun.com/getStart/information.htm?raceId=2315222.需求内容竞赛题目在真实的业务场景下,我们往往需要对所有商品的一个子集构建个性化推荐模型。在完成这件任务的过程中,我们不仅需要利用用户在这原创 2017-12-02 13:55:28 · 77769 阅读 · 11 评论 -
Elasticsearch权威指南-学习笔记
对Elasticsearch权威指南的学习笔记,主要为理论部分原创 2017-10-06 09:08:29 · 44662 阅读 · 0 评论 -
Elasticsearch-JSON串查询总结
对Elasticsearch的JSON方式查询总结原创 2017-10-06 08:55:08 · 67663 阅读 · 0 评论 -
大数据应用
大数据应用随着web4.0时代的到来,数据将成为企业的最大资产。运营商所含有的数据是不可限量的,同时其带来的价值也是无法估量的。充分利用运营商的数据以及互联网大数据技术,能够为企业带来意想不到的效果。1.应用 对内:网络优化、异常检测、大数据报表、用户轨迹、协同警方监控及判案、智慧城市对外:用户画像、客户细分、精准营销、追踪用户、产品推荐1.1对内...原创 2017-10-05 11:46:31 · 47191 阅读 · 0 评论 -
ElasticSearch javaAPI demo示例
一.数据实体:ID:自增主键ID:ID值VALUE_DAY:该机器当天的值GROUPNAME:组名TYPE_MACHINE:机器类型DATE:日期TYPE:类型二.Java代码:1.创建客户端:package elasticsearch.util;import java.net.InetAddress;import org.elastic原创 2017-09-28 08:57:05 · 49985 阅读 · 0 评论