普通网友-优快云博客

原创最新【Collections类】之欢乐斗地主底层逻辑分析及实现(1)，BAT大厂面试题整理

是针对集合操作的工具类此类完全由在 collection 上进行操作或返回 collection 的静态方法组成。它包含在 collection 上操作的多态算法，即“包装器”，包装器返回由指定 collection 支持的新 collection，以及少数其他内容。如果为此类的方法所提供的 collection 或类对象为 null，则这些方法都将抛出 NullPointerException。

2024-05-16 07:02:35 946

原创最新【clickhouse专栏】数据库、数据仓库之间的区别与联系，2024年最新程序员如何自我学习和成长

比如：查询内存使用率>80,CPU使用率>70的服务器的时候，就不会两表关联查询了，查询一张宽表就可以了，数据分析的性能飞跃式提升。理解上面的两个数据，剩下的就简单多了，数据库通常面向OLTP操作，数据仓库通常面向OLAP操作。因此，数据仓库通常面向的是吞吐量大的历史数据进行存档、不会在做更新删除操作的这种数据场景，数据存档之后通常只面向数据查询分析。可以进行股票量化交易分析。又比如：用户商品点击量数据、用户操作行为数据、用户网页浏览时长数据等等，这些数据都是对用户进行分析所需要的数据，一旦入库不会修改。

2024-05-16 07:02:02 722

原创最新【ClickHouse】-01(1)，2024年最新大数据开发源码的Binder权限是如何控制

，解决了很多数字化转型企业数据分析的效率问题，包括：● 大数据建设完成后最终产出了大量的 BI 报表、OLAP 分析，数据驱动距离业务远。● 有经验的业务分析人员无法快速获得需要的数据，或者需要复杂 NoSQL 技术。● 数据驱动还是“人”驱动，还有大量的提数、出报表的需求，而很多报表往往只用一次。● 业务快速变化要求更新速度高，数据流无法让业务人员上手。

2024-05-16 07:01:30 1249

原创最新【C++进阶】map和set，2024年最新从消息中间件看分布式系统的多种套路

前面对map/multimap/set/multiset进行了简单的介绍，在其文档介绍中发现，这几个容器有个其底层都是按照二叉搜索树来实现的，但是二叉搜索树有其自身的缺陷，假如往树中插入的元素有序或者接近有序，二叉搜索树就会退化成单支树，时间复杂度会退化成O(N)，因此map、set等关联式容器的底层结构是对二叉树进行了平衡处理，即采用平衡树来实现。{}// 该节点的左孩子// 该节点的右孩子// 该节点的双亲T _data;int _bf;// 该节点的平衡因子。

2024-05-16 07:00:57 825

原创如何成为一名黑客需要学什么，黑客入门必学的7个基本技术_黑客需要大数据嘛(1)

首先要明白啊，我们现在说的黑客不是那种窃取别人信息、攻击别人系统的黑客，说的是调试和分析计算机安全系统的网络安全工程师。如果你是要学前者，别来找我，找我我也不教，学后者的话请用心听了。黑客技术的核心就是渗透攻防技术，是为了证明网络防御按照预期计划正常运行而提供的一种机制。听不懂吗？就是没耐心看下去的同学，划走之前听盾叔说一句，学习黑客的水太深，你把握不住，别自己在下边瞎鼓捣，哪里不懂直接来问我就好了，帮你解决问题，一点也不麻烦。

2024-05-15 22:15:18 822

原创如何在 2024 年为 Web 应用程序选择技术堆栈_2024年 java web技术栈

术语“技术堆栈”是指编程语言、软件和一系列用于开发应用程序的框架的复杂组合。应该在 Web 开发过程的规划阶段选择它。任何 Web 应用程序的架构都包含两个方面：客户端（前端）和服务器端（后端）。客户端是用户可以在其显示器上看到的可视化数据。编程语言，负责 Web 应用程序的交互部分，在浏览器中显示网站内容的文档标记语言，用于描述文档表示的样式表语言，用户界面框架。服务器端对用户不可见。它为客户端提供数据。数据库，后端编程语言，构架，Web 服务器（也可以选择无服务器架构），

2024-05-15 22:14:45 959

原创如何在 2024 年为 Web 应用程序选择技术堆栈_2024年 java web技术栈(1)

术语“技术堆栈”是指编程语言、软件和一系列用于开发应用程序的框架的复杂组合。应该在 Web 开发过程的规划阶段选择它。任何 Web 应用程序的架构都包含两个方面：客户端（前端）和服务器端（后端）。客户端是用户可以在其显示器上看到的可视化数据。编程语言，负责 Web 应用程序的交互部分，在浏览器中显示网站内容的文档标记语言，用于描述文档表示的样式表语言，用户界面框架。服务器端对用户不可见。它为客户端提供数据。数据库，后端编程语言，构架，Web 服务器（也可以选择无服务器架构），

2024-05-15 22:14:12 992

原创好不容易说明白AQS，面试官却还要我说应用场景，我只好又讲了CountDownLatch ~~

就像我开头说的，调用await()方法的线程会被阻塞，直到计数器减到 0 的时候，才能继续往下执行；countDown()：将计数器减一。结合上面的源码讲解，先说await()如果计数器不为0，那么tryAcquireShared返回的就一定为1，那么r >= 0就不会满足，那么就无法退出，会一直进行for循环即起到阻塞作用再说countDown()每调用一次countDown()方法就会去利用CAS将计数器减一当同步状态为0的时候才会去调用，doReleaseShared（）方法。

2024-05-15 22:13:39 729

原创好不容易说明白AQS，面试官却还要我说应用场景，我只好又讲了CountDownLatch ~~(1)

博主。

2024-05-15 22:13:02 929

原创大数据最全(2)，2024年最新请把这些学完再去面试

用法如下：当然还要在视图中定义节，否则会出现异常：为了防止因缺少节而出现异常，可以给RenderSection()提供第2个参数：

2024-05-15 11:32:28 289

原创大数据时代，听阿里P8为你解读20个大数据热词，助你尽情徜徉大数据时代

因为数据仓库中的数据是面向某一主题的数据的集合，这些数据从多个业务系统中抽取而来而且包含历史数据，这样就避免不了有的数据是错误数据、有的数据相互之间有冲突，这些错误的或有冲突的数据显然是我们不想要的，称为“脏数据”。分布式架构是分布式计算技术的应用和工具，目前成熟的技术包括J2EE, CORBA和.NET(DCOM)，这些技术牵扯的内容非常广，相关的书籍也非常多，本文不介绍这些技术的内容，也没有涉及这些技术的细节，只是从各种分布式系统平台产生的背景和在软件开发中应用的情况来探讨它们的主要异同。

2024-05-15 11:31:53 362

原创大数据时代，听阿里P8为你解读20个大数据热词，助你尽情徜徉大数据时代(4)

因为数据仓库中的数据是面向某一主题的数据的集合，这些数据从多个业务系统中抽取而来而且包含历史数据，这样就避免不了有的数据是错误数据、有的数据相互之间有冲突，这些错误的或有冲突的数据显然是我们不想要的，称为“脏数据”。分布式架构是分布式计算技术的应用和工具，目前成熟的技术包括J2EE, CORBA和.NET(DCOM)，这些技术牵扯的内容非常广，相关的书籍也非常多，本文不介绍这些技术的内容，也没有涉及这些技术的细节，只是从各种分布式系统平台产生的背景和在软件开发中应用的情况来探讨它们的主要异同。

2024-05-15 11:31:16 348

原创大数据时代，听阿里P8为你解读20个大数据热词，助你尽情徜徉大数据时代(3)

因为数据仓库中的数据是面向某一主题的数据的集合，这些数据从多个业务系统中抽取而来而且包含历史数据，这样就避免不了有的数据是错误数据、有的数据相互之间有冲突，这些错误的或有冲突的数据显然是我们不想要的，称为“脏数据”。分布式架构是分布式计算技术的应用和工具，目前成熟的技术包括J2EE, CORBA和.NET(DCOM)，这些技术牵扯的内容非常广，相关的书籍也非常多，本文不介绍这些技术的内容，也没有涉及这些技术的细节，只是从各种分布式系统平台产生的背景和在软件开发中应用的情况来探讨它们的主要异同。

2024-05-15 11:30:40 411

原创【小程序实战系列】电商平台源码及功能实现_import { fetchhome } from ‘(1)

(img-cdVqiNr5-1715712808545)](img-EzR8Ntuz-1715712808545)]“navigationBarTitleText”: “首页”,message: ‘点击加入购物车’,

2024-05-15 02:53:51 853

原创【小程序】常见系统API 页面分享位置信息本地存储_小程序分享api

imageUrlId | string | 审核通过的图片 ID，详见使用审核通过的转发图片 || promise | promise | 如果该参数存在，则其它的参数将会以 resolve 结果为准，如果三秒内不 resolve，分享会使用上面传入的默认参数 || toCurrentGroup | boolean | 是否转发到当前群。该参数只对从群工具栏打开的场景下生效，默认转发到当前群，填入 false 时可转发到其他会话。

2024-05-15 02:53:15 816

原创【小程序】常见系统API 页面分享位置信息本地存储_小程序分享api(1)

如何决定这些信息的展示呢？通过是监听用户点击页面内转发按钮（button 组件 open-type= “share”）或右上角菜单“转发”按钮回调的函数，并自定义转发内容。此事件处理函数需要 return 一个 Object，用于自定义转发内容；

2024-05-15 02:52:39 527

原创【小白视角】大数据基础实践(三)HDFS的简单基本操作_使用客户端节点执行hdfs dfs -put文件上传至hdfs很慢

HDFS（Hadoop Distributed File System）分布式文件系统，是Hadoop项目的核心子项目，是分布式计算中数据存储管理的基础。兼容廉价的硬件设备流数据读写大数据集简单的文件模型强大的跨平台兼容性不适合低延迟数据访问无法高效存储大量小文件不支持多用户写入及任意修改文件。

2024-05-15 02:52:03 2408

原创 Kunpeng BoostKit 使能套件：大数据场景如何实现“大鹏一日同风起”倍级性能提升？(4)

BoostKit 是一个应用使能套件，并不只是由一个软件包构成，而是由很多软件包组成的。BoostKit 是部署在鲲鹏整机（服务器）环境之上，往上搭建的一个全栈优化的使能套件。具体结构如下图所示：鲲鹏应用使能套件 BoostKit，释放倍级性能优势，提供八大场景化应用使能套件：大数据、分布式存储、数据库、虚拟化、ARM 原生、Web/CDN、NFV 和 HPC。在接下来的过程中，我们将其分为三个部分依次介绍。

2024-05-14 17:32:11 877

原创 Kunpeng BoostKit 使能套件：大数据场景如何实现“大鹏一日同风起”倍级性能提升？(3)

在数据和经济时代，业务和数据的多样性需要新的计算架构，海量的数据增长也带来了更高的计算需求。那么在这个过程中，鲲鹏计算产业也正在成为更多计算场景的新一代 IP 基座。基于华为鲲鹏处理器构建的鲲鹏全栈 IT 技术实施设施行业应用以及服务，致力于为智能世界持续提供我们的先进算力支持，使得各个行业可以实现数字化转型。应用软件的迁移与优化一直是鲲鹏软件生态的难点和关键。本次鲲鹏 BoostKit 训练营为开发者介绍如何基于鲲鹏 BoostKit 使能套件实现应用性能的加速，并重点剖析性能优化技术和关键能力。

2024-05-14 17:31:36 1178

原创 Kunpeng BoostKit 使能套件：大数据场景如何实现“大鹏一日同风起”倍级性能提升？(2)

在数据和经济时代，业务和数据的多样性需要新的计算架构，海量的数据增长也带来了更高的计算需求。那么在这个过程中，鲲鹏计算产业也正在成为更多计算场景的新一代 IP 基座。基于华为鲲鹏处理器构建的鲲鹏全栈 IT 技术实施设施行业应用以及服务，致力于为智能世界持续提供我们的先进算力支持，使得各个行业可以实现数字化转型。应用软件的迁移与优化一直是鲲鹏软件生态的难点和关键。本次鲲鹏 BoostKit 训练营为开发者介绍如何基于鲲鹏 BoostKit 使能套件实现应用性能的加速，并重点剖析性能优化技术和关键能力。

2024-05-14 17:31:00 1054

原创 Kunpeng BoostKit 使能套件：大数据场景如何实现“大鹏一日同风起”倍级性能提升？(1)

在数据和经济时代，业务和数据的多样性需要新的计算架构，海量的数据增长也带来了更高的计算需求。那么在这个过程中，鲲鹏计算产业也正在成为更多计算场景的新一代 IP 基座。基于华为鲲鹏处理器构建的鲲鹏全栈 IT 技术实施设施行业应用以及服务，致力于为智能世界持续提供我们的先进算力支持，使得各个行业可以实现数字化转型。应用软件的迁移与优化一直是鲲鹏软件生态的难点和关键。本次鲲鹏 BoostKit 训练营为开发者介绍如何基于鲲鹏 BoostKit 使能套件实现应用性能的加速，并重点剖析性能优化技术和关键能力。

2024-05-14 17:30:21 741

原创 2024年最新Flink 大数据学习详情(1)，大数据开发校招面试经验汇总

flink提交作业和执行任务，需要几个关键组件：客户端（client）：代码由客户端获取并作转换，之后提交给 jobManagerJobManager：就是flink集群里的“管事人”，对作业进行中央调度管理；

2024-05-14 08:53:33 430

原创 2024年最新ES(Elasticsearch)的docker安装部署教程_docker 安装es(1)，大数据开发面试项目经验

ES集群安装要求桥接网络和一定的vm配置，执行./network.sh。给master.sh加执行权限：chmod u+x master.sh。给slave.sh加执行权限：chmod u+x slave.sh。然后执行./slave.sh 直接创建3个从节点的实例。执行./master.sh 直接创建2个主节点，

2024-05-14 08:52:57 507

原创 2024年最新ElscticSearch基础操作_elticsearch9，送给正在迷茫的你

只需要在_doc后面添加指定的ID即可。

2024-05-14 08:52:21 529

原创 2024年最新ELFK 分布式日志收集系统(3)，详解大数据开发架构进阶面试题

【代码】2024年最新ELFK 分布式日志收集系统(3)，详解大数据开发架构进阶面试题。

2024-05-14 08:51:45 260

原创 2024年大数据最新【数学模型】层次分析_数学建模层次分析法例题及答案(3)，2024年最新劲爆

层次分析法（The Analytic Hierarchy Process即 AHP)是由美国运筹学家、匹兹堡大学教授T . L. Saaty于20世纪70年代创立的一种系统分析与决策的综合评价方法，是在充分研究了人类思维过程的基础上提出来的，它较合理地解决了定性问题定量化的处理过程。AHP的主要特点是通过建立递阶层次结构，把人类的判断转化到若干因素两两之间重要度的比较上，从而把难于量化的定性判断转化为可操作的重要度的比较上面。

2024-05-14 00:13:49 1136

原创 2024年大数据最新【推荐系统】推荐业务架构介绍(一)_推荐业务百度百科，2024年最新一文说清

sqoop导入业务数据到hadoop操作增量导入形式用户行为日志收集的相关工作流程flume收集到hive配置supervisor进程管理工具使用文章内容标签化：内容标签化，根据内容定性的制定一系列标签，这些标签可以是描述性标签。针对于文章就是文章相关的内容词语。文章：频道ID内容，关键词、主题词用户画像：研究用户对内容的喜好程度。

2024-05-14 00:13:12 929

原创 2024年大数据最新【手把手带你学JavaSE】第三篇：运算符和程序逻辑控制(1)，大数据开发高级开发面试题

增量赋值运算符 += -= *= /= %=自增/自减运算符 ++ –结论:1 . 如果不取自增运算的表达式的返回值, 则前置自增和后置自增没有区别.2. 如果取表达式的返回值, 则前置自增的返回值是自增之后的值, 后置自增的返回值是自增之前的值.

2024-05-14 00:12:36 687

原创 2024年大数据最新【微信小程序】协同工作和发布数据绑定_小程序发布数据，分享一些行业经验

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！体验测试③ 最后修复完程序的 Bug 后，发布正式版供外部用户使用点击提交审核，可将代码提交审核。开发版本可删除，不影响线上版本和审核中版本的代码。||体验

2024-05-14 00:12:00 906

原创绝对完美解决hdfs datanode数据和磁盘数据分布不均调整（hdfs balancer ）——经验总结_datanode balance

hdfs 需要存写大量文件，有时磁盘会成为整个集群的性能瓶颈，所以需要优化 hdfs 存取速度，将数据目录配置多磁盘，既可以提高并发存取的速度，还可以解决一块磁盘空间不够的问题。大数据Hadoop之——Hadoop 3.3.4 HA（高可用）原理与实现（QJM）

2024-05-12 21:08:38 1110

原创绝对完美解决hdfs datanode数据和磁盘数据分布不均调整（hdfs balancer ）——经验总结_datanode balance(3)

hdfs 需要存写大量文件，有时磁盘会成为整个集群的性能瓶颈，所以需要优化 hdfs 存取速度，将数据目录配置多磁盘，既可以提高并发存取的速度，还可以解决一块磁盘空间不够的问题。大数据Hadoop之——Hadoop 3.3.4 HA（高可用）原理与实现（QJM）

2024-05-12 21:08:02 378

原创绝对完美解决hdfs datanode数据和磁盘数据分布不均调整（hdfs balancer ）——经验总结_datanode balance(2)

hdfs 需要存写大量文件，有时磁盘会成为整个集群的性能瓶颈，所以需要，将数据目录配置多磁盘，既可以提高并发存取的速度，还可以。

2024-05-12 21:07:27 586 1

原创绝对完美解决hdfs datanode数据和磁盘数据分布不均调整（hdfs balancer ）——经验总结_datanode balance(1)

配置各个磁盘的均衡阈值的，默认为10G（10737418240），在此节点的所有数据存储的目录中，找一个占用最大的，找一个占用最小的，如果在两者之差在10G的范围内，那么块分配的方式是轮询。它的含义是数据块存储到可用空间多的卷上的概率，由此可见，这个值如果取0.5以下，对该策略而言是毫无意义的，一般就采用默认值。存放HDFS文件系统数据文件的目录（存储Block），作用是存放hadoop的数据节点datanode里的多个数据块。设置数据存储策略，默认为轮询，现在的情况显然应该用“选择空间多的磁盘存”模式。

2024-05-12 21:06:50 497 1

原创实时即未来，大数据项目车联网之项目基石与前瞻【一】_车联网大数据项目(2)

通过终端设备采集车辆上的CAN总线实时数据和企业静态hu离线数据，获取当前车辆的位置、行驶高程、车速、油压、电量、行驶里程、告警数据等数据，对其进行业务，车辆行程、故障告警、电子栅栏、百公里油耗、高温报警、低soc告警、疲劳驾驶告警等车联网分析，支撑汽车后服务市场、车企、政府监管部门、车主等服务。车联网数据分析车辆驾驶信息、车辆行驶信息、车辆车况信息、车辆故障信息、车辆报警信息等。监管车辆的行驶轨迹、防止骗补，故障告警等。在调度平台中加载 shell 文件。HDFS 分布式存储系统。kafka 消息队列。

2024-05-12 03:58:35 779

原创实时即未来，大数据项目车联网之项目基石与前瞻【一】_车联网大数据项目(1)

更全 8-》21+篇更细 -》图文并茂、部分代码首次披露更新 -》Flink车联网项目贴近企业开发凡购买本专栏的读者，可加我好友获取车联网大数据资料文章持续更新不止21篇，保障更新完整。前期49.9元，后期满50人恢复原价99元车联网的概念介绍车联网（ Internet of Vehicles ）指按照一定的通信协议和数据交互标准，在“人-车-路-云“之间进行信息交换的网络。即首先实现汽车智能网联化，再利用各种传感技术，感知车辆状态信息，并借助无线通信网络与大数据分析技术实现交通的智能化管理。

2024-05-12 03:57:59 1017

原创实时即未来，大数据项目车联网之创建Flink实时计算子工程【二】_flink实时数仓车联网项目

创建StreamingAnalysis工程设置打包类型为：jar。

2024-05-12 03:57:23 207

原创实时即未来，大数据项目车联网之创建Flink实时计算子工程【二】_flink实时数仓车联网项目(1)

更全 8-》21+篇更细 -》图文并茂、部分代码首次披露更新 -》Flink车联网项目贴近企业开发凡购买本专栏的读者，可加我好友获取车联网大数据资料文章持续更新不止21篇，保障更新完整。前期49.9元，后期满50人恢复原价99元。

2024-05-12 03:56:47 362

原创大数据最全【数仓】flume软件安装及配置_flume的安装配置(1)，2024年最新客户端开发面试题目

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新需要这份系统化资料的朋友，可以戳这里获取tar -xzvf apache-flume-1.11.0-bin.tar.gzmv apache-flume-1.11.0-bin/ /data/flume/export FLUME_HOME=/data/flu

2024-05-11 19:20:03 2063

原创大数据最全【操作系统入门到成神系列九】进程和线程(2)，书籍+视频+学习笔记+技能提升资源库

线程是进程当中的一条执行流程。同一个进程内多个线程之间可以共享代码段、数据段、打开的文件等资源，但每个线程各自都有一套独立的寄存器和栈，这样可以确保线程的控制流是相对独立的。

2024-05-11 19:19:27 676

原创大数据最全【推荐系统】推荐业务架构介绍(一)_推荐业务百度百科，2024年最新你会的还只有初级大数据开发工程师的技术吗

用户行为日志收集的相关工作流程flume收集到hive配置supervisor进程管理工具使用文章内容标签化：内容标签化，根据内容定性的制定一系列标签，这些标签可以是描述性标签。针对于文章就是文章相关的内容词语。文章：频道ID内容，关键词、主题词用户画像：研究用户对内容的喜好程度。

2024-05-11 19:18:52 1177

空空如也

空空如也