- 博客(15)
- 收藏
- 关注
原创 SPSS应用及统计分析
操作简便。绝大多数操作是通过菜单、按钮、对话框完成的。无需计算机编程、需记忆大量命令和参数。分析方法丰富、分析结果清晰、直观。可以直接读取其他软件格式的数据文件,如:xls、sas等。最新版本采用分布式分析系统,适应互联网,支持动态收集、分析数据和HTML报告不方便与一般的办公软件直接兼容。
2024-05-05 23:03:08
3596
原创 数据分析(R语言)从入门到进阶
线性回归模型介绍了使用R语言构建线性回归模型全流程的内容,从认识数据讲起,到将变量处理为正确的类型,再到构建线性回归模型,提取模型结果,将模型结果格式化输出,对模型进行异方差、自相关、共线性等的检验和修正,最后使用模型进行预测并对预测结果进行可视化和误差评估。logistic回归模型,主要介绍使用R语言构建logistic回归模型用于分类问题的相关内容,内容包括数据读取与整理,模型构建,格式化输出,使用模型进行预测,使用ROC、AUC、混淆矩阵评估模型预测性能等。
2024-05-03 21:23:11
1186
1
原创 基于flink&hudi批流一体技术
Hudi是Hadoop Updates and Incrementals的简写,它是由Uber开发并开源的Data Lakes解决方案。Hudi 用于管理的数据库层上构建具有增量数据管道的流式数据湖,同时针对湖引擎和常规批处理进行了优化。简言之,Hudi是一种针对分析型业务的、扫描优化的数据存储抽象,它能够使DFS数据集在分钟级的时延内支持变更,也支持下游系统对这个数据集的增量处理。
2024-04-21 18:20:51
1480
2
原创 MySQL知识点全集(更新中)
数据库:保存数据的仓库。它体现我们电脑中,就是一个文件系统。然后把数据都保存这些特殊的文件中,并且需要使用固定的语言(SQL语言)去操作文件中的数据。技术定义: 数据库(Database)是按照数据结构来组织、[存储和管理数据的建立在计算机存储设备上的仓库。数据定义语言 - Data Definition Language用来定义数据库的对象,如数据表、视图、索引等创建数据库:create database test;创建视图:create view test;
2024-04-18 23:09:54
794
1
原创 数仓体系与数据治理全集
数据仓库(Data Warehouse),可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它出于分析性报告和决策支持目的而创建。
2024-04-06 22:20:19
3609
1
原创 Hadoop集群HDFS、MapReduce及Yarn面试全集(更新中)
广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。狭义上说,Hadoop指Apache这款开源框架,它的核心组件有:HDFS(分布式文件系统):解决海量数据存储YARN(作业调度和集群资源管理的框架):解决资源任务调度MAPREDUCE(分布式运算编程框架):解决海量数据计算定义:Hdfs是一个分布式文件系统,用来存储文件,通过目录树来定位文件。Hdfs适合一次写入、多次写出的文件场景,且不支持文件的修改,适合用来做数据分析,并不适合用来做网盘应用。
2024-03-31 22:49:50
1047
1
原创 微信公众号-小程序等注册运营(更新中)
1.网站:https://mp.weixin.qq.com/cgi-bin/registermidpage?如页面显示,有四种账号类型:订阅号、服务号、小程序及企业微信。目前我们阅读的文章绝大部分来自于订阅号,订阅号的主体可以是个体,也可以是公司。
2023-11-18 11:04:03
263
1
原创 ANSYS WORKBENCH建模、仿真与分析
ANSYS WORKBENCH具备强大的建模能力、求解能力,在仿真分析与结构优化起着重大作用。
2023-11-08 22:52:51
9512
3
原创 CATIA V5机械设计(上)
CATIA涵盖了产品从概念设计、工业设计、三维建模、分析计算、动态模拟与仿真、工程图的生成到生产加工成产品的全过程
2023-10-25 23:38:54
1000
1
原创 Flink保姆级面试大全(更新中)
1.1概念Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink 被设计在所有常见的集群环境中运行,以内存执行速度和任意规模来执行计算。1.2处理有界和无界数据无界流有起点但没有定义的终点。无界流必须持续处理,即事件在被摄取后必须立即处理。处理无界数据通常需要以特定顺序(例如事件发生的顺序)摄取事件,以便能够推断结果的完整性。有界流有定义的开始和结束。可以在执行任何计算之前摄取所有数据来处理有界流。
2023-09-24 16:46:24
1376
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人