- 博客(10)
- 收藏
- 关注
原创 R语言实验
设置公共因子数为2,分别用极大似然法和主轴因子法进行对该数据集进行因子分析,计算未旋转前的载荷矩阵,因子得分,以及正交旋转、斜交旋转后的载荷矩阵、因子得分。分析两个因子的含义,并以两个因子的得分作为横纵坐标,画出各个样本的二维散点图。计算未旋转前的载荷矩阵,因子得分,以及正交旋转、斜交旋转后的载荷矩阵、因子得分。分析各个因子的含义。2、数据集salary.csv中保存了书上题5-1的数据,请参照书中的步骤,运用协方差矩阵对该数据集进行主成分分析,分别计算第一和第二主成分的方差贡献率,以及相应的线性表达式。
2023-12-20 00:12:20
410
原创 网络安全中数据加密技术的发展趋势及相关应用
摘要:近年来网络科学技术不断在发展,而且自普及以来,因其迅速、便捷的获取信息方式,让人们在工作与生活中体会到了十足的便利。人们与网络形成了命运共同体,形成了你中有我我中有你的大格局。但是,网络通信问题却面临着例如安全问题、病毒防护不彻底的严峻形式。因此,如何有效的对计算机病毒进行预防,在人们经由网络通信进行信息交流中保障其安全,并强调让人们在此过程中提升网络自安全意识,成为网络防护面临的重中之重。本文研究分析数据加密技术在计算机网络安全中的应用及数据加密技术增强计算机网络安全的方法。关键词 :网络
2023-12-20 00:10:51
1613
原创 Machine Learning: 十大机器学习算法
机器学习中,决策树是一个预测模型,树中每个节点表示某个对象,而每个分叉路径则代表某个可能的属性值,而每个叶节点则对应从根节点到该叶节点所经历的路径所表示的对象的值。例如,建立人口身高模型,很难有人力与物力去统计全国每个人的身高,但是可以通过采样,获取部分人的身高,然后通过最大似然估计来获取分布的均值与方差。随机森林算法(Random Forest)的名称由 1995 年由贝尔实验室提出的random decision forests 而来,正如它的名字所说的那样,随机森林可以看作一个决策树的集合。
2023-12-19 23:50:58
961
原创 MySQL与Redis的区别与联系详解
6.1 首先要知道MySQL存储在磁盘里,Redis存储在内存里,Redis既可以用来做持久存储,也可以做缓存,而目前大多数公司的存储都是MySQL + Redis,MySQL作为主存储,Redis作为辅助存储被用作缓存,加快访问读取的速度,提高性能.6.2 Redis存储在内存中,如果存储在内存中,存储容量肯定要比磁盘少很多,那么要存储大量数据,只能花更多的钱去购买内存,造成在一些不需要高性能的地方是相对比较浪费的,所以目前基本都是MySQL。Redis用于存储使用较为频繁的数据到缓存中,读取速度快.
2023-12-19 20:43:19
689
原创 大数据的发展历程及应用简述
在第三个阶段,21世纪初,大数据的定义被正式确定,被看作是一种需要具备实践能力和挖掘成本的技术,而在第四个阶段,2010年代,大数据技术不断发展,数据计算成为了大数据技术的核心,包括数据查询、统计、分析、预测、挖掘、图谱处理、BI商业智能等,这是大数据概念的第五个阶段。大数据的发展趋势是随着技术的发展而不断进步的,包括实时分析、更依赖云存储、合乎道德的客户资料收集、人工智能/机器学习的自动化以及跨行业的大数据,这些都将为企业的发展提供更大的帮助。
2023-12-19 20:22:07
947
原创 docker快速入门:基础docker部署
看到这篇文章的读者肯定希望快速上手 docker,所以这篇文章不会涉及到 docker的底层原理,而是主要讲如何编写 Dockerfile以及如何使用 docker进行项目部署,不管怎么样我们先用起来。不过在这之前我们先简单介绍一下 docker以便确定你是否真的需要使用 docker。首先我们先了解一下 docker能够帮我们做什么。用一句话概括就是:docker可以将我们的项目打包,然后无障碍地部署到大部分服务器上。
2023-12-19 20:14:50
853
原创 Hadoop、Spark、Storm、Flink的区别是什么?分别适用什么场景?
Flink 的核心优势在于内置状态管理以及先发优势带来的较为完善的功能支持,这方面解决了流计算开箱即用的问题,以及双十一磨砺的性能优势,目前仍然是流计算框架的跑分榜第一。Flink 的官方标语就是状态化的流计算,因此这才是它的核心竞争力。注意到每个阶段都有读取数据文件和数据写出到文件的开销,对于同一个任务的中间结果,其唯一用途就是被下一阶段读取,且读后就成为垃圾文件,对中间结果落盘显然是不合理的重大开销。前面讨论的批计算,其特点是输入数据集是事先知晓且有限的,而流计算的世界观认为输入数据集是无限的消息流。
2023-12-19 20:10:47
759
原创 Java 和 Python 全方位对比,孰优孰劣?
另一方面,Django是一种很有特色的框架,可以帮助开发人员构建强大的后端,同时还可以保障效率和安全性,而且它还拥有ORM层,可以轻松地处理数据库并对数据进行各种操作。所以,Python的语法更为简单。Java是一种同步的面向对象编程语言,为了尽可能地降低实现上的依赖性,并让程序员“编写一次,到处运行”——编译好的Java代码能够在各个平台上运行,而不需要再次编译。而对于Java而言,Spring是最受欢迎的后端框架,这个框架拥有庞大的生态系统和庞大的社区,戴尔、Orange等大公司都是采用了这个框架。
2023-12-19 20:06:40
911
原创 spark与flink比较?在国内的现状如何?
好,我们首先来简单比较下spark与flink。Spark和Flink都属于引擎。Flink属于框架,通过流来模拟批,Spark属于框架,通过批来模拟流,分别属于Lambda架构和Dataflow架构。
2023-12-19 20:05:13
1172
原创 Hadoop时代落幕,谁是大数据时代新宠?
这些年围绕Hadoop已经构建起来一个完整的生态,即使企业没有用Hadoop,但Hadoop的很多技术理念,比如Hadoop松耦合的架构体系、建立在通用硬件平台上的分布式系统设计,以及开放的数据标准和开源技术,早就超越了十几年前的HDFS、MapReduce 的范畴,在更多新兴技术中体现。唱衰Hadoop的第三原因是云计算的崛起。即使这样,作为开源项目的Hadoop的部署和实施都高度依赖工程师的技术能力,而如此这多的模块要都精通对技术人员要求非常之高,这些都导致Hadoop的高复杂性而屡屡受到诟病。
2023-12-19 20:02:57
1564
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人