自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 wordcount任务:建立一个自己的jar包然后统计数字出现的次数

/bin/ jar ./myapp/WordCount.jar input output//指向hadoop 安装目录下bin文件夹下的hadoop版本。jar用来打包JAR文件 input是输入目录或文件 output是结果输出的目录。如果output文件存在,hadoop会拒绝执行任务。在任务进行前,需要西按删除output目录。./bin/hdfs dfs -cat output/* 查看结果。

2025-02-23 17:13:49 139

原创 实验二:熟悉常用的java hbase操作

/在增添数据时,hbase会自动为添加的数据添加一个时间戳,在修改数据的时候,hbase会为修改后的数据生成一个新的时间戳,旧的版本保留。系统会定时回收垃圾数据,只留下几个最新的版本,保存的版本数可以在创建表的时候指定。put "student","001","sname","小书" //001作为行键,然后put每次只能放一个列。//put函数添加数据,每次只能为一个表的一行数据的一个列添加一个数据。3、打开hbase的shell终端,查看表的状态。list 查看在hbase数据库中已经存在的表。

2025-02-23 17:13:17 125

原创 实验一:熟悉常用的hadoop操作

/bin/hdfs dfs -cp -f file:///usr/local/hadoop/wordcount.txt sure.txt # 可以选择复制文件的路径,不局限于本地。./bin/hdfs dfs -appendToFile wordcount.txt sure.txt 将本地文件写入到sure.txt中,追加到原文件末尾。./bin/hdfs dfs -copyFromLocal -f wordcount.txt sure.txt #-f 强制覆盖目标文件,复制的是本低文件。

2025-02-23 17:12:07 138

原创 医学统计学问答(含答案)

简答题 0. 算术均数、几何均数和中位数各有什么适用条件?答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。(3)中位数:适用各种类型的资料,尤其以下情况:A 资料分布呈明显偏态;B 资料一端或两端存在不确定数值(开口资料或无界资料);C 资料分布不明。1.对于一组近似正态分布的资料,除样本含量n 外,还可计算S X ,和S X 96.1±,问各说明什么?(1)X 为算

2025-02-23 16:33:17 1309

原创 python入门之math包的用法和常见语句

math包导入:Python 的math模块提供了对 C 标准定义的数学函数的访问。这些函数通常用于处理浮点数运算,包括基本算术运算、三角函数、指数和对数函数等。要使用math模块中的函数,首先需要通过语句导入该模块。

2025-02-23 16:31:01 604

原创 python入门之常见的字符串语句

在 Python 中,字符串是一种非常常用的数据类型,用于表示文本信息。Python 提供了丰富的内置方法来操作字符串,使得处理文本变得简单而高效。以下是一些常见的字符串操作和常用的语句示例。

2025-02-23 16:30:44 300

原创 python基础入门之如何导入包

n 换行 \t 制表符代表空四个字符的位置 \r 将当前位置移动到本行的开头。python语言中的基本数据类型:整型、浮点型、布尔型、字符串类型、变量名称只能使用下划线、字母、数字,且只能用字母和下划线开头。pip install 包名:安装某个包的最新版本。pip install -i 指定某个源来安装包。pip uninsatll:卸载。

2025-02-23 16:19:35 86

原创 第二章:大数据处理架构Hadoop介绍

sqoop是SQL-to-Hadoop的缩写,用来在hadoop和关系数据库之间进行交换数据,可以改进数据的互操作性,通过sqoop可以将关系数据库中的数据导入hadoop(hive hbase hdfs),或者将数据哦那个hadoop导入到关系数据库,使得传统数据库与hadoop之间的数据迁移变得很简单,sqoop主要是通过java数据库连接(JDBC)和关系数据库进行交互,理论上支持jdbc的关系数据库都有可以是sqoop和hadoop进行数据交互。hbase主要用来存储非结构化和半结构化的松散数据。

2025-02-23 16:18:00 358

原创 大数据与云计算、物联网的关系 大数据关键技术 大数据计算模式 大数据的概念 大数据的影响 大数据的应用 大数据的产业

大数据、云计算、物联网之间的区别和联系:物联网是大数据的来源 大数据技术为物联网数据分析提供支撑 云计算为物联网提供了海量数据存储能力 物联网为云计算机技术提供了广阔的应用空间 云计算为大数据提供了技术基础 大数据为u云计算提供了用物之地。物联网是物物相连的互联网,是互联网的延申,他利用局部网络或者互联网等通信技术把传感器、控制器、计算机、人员和物等通过新的方式联系在一起,形成人与物、物与物相连。数据中心是云计算的重要载体,为云计算提供了计算、存储、宽带等多种硬件资源,1、8大数据与云计算、物联网。

2025-02-23 16:17:02 267

原创 机器学习知识汇总(最新版)

4. 模型选择 根据问题的特点和数据的性质选择合适的模型。在超参数的取值空间内,按照一定的方式i(等间隔取值或者是随机取值) 取一个超参数值,用这组确定的超参数,通过训练集训练模型,将训练得到的模型用于验证集面积算验证误差,取不同的超参数,重复这个过程,最后确定效果做好的超参数和对应的模型,然后测试集测试性能,计算测试误差,估计泛化性能。获取的数据难免存在噪声,模型为了尽可能使训练误差小,可能过度的拟合噪声的趋向,导致拟合的模型在局部变化过于剧烈,这种模型对于新的输入的预测性不好么火对测试集的误差很大。

2025-02-23 16:15:41 1314 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除