- 博客(12)
- 收藏
- 关注
原创 大数据技术——处理架构Hadoop
生态系统:Hadoop 生态系统包括许多附加组件,如 Apache Hive、Apache Pig、Apache HBase 等,这些组件扩展了 Hadoop 的功能,使其更适合各种大数据处理需求。它在云计算、商业智能、日志分析等领域都有广泛的应用。的终端中输入密码,终端是不会显示任何你当前输入的密码,也不会提示你已经输入了多少字符密码,读者不要误以为键盘没有响应。凭借其突出的优势,已经在各个领域得到了广泛的应用,而互联网领域是其应用的主阵地。的公司主要有百度、淘宝、网易、华为、中国移动等,其中,淘宝的。
2023-10-22 22:47:26
2020
6
原创 python——批量替换代码
有的同学老是说哎呀那啥啥语言才是最好的,我想说,能别搞语言歧视吗?语言没有好坏,只有适合,我觉的厉害的程序员到最后一定是一种思维和经验的积累,语言只是使用的工具,一般来说,Python是最好用的工具。注意:在进行此操作之前,强烈建议先备份文件,以防止出现替换错误或其他问题。”功能来实现将全部相同的字符一起替换成新的字符。进入“Find and Replace”功能。使用PyCharm的“
2023-10-20 11:29:07
1853
2
原创 大数据——技术生态体系
SparkR 是 Apache Spark 生态系统中的一个项目,它提供了一个接口,允许 R 语言用户利用 Spark 的分布式计算能力来进行数据分析和处理。:Spark SQL 可以与其他 Spark 组件(如Spark Streaming、Spark MLlib等)集成,使用户能够在一个统一的 Spark 应用程序中进行数据处理、实时数据流处理和机器学习。Spark SQL 不仅用于传统的 SQL 查询,还可以用于复杂的数据处理和分析任务,包括数据清洗、数据转换、数据聚合等。
2023-10-20 11:09:40
843
4
原创 数据结构——冒泡排序
它重复地遍历要排序的列表,一次比较两个元素,如果它们的顺序错误就把它们交换过来。这个算法的名字由于越小的元素会经由交换慢慢“浮”到数列的顶端,故名。这就是为什么这个算法被称为“冒泡排序”的原因。由于 97 已经判断为最大值,所以第二次冒泡排序时就需要找出除 97 之外的无序表中的最大值,比较过程和第一次完全相同。如图 1 所示是对无序表的第一次起泡排序,最终将无序表中的最大值 97 找到并存储在表的最后一个位置。经过第二次冒泡,最终找到了除 97 之外的又一个最大值 76,比较过程完全一样,这里不再描述。
2023-10-19 17:07:26
414
10
原创 深度学习中数据增强的办法
数据增强可以帮助模型更好地泛化到未见过的数据,减轻过拟合问题,提高模型的性能和稳健性。不同的任务和数据类型可能需要不同的数据增强方法,因此应根据具体情况选择合适的方法。深度学习中使用数据增强是一种重要的技术,可以帮助提高模型的性能和泛化能力,特别是当训练数据有限时。数据增强通过对原始训练数据进行多样性的变换来生成更多的训练样本。10.同义词替换:替换文本中的一些单词为它们的同义词,保持句子语义不变。14.字符级数据增强:对字符级文本进行随机扰动,如添加字符级噪声。22.幅度调整:随机调整数据点的幅度。
2023-10-19 16:33:40
359
1
原创 C语言——大小写字母的转换
首先,了解一下ASCII码,每个字符对应一个ASCII码,比如说A对应的是65,小写的a对应的是97.因为中间夹杂了6个字符。所以65+32=97。65~90 大写字母A~Z97~122 小写字母a~z
2022-05-10 09:09:44
12199
2
原创 C语言——5位数的倒序
这是一种比较基础的方法,较为通俗易懂,也可以利用循环来解。#include <stdio.h>#include <stdlib.h> int main(){ int w,q,b,s,g,number; printf("please input number\n"); scanf("%d",&number); w=number/10000; q=number%10000/1000; b=number%1000/100; s=number%100/1
2022-05-07 00:41:25
3804
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人