
python
文章平均质量分 77
大数据海中游泳的鱼
大数据海中游泳的鱼,对Spark、Hadoop、HDFS、Kafka、Hive、HQL、SQL都有兴趣。
展开
-
Python文件操作
在 Python 中清空某个文件有多种方法,可以根据不同的需求选择不同的方法。需要注意的是,以上方法都是清空文件内容,而不是删除文件本身。原创 2023-04-19 00:00:00 · 179 阅读 · 0 评论 -
Python核心编程——保护性代码
在实际工作中,个人编写的函数通常需要对输入的数据保护性代码的校验,以免你写的代码抛异常。无论如何,对输入进行验证是保护性编程的重要步骤之一,可以确保程序的正确性和可靠性。保护性编程是一种编写代码的方法,目的是尽可能减少代码中可能出现的错误和漏洞。、空字符串、空列表、空字典、零值、非空字符串、非空列表和非空字典来测试函数,并输出相应的信息。我们使用整数、浮点数、字符串、列表和字典来测试函数,并输出它们的数据类型和相应的信息。最后,如果用户输入不为空,则输出用户输入,并可以在这里添加您想要执行的代码。原创 2023-04-11 23:31:48 · 433 阅读 · 0 评论 -
Python基础(先写个框架)
Python核心编程语言学习内容(明白要学什么)Python基础语法:了解Python的基本语法,如变量、数据类型、运算符、控制语句等。函数和模块:掌握函数和模块的使用,了解Python中的内置函数和标准模块。面向对象编程:学习面向对象编程的基本概念及其在Python中的实现方式。异常处理:掌握Python中的异常处理机制,学会如何处理和抛出异常。文件操作:了解如何在Python中进行文件读写操作。数据结构和算法:学习Python中的常见数据结构和算法,如列表、字典、集合、排序、搜索等。GU原创 2023-04-11 23:15:14 · 111 阅读 · 0 评论 -
Spark处理非结构化数据的思路(python实现)
我们首先初始化了Spark环境,然后使用Spark的textFile方法将文本数据导入到Spark中进行处理。然后使用sklearn库的TF-IDF算法进行特征提取,并使用KMeans算法进行数据聚类分析。最后,使用Matplotlib库生成了聚类结果的散点图。接着使用NLTK库对文本数据进行清洗,去除了停用词。原创 2023-04-10 22:49:47 · 706 阅读 · 0 评论 -
Hadoop集群JVM指标监控(python)
笨办法监控hadoop集群原创 2023-04-05 15:09:24 · 658 阅读 · 0 评论