自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 pandas复杂操作

【代码】pandas复杂操作。

2024-11-20 10:23:50 181

原创 python程序设计员—练习笔记

soup = BeautifulSoup( 文本 ,"html.parser")如:dict_[ "键" ] = "插入的值"5 // 2 结果为:2。3 % 2 结果为:1。如:3 // 2 结果为:1。如:7 % 2 结果为:1。

2024-10-18 11:41:40 1027

原创 Hadoop集群基础搭建

HDFS的定义:HDFS是一种允许文件通过网络在多台主机上分享的文件系统,可以让多台机器上的多个用户分享文件和存储空间。HDFS的适用场景:适合一次写入,多次读出的场景,且不支持文件的修改。安装完成后/opt/module/目录下出现 hadoop-3.3.6文件。文件/root/.ssh/authorized_keys是个。mv命令用法:mv /要改名的文件路径 /改名后的路径。存放路径为:/hadoop的路径/etc/hadoop/:mv /要移动的文件路径 /目标目录的路径。

2024-10-13 20:46:53 1137 1

原创 大数据—爬虫基础

使用and、or、not等逻辑运算符选择节点,例如://book[price

2024-05-14 09:45:18 2296

原创 大数据—数据可视化—matplotlib

10) :设置标记点。将xlim()和 ylim()的参数反转,坐标轴反转。用x,y 表示标题在x轴,y轴的位置。其他的和垂直方向的堆叠条形图的绘制类似。在绘制水平方向的堆叠条形图时,需要将参数。=3) : 设置标记点。='grey') :设置标记点。一个带有圆角和内部凹陷的复杂框。图例展示为几列,默认展示为1列。ncols参数,传入数字类型。='white') :设置。先框选出要画图例的区域,配合。参数指定文本框的样式,使用。正方形框,带有尖角。

2024-04-26 19:50:47 1300 1

原创 大数据—MapReduce概念

Mapper函数是对输入数据进行处理的函数。它接收输入的数据记录,将其转化为(Key,Value)对,并输出到Reducer函数进行处理。你可以根据需求自定义Mapper函数。

2024-04-10 10:05:25 2983 1

原创 大数据—pandas基础教程

pandas数据结构Series结构如下Series 类似于一维数组的对象,可以保存任何类型的数据,由一组数据和相关的索引两部分组成创建Series对象获取数据和DataFrame创建DataFrame对象DataFrame使用读取数据有时候会报错是因为编码格式的问题,主要的编码格式有。在导入的时候加上encoding=“编码格式”如:pd.read_csv(r"xxx",encoding=“gbk”)数据查看索引操作基础索引索引和索引索引排序嵌套列表创造多重索引导入库。

2024-04-03 11:40:40 1108 1

原创 大数据—HDFS常用命令

HDFS的定义:HDFS是一种允许文件通过网络在多台主机上分享的文件系统,可以让多台机器上的多个用户分享文件和存储空间。HDFS只是分布式文件管理系统中的一种。HDFS的适用场景:适合一次写入,多次读出的场景,且不支持文件的修改。

2024-03-20 22:00:13 1436 2

原创 大数据—数据可视化—Pyecharts基础图表

学习作图前先要先学习画图配置项条形图 Bar ( )堆叠柱状图折线图 Line()阶梯图连接空数据(折线图)面积图饼图 Pie()环形图嵌套饼图玫瑰图散点图动态涟漪散点图雷达图箱型图词云图 WordCloud()漏斗图 Funnel水球图地图。

2024-03-19 11:26:00 1141

原创 pyecharts可视化——饼图

玫瑰图 rosetype。环形图 radius。

2024-03-18 09:40:47 1468

原创 pyecharts可视化——折线图

连接空数据(折线图)

2024-03-17 23:24:05 1289 1

原创 pyecharts可视化——柱状图

基础柱状图。

2024-03-17 21:36:06 1166 1

原创 大数据—数据可视化—Pyecharts配置项

基础图表。

2024-03-14 21:29:17 3670 1

pyecharts实现可视化大屏

用pyecharts实现的可视化大屏,使用Timeline时间轴,为大屏添加动态效果,对历年的人口,经济等数据进行分析。

2024-10-29

python实现微信自动发信息

用python程序模拟键盘操作,用快捷键发送信息 压缩包内包含源代码和exe可执行文件 在使用之前要保证Ctrl+Alt+W可以打开微信 在程序运行时不要操作,避免出现错误。

2024-06-17

mapreduce求最大值和最小值

用mapreduce编写程序,求文件中的最大值和最小值,用cleanup()方法,在Map阶段结束时将判断的最终数值传入Reduce,在Reduce阶段直接传出。

2024-06-12

对小说网站进行爬取,获取文章内容并下载

顶点小说爬取,用BeautifulSoup库和re库解析文章内容,再用os库创建文件夹并下载到文件夹中。

2024-05-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除