自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 python语法基础(函数)

定义函数格式:Def 函数名 (参数列表):函数体函数的调用:返回值=函数名(输入参数)

2024-07-25 14:20:28 226

原创 python语法基础(集合)

s.intersection(t1,t2,...,etc):集合s与t1,t2...的交集,t1是必须的,后续参数可选。s.union(t1,t2,...,etc):集合s与t1,t2...的并集,t1是必须的,后续参数可选。s.issubset(t):判断集合s是否为集合t的子集(t包含s,s属于t的一部分)s.discard(x):集合s删除元素x,如果x不存在不会报错。s.update(t):集合s中加入t,t是另一个集合或者元素。s.issuperset(t):判断集合s是否为集合t的超集。

2024-07-24 13:20:40 326

原创 python语法基础(字典)

键(key)对应的值(value)。key必须唯一{}表示字典字典中的key和value之间用冒号:分隔,元素之间用逗号,分隔。

2024-07-16 16:43:57 331

原创 python语法基础(字符串)

rstrip([chars]):截掉字符串右边的空格或指定字符chars strip([chars]):调用lstrip([chars])和rstrip([chars])(截掉空格或chars)find(str,beg=0,end=len(string)):判断str是否在字符串中,如果指定查找范围则在[beg,end)中查找,返回找到的起始下标,不存在返回-1。count(str,beg=0,end=len(string)):求str在字符串中出现次数,如果指定查找范围则在[beg,end)中查找。

2024-07-16 12:55:41 987

原创 python语法基础(列表)

a.index(x,start,stop):计算元素x在列表a下标[start,stop)中第一次出现的位置。根据值删除元素:a.remove(x) 删除列表a中值为x的第一个元素(第一次出现的)中间插入元素:list.insert(idx,x) 在列表中添加idx位置的元素x。利用del删除列表中的元素:del a[idx] 删除列表a中下标为idx的元素。利用pop删除列表中的元素:a.pop(idx) 删除列表a中下标为idx的元素。2.in 表达式:x in a:判断x是否在列表a中。

2024-07-14 13:34:55 613

原创 python数据结构(排序)

步骤1:构建最大堆:刚开始把序列看作是一颗顺序存储的全二叉树,在起始数组为0的情况下,节点i的左子节点再外置(2*i+1),右子节点为(2*i+2);第一个为固定有序值,然后除第一个之后都是无序的,相当于一个一个往后移的比较,第一个和第二个先比较,然后再加入第三个比较,然后依次类推。相当于找序列中的最小值,然后放在第一位(和第一位交换位置),然后再剩下的序列中,再找最小值,然后刚在后面,以此类推。无序序列中的记录的到其中关键字最小或最大的记录,并将其加入到有序子序列中,最终形成有序序列。

2024-07-12 12:42:19 925

原创 python数据结构(哈希表)

该方法最关键的是对于p的选择,当数据量较大,冲突产生,一般选择近m的质数。以关键字为自变量,通过一定的函数关系,计算出对应的函数值(哈希值)H(key)=key 或者 H(key) = a key + b。哈希函数是一个映象,将关键字的集合映射到某个地址集合上。最为常见的方法之一。选择一个随机数,取关键字的随机函数值为它的散列地址。(如果非数字关键字,则需先对其进行数字化处理)哈希函数为关键字的线性函数。

2024-07-11 12:18:55 279

原创 python数据结构(二叉排序树)

也就是说相当于一个列表从小到大排序,然后从中间抽取了中间值,然后变成树,中间值的左边都小于它,右边都大于它。一种盖度平衡的排序二叉树,其每一个节点的左子树和右子树的高度差最多等于1,只可能是-1, 0 和 1。2.若二叉排序树非空,则新插入的结点是新的叶子结点,且插入的位置由查找过程得到。特征:1.若它的左子树不为空,则左子树上所有结点的值均小于根结点的值;2.若它的右子树不为空,则右子树中所有结点的值均大于根结点的值;1.若二叉排序树为空树,则新插入的结点是新的根结点。右边的就是平衡二叉树。

2024-07-10 13:43:42 621

原创 python数据结构(查找)

就是每次查找去分成两等分,然后有个中间值,让这个值和我们要查找的值进行比较,可以比较出来看是哪边的,是大于它的还是小于它的,大于它则在大于它的区间找,小于则小于找,然后以此类推,找中间值,然后作比较。从表的头或者尾开始,逐一开始查找,然后一一和我们要查找的目标进行一一对比,看是否相同,最后查找完也没发现,则说明该表中没有此元素。建立一个索引表,每块中最大关键字的值及每块的第一个记录在表中的位置和最后一个记录在表中的位置存放在索引项中。查找某个“特定的”数据元素是否在查找表中;在查找表中插入一个数据元素;

2024-07-08 17:13:44 541 2

原创 python数据结构(最短路径)

一步步寻求起始点到结束点之间顶点的最短路径,即基于已经求出的最短路径,逐步求得更远顶点的最短路径,最终达到目的。指两个顶点(源点到终点)之间经过的边上权值之和最少的路径。迪杰斯特拉(Djikstra)算法。一个节点到其他顶点的最短路径。一次求出任意两点间的最短路径。弗洛伊德(Floyd)算法。

2024-07-08 13:45:08 378

原创 python数据结构(最小生成树)

如果到了没有结点可以访问的,或者是都是访问过的,则回到上一个或者是上几个,在已经访问了的节点中间还有没访问的结点,在这些没访问的几点中间找到权值相对于没访问的较小的权值进行访问。对于有n个节点的无向连通图,无论其生成树的形态如何,所有的生成树必然没有回路,而且都有且仅有n-1条边。当无向连通图是一个带权图,其所有生成树中必有一颗边的权值总和最小的生成树,称为最小生成树。所有权值从小到大排序,顶点集合的有哪些,然后根据权值的小的优先进行排序,克鲁斯卡尔(Kruskal)算法。普里姆(Prim)算法。

2024-07-07 14:11:13 619

原创 python数据结构(树)

孩子兄弟表示法,在这个其中给了两个指针,左指针所指向的是孩子也就是下一节,而右指针所指向的是兄弟,其中,都是从左孩子开始的,就是第一个孩子。如图A的孩子是B和C,A左指针直接指向B,而C是B的兄弟,所以在B的右指针。孩子表示法就是用指针去对应元素,A的孩子是B和C在左边竖着的可以看出B和C都是1和2号元素,所以用指针直接指向1和2号,以此类推。双亲往上推,如A的双亲就是父结点,没有所以用-1表示,B和C的父结点都是A,而A是0号结点。

2024-07-06 14:30:56 319

原创 python数据结构(二叉树遍历)

【证明】:在具有相同深度的二叉树中,仅当每一层都含有最大节点数时,其数 中节点数最多。因此利用性质1可得,深度为k的二叉树的节点数至多为。由于二叉树的每个节点至多有两个孩子,故第i层上的节点书至多是第i-1层上的最大节点数的2倍。【证明】:因为二叉树所有节点的度数均不大于2,所以节点总数(记为n)应等于0度节点数、1度节点(记为。因为第1层上只有一个根节点,所以命题成立。归纳步骤:根据归纳假设,第i-1层上至多有。先访问根结点,再访问左子树,最后访问右子树。先访问左子树,再访问根结点,最后访问右子树。

2024-07-06 09:49:12 424

原创 python数据结构(树和二叉树)

若某节点i是双亲节点的左孩子,则将该结点的右孩子以及当且仅当连续地沿着此右孩子的右链不断搜索到的所有右孩子都分别与结点i的双亲用虚线连起来。3.对任一结点,若其右分支下的子孙的最大层次为L,则其左分支下的子孙的最大层次为L或L+1。深度为k的二叉树中所含的n个结点和深度为k的满二叉树中编号为1至n的结点一一对应。结点的层次:根结点的层次为1,第i层的结点的子树的根结点的层次为i+1。双亲结点:孩子结点的上层结点叫该结点的双亲 (父节点)孩子结点:结点子树的根称为该结点的双孩子。在各亲兄弟之间加一虚线。

2024-07-05 14:53:40 516

原创 python数据结构(串)

stringBlank=" ",仅含一个空格,长度为1。:两个串长度相等,并且对应位置的字符都相等。:子串的第一个字符在主串中的位置来表示。:串中任意个连续的字符组成的字序列。由零个或多个字符组成的有限序列。:string="",长度为0。:串的所有字串,除了自身以外。:包含子串的串相应地称为主串。:字符在序列中的序号。

2024-07-05 09:36:42 216

原创 python数据结构(队列)

一种操作受限制的特殊线性表,只允许在线性表的一端进行插入,而在另一端进行删除。这样的话,count不仅具有计数功能,而且可以起到标识作用。队满条件:count==maxsize。当入队列操作成功,count+1。当出队列操作成功,count-1。假设计数器count,初值为0。队空条件:count==0。特性:先进先出 (就和排队一样)出队:删去对头元素并返回该元素。入队:将值为x的元素插入队尾。

2024-05-30 11:33:48 173

原创 python数据结构(堆栈)

(bottom)表头元素,不允许插入和删除的一端。栈是限定仅在表尾进行插入或删除操作的线性表。(top)表尾元素,允许插入和删除的一端。(PUSH)最先插入的元素放在栈的底部。(POP)最后插入的元素先出。

2024-05-19 19:17:38 241 1

原创 python的数据结构(线性表)

它是由n(n>=0)个元素(节点)组成的满足如下条件的有限序列(a0,a1...,an-1):当i=1,...,n-1时,ai有且仅有一个直接前趋ai-1;当i=0,1,...,n-2时,有且仅有一个直接后继ai+1;表中第一个元素a0没有前去;最后一个元素an-1无后继。数据元素的个数n称为线性表长度,长度为0时称为空表。数据元素可以是单一类型的数据,如整数、字符串等,也可以由若干个数据项组成的结构体,如学生信息等。存储分为:顺序存储和链式存储。

2024-05-08 18:39:42 817 1

原创 Python中的turtle小乌龟绘图(2)

大家好,又到了更新的时候了!我们接着上一次的讲---------

2023-11-29 20:37:27 2715 1

原创 Python中的turtle小乌龟绘图(1)

Python中的turtle小乌龟绘图,这个是初入Python中用来向朋友展示的一个库,网上的玫瑰也可以用turtle小乌龟绘画出来。

2023-11-22 21:04:04 2276 1

圣诞节的圣诞树,有html型、有exe型,还有使用python型

打开压缩包第一个是动态生成樱花python需要下载python,第二个是圣诞树.ext类型是使桌面生成一颗圣诞树,但是每次开机时会自动生成,如果需要关闭可以右键将startup关闭勾选,第三个是html型直接点开即可,后面两个都是python类型。

2024-07-31

爬取豆瓣电影top250和爬取当当网数据

(2)编写爬虫程序,使用Urllib或Requests库获取到服务器URL的首页数据。 (3)解析数据,包含图书编号、名称、作者、出版社、出版时间、价格、简介、图书图片的URL,同时实现翻页功能爬取全部网页数据; (4)数据持久化存储:将全部解析的数据存储到 .CSV文件;将全部图书的图片存储到当前目录中“download”文件夹;将全部解析的数据存储到数据库( MySQL或MongoDB )。 编写爬虫程序,使用获取到服务器URL的首页数据。 (3)使用解析RE、BS4、XPATH数据,包含图书编号、名称、作者、出版社、出版时间、价格、简介、图书图片的URL,同时实现翻页功能爬取全部网页数据; (4)数据持久化存储:将全部解析的数据存储到 .CSV文件;将全部图书的图片存储到当前目录中“download”文件夹;将全部解析的数据存储到数据库( MySQL或MongoDB )。

2024-07-31

mysql5.7.21版本安装

内部有视频指导安装,尽量一次性安装完成,如需卸载干净请在b站上找对应的视频。如果没安装好不想卸载的话,可以再次点击安装程序,会出来一个修改框架,修改框架中点击add可以安装视频中没有安上的小插件。

2024-07-31

数据可视化的可视化大屏课程设计

1、选取合适的数据集:根据毕业设计的主题和目标,选择与之相关的合适的数据集。确保数据集可获得并包含足够的样本和特征,以支持后续的数据分析和开发工作。 2、项目背景:介绍毕业设计的背景和动机,说明为什么选择该课题以及相关领域的研究现状和问题。 3、项目目标:明确毕业设计的目标和预期成果,阐述希望通过这个项目实现的具体价值和意义。 4、数据说明:详细描述所选数据集的来源、规模、结构和内容,包括数据的格式、字段含义、数据质量等信息。 5、项目分析:对数据集进行初步的数据分析,包括数据预处理、特征提取、数据探索等,以获得对数据集的深入理解,为后续的开发工作做准备。 6、开发环境:采用Echarts大数据可视化技术。项目开发采用当前最主流的前后端分离的方式:后端用Pycharm工具搭建Flask框架,然后利用Python技术完成数据清洗、数据制作,最终形成数据接口;前端用Vscode工具完成可视化大屏布局、用Echarts技术完成图形展示;前后端只通过数据接口交互。 7、后端开发:根据项目需求和目标,进行后端开发工作,包括数据处理、函数的设计等,确保后端能够正确处理数据,并提供相应的接口和功能。

2024-07-31

spark课程设计任务

对数据文件data.csv在根据课程设计要求在IDEA中编写Spark程序并打包成jar包,并且将数据文件data.csv上传到HDFS中,提交jar包到Spark集群中运行。 data.csv里面包含餐厅数据,可以用记事本打开查看,主要包含以下13个字段,字段之间由逗号分隔: "所属年月","商家名称","主营类型","店铺URL","特色菜","累计评论数","累计销售人次","店铺评分","本月销量","本月销售额","城市","商家地址","电话" 课程设计要求完成以下任务,在IDEA中创建Maven项目,提供pom.xml文件给大家,完成以下任务。 一、将data.csv文件上传到hdfs的/cateringdata/目录下。 二、编写Spark程序,实现以下功能,并且将程序打包为jar包 1.去掉"本月销量","本月销售额"(第8列和第9列)的数据异常(数据为空字符串或者null或者为0),并且统计去掉了多少条;这一步清洗获得的数据要以逗号分割,存到hdfs的/foodsparktask1目录下; 2.去掉"店铺评分"数据为null的数据,并统计去掉了多少条; 3.去掉"店

2024-07-31

vm的远程登录软件SecureCRTPortable和MobaXterm-Personal

打开压缩包第一个目录下MobaXterm_Personal_23.2.exe是一个远程登录软件,打开03.SecureCRTSecureFX目录,此目录下SecureCRTPortable.exe是另一个登录软件。 在用MobaXterm_Personal时,点击左上角的session中的ssh输入ip地址和名字即可连接设备;在用SecureCRTPortable时点击左上角第二个快速连接,点击协议ssh输入ip和用户名即可连接

2024-07-31

使用kettle进行商品销售数据清洗整合处理

2.任务一:分组聚合订单 售货门店客户订单信息表记录着有关客户的订单信息。 从客户的角度出发,分析客户订单信息表中的数据,了解客户订单状况,按照客户订单数据进行聚合计算,对客户订单消费金额从高到低进行排序,了解哪些客户的消费金额较多,并为这些客户提供更好的服务。 针对“order_list.csv”表实现以下几个步骤: (1) 建立【分组聚合客户订单】转换工程。 (2) 获取客户的详细订单数据。 (3) 分组聚合统计客户的订单数据,聚合统计客户的消费金额。 (4) 装载和解读结果数据。对于聚合统计好的客户订单数据,按照客户消费金额,从高到低进行排序,再将排序后的数据装载至Excel文件中,并对结果数据进行解读。 3.任务二:计算各商品销售金额 售货门店客户订单的详情数据,记录着订单中的每种商品销售的数量、价格等数据。 从商品销售的角度出发,分析商品的销售数据,计算各种商品的销售金额,以便了解商品的销售情况,分析哪些商品属于热销或滞销商品,为商品的销售提供更好的运营决策。 (1) 建立【计算各商品销售金额】转换工程。 (2) 获取和筛选数据。分析数据,通过分析获得需要过滤的字段名称,开展

2024-07-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除