
pyhton数据分析及可视化-从入门到实践
文章平均质量分 84
白话机器学习
10年IT从业经验,人工智能高级算法工程师、优快云博客专家、阿里云专家、《2023博客之星马龄赛道11-15年》第一名、《2023博客之星,城市赛道》长春TOP1,优快云付费资源项目实践专家
展开
-
万字Python pandas 核心操作知识总结,建议收藏
先不要管下面这个案例有没有用,你只需要知道,使用正则做数据清洗多好用;将指定位置的字符,替换为给定的字符串(接受正则表达式)findall使用正则表达式,做数据清洗,真的很香!利用正则表达式,去字符串中匹配,返回查找结果的列表。接受正则表达式,抽取匹配的字符串(一定要加上括号)在字符串的左边、右边或左右两边添加给定字符。8.pad+side参数/center。使用给定的字符串,替换指定的位置的字符。将指定位置的字符,替换为给定的字符串。计算给定字符在字符串中出现的次数。获取指定位置的字符串。原创 2024-01-07 20:09:59 · 1299 阅读 · 3 评论 -
基础准备-python系统操作(os模块)知识点汇总
os.path.split() 将路径 path 拆分为一对,即 (head, tail),其中,tail 是路径的最后一部分,而 head 里是除最后部分外的所有内容。os.path.getatime(path)返回path的最后访问时间,返回的时间为秒(时间戳),可以利用tiem转换成常用的时间格式。os.path.getctime(path) 在windos下获取文件的创建时间,在Unix返回的是最后的修改时间。os.path.abspath(path) 返回路径 path 的绝对路径。原创 2023-03-24 16:23:01 · 146 阅读 · 0 评论 -
基础准备-python文件操作知识点汇总
本篇重点介绍python文件处理的方法。原创 2023-03-24 15:58:41 · 159 阅读 · 0 评论 -
python数据分析开发工具-Jupyter使用方法
上面看到的%matplotlib就是IPython魔术命令的一个示例,基于IPython内核,Jupyter可以访问IPython内核中的所有魔法,它们可以让我们更轻松的使用 Jupyter!但是鲜为人知的是,我们可以修改一个 ast_note_interactivity 选项,使Jupyter对自己行中的任何变量或语句执行此操作,这样我们就可以一次看到多个语句的值。使用%%writefile将该单元格的内容保存到外部文件中,%pycat的作用正好相反,它(在弹出窗口中)可以显示外部文件的内容。原创 2023-03-23 16:51:58 · 3174 阅读 · 0 评论 -
python数据分析开发工具-Anaconda+Jupyter的安装和使用
作为单位运行的,选中一个代码块后,点击运行只会运行当前单元格的内容,每个单元格相当于一个“断点”,所以很适合将一个大工程分段调试,比如我就经常分“导入数据”,“处理数据”,“绘图”等模块,分块调试程序。在数据分析中,你会用到很多第三方的包,而conda(包管理器)可以很好的帮助你在计算机上安装和管理这些包。这时会出现很多字,不用管它。(2)相比Pycharm等,Spyder更轻便,是专门为数据科学开发的IDE,其合并的NumPy、Matplotlib 和 SciPy库都是数据分析的主流第三方库。原创 2023-03-23 16:29:45 · 431 阅读 · 0 评论 -
基础准备-python语言基础知识总结(五)
d.setdefault(key, default_value) ---如果 key 已存在,则返回对应的 value,若 key 不存在,则返回 default_value,并在原字典中新增键值对 key: default_value。整形-int-不可变、浮点型-float-不可变、字符型-str-不可变、列表-list-可变、元祖-tuple-不可变、字典-dict-可变。GIL 可能会影响多线程程序的性能,因此通常不建议在 Python 中开发 CPU 密集型的多线程程序。原创 2023-03-22 23:37:40 · 506 阅读 · 0 评论 -
基础准备-python语言基础知识总结(四)
thread.join() 方法的作用是阻塞当前线程,直到调用 join() 方法的线程结束。print(random.choices([10,20,30],k=2)) # 随机从列表选择 k 个数,返回列表形式,取出放回方式,意思是取出的数可以重复。round() 第一个参数是要处理的数字,第二个可选参数为四舍五入保留的位数,若不传如第二个参数,则默认四舍五入到最近的整数。对于可变数据类型,浅拷贝只拷贝第一层中的引用,深拷贝在拷贝时,会逐层进行拷贝,直到所有的引用都是不可变对象为止。原创 2023-03-22 22:58:45 · 156 阅读 · 0 评论 -
基础准备-python语言基础知识总结(三)
特殊的迭代器,只需要使用 yield 关键字,那么就会立即变为一个生成器,也就是说,只要一个函数中包含了一个 yield 关键字(不管几个),那么这个函数就会自动变成一个生成器函数;进程:正在执行的程序,将静态的执行代码运行起来,进程内拥有该程序执行所需的全部资源;每个线程都有自己的堆栈,自己的程序计数器,自己的局部变量,这里体现了程序的独立性;函数和普通变量的存储原理是一样的,函数名可以像变量名那样去使用,比如可以进行赋值;迭代器是迭代对象的一种,迭代器一定是可迭代对象,可迭代对象不一定是迭代器。原创 2023-03-22 22:31:28 · 114 阅读 · 0 评论 -
基础准备-python语言基础知识总结(二)
通过字符串的形式在运行时动态修改程序的变量、方法及属性,所有的修改都在内存中进行,所以他并不会实际修改代码,主要目的就是提高代码在运行时的灵活性;getattr 获取对象属性值或方法的引用,如果是方法,则返回方法的引用,如果是属性,则返回属性的值,如果该方法或属性不存在,则抛出异常;w:只写模式,如果用 w 模式打开,一律会清空之前文件的所有内容,如果文件不存在,则自动创建文件,从头开始写;w+:读写模式,也会清空之前文件的所有内容,如果文件不存在,则自动创建文件,从头开始写;原创 2023-03-22 22:22:45 · 86 阅读 · 0 评论 -
基础准备-python语言基础知识总结(一)
string.find(str, start=0, end=len(string)) | 检测 str 是否包含在 string 中,如果 start 和 end 指定范围,则检查是否包含在指定范围内,如果是返回开始的索引值,否则返回 -1;string.replace(old_str, new_str, num=string.count(old)) | 把 string 中的 old_str 替换成 new_str,如果 num 指定,则替换不超过 num 次;原创 2023-03-22 22:16:50 · 149 阅读 · 0 评论 -
基础准备—python数据分析常用库介绍
Keras 并非简单的神经网络库,而是一个基于Theano 的强大的深度学习库,不仅可以搭建简单普通的神经网络,还可以搭建各种深度学习模型,如自编码器、循环神经网络、递归神经网络、卷积神经网络等。Pandas 是Python下最强大的数据分析和探索工具,包含高级的数据结构和精巧的工具,支持类似SQL的数据增、删、查、改,并有丰富的数据处理函数;支持时间序列分析功能;Scikit-learn 是一个与机器学习相关的库,它提供了完善的机器学习工具箱,包括数据预处理、分类、回归、聚类、预测、模型分析等。原创 2023-03-20 22:29:20 · 1033 阅读 · 0 评论 -
基础准备-使用python进行数据分析有什么优势
大数据市场急需 Python开 发 者,不是 Python开发者的专家也可以以相当低廉的成本快速的学习这门语言,从而最大化用在分析数据上的时间,最小化学习这门语言的时间,节约了开发成本和门槛。包括数据搜集,清洗,整理,可视化,机器学习,人工智能,开发,运维等。Python语言是一种开源的编程语言,属于使用弱类型的脚本语言,1989年发明由GuidovanRossum发明,Python优势的最大优点就是比其他语言更简单易学,功能强大的解释型编程语言,语法简单,数据结构高效,能快速实现面向对象编程。原创 2023-03-20 21:52:32 · 184 阅读 · 0 评论