
python
小兔子要健康
记录自己的错误时光
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ubuntu和windows下运行jupyter lab 报错ModuleNotFoundError: No module named ‘pydotplus‘的解决方法
linux可以直接pip install pydotplus。这个是缺少安装包导致的。如果windows下是用。原创 2022-10-07 13:03:59 · 1175 阅读 · 0 评论 -
数据可视化第四章答案
热狗大赛大胃王前三from pyecharts import Pieimport pandas as pdhotplace = pd.read_csv("hot-dog-places.csv", header=None)hotplace = pd.DataFrame(hotplace.values.T, index=hotplace.columns, columns=['year', 'A', 'B', 'C'])print (list(hotplace.A)[10])pie = Pie( "原创 2021-05-17 21:16:28 · 1719 阅读 · 1 评论 -
基于K-Means聚类算法对NBA球员数据的聚类分析
文章目录前言1.数据获取二、使用步骤2.模型构建总结前言 聚类分析的研究成果主要集中在基于距离(或者称为基于相似度)的聚类方法,用距离来作为相似性度量的优点是十分直观,从我们对物体的识别角度来分析,同类的数据样本是相互靠近的,不同类样本应该相聚较远。K-Means聚类算法是划分聚类方法中最常用、最流行的经典算法,许多其他的算法都是K-Means聚类算法的变种。其主要思想是通过迭代过程将数据集划分为不同类别,使评价聚类性能的准则函数达到最优,使生成的每个聚类类内紧凑,类间独立。 本文介绍并实践了一原创 2021-05-17 21:12:34 · 3760 阅读 · 1 评论 -
机器学习K-均值——nonzero(clusterAssment[冒号,0].A==cent
先准备测试数据,如下上面都是准备数据,下面才是一步步的告诉你怎么生成我们要的数据矩阵.A是把矩阵转换为数组numpynonzero()返回哪些元素不是False或者0,第一个array描述行,第二个array描述列...原创 2021-05-06 21:30:29 · 285 阅读 · 0 评论 -
实现二分k-means算法
(1) 算法思路:二分 k-means 算法,此算法不需要标签变量,在 k-means 算法的基础上需要通过四个特征变量将 Iris 进行聚类。目标:通过 Iris 的四个特征值进行聚类,得到每个聚类中的质心,并把聚类结果写入文件中。(2) 算法原理基础:在原理上跟 k-means 上差不多相同。(3) 算法步骤:把整个数据集看成一个簇,计算质心将这个簇分成两个簇选择满足条件的可以分解的簇,选择条件为簇元素的个数和 SSE 大小使用 k-mean 算法将可分裂的簇分成两个簇重复(2)(3)原创 2021-05-06 21:27:36 · 883 阅读 · 0 评论 -
dataframe 统计重复次数
对重复数据列进行次数统计data['列名'].value_counts()原创 2021-04-29 22:15:16 · 1431 阅读 · 0 评论 -
python用来正常显示中文标签 plt.rcParams[‘font.sans-serif‘] = [‘SimHei‘]错误
用来正常显示中文标签显示错误代码plt.rcParams[‘font.sans-serif’] = [‘SimHei’]无法运行我的环境:在JetBrains PyCharm Community Edition 2018.3.5 x64中,解释器是Anaconda3中的Python3.5错误根源代码:plt.rcParams['font.sans-serif'] = ['SimHei']错误根源:Anaconda3的字体库中没有中文字simhei.ttf如下图是我添加之后的文件夹字体显示解决办法原创 2021-04-27 14:46:30 · 18021 阅读 · 0 评论 -
Python】np.linspace用法介绍
np.linspace主要用来创建等差数列。np.linspace参数:numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0)Return evenly spaced numbers over a specified interval.(在start和stop之间返回均匀间隔的数据)Returns num evenly spaced samples, calculated over原创 2021-04-27 14:41:11 · 882 阅读 · 0 评论 -
绘制板块图层
绘制板块图层1import pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport matplotlibimport squarifycolor = sns.color_palette()#无参数调用color_palette()返回默认的颜色集# 1、读取3张表pd.options.mode.chained_assignment = None#不允许输出报错信息products_df = pd.rea原创 2021-04-27 11:56:40 · 835 阅读 · 1 评论 -
数据可视化第五章
基于python的散点图实现.pyimport ggplot as gpimport pandas as pdcrime=pd.read_csv("crimeRatesByState2005.csv")plot=gp.ggplot(gp.aes(x='murder',y='burglary'),data=crime)#谋杀案,入室盗窃points=gp.geom_point(color='red')print(plot+points)基于python散点图实现2.pyimport ggp原创 2021-04-24 22:59:23 · 1766 阅读 · 1 评论 -
基于Python的Anaconda3,导包报错 cannot import name ‘Timestamp‘
问题:已经在cmd下使用"pip install ggplot"成功安装了ggplot包,在IDLE以及Jupyter Notebook下使用“from ggplot import *”语句导入ggplot包时报错:原创 2021-04-24 21:56:24 · 263 阅读 · 0 评论 -
解决安装Python包时超时失败ReadTimeoutError: HTTPSConnectionPool(host=‘files.pythonhosted.org‘, port=443)
问题:今天在遇到了安装Python中的statsmodels包的时候一直超时失败报错如下ReadTimeoutError: HTTPSConnectionPool(host=‘files.pythonhosted.org’, port=443): Read timed out.之前的安装的方式是:pip install statsmodels解决办法:使用国内的镜像源安装。在原来安装时在命令里加一个参数 -i,然后在i后面加国内镜像地址。选择国内的镜像源列表如下:清华源: https:/原创 2021-04-23 22:13:52 · 1000 阅读 · 0 评论 -
关于安装pyecharts报错 No module named ‘pyecharts_snapshot
安装pyecharts后使用会出现如下错误:ERROR:lml.utils:failed to import pyecharts_snapshotTraceback (most recent call last): File "/usr/lib/python3.7/site-packages/lml/utils.py", line 43, in do_import plugin_module = __import__(plugin_module_name)ModuleNotFoundErr原创 2021-04-13 13:54:07 · 1156 阅读 · 0 评论 -
python安装包超出时间报错的解决方法
阿里云 http://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/豆瓣(douban) http://pypi.douban.com/simple/清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simple/代码:pip install -i https://原创 2021-04-03 17:11:12 · 158 阅读 · 0 评论 -
python pip安装报lib包错误
python pip安装第三方库超时问题(raise ReadTimeoutErrorself._pool, None, ‘Read timed out.’)pip工具安装百度经验链接: pip安装及环境变量配置.pip下载超时处理aise ReadTimeoutError(self._pool, None, ‘Read timed out.’)方案一:对于比较小的库,可以延时处理-------- pip --default-timeout=100 install -U pip--------原创 2021-04-03 16:53:26 · 364 阅读 · 0 评论 -
实验一:时间数据可视化
上图代码如下:import pyecharts.options as optsfrom pyecharts.charts import Polar,Pageimport csvfilename = "hot-dog-places.csv"data_x = []data_y = []with open(filename) as f: reader = csv.reader(f) for data_row in reader: data_x.append(data...原创 2021-03-29 22:37:49 · 1164 阅读 · 0 评论 -
修改ID3核心函数,用C4.5实现
from numpy import *import mathimport copyimport pickle as pickleclass C45DTree(object): def __init__(self): # 构造方法 self.tree = {} # 生成树 self.dataSet = [] # 数据集 self.labels = [] # 标签集 # 数据导入函数 def loadDataSet(self, path, labels): recordlist原创 2021-03-29 22:30:36 · 195 阅读 · 0 评论 -
id3算法实现决策树
import mathimport copyclass ID3DTree(object): def __init__(self): self.tree={ }#生成的树 self.dataSet = []#数据集 self.labels={}#标签集 #导入数据 def loadDataSet(self,path,labels): recordlist = [] fp = open(path,"rb"原创 2021-03-29 22:28:16 · 494 阅读 · 0 评论 -
TypeError: write() argument must be str, not bytes
Python2随机写入二进制文件:with open('/python2/random.bin','w') as f: f.write(os.urandom(10))但使用Python3会报错:TypeError:must be str, not bytes原因为:Python3给open函数添加了名为encoding的新参数,而这个新参数的默认值却是‘utf-8’。这样在文件句柄上进行read和write操作时,系统就要求开发者必须传入包含Unicode字符的实例,而不接受包含二进制数原创 2021-03-29 22:25:22 · 296 阅读 · 0 评论 -
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 0: illegal multibyte sequence
f = open(‘testData’)testData = pickle.load(f)错误提醒=>UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 0: illegal multibyte sequence修改为f = open(‘testData’, ‘rb+’)testData = pickle.load(f)原创 2021-03-29 22:23:23 · 1739 阅读 · 0 评论 -
nltk下载出现问题
nltk下载出现问题今天继续项目三,由于需要做一个英文的关键词提取,所以需要用到nltk的库文件。from nltk.stem import WordNetLemmatizer# 使用WordNetLemmatizer类,即wordnet词形还原方法def Lemmatization_text(text_cut_list): wnl = WordNetLemmatizer() return [wnl.lemmatize(n) for n in text_cut_list] tex原创 2020-12-03 15:52:32 · 1754 阅读 · 0 评论 -
人工智能:python 实现 第十章,NLP 第六天,构建性别识别器
构建性别识别器性别识别是一个有趣的问题。既然如此,我们将使用启发式的方法来构建一个特征向量,并且使用它训练一个分类器。这里使用的启发式是被给定名字的最后N个字母。例如,假设名字以ia结尾,它很可能是一个女性的名字,如Amelia 或者Genelia。另外,如果名字以rk结尾,它更可能是一个男性的名字,如Mark 或者Clark。因此 我们不能确定要使用的准确字母数量,我们将使用这个参数,并且找出这个最好的答案。那我们该如何做到呢?创建一个新的python文件 ,代码如下:#导入如下的包import原创 2020-12-03 15:50:36 · 463 阅读 · 0 评论 -
Python 环境下下载并安装NLTK说明
我第一次直接用的是pip install nltk 命令告诉我网络超时,后来我用下面的步骤进执行就下载成功了!1、在cmd窗口中,进入到python的文件夹内的 Scripts内,我的目录地址是:D:\Python\Scripts命令行输入:easy_install pip运行结束后,安装PyYAML and NLTK ,命令行输入:pip install pyyaml nltk会有很多进度条,最后显示successfully 。。这样就将nltk安装完成2、然后进入Python命令行敲入下面原创 2020-12-03 14:15:55 · 1153 阅读 · 0 评论 -
NLTK Downloader出现 [Error 11004]getaddrinfo failed的错误时怎么解决
当打开NLTK下载器时,弹出 [Error 11004]getaddrinfo failed的提示窗口。#打开NLTK下载器import nltknltk.download()出现这样的问题时要怎么解决?很多人都走错了思路导致浪费了不少时间在这上面。首先返回到代码,这边已经输出了显示信息,点击打开输出的网址。发现无法打开网址,这其实是“找不到 raw.githubusercontent.com 的服务器 IP 地址”的错误。在 C:\Windows\System32\driver原创 2020-12-03 14:12:52 · 3266 阅读 · 6 评论 -
python:pandas中dataframe的基本用法汇总
一. DataFrame的创建创建一个空的dataframe1df=pd.DataFrame(columns={“a”:"",“b”:"",“c”:""},index=[0]) out:12a c b0 NaN NaN NaN 用list的数据创建dataframe:123a = [[‘2’, ‘1.2’, ‘4.2’], [‘0’, ‘10’, ‘0.3’], [‘1’, ‘5’, ‘0’]]df = pd.DataFrame(a, columns=[‘o原创 2020-10-18 13:39:52 · 2600 阅读 · 0 评论 -
Python常用第三方库(计算机二级)
总结了在计算机二级考试中出现的第三方库pip简介:常用的第三方库安装方法常用命令:①安装第三方库pip install <第三方库名>②升级pip版本pip install -U pip③ 查看已安装的第三方库pip list ④卸载第三方库pip uninstall <第三方库名>⑤获取帮助信息pip help⑥搜索安装包pip search <第三方库名>pyinstall简介:将python源文件(.py)打包成可执行文件(.e原创 2020-09-07 17:20:29 · 2990 阅读 · 0 评论 -
Python的__str__方法
python 中的魔法方法:str 和__repr__引言在学习面向对象的时候,我们知道在 python 中有一类特殊的方法,叫做魔法方法,这种方法的特点如下: 1. 方法定义的时候以两个下划线开头和两个下划线结尾:如__init__、str__和__repr 2. 这类方法一般不需要我们手动调用,在满足某个条件的时候会自动调用,这个满足的条件我们可以成为调用时机。在Python 中有两个魔法方法都是用来描述对象信息的,str__和__repr,那为什么要定义两个这样的方法呢,其实是他们设计的目的是不一原创 2020-07-04 14:02:45 · 2572 阅读 · 0 评论 -
关于Python模块shelve存储的对象,改变字典的值时必须将获取的副本赋给一个临时变量的更好解决方法
文章的关键点:将函数open的参数writeback设置为True就不需要引用一个临时变量。开始文章的叙述:如何将数据存储到文件中,如果需要的是简单的存储方案,模块shelve可替你完成大部分工作——你只需提供一个文件名即可。对于模块shelve,你唯一感兴趣的是函数open。这个函数将一个文件名作为参数,并返回一个Shelf对象,供你用来存储数据。你可像操作普通字典那样操作它(只是键必须为字符串),操作完毕(并将所做的修改存盘)时,可调用其方法close。该模块作用用于创建永久性映射,其内容存储在使用原创 2020-07-04 16:13:33 · 280 阅读 · 0 评论 -
python安装pandas失败问题
开始使用pip install pandas报错后来将pip语句更换为 pip --default-time=100 install pandas成功安装pandas原创 2020-06-22 17:10:15 · 1468 阅读 · 0 评论 -
pymysql fetchone () , fetchall () , fetchmany ()用法与区别
定义1.1 fetchone() :返回单个的元组,也就是一条记录 (row),如果没有结果 则返回 None1.2 fetchall() :返回多个元组,即返回多个记录 (rows), 如果没有结果 则返回 ()首先 fetchone () 函数它的返回值是单个的元组,也就是一行记录,如果没有结果,那就会返回 null其次是 fetchall () 函数,它的返回值是多个元组,即...原创 2020-04-20 20:25:18 · 13610 阅读 · 0 评论 -
Python 中的键值(具名)参数:如何使用它们
键值参数是 Python 的一个特性,对于从其他编程语言转到 Python 的人来说,不免看起来有些奇怪。人们在学习 Python 的时候,经常要花很长时间才能理解键值参数的各种特性。在 Python 教学中,我经常希望我能三言两语就把键值参数丰富的相关特性讲清楚。但愿这篇文章能够达到这个效果。在这篇文章中我会解释键值参数是什么和为什么要用到它。随后我会细数一些更为深入的使用技巧,就算老 Py...原创 2020-04-20 20:22:17 · 2016 阅读 · 1 评论 -
sqlite数据库操作
'''一、DB-API2.0在不同类型的数据源之间转换数据库连接:connect(),commit(),rollback(),close()数据库操作:cur=connect().curor():记录指针;cur.execute(sql[,(参数化列表)]),fetchone(),fetchmany(-1)=fetchall()'''import sqlite3 #导入模块#(1)...原创 2020-04-20 20:15:23 · 209 阅读 · 0 评论 -
python里面的execute与executemany区别
可以看出明显的区别, 如果需要批量插入数据库,还是用 executemany方法 这个和execute 不是一个数量级.如果只是插入比较少的数量量 用 exectue 比较好点.总的来说execute与executemany功能差不多,只不过后者比前者速度快一些。...原创 2020-04-20 20:11:55 · 8222 阅读 · 0 评论 -
python异常处理
Python3 错误和异常作为 Python 初学者,在刚学习 Python 编程时,经常会看到一些报错信息,在前面我们没有提及,这章节我们会专门介绍。Python 有两种错误很容易辨认:语法错误和异常。Python assert(断言)用于判断一个表达式,在表达式条件为 false 的时候触发异常。语法错误Python 的语法错误或者称之为解析错,是初学者经常碰到的,如下实例w...原创 2020-03-17 14:21:01 · 149 阅读 · 0 评论 -
python文件读写
open() 方法Python open() 方法用于打开一个文件,并返回文件对象,在对文件进行处理过程都需要使用到这个函数,如果该文件无法被打开,会抛出 OSError。注意:使用 open() 方法一定要保证关闭文件对象,即调用 close() 方法。open() 函数常用形式是接收两个参数:文件名(file)和模式(mode)。open(file, mode='r')完整的语法格...原创 2020-03-17 14:19:19 · 145 阅读 · 0 评论 -
python的数据类型
Python3 基本数据类型Python 中的变量不需要声明。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。在 Python 中,变量就是变量,它没有类型,我们所说的"类型"是变量所指的内存中对象的类型。等号(=)用来给变量赋值。等号(=)运算符左边是一个变量名,等号(=)运算符右边是存储在变量中的值。例如:实例(Python 3.0+)#!/usr/bin/python3...原创 2020-03-17 13:58:22 · 214 阅读 · 0 评论 -
python面向对象
Python3 面向对象Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对象是很容易的。本章节我们将详细介绍Python的面向对象编程。如果你以前没有接触过面向对象的编程语言,那你可能需要先了解一些面向对象语言的一些基本特征,在头脑里头形成一个基本的面向对象的概念,这样有助于你更容易的学习Python的面向对象编程。接下来我们先来简单的了解下面向对象...原创 2020-03-17 13:51:22 · 120 阅读 · 0 评论 -
python函数
Python3 函数函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。函数能提高应用的模块性,和代码的重复利用率。你已经知道Python提供了许多内建函数,比如print()。但你也可以自己创建函数,这被叫做用户自定义函数。定义一个函数你可以定义一个由自己想要功能的函数,以下是简单的规则:• 函数代码块以 def 关键词开头,后接函数标识符名称和圆括号 ()。• 任何...原创 2020-03-17 12:13:17 · 165 阅读 · 0 评论 -
python——pickle模块的详解
pickle模块详解该pickle模块实现了用于序列化和反序列化Python对象结构的二进制协议。 “Pickling”是将Python对象层次结构转换为字节流的过程, “unpickling”是反向操作,从而将字节流(来自二进制文件或类似字节的对象)转换回对象层次结构。pickle模块对于错误或恶意构造的数据是不安全的。pickle协议和JSON(JavaScript Object Nota...原创 2020-03-30 19:24:07 · 447 阅读 · 0 评论 -
python程序结构
程序结构:主要是指结构化程序设计。它把一个程序分成若干互相独立的模块。在程序设计时,只要各个模块设计正确了,就可以保证整个程序也肯定设计正确。结构化程序是由若干个基本结构组成而成,每一个结构可以包含若干条语句和其它基本结构。共有三种基本结构。顺序结构:指程序按照我们编写的顺序,一条条的运行。选择结构:指只有满足一定的条件时,才会执行的程序模块。例如下面的例子,当条件P的值为真时,执行A模块...原创 2020-03-17 12:02:43 · 200 阅读 · 0 评论