
python
python相关的基础知识
frostjsy
越努力,越幸运
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
json.dumps()包含的参数
作用:控制项目分隔符和键-值分隔符。默认值会在键和值之间添加一个空格,使 JSON 更具可读性。为整数时表示每层的空格数;为字符串时表示每层的这个字符串。遇到无法序列化的对象时,会调用此函数。此函数应返回一个可序列化的对象。作用:指定一个自定义的 JSONEncoder 子类来进行序列化。,则不检查循环引用(不推荐关闭此选项,以避免无限递归)。,则按字母顺序对字典的键进行排序。作用:设置缩进的字符数或字符。,则按字母顺序对字典的键进行排序。,则将非ASCII字符转义为。为对应的 JSON 值。原创 2024-08-04 20:35:24 · 862 阅读 · 0 评论 -
pandas按某2列进行分层随机抽样
在某些情况下,你可能需要按多列组合后的分组进行分层随机抽样。pandas 提供了灵活的数据操作方法,你可以使用groupby和apply方法结合sample来实现这种需求。具体来说,你可以先按多列分组,然后对每个分组进行随机抽样。原创 2024-08-04 20:28:20 · 431 阅读 · 0 评论 -
pandas采样
pandas 提供了丰富的参数和功能,让sample方法能够满足各种随机抽样的需求,包括指定抽样数量、按比例抽样、设置随机种子、有无放回抽样以及按列和分层抽样。这些功能在数据分析和处理过程中非常有用,有助于快速获取具有代表性的小样本进行分析。原创 2024-08-04 20:27:41 · 880 阅读 · 0 评论 -
json.dumps和json.dump区别
是将 Python 对象序列化为 JSON 格式的字符串。如果你想将 JSON 数据写入文件,可以将生成的字符串写入文件,或者更直接地使用函数,它会直接将 Python 对象序列化写入文件。下面是两个方法,一是使用然后写入文件,二是使用直接写入文件。原创 2024-08-04 20:26:32 · 1442 阅读 · 0 评论 -
json.loads时限定为utf-8
json.loads本身支持 UTF-8 编码,直接解析即可。如果原始数据不是 UTF-8 编码,先转为 UTF-8 再解析。读取 JSON 文件时,指定以确保正确处理非 ASCII 字符。使用编码读取以去除 BOM。通过这些方法,你可以确保在使用json.loads时正确处理 UTF-8 编码的 JSON 数据。原创 2024-08-04 20:25:53 · 1173 阅读 · 0 评论 -
混合了 UTF-8 字符串和 Unicode 转义序列的字符串统一转化为 UTF-8 编码的字符串
如果你有一个包含混合了 UTF-8 字符串和 Unicode 转义序列的字符串,并希望将它们统一转化为 UTF-8 编码的字符串,你可以按以下步骤进行操作。此过程涉及区分正常的 UTF-8 字符串和那些需要解码的 Unicode 转义序列。原创 2024-08-04 20:19:46 · 677 阅读 · 0 评论 -
pandas 分层按列随机抽样
实现一个多步骤的过程以达到根据类别分层随机抽样,然后从特定的 ID 中选取相关的样本。下面的代码展示了如何用 pandas 来实现这些步骤。原创 2024-08-04 20:18:00 · 585 阅读 · 0 评论 -
conda虚拟环境升级python
提示:升级 Python 版本时可能会影响你的项目依赖库。在执行以上操作时,确保已经备份你的环境和项目数据,以免意外发生。如果发现新版本与现有代码不兼容,你可能需要回退到旧版 Python,或更新你的代码以匹配新版 Python 的要求。如果默认的 channels 还没有 3.11 版本,你可能需要添加其他的 channels,例如。中的版本号为你希望安装的确切版本(如 3.11.0),如果它在该 channels 中存在的话。首先,打开终端,在命令行中激活你想升级 Python 版本的虚拟环境。原创 2024-07-28 08:56:35 · 4560 阅读 · 0 评论 -
tf处理序列常用函数
是 TensorFlow 中的一个函数,用于找出一个张量中所有的唯一元素,并且返回它们的索引。该函数会返回两个张量:第一个包含了输入张量中的唯一元素,第二个包含了原始输入张量中每个元素在唯一元素张量中的索引。输出张量的长度是输入张量的最大值加1。是 TensorFlow 中的一个函数,用于逐元素比较两个张量,并返回一个布尔张量,该张量的每个元素表示第一个输入张量中的元素是否大于第二个输入张量中对应的元素。返回的是一个一维张量,因为它从输入张量中抽取了所有被选中的元素,并将它们平铺在了一个新的一维张量中。原创 2024-06-10 21:22:43 · 1264 阅读 · 0 评论 -
python clear和clear()
不带括号的情况,它没有执行任何操作,只是引用了方法对象。这在实际代码中通常不会直接使用,除非你有特殊的理由将方法作为一个第一级对象传递给其他函数或保存为变量。是一个方法属性,代表着一个清除容器内容的方法对象,但它没有被调用执行。调用clear,什么了一个方法,原来的值并没有改变。调用clear对象,引用对象也会被删除。另外赋值,将代码地址空间引入到其他地方。方法,作用是实际清除容器中的内容。是一个调用操作,表示执行。原创 2024-05-18 21:28:19 · 849 阅读 · 0 评论 -
tf输出tf.variable_scope作用域的变量名
对于TensorFlow 1.x和2.x,总体上的使用逻辑类似,但语法和API有所差异。,这是用来标示这是变量的第一个引用。在TensorFlow中,你可以有同名的多个变量引用,编号标示它们的不同。内创建变量时,所有变量的名称都会带有这个作用域的前缀。如果你需要获取特定作用域下所有变量的名称,你可以使用。已经不再使用,所以对于变量和模型组件的命名和组织,应优先使用。在TensorFlow 1.x中,当你在一个特定的。函数,并且筛选出名称以这个特定作用域为前缀的变量。在TensorFlow 2.x中,由于。原创 2024-05-18 21:27:47 · 255 阅读 · 0 评论 -
pandas apply多线程实现
目录一、多线程化选择二、并行化思想三、多线程化应用参考网址一、多线程化选择 并行化一个代码有两大选择:multithread 和 multiprocess。 Multithread,多线程,同一个进程(process)可以开启多个线程执行计算。每个线程代表了一个 CPU 核心,这么多线程可以访问同样的内存地址(所谓共享内存),实现了线程之间的通讯,算是最简单的并行模型。 Multiprocess,多进程,则相当于同时开启多个 Python 解释器,每个解...原创 2020-07-18 23:09:02 · 8301 阅读 · 0 评论 -
置信度学习
1、置信度学习置信度学习CL流程(图1)是用于表征,发现和学习带有标签错误的一系列理论和算法,该算法使用预测的概率和嘈杂的标签对未归一化的置信关节中的样本进行计数,然后归一化以估计联合分配,修剪噪音数据,生成干净的数据作为输出。...原创 2020-08-23 21:27:00 · 4278 阅读 · 0 评论 -
Pandas简单学习-1读取数据及其相关属性
一、读取数据及其相关属性1.使用pandas的reed_csv()来读取csv文件import pandasinfo=pandas.read_csv('data/shop_info.csv')print type(info)<class 'pandas.core.frame.DataFrame'> 2.使用函数head( m )来读取前m条数据,如果没有参数m,默认读取前五条数据pri...原创 2018-04-26 16:18:44 · 1059 阅读 · 0 评论 -
pandas基本操作
1、pd.merge合并时后缀设置pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,left_index=False, right_index=False, sort=True,suffixes=('_x', '_y'), copy=True, indicator=False)https://blog.youkuaiyun.com/qq_38923076/article/details/83017310(可参考.原创 2020-11-25 15:39:33 · 110 阅读 · 0 评论 -
pandas数据操作
https://www.cnblogs.com/nxf-rabbit75/p/10105271.html(取出某行某列)https://www.cnblogs.com/-wenli/p/10274932.html(数据预处理,统计,不缺值)原创 2020-09-13 21:55:49 · 118 阅读 · 0 评论 -
主动学习
1、为什么要提出主动学习 减少标注的代价,快速提高模型的判别能力参考https://zhuanlan.zhihu.com/p/39367595(主要讲了主动学习英应用的场景和常见的策略,常见的策略讲的较为粗略)https://www.zhihu.com/question/265479171(主动学习的方法详细介绍)https://www.sohu.com/a/228466371_99940985(主动学习与半监督算法结合在支付宝风控的应用)https://www.rc...原创 2020-09-28 18:27:02 · 317 阅读 · 0 评论 -
python pandas实现下采样
参考网址:pandas sample解释网址:https://blog.youkuaiyun.com/shiheyingzhe/article/details/81835821import numpy as npimport pandas as pd #通过numpy随机选取多数样本的采样下标def lower_sample_data(df, percent=1): ''' ...原创 2019-03-31 21:18:08 · 7383 阅读 · 1 评论 -
使用anaconda虚拟环境运行Jupyter Notebook
1、anaconda兼容多个环境1.1、创建环境利用conda创建一个python2.7的环境conda create --name python27 python=2.7运行完成后,在原来的anaconda3目录会下生成/envs/python27的目录1.2、激活环境现有环境是python3.6,想要切换python2.7,使用如下命令即可source activate python271.3、在环境中安装包比如需要安装skearnpip install原创 2021-10-08 22:07:35 · 1592 阅读 · 0 评论 -
安装tensorflow1.12出现illegal hardware instruction python错误
1、问题通过pip install tensorflow==1.12安装tensorflow1.12后,执行import tensorflow as tf报如下错误illegal hardware instruction python2、定位问题安装的tensorflow和所依赖的环境不太匹配,很多建议说降低tensorflow的版本就可以了。与此同时,鄙人确实需要安装tensorflow1.4;在同样的环境下,执行import tensorflow as tf;运行正常。可以肯定确.原创 2021-04-17 11:51:36 · 6968 阅读 · 1 评论 -
anaconda出现AttributeError: dlsym(RTLD_DEFAULT, AbsoluteToNanoseconds): symbol not found
1、问题描述安装anaconda,测试conda时,出现AttributeError: dlsym(RTLD_DEFAULT, AbsoluteToNanoseconds): symbol not found错误2、问题定位mac系统版本为11.2.3;目前anaconda还不支持。这是macOS Big Sur 11.0.1系统新增的功能,它带有所有系统提供的库的内置动态链接器缓存。 作为此更改的一部分,文件系统上不再存在动态库的副本。 试图通过在路径中查找文件或枚举目录来检查动态库是否.原创 2021-04-17 11:36:45 · 4234 阅读 · 2 评论 -
python list,set,dict时间复杂度
较全且详细的python list,set,dict时间复杂度解释参考网址https://pyocean.com/post/2019_09_02_python%E4%B8%8A%E7%9A%84%E6%97%B6%E9%97%B4%E5%A4%8D%E6%9D%82%E5%BA%A6/转载 2021-02-19 11:48:52 · 637 阅读 · 0 评论 -
python查看内存地址
1、查看python内存地址python 通过id查看内存地址eg:a=1print(id(a))#输出944866978432002、不可变量不可变对象是指对象的内存值不能被改变。Python中变量以引用的方式指向对象,如果变量引用了不可变对象,当改变该变量时,由于其所指的对象的值不能被改变,相当于把原来的值复制一份后再改变,这会开辟一个新的地址,变量再指向这个新的地址,即变量引用了新的对象。 数值类型(整数和浮点)、字符串str、元组tuple都是不可变类型。...原创 2021-02-13 17:28:39 · 6078 阅读 · 1 评论 -
查找python 安装路径的方法
1、进入python命令行,输入python2、导入sys,输入import sys3、查看python安装路径,输入sys.path原创 2020-12-31 22:44:46 · 887 阅读 · 0 评论 -
np的reshape函数
1、np.shape函数np.reshape(a, newshape, order='C')a:Array to be reshaped.newshape:int or tuple of intsorder:{'C', 'F', 'A'}, optional2、实例np.arange(6)值:array([0, 1, 2, 3, 4, 5])a = np.arange(6).reshape((3, 2))将a转化为3*2的形状array([[0, 1], ...原创 2020-09-27 10:37:06 · 23485 阅读 · 0 评论 -
jupyter python 绘图中文设置
1、问题python绘图时,中文无法显示在网上找了很多教程,很多都说加这3行代码即可解import matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus']=False本人加了这3行代码,绘图仍无法显示:2、通过如下脚本看看anaconda下的fond配置from matplotlib.font_manager import _rebui原创 2020-09-14 00:40:08 · 3794 阅读 · 3 评论 -
python绘图
https://blog.youkuaiyun.com/hohaizx/article/details/79101322 (绘制条形图)https://blog.youkuaiyun.com/qq_29721419/article/details/71638912(条形图绘制)原创 2020-09-13 21:56:52 · 137 阅读 · 0 评论 -
python字符串格式时间转化为时间戳
1、问题:在服务请求记录时间时,往往是毫秒级的,在秒上计数会有小数点,例如dt='2020-09-09 15:03:56.742'time.strptime支持的几种数字类型如下;decimal鄙人觉得应该支持浮点数;尝试format_string="%Y-%m-%d %H:%M:%S" 直接解析,无奈报错了;时间转化代码如下import time#将时间字符串转换为10位时间戳,时间字符串默认为2017-10-01 13:37:04格式def date_to_times..原创 2020-09-13 20:15:34 · 9790 阅读 · 0 评论 -
python堆实现 heapq
1、堆的定义 堆的定义:堆分为两种,大根堆和小根堆是一颗每一个节点的键值都不小于(大于)其孩子节点的键值的树。无论是大根堆还是小根堆(前提是二叉堆)都可以看成是一颗完全二叉树。2、python heapq模块heapq相关函数:'heapify':将一个列表转化为堆 (Transform list into a heap)'heappop':pop最小的item,保持堆不变(Pop the smallest item off the heap, maintaining the ..原创 2020-07-15 00:17:05 · 389 阅读 · 0 评论 -
python lambda,filter,字典排序简单应用
对于一个字典的简单排序lambda:在lambda后面直接跟变量,变量后面是冒号,冒号后面是表达式,表达式计算结果就是本函数的返回值,形式如下:lambda arg1, arg2, ...argN : expression using argumentsfilter:filter的中文含义是“过滤器”,在Python中,它起到了过滤器的作用,形式如下:filter(function...原创 2018-10-17 21:51:22 · 3435 阅读 · 0 评论 -
python实现判断0-100的数是否为质数
python实现判断0-100的数是否为质数# -*- coding: utf-8 -*-import mathdef is_prime(n): '''判断一个数是不是质数''' for i in range(2,int(math.sqrt(n))+1): if(n%i==0): return False return Tr...原创 2018-10-17 22:01:32 · 2488 阅读 · 0 评论 -
python类相关,super调用父类被重写的方法
python类相关,super调用父类被重写的方法简单的小实例:# -*- coding: utf-8 -*-class Person: def __init__(self,name): self.name=name self.email="frosttry@gmail.com" def f(self): print("P...原创 2018-10-18 22:26:22 · 1120 阅读 · 0 评论 -
python 静态方法和类方法
简单小实例# -*- coding: utf-8 -*-''' 静态方法和类方法 通过@指定 (1)@staticmethod表示下面的方法是静态方法。 (2)@classmethod表示下面的方法是类方法。 如果没有self,无法访问实例变量、类和实例的属性了,因为它们都是借助self来传递数据的 静态方法没有self属性 类方法...原创 2018-10-19 11:44:50 · 320 阅读 · 0 评论 -
python中多态简单介绍
# -*- coding: utf-8 -*-"""多态是指相同的信息发给不同的对象会引发不同的动作"""class A: def __init__(self,name=""): self.name=name def show(self): print("A show ", self.name)class A1(A): def...原创 2018-10-25 14:49:56 · 308 阅读 · 1 评论 -
python封装与私有化简单介绍
# -*- coding: utf-8 -*-"""封装(Encapsulation)是对对象(object)的一种抽象,即将某些部分隐藏起来,在程序外部看不到,无法调用封装离不开私有化,私有化是指将某个对象限定在某个自己认定的范围内私有化的方法:将准备私有化的属性对象前面加双下划线"""class Encap: def __init__(self,name,age): ...原创 2018-10-25 14:56:37 · 456 阅读 · 0 评论 -
python实例属性,类属性,特殊属性的使用,及属性访问的顺序简单介绍
# -*- coding: utf-8 -*-"""实例属性,类属性,特殊属性的使用,及属性访问的顺序"""class Rec: def __init__(self): self.w=0 self.h=0 def setSize(self,size): self.w,self.h=size def getSize(...原创 2018-10-25 15:01:32 · 518 阅读 · 0 评论 -
python中迭代器和生成器的简单介绍
# -*- coding: utf-8 -*-"""迭代器和生成器迭代器:类型list、tuple、file、dict的对象有__iter__()方法,标志着它们能够迭代用__iter__()方法生成迭代对象,然后用__next__()方法访问生成器:是迭代器,__iter__()和next();针对大数据的时候,Python处理列表时,将全部数据都读入到内存,而迭代器(生成器是迭...原创 2018-10-25 15:06:05 · 324 阅读 · 0 评论 -
python中错误和异常简单介绍--------try except else finally
# -*- coding: utf-8 -*-"""try except else finallytry:尝试执行语句except:try执行的语句抛出异常else:如果执行try语句,则执行else语句。执行except语句不执行else中的语句finally:不管执行try还是else都会执行finally中的语句"""class Cal: def f(self,...原创 2018-10-25 15:11:09 · 366 阅读 · 0 评论 -
python实现解一元二次方程
python实现一元二次方程的求解要考虑的点:1、二元方程组a=0的情况2、判别式是否大于03、当有复数解时如何表示程序块:# -*- coding: utf-8 -*-import mathdef root_of_square(a,b,c): '''solve the quadratic equation''' discr=pow(b,2)-4*...原创 2018-10-17 21:00:51 · 14149 阅读 · 0 评论