
python
sorrythanku
这个作者很懒,什么都没留下…
展开
-
判断dataframe是否有重复行索引或列索引和drop_duplicates用法
data = pd.DataFrame(a,index=[“a”,“b”,“c”],columns=[“one”,“two”,“one”])判断列索引是不是重复print(data.index.is_unique)False#表示有重复判断列是不是有重复print(data.index.is_unique)False#表示有重复...原创 2018-11-20 23:56:24 · 10861 阅读 · 0 评论 -
6.Z字变换(python)
将一个给定字符串根据给定的行数,以从上往下、从左到右进行 Z 字形排列。比如输入字符串为 “LEETCODEISHIRING” 行数为 3 时,排列如下:L C I RE T O E S I I GE D H N之后,你的输出需要从左往右逐行读取,产生出一个新的字符串,比如:“LCIRETOESIIGEDHN”。请你实现这个将字符串进行指定行数...原创 2019-01-20 20:54:04 · 216 阅读 · 0 评论 -
7.整数反转(python)
给出一个 32 位的有符号整数,你需要将这个整数中每位上的数字进行反转。示例 1:输入: 123输出: 321示例 2:输入: -123输出: -321示例 3:输入: 120输出: 21注意:假设我们的环境只能存储得下 32 位的有符号整数,则其数值范围为 [−231, 231 − 1]。请根据这个假设,如果反转后整数溢出那么就返回 0。思路:这题用C++做的话,我当时...原创 2019-01-20 21:36:11 · 4819 阅读 · 0 评论 -
python中strip和lstrip和rstrip
strip指删除一个字符的前导和后缀字符情况1.如果strip()的参数为空,那么会默认删除字符串头和尾的空白字符(包括\n,\r,\t这些)。a="\rabbcd123\n"b=a.strip()print(b)abbcd123情况2.指定单个参数,会删除前导和后缀cca="cchdmccujcc"b=a.strip("c")print(b)hdmccuj情况3...原创 2019-01-20 22:02:32 · 668 阅读 · 2 评论 -
8.字符串转换整数(python)
请你来实现一个 atoi 函数,使其能将字符串转换成整数。首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。当我们寻找到的第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字组合起来,作为该整数的正负号;假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。该字符串除了有效的整数部分之后也可能会存在多余的字符,这些字符可以被忽...原创 2019-01-21 17:30:48 · 593 阅读 · 0 评论 -
9. 回文数(python)
判断一个整数是否是回文数。回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。示例 1:输入: 121输出: true示例 2:输入: -121输出: false解释: 从左向右读, 为 -121 。 从右向左读, 为 121- 。因此它不是一个回文数。示例 3:输入: 10输出: false解释: 从右向左读, 为 01 。因此它不是一个回文数。思路:一个简单的...原创 2019-01-21 17:53:02 · 3247 阅读 · 0 评论 -
皮尔森相关系数
作用如衡量国民收入和居民储蓄存款、身高和体重、高中成绩和高考成绩等变量间的线性相关关系。当两个变量都是正态连续变量,而且两者之间呈线性关系时,表现这两个变量之间相关程度用积差相关系数,主要有Pearson简单相关系数。表现强度相关系数的绝对值越大,相关性越强:相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。通常情况下通过以下取值范围判断变量的相关强度:相关系数 ...原创 2019-03-05 20:43:20 · 4058 阅读 · 0 评论 -
python中numpy.apply_along_axis()函数的用法
1.函数原型numpy.apply_along_axis(func, axis, arr, *args, **kwargs)2.作用:将arr数组的每一个元素经过func函数变换形成的一个新数组3.参数介绍:其中func,axis,arr是必选的func是我们写的一个函数axis表示函数func对arr是作用于行还是列arr便是我们要进行操作的数组了可选参数:*args, **k...原创 2018-11-07 21:41:15 · 27292 阅读 · 2 评论 -
tf.randm_normal和tf.constant
以下两个函数都是tf.Variable中initializer的主要参数,目的是为了生成张量,下面简要的说下。1.tf.random_normal他的函数如下,就是一个高斯分布即随机生成满足高斯分布的张量tf.random.normal(shape,mean=0.0,stddev=1.0,dtype=tf.float32,seed=None,name=None)shape:一个一维整数...原创 2018-10-10 11:01:24 · 335 阅读 · 0 评论 -
python链表所有操作详解
一.插入操作1.append操作把一个元素添加到链表的结尾a=[1,3,5,4,8,7]a.append(9)[1, 3, 5, 4, 8, 7, 9, 9]2.extend操作就是合并链表的操作a=[1,3,5,4,8,7]b=[5,6,8]a.extend(b)[1, 3, 5, 4, 8, 7, 9, 9, 5, 6, 8]3.insert操作就是元素插入指定位...原创 2019-03-07 23:01:41 · 2510 阅读 · 2 评论 -
python中的replace函数
replace函数可以把字符串里面的old字符串替换成new字符串,max参数指替换不超过max次replace(old,new,max)栗子:a="i love love love love you my love lxy"a.replace('love','want')Out[3]:'i want want want want you my want lxy'a.replac...原创 2019-04-03 16:49:31 · 12940 阅读 · 0 评论 -
1.两数之和(python)
题面:给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。示例:给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] = 2 + 7 = 9所以返回 [0, 1]思路:用ha...原创 2019-01-13 23:46:06 · 2292 阅读 · 0 评论 -
3. 无重复字符的最长子串(python)
给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。示例 1:输入: “abcabcbb”输出: 3解释: 因为无重复字符的最长子串是 “abc”,所以其长度为 3。示例 2:输入: “bbbbb”输出: 1解释: 因为无重复字符的最长子串是 “b”,所以其长度为 1。示例 3:输入: “pwwkew”输出: 3解释: 因为无重复字符的最长子串是 “wke”,所...原创 2019-01-18 11:31:45 · 346 阅读 · 0 评论 -
python中merge函数
merge函数用来合并下面我们看看长什么样子merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, valida...原创 2018-11-19 20:58:24 · 17152 阅读 · 2 评论 -
os库常用的几个
最近写word2vec顺便看了下os库,但是太多了就挑了几个常用的(其实是太菜了)os.cwd()获得当前工作目录,即当前python脚本的工作目录os.path.join(path,name)连接目录和文件名#path是路径,name是文件名这个用的比较多,可以与上面连用os.getenv()获得环境变量os.envion可以获取并修改环境变量os.system()运行shell或...原创 2018-10-26 00:00:27 · 718 阅读 · 0 评论 -
Python enumerate() 函数
enumerate(sequence, [start=0])sequernce是你的序列,start是开始的下标a=[1,2,3,4,5]list(enumerate(a))[(0, 1), (1, 2), (2, 3), (3, 4), (4, 5)]for i in enumerate(a): print(i) (0, 1)(1, 2)(2, 3)(3, 4)(4,...原创 2018-11-19 23:42:42 · 197 阅读 · 0 评论 -
降序查看缺失值情况
#这里不展示数据集了,下面显示数据集缺失最多的10个data.isnull().sum().sort_values(ascending=False).head(10)LotFrontage 486GarageYrBlt 159MasVnrArea 23BsmtHalfBath 2BsmtFullBath 2BsmtFinSF2 ...原创 2018-11-25 20:46:54 · 516 阅读 · 0 评论 -
pandas的get_dummies进行one-hot编码
pandas.get_dummies(data, prefix=None, prefix_sep=’_’, dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None)说下常用参数data:的话就是我们要处理的数据prefix:就是我们制定的前缀,columns:这是我们直接在原数据集上使用eg:da...原创 2018-11-24 23:06:12 · 208 阅读 · 0 评论 -
将一个series插入到一个dataframe任一一列中
例如我们将series1插入到df中#我们从一个dataframe中选取一列series1.series1=data.pop('day')#为df1添加一个列,第一个0我们可以改变选择你想插入的位置,第二个可以选择你想要的名字df.insert(0,'series1',series1)#对这一列赋值#df['series1']=series1...原创 2018-11-29 23:47:08 · 20948 阅读 · 0 评论 -
pandas的groupby
作用:groupby操作的是所有操作标签相同的数比如data.groupby(‘col1’)操作的是所有col1标签相同的行他们列相加例如下面一个dataframe A B C0 a 2 1021 b 8 982 a 1 1073 c 4 1044 a 3 1155 c 2 876 b 5 927 c 9 1...原创 2018-11-28 20:07:53 · 862 阅读 · 0 评论 -
对dataframe的行和列进行遍历和修改
首先先定一个这样的字典,然后我们用不同的方法对其遍历和修改字典dfdf=pd.DataFrame({"A":[1,2,3,4],"B":[5,6,7,8],"C":[1,1,1,1]}) A B C0 1 5 11 2 6 12 3 7 13 4 8 1i.遍历列1.ix函数(df.ix[条件,操作区域])df.ix[df.A>1,'B'...原创 2018-12-03 21:12:12 · 56706 阅读 · 5 评论 -
python中apply函数
函数原型DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds)1.该函数最有用的是第一个参数,这个参数是函数,相当于C/C++的函数指针。2.这个函数需要自己实现,函数的传入参数根据axis来定,比如axis = 1,就会把一行数据作为Series的数据结构传入给自己实...原创 2019-01-11 22:56:06 · 51196 阅读 · 5 评论 -
2.两数相加(pyhton)
题面:给出两个 非空 的链表用来表示两个非负的整数。其中,它们各自的位数是按照 逆序 的方式存储的,并且它们的每个节点只能存储 一位 数字。如果,我们将这两个数相加起来,则会返回一个新的链表来表示它们的和。您可以假设除了数字 0 之外,这两个数都不会以 0 开头。示例:输入:(2 -> 4 -> 3) + (5 -> 6 -> 4)输出:7 -> 0 -&...原创 2019-01-17 22:50:23 · 219 阅读 · 0 评论 -
python中的datatime.dt.day一系列
1998-10-19这种日期是datatime标准形式如果数据为1998/10/19或其他可以下面语句变为标准train_df['label'] = (train_df['repay_date'] - train_df['auditing_date']).dt.days2.下面这种类型的语句可以对操作后的datatime直接进行取数pandas.series.dt.daysdf[...原创 2019-06-11 21:19:40 · 13499 阅读 · 0 评论