- 博客(33)
- 收藏
- 关注
原创 Mac下安装spark,并配置pycharm-pyspark完整教程
最近在学spark,先学习在Mac上安装spark,然后由于本人经常用Python,所以还要配置一下pyspark+pycharm,网上的教程大多不全,现将本人搭建的完整过程分享如下。参考:https://www.cnblogs.com/ostrich-sunshine/p/8414677.htmlhttps://www.jianshu.com/p/31c7f6a5fc7ehttp...
2019-08-21 14:33:13
10204
9
转载 pandas 根据列的值选取所有行
选取等于某些值的行记录 用 ==df.loc[df[‘column_name’] == some_value]选取某列是否是某一类型的数值 用 isindf.loc[df[‘column_name’].isin(some_values)]多种条件的选取 用 &df.loc[(df[‘column’] == some_value) & df[‘other_column...
2019-08-12 14:43:40
357
转载 Pandas的Apply函数理解
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 import pandas as pd import datetime #用来计算日期差的包...
2019-08-06 17:13:43
632
原创 python----最长回文子串的暴力解法以及动态规划解法
https://blog.youkuaiyun.com/haoshan4783/article/details/88714499第一种:暴力解法,双重循环,o(n^2)def longestPalindString(ss): palindString="" max_len=0 if len(ss)==1: return ss for i in ra...
2019-08-06 17:11:30
423
转载 python -- lambda表达式
lambda表达式,通常是在需要一个函数,但是又不想费神去命名一个函数的场合下使用,也就是指匿名函数。lambda所表示的匿名函数的内容应该是很简单的,如果复杂的话,干脆就重新定义一个函数了,使用lambda就有点过于执拗了。lambda就是用来定义一个匿名函数的,如果还要给他绑定一个名字的话,就会显得有点画蛇添足,通常是直接使用lambda函数。如下所示:add = lambda ...
2019-08-06 17:03:08
136
转载 pandas中关于set_index和reset_index的用法
1.set_indexDataFrame可以通过set_index方法,可以设置单索引和复合索引。DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)append添加新索引,drop为False,inplace为True时,索引将会还原为列2...
2019-08-06 16:39:22
399
原创 pandas数据显示不完全的问题
利用set_option进行设置# 显示所有列(参数设置为None代表显示所有行,也可以自行设置数字)pd.set_option('display.max_columns',None)# 显示所有行pd.set_option('display.max_rows',None)# 设置数据的显示长度,默认为50pd.set_option('max_colwidth',200)...
2019-08-06 10:43:09
1958
原创 python中pandas读取文件有中文路径怎么办
df1 = pd.read_csv("D:/消费数据/2.csv",'rb') print(df1) 后面加上‘rb’。
2019-08-06 10:38:19
1515
原创 module 'sklearn' has no attribute 'linear_model'
以下导入方式会报错import sklearnmodel = sklearn.linear_model.LinearRegression()修改导入,引用方式,如下所示即可
2019-08-05 17:04:50
3236
转载 使用PolynomialFeatures来进行特征的构造
使用sklearn.preprocessing.PolynomialFeatures来进行特征的构造。它是使用多项式的方法来进行的,如果有a,b两个特征,那么它的2次多项式为(1,a,b,a^2,ab, b^2),这个多项式的形式是使用poly的效果。PolynomialFeatures有三个参数degree:控制多项式的度interaction_only: 默认为False,如果...
2019-07-20 11:02:29
1470
原创 1021. 删除最外层的括号
有效括号字符串为空 ("")、"(" + A + ")" 或 A + B,其中 A 和 B 都是有效的括号字符串,+ 代表字符串的连接。例如,"","()","(())()" 和 "(()(()))" 都是有效的括号字符串。如果有效字符串 S 非空,且不存在将其拆分为 S = A+B 的方法,我们称其为原语(primitive),其中 A 和 B 都是非空有效括号字符串。给出一个非空有效字...
2019-07-09 17:43:30
164
原创 709. 转换成小写字母-Python
实现函数 ToLowerCase(),该函数接收一个字符串参数 str,并将该字符串中的大写字母转换成小写字母,之后返回新的字符串。示例 1:输入: "Hello"输出: "hello"示例 2:输入: "here"输出: "here"示例 3:输入: "LOVELY"输出: "lovely"python3代码:1、直接使用str的lower()函数...
2019-07-06 16:02:40
186
原创 938. 二叉搜索树的范围和
给定二叉搜索树的根结点 root,返回 L 和 R(含)之间的所有结点的值的和。二叉搜索树保证具有唯一的值。示例 1:输入:root = [10,5,15,3,7,null,18], L = 7, R = 15输出:32示例 2:输入:root = [10,5,15,3,7,13,18,1,null,6], L = 6, R = 10输出:23提示:...
2019-07-05 11:54:43
95
原创 182.查找重负的电子邮箱
编写一个 SQL 查询,查找 Person 表中所有重复的电子邮箱。示例:+----+---------+| Id | Email |+----+---------+| 1 | a@b.com || 2 | c@d.com || 3 | a@b.com |+----+---------+根据以上输入,你的查询应返回以下结果:+---------+| Emai...
2019-07-05 10:03:34
320
转载 复杂网络-4种网络模型
https://www.cnblogs.com/forstudy/archive/2012/03/20/2407954.html一. 规则图 规则图差不多是最没有复杂性的一类图,random_graphs.random_regular_graph(d, n)方法可以生成一个含有n个节点,每个节点有d个邻居节点的规则图。 下面一段示例代码,生成了包含20个节点、每个节点有3个邻...
2019-07-05 09:57:01
2202
转载 tensorflow载入数据的三种方式
转https://blog.youkuaiyun.com/lujiandong1/article/details/53376802
2018-04-23 21:22:08
189
原创 python3下使用cv2.imwrite存储图片名含有中文字符的图片
python3中直接用cv2.imwrite方法的话,在图片名中出现乱码,查资料,折腾了好久,发现如下解决方法。代码如下if i % frame_interval == 0: imagename = '{}_{}_{:0>6d}.jpg'.format(video_prefix, filename.split('.')[0], i) imagepath = os.sep.jo...
2018-04-11 15:21:26
11608
3
原创 TensorFlow各种问题整理
1、AttributeError: 'module' object has noattribute 'random_crop'将tf.scalar_summary(loss.op.name,loss)改为tf.summary.scalar(loss.op.name, loss)即可2、AttributeError: 'module' object has no attribute'per_imag...
2018-03-30 16:53:03
4051
1
转载 TensorFlow的reshape操作 tf.reshape
https://www.cnblogs.com/qggg/p/6836238.htmlTF-调整矩阵维度 tf.reshape 介绍函数原型为 def reshape(tensor, shape, name=None)第1个参数为被调整维度的张量。第2个参数为要调整为的形状。返回一个shape形状的新tensor注意shape里最多有一个维度的值可以填写为-1,表示自动计算此维度。很简单的函数,如...
2018-03-30 15:43:17
503
转载 数据库查询模糊匹配
执行数据库查询时,有完整查询和模糊查询之分。一般模糊语句格式如下:SELECT 字段 FROM 表 WHERE 某字段 LIKE 条件;12其中,关于条件,SQL提供了四种匹配模式:一、%:表示零个或多个字符。可以匹配任意类型和任意长度的字符,有些情况下若是中文,请使用两个百分号(%%)表示。select * from flow_user where username like '%王%';1...
2018-03-24 16:17:09
903
转载 NLP 深度学习 doc2vec
使用说明 http://www.cnblogs.com/Z-D-/p/6554563.html基于Word2Vec Doc2Vec 进行文本情感分类 http://blog.youkuaiyun.com/glory1234work2115/article/details/52454141基于gensim的Doc2Vec简析 http://blog.youkuaiyun.com/junjie20082008/article...
2018-03-24 16:16:02
305
转载 JAVA 交集,差集,并集
http://blog.youkuaiyun.com/benbenkui/article/details/6403383package test;import java.util.HashSet;import java.util.Set;public class Test { public static void main(String[] args) { Set<Integer&g...
2018-03-24 16:15:23
206
转载 Fisher's exact test( 费希尔精确检验)
http://blog.youkuaiyun.com/u011467621/article/details/47971909Fisher's exact test[1][2][3] is a statistical significance test used in the analysis ofcontingency tables. Although in practice it is employed w...
2018-03-15 19:58:48
38536
2
转载 朴素贝叶斯
http://www.cnblogs.com/marc01in/p/4775440.html引和师弟师妹聊天时经常提及,若有志于从事数据挖掘、机器学习方面的工作,在大学阶段就要把基础知识都带上。机器学习在大数据浪潮中逐渐展示她的魅力,其实《概率论》、《微积分》、《线性代数》、《运筹学》、《信息论》等几门课程算是前置课程,当然要转化为工程应用的话,编程技能也是需要的,而作为信息管理专...
2018-03-15 19:53:41
261
转载 一步步构建卷积神经网络
https://yq.aliyun.com/articles/178374?&utm_campaign=sys&utm_medium=market&utm_source=edm_email&msctype=email&mscareaid=cn&mscsiteid=cn&mscmsgid=2430117083100209225&
2018-03-15 19:53:02
747
转载 Excel/SPSS相关性及显著性水平分析
转载自 http://blog.youkuaiyun.com/liyanzhong/article/details/51145381 对两列数据的相关性以及显著性水平的问题一直有困扰,由于对excel的钟情,总是倾向于把数据分析放在excel中进行。本文简单分析excel和SPSS对相关分析和显著性水平的检验应用。(1)方法介绍 Excel中相关性系数可以直接调用CORREL或者Pearson(查看...
2018-03-15 19:48:50
40858
转载 5种常用的相关分析方法
转载自蓝鲸网站分析博客http://bluewhale.cc/2016-06-30/analysis-of-correlation.html5种常用的相关分析方法相关分析(Analysis of Correlation)是网站分析中经常使用的分析方法之一。通过对不同特征或数据间的关系进行分析,发现业务运营中的关键影响及驱动因素。并对业务的发展进行预测。本篇文章将介绍5种常用的分析方法。在开始介绍相...
2018-03-15 19:47:27
43205
1
转载 贝叶斯机器学习路线
https://www.cnblogs.com/bayesianML/p/6377588.html#belief_propagation这是一份贝叶斯机器学习路线图, 正在不断更新中. 路线图由简短的介绍配以相应的学习资源组成, 读者不一定要按顺序学习, 可以直接定位到自己需要的地方. 很多时候, 我们希望自学某个领域的知识, 学习能力是不差的, 但苦于不知该学哪些, 从何学起, 看什么...
2018-03-15 19:44:33
388
转载 核密度估计 Kernel Density Estimation(KDE)
http://blog.youkuaiyun.com/unixtch/article/details/78556499
2018-03-15 19:43:20
604
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人