
Python
一杯拿铁go
好记性不如烂笔头
展开
-
【php】基础用法
php语言的第一篇文章开始的感觉PHP语言跟shell脚本有些相似,另外跟html语言也比较像。一些区别:1,开始与结束:PHP代码的开始结束标志为:<?php *code*?>2,变量php变量的定义与python类似,不需要申明变量的类型,直接将数据赋值给变量即可。PHP的变量对大小敏感。变量的定义和使用的时候是以“$”开头,变量名的定义形式与C++一致。原创 2018-10-18 09:58:19 · 856 阅读 · 1 评论 -
matplotlib简单使用
0,基础部分一个figure可以有多个坐标。pyplot.subplots创建一个独立的坐标轴,来线上数据。plot函数将数据绘制到坐标轴上。两种风格的画图方式(OO-style和pyplot-style)#OO-style fig, ax = plt.subplots() # Create a figure containing a single axes. ax.plot([1, 2, 3, 4], [1, 4, 2, 3]) # Plot some data on the axes. ..原创 2021-09-29 17:07:45 · 238 阅读 · 0 评论 -
python3与2中的特异性记录
一,负数除以正数的值负数除以正整数的值为:-1+结果值。如下:>>> -15/60-1>>> -15/16-1>>> 15/160>>> -15/10-2原创 2020-05-19 10:57:37 · 240 阅读 · 0 评论 -
Python命令行输入多行代码
在命令行内输入多行python代码,在空一行之后按一下回车键,代码可自动执行需要用tab键来控制缩进原创 2020-04-21 15:47:55 · 4351 阅读 · 2 评论 -
【python】相对路径和绝对路径的使用
绝对路径:直接将文件在磁盘时所在的地址赋值给变量:user_path = {}user_path["WORK_DIR"] = "/data/home/zhbei/search-personword_offlao.net/"相对路径:是以当前执行脚本所在的目录来得到其地址,如:user_path = {}user_path["WORK_DIR"] = os.path.abspat...原创 2020-03-27 11:19:03 · 446 阅读 · 0 评论 -
使用python操作redis数据库
一,连接redis数据库:在Linux环境下:redis-cli -h host -p port -a password比如:redis-cli -h 172.16.15.2008 -p 6379 -a 4uM5ormgE3YsssssssiBZvDT2dRPybFh172.16.15.2008:6379>使用Python脚本的话:def conn_redis(...原创 2020-03-22 20:53:15 · 523 阅读 · 0 评论 -
1000瓶药水和10只老鼠的问题及其扩展
一,常规的问题问题背景:1000瓶药水,有一瓶有毒,小老鼠喝下去之后会在1小时死亡。问给你一小时你需要多少只老鼠才能检测出那瓶是毒药?分析问题:最优的方法是进制法去求解。因为时间是一个小时在喝下药水之后小老鼠的状态有生和死两种状态,对应着二进制中的0和1,因此可以用二进制的想法去求解。因为2^10=1024所以需要10只老鼠就可以检测出毒药。先给出解法步骤:解法:1,...原创 2019-10-13 12:02:49 · 4929 阅读 · 0 评论 -
【python】对文件的操作;判空、读写、拷贝
一,判空判断所给的文件是不是存在的,以免打开的时候发生错误。使用os库:import osos.path.isfile(filename)若文件不存在则返回空。判断文件夹是不是存在的os.path.exists(dirname)os库其他一些实用的方法:os.remove(filename): 删除filename文件;os.listdir(sourcedir)...原创 2018-12-15 12:26:26 · 942 阅读 · 0 评论 -
【python】在特征工程处理数据时遇到的坑
一,string中判断是否是纯英文要判断一个string中是否是纯英文,就使用了string.isalpha()函数来判断。但是在python3.6版本中当string为纯中文时函数isalpha()也会返回true。>>> a = "hello">>> a.isalpha()True>>> b = "你好啊"&g原创 2018-12-15 12:48:48 · 385 阅读 · 0 评论 -
【python】list多级排序
在python3的sorted中去掉了cmp参数,转而推荐“key+lambda”的方式来排序。如果需要对python的list进行多级排序。有如下的数据:list_num = [[12,3],[18,34],[18,10],[12,45],[18,10],[8,34]]需要从小到大的排序。先比较第一个数,如果第一个数相等的话比较第二个数。代码如下:#默认的sort函数会先对第...原创 2019-01-10 20:54:17 · 6950 阅读 · 3 评论 -
【python】python3多进程库multiprocessing的采坑记录
背景:想输入一个list,经过函数filter_noresult,判断该list中哪些数据是有结果哪些数据没结果,返回两个list。单进程执行的话,40w数据需要执行2小时。后来开了4个进程之后40w数据执行半小时就行。使用的是:from multiprocessing import Pool使用的是异步执行操作:pool.apply_async。主要用的是很简单的想法,先将4...原创 2019-03-29 14:45:05 · 1463 阅读 · 0 评论 -
【Python】简单爬虫---爬取流行歌曲
背景:因为业务需要,要爬取一些经典的流行歌曲,以前接触过爬虫这次正好应用下。先回顾下:爬虫会用到的Python库:requests库、htmlparser库、BS4库。1,爬虫的小知识requests库:get方法:r=requests.get(url);这样得到的r可以用如下的函数得到其中的信息:包含url,status_code,headers,encoding以及text、j...原创 2019-04-02 16:55:48 · 1459 阅读 · 0 评论 -
【python】对于try...except的用法
在编码中难免会遇到各种各样的问题,尤其是在对数据进行处理的时候会因为数据的各种问题而抛出异常,如果将数据舍弃太可以,所以数据都过一遍逻辑又太费时间。如果只是对出错的部分进行处理的话会很好的解决问题。Python中错误处理的语句是:try....except.....finally在有可能出错的代码前面加上try,然后捕获到错误之后,在except下处理,finally部分无论try会不...原创 2019-04-02 20:06:35 · 90959 阅读 · 4 评论 -
【python】Python与shell的交互
一,shell调用pythonshell调用python是比较简单的,直接在.sh脚本中输入执行命令即可,跟在linux环境下没有什么两样:加上“python”是具有软连接的;python filename.py二,Python调用shellPython根据版本的不同需要使用不同的Python库,Python2的话是使用"commands"的库,执行起来非常简单:exe...原创 2019-04-25 17:05:37 · 2720 阅读 · 0 评论 -
【python】python2出现的SyntaxError错误
当在Python 2.X文件中写中文注释或输出中文时候,经常会出现编译错误(在Python 3.X中没有这种错误。)SyntaxError: Non-ASCII character '\xe7' in file chec.py这是因为Python 2.X的默认编码文件是用ASCII码,如果想要编译通过,则只需要在文件开头加入一行代码将文件存成UTF-8格式。看到网上给的解决办法是再行...原创 2019-05-07 15:01:02 · 1427 阅读 · 1 评论 -
【Python】获取前几天的日期转成固定的格式
1,获取8天之前的数据代码如下:import timeimport datetimetoday = time.strftime("%Y-%m-%d", time.localtime()) /获取当前时间并转换成固定格式week_ago_time = (datetime.datetime.now() - datetime.timedelta(days=8)).strftime("...原创 2019-06-19 22:06:12 · 1394 阅读 · 0 评论 -
【Python练习题】将数据按照分数排序
有如下数据:垃圾袋 1497043 5.063276505358443抽纸 1064344 5.28969789617728水杯 1181517 5.5993742803056765水杯 1194451 9.164971781320457水杯 84793 4.089972381569897水杯 87067 8.169655974237727水杯 91113 4.429693750...原创 2019-08-15 11:36:53 · 1305 阅读 · 1 评论 -
部署线上服务--Python web框架tornado初体验
启动一个简单的服务:创建hello.py文件,在里面写入:#!/usr/bin/env python#-*-coding:utf-8import reimport osimport jsonimport timeimport numpy as npimport sysimport tornado.webimport tornado.ioloop#定义处理类型cla...原创 2019-08-17 13:59:17 · 656 阅读 · 1 评论 -
Python编码错误:UnicodeEncodeError: 'ascii' codec can't encode 的一些总结
对于Python处理文本数据的时候经常出现的就是编码错误了,烦不胜烦,编码出错时的错误提示为:UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-3: ordinal not in range(128)处理的方式有如下,摸索的情况:0,使用'iconv'命令将文件转换成utf-8格式ic...原创 2019-08-28 14:23:57 · 6209 阅读 · 1 评论 -
【python】在pycharm初次使用的时候出现错误:no python interpreter configured for the project
在pycharm初次使用的时候出现错误:no python interpreter configured for the project意思是说没有找到python解释器。那我们添加Python解释器即可。保存。原创 2017-07-03 10:32:52 · 4221 阅读 · 0 评论 -
【python】多线程之坑
由于性能需要。加上没有使用集群,因此在代码中使用了多线程,但是由于python中全局解释锁GIL的存在造成使用多线程的时候并不能起到作用,在使用threadpool时,设置线程数并不能起到作用。因此应该使用多进程才是正确的,使用multiprocessing库可以使用多进程的方式使用之。不过使用的时候要确保能异步执行的,先将数据分成n份,然后将线程再分成n个,每个线程执行一份数据,最后将结果合...原创 2018-11-29 01:23:20 · 3030 阅读 · 0 评论 -
【python】python3的包pymysql的坑
由于坚定的想坚持用python3,所以链接mysql的时候使用pymysql库,以下是遇到的坑:1,连接的时候port是一个数字不是字符串如下所示:mport pymysqlconn = pymysql.connect(host='127.0.0.1',port = 3306,user='root',passwd='root',db = 'mysql')如果写 port =...原创 2018-11-05 21:50:27 · 1275 阅读 · 0 评论 -
【python】统计文件中的字符串数目
统计文件中的字符一个txt文件中已知数据格式为:C4D/suC4D/max/AE统计每个字段出现的次数,比如C4D、maya原创 2017-11-02 14:10:43 · 12235 阅读 · 0 评论 -
【python】python中的print函数以及产生随机数据的方式
一直以来对于python语句中print函数的用法以及产生随机数的方法一直是一知半解,可是平时有经常用到它们,索性今天就整理一下。 一,产生随机数的方法 1,使用random模块:import random 使用random函数中的uniform(a,b)可以生成一个在a,b之间的浮点数:fl = random.uniform(2,8)flfl=6.398603973099546 注:a不原创 2017-10-06 20:11:29 · 804 阅读 · 0 评论 -
【python】练习题:去重排序以及列表推导式
python中的列表推导式和一个编程题:对文件中的数据去重以及根据规则排序原创 2017-10-11 20:55:41 · 1242 阅读 · 0 评论 -
pip install - PermissionError: [Errno 13] Permission denied
pip install - PermissionError: [Errno 13] Permission denied当运行Anaconda,安装sklearn的的时候出现这个错误CondaHTTPError: HTTP None Nonefor url <None>原创 2017-07-24 10:26:19 · 18192 阅读 · 0 评论 -
【python】Python安装pip出错:no matching distribution found for xxx
在安装完python之后,安装pip;打开cmd,然后使用cd命令进入到Python安装目录下的Scripts文件夹下,我的路径如下:C:\Python27\Scripts然后使用命令:easy_install pip; 来安装pip。出现如下界面表示pip安装成功:问题1:在安装成功了pip之后,使用命令安装包的时候: pip install sklearn 报错:...原创 2017-07-03 09:48:39 · 247073 阅读 · 17 评论 -
【python】Python中split函数的用法
一,查询Python中某些函数的用法当我们需要查询Python中某个函数的是什么意思时,可以通过下面步骤查询:1,进入python环境中,并引入要查询的包;#import2,查询该包下包含的函数;#dir3,查询函数;#help如我们要查询string包下的split函数的意思,可以这样:import stringdir(string)help(string.spl原创 2017-07-10 15:20:51 · 3511 阅读 · 0 评论 -
【Python】list数组赋值
list数组对于python带来了很大的方便,在数组中存入数据时不用有那么多的顾虑,但是对list数组赋值时要特别的注意,若是赋值不当很容易会改变原数组的值。1,对一维数组来说使用赋值符号会影响原数组如下代码:li_a=[2,3,4,6,8]li_c=li_ali_c[0]=11li_c[1]=11print(li_c)print(li_a)将一维数组li_a赋值给数组li_原创 2017-02-03 21:50:41 · 40941 阅读 · 0 评论 -
【Python】python对齐问题的总结
Python的对齐方式很重要,对齐方式决定了函数或者判断条件的作用域。def print_circle(matrix,up_hang,up_lie,down_hang,down_lie): result=[] if up_lie==down_hang and down_hang==down_lie: result.append(matrix[up_原创 2017-02-02 23:15:28 · 14803 阅读 · 0 评论 -
【python】生成笛卡尔积(交叉表)DataFrame和numpy
有文件A:,B:,希望通过A,B生成C: 就是笛卡尔积操作。 一,当数据在numpy数组中,数据为:A=['a','b','c','d']B=['1','2','3','4']其实方法一的思想很简单粗暴:A,B元素存储在list中,将A中每个元素复制len(B)次,然后将之与B进行行合并;得到的结果再与result列合并。最后输出result原创 2017-11-03 17:39:15 · 17370 阅读 · 2 评论 -
【机器学习】使用Hadoop Streaming来用Python代码完成MapReduce
介绍了,Hadoop Streaming原理 ,map-reduce的重点,最后通过Hadoop Streaming来处理经典的词频统计的问题,并给出了map和reduce阶段的代码。原创 2017-11-27 14:10:15 · 1186 阅读 · 0 评论 -
【python】python环境管理工具pipenv的使用
pipenv在使用过程中会生成一个虚拟环境,使用之是可以替代pip工具的。在该环境中会生成Pipfile文件,然后在移动到生成环境的时候,执行pipenv install 就可以将该环境下的库以及依赖库一下下来。...原创 2018-11-02 10:35:20 · 760 阅读 · 0 评论 -
shell/python 调用mysql
一,shell调用mysql坑:在shell执行mysql语句的时候密码一定要与“-p”写在一起:$MYSQL -h $HOST_NAME -u $USER -p"$PASSWORD" -e "${SHOWBASE}"分开写会出错。二,python调用mysql1,python2连接mysql:import MySQLdb#连接数据库conn = MySQLdb.con...原创 2018-09-25 17:27:26 · 979 阅读 · 0 评论 -
【python】子目录的调用
主要是论述Python中的调用父目录或者子目录的情况有如下图示:如上图所示在parent_dir目录中有一个py文件test.py和两个文件夹,两个文件夹中有各自有相关的文件。case1,调用父目录的文件;如在a.py文件中调用test.py文件。需要在在文件头部加入如下代码:import syssys.path.append(&quot;..&quot;)import test然后就可以在a.p...原创 2018-10-25 15:51:12 · 4220 阅读 · 0 评论 -
【python】启动一个http服务,两个机器之间数据交互
使用场景:想要在浏览器下查看某个机器下的目录文件;想使用wget临时的下载某个机器下的文件。首先在目标机器下使用python启动一个http服务:python -m SimpleHTTPServer ---------这样会启动一个端口为默认端口8000的HTTP服务。如果想要自己定义端口的话可以:python -m SimpleHTTPServer 8080 ----...原创 2018-10-11 20:30:58 · 2535 阅读 · 0 评论 -
Hadoop Streaming的使用
资料来源:https://zhuanlan.zhihu.com/p/34903460重点记录:mapper的角色:hadoop将用户提交的mapper可执行程序或脚本作为一个单独的进程加载起来,这个进程我们称之为mapper进程,hadoop不断地将文件片段转换为行,传递到我们的mapper进程中,mapper进程通过标准输入的方式一行一行地获取这些数据,然后设法将其转换为键值对,再通过标...原创 2018-08-26 16:14:20 · 1362 阅读 · 0 评论 -
【python】Anaconda的一些使用和调试
一,使用jupyter notebook新版本的Anaconda,不知为何在安装的时候目录下面没有jupyter notebook的按钮:方法:打开“cmd”,然后cd到需要查看ipynb文件的目录下面。输入“jupyter notebook”命令来打开即可。二,常用的一些命令1,"conda info --envs" 查看当前环境下创建了多少的python环境。...原创 2018-03-26 23:31:23 · 3973 阅读 · 0 评论 -
【机器学习】pyspark中RDD的若干操作
pyspark中RDD的若干操作原创 2017-11-28 10:49:03 · 13087 阅读 · 2 评论 -
【机器学习】pandas中Series和DataFrame
一,Series 1,Series的定义 Series类似于一个字典,可以通过index参数定义其“key”值。Series使用pandas.Series来定义。 如下所示:s = pd.Series([7, "Beijing", 2.17, -12345, "Happy"], index=["A", "B", "C", "D", "E"])print(s)结果为:A 7原创 2017-11-27 17:24:34 · 2131 阅读 · 0 评论