python基础
起飞并不晚
python:数据挖掘,图像处理,深度学习
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python中return语法
def testReturn(x): if x > 10000: return print "test return!!" #这句话永远不会得到执行 elif x > 1000: return 100 elif x > 100: return 10 e...原创 2019-12-26 22:55:10 · 428 阅读 · 0 评论 -
python3 换源
1.原因pip是很强大的模块安装工具,但是由于国外官方pypi经常被墙,导致不可用。所以我们最好是更换pip源,这样就能解决被墙导致的装不上库的问题。2.可用源网上有很多可用的源:豆瓣:http://pypi.douban.com/simple/清华:https://pypi.tuna.tsinghua.edu.cn/simple清华大学的pip源,它是官网pypi的镜...原创 2018-08-09 11:10:12 · 3905 阅读 · 0 评论 -
scrapy写爬虫是出现no module named win32api错误
scrapy写爬虫是出现no module named win32api错误windows下利用scrapy(python2.7)写爬虫,运行 scrapy crawl dmoz 命令时提示:exceptions.ImportError: No module named win32api 插个话题,这里还需要注意的是你需要到你所创建的爬虫项目目录下运行以上命令,比如你创建了 scrap...原创 2018-08-09 11:13:38 · 313 阅读 · 0 评论 -
两个版本的Python安装库的方法
两个版本的Python安装库:1.python3:python3 -m pip install xxxx2.python2python2 -m pip install xxx原创 2018-08-01 13:37:17 · 3193 阅读 · 0 评论 -
window系统之mongoDB安装,启动及如何设置为windows服务(总结)
一: 下载 上MongoDB官网 ,下载适合的自己电脑系统相对应的版本,安装到合适的位置。我这里下载的为:安装之后我就放到”D盘“,改下文件夹名字为”mongodb“(data,etc,logs三个文件夹为后面自己创建的,稍后说明)。 二:开启服务与关闭 创建数据库目录D:\mongodb\data,接下来打开cmd命令行窗口,切换到D:\mongodb...原创 2018-08-14 12:52:01 · 244 阅读 · 0 评论 -
MongoDB在Windows系统下的安装和启动
版本选择MongoDB的版本命名规范如:x.y.z;y为奇数时表示当前版本为开发版,如:2.3.0、2.1.1; y为偶数时表示当前版本为稳定版,如:2.0.1、2.2.0;目前官网上最新的版本为3.4.6平台选择生产环境使用32位机器的数据限制2G,在64位机器上坚决要使用64位版本,可以获得更大的内存映射空间,提升MongoDB的性能; 至于操作系统,MongoDB是跨平台的,...原创 2018-08-14 12:53:21 · 183 阅读 · 0 评论 -
Python的LXML(附安装步骤)
如题,在安装LXML时,需在网址https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml中下载LXML文件,发现版本很多。尝试多次发现文件名“lxml‑4.2.1‑cp37‑cp37m‑win32.whl”中:“lxml‑4.2.1”为LXML版本号“cp37‑cp37m”为对应的python版本号,如本人安装的python版本号为Python 3....原创 2018-08-03 09:11:25 · 3670 阅读 · 0 评论 -
scrapy用pipelines输出中文到json文件,能取到数据,但是json文件中是空的
items.pypipelines.pysettings.py下面是取到的数据和json文件拜托各位大神帮忙看一下,谢谢!问题我找到了,在第一张图片def parse()方法最后加上yield item 就能写入了。...原创 2018-08-13 10:31:05 · 1640 阅读 · 4 评论 -
Python爬虫环境常用库安装
1:urllib urllib.request这两个库是python自带的库,不需要重新安装,在python中输入如下代码:import urllibimport urllib.requestresponse=urllib.request.urlopen("http://www.baidu.com")print(response)1 2 3 4返回结果为HTTPResp...原创 2018-08-16 10:28:07 · 1369 阅读 · 0 评论 -
Xpath string()提取多个子节点中的文本
<div> <ul class="show"> <li>275万购昌平邻铁三居 总价20万买一居</li> <li>00万内购五环三居 140万安家东三环</li> <li>北京首现零首付楼盘 53万购东5环50平</li&原创 2018-08-16 15:01:01 · 492 阅读 · 0 评论 -
Python中使用Beautiful Soup库的超详细教程
1. Beautiful Soup的简介https://www.jb51.net/article/65287.htm简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下: Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因...原创 2018-08-22 09:10:29 · 78577 阅读 · 6 评论 -
使用BeautifulSoup中的find()和findAll()函数时关键字参数的注意事项
BeautifulSoup是Python里最受欢迎的HTML解析库之一。它可以提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。find()和findAll()在BeautifulSoup中的定义为:findAll(tag, attributes, ...原创 2018-08-23 14:07:32 · 1517 阅读 · 0 评论 -
【已解决】stop: Rejected send message
ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: NO) Red Hat Enterprise Linux 5服务器上mysql启动报错:ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using pass...原创 2018-08-23 21:02:25 · 1258 阅读 · 0 评论 -
ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) 解决
Linux环境解决Mysql权限不足以下方法亲测好使,鉴于版本的多样性,如果解决不了,请百度, Linux 环境相关的解决 Mysql 权限不足还是很多文章的。 方法操作很简单,如下: # /etc/init.d/MySQL stop # mysqld_safe --user=mysql --skip-grant-tables --skip-networking &am...原创 2018-08-23 21:05:45 · 10337 阅读 · 0 评论 -
【底层原理】Unicode与UTF-8的区别
要弄清Unicode与UTF-8的关系,我们还得从他们的来源说起,下来我们从刚开始的编码说起,直到Unicode的出现,我们就会感觉到他们之间的关系 ASCII码 我们都知道,在计算机的世界里,信息的表示方式只有0和1,但是我们人类信息表示的方式却与之大不相同,很多时候是用语言文字、图像、声音等传递信息的。那么我们怎样将其转化为二进制存储到计算机中,这个过程我们称之为编码。更...原创 2018-08-31 09:59:45 · 1443 阅读 · 0 评论 -
(.*?)匹配的是什么
点代表的是任意字符。* 代表的是取 0 至 无限长度问号代表的是非贪婪模式。三个链接在一起是取尽量少的任意字符,一般不会这么单独写。原创 2018-07-31 10:21:01 · 4713 阅读 · 0 评论 -
Python3相对于Python2对于编码的支持有了很大的提升,默认全局采用utf-8编码
Python3相对于Python2对于编码的支持有了很大的提升,默认全局采用utf-8编码原创 2018-07-27 13:53:50 · 489 阅读 · 0 评论 -
beautifulsoup提取所有<a>标签内容 Python
# -*- coding:utf-8 -*-#python 2.7#XiaoDeng#http://tieba.baidu.com/p/2460150866#标签操作from bs4 import BeautifulSoupimport urllib.requestimport re#如果是网址,可以用这个办法来读取网页#html_doc = "http://tieba...原创 2018-07-30 15:45:46 · 21492 阅读 · 1 评论 -
python3编码问题汇总
这两天写了个监测网页的爬虫,作用是跟踪一个网页的变化,但运行了一晚出现了一个问题。。。。希望大家不吝赐教!我用的是python3,错误在对html response的decode时抛出,代码原样为:? 1 2 response = urllib.urlopen(dsturl) content = response.read().decode('...转载 2018-07-23 11:20:09 · 3084 阅读 · 0 评论 -
安装两个不同版本的python注意点
安装两个不同版本的python注意点:1.在cmd中检查时:需指出 python版本 比如python3.原创 2018-07-23 14:26:01 · 1099 阅读 · 0 评论 -
生成器
4. 生成器(generator)4.1. 生成器简介首先请确信,生成器就是一种迭代器。生成器拥有next方法并且行为与迭代器完全相同,这意味着生成器也可以用于Python的for循环中。另外,对于生成器的特殊语法支持使得编写一个生成器比自定义一个常规的迭代器要简单不少,所以生成器也是最常用到的特性之一。从Python 2.5开始,[PEP 342:通过增强生成器实现协同程序]的实现为...转载 2018-07-17 16:28:12 · 445 阅读 · 0 评论 -
py编码
一什么是编码?基本概念很简单。首先,我们从一段信息即消息说起,消息以人类可以理解,易懂的表示存在。我打算将这种表示称为“明文”(纯文本)。对于说英语的人,纸张上打印的或屏幕上显示的英文单词都算作明文。其次,我们需要能将明文表示的消息转成另外某种表示,我们还需要能将编码文本转回成明文,从明文到编码文本的转换称为“编码”,从编码文本又转回成明文则为“解码”。编码问题是个大问题,如果不...转载 2018-07-16 12:45:47 · 818 阅读 · 0 评论 -
Python内置函数
(1)ABS(),绝对值或复数的模1打印(abs(-6))#>>>> 6(2)所有()接受一个迭代器,如果迭代器的所有元素都为真,那么返回真,否则返回假1打印(全部([1,0,3,6]))#>>>>错误(3)任何()接受一个迭代器,如果迭代器里有一个元素为真,那么返回真,否则返回假1打印(任何([0,0,0,[]]))#&g...转载 2018-07-16 12:45:38 · 420 阅读 · 0 评论 -
python基础知识刷题
1,执行Python脚本的两种方式 1 2 3 4 五 交互方式:命令行 Windows操作系统下,快捷键cmd,输入“python”启动交互式python解释器。 文件方式:python文件 2,简述位,字节的关系 1 2 3 4...转载 2018-07-16 12:45:29 · 16258 阅读 · 0 评论 -
python内置了一系列的常用函数
一。简介 蟒蛇内置了一系列的常用函数,以便于我们使用,蟒蛇英文官方文档详细说明:点击查看,为了方便查看,将内置函数的总结记录下来。 二。使用说明 以下是Python3版本所有的内置函数:1. abs()获取绝对值1 >>> abs(-10 ) 2 10 3 >>> abs(10 ) 4 10 5 >&...转载 2018-07-16 12:45:08 · 262 阅读 · 0 评论 -
多版本Python共存的配置方法
同一台PC中,如果同时安装Python2和Python3环境,会在执行python命令时出现错误,操作系统会找到默认的配置进行执行。怎么样才能让python2和python3一起工作又互相不影响呢。但是由于工作需要,我们的个人PC上可能需要多个python版本共存,应该进行什么样的设置呢,本章内容就针对这个问题进行分析和使用的介绍1.python2和python3版本共存的配置 进入pyt...转载 2018-07-20 15:14:36 · 266 阅读 · 0 评论 -
python字符串内置函数
1、字符串定义:它是一个有序的字符的集合,用于存储和表示基本的文本信息,‘’或“”或‘’‘ ’‘’中间包含的内容称之为字符串特性:1.只能存放一个值2.不可变3.按照从左到右的顺序定义字符集合,下标从0开始顺序访问,有序补充: 1.字符串的单引号和双引号都无法取消特殊字符的含义,如果想让引号内所有字符均取消特殊意义,在引号前面加r,如name=r'l\thf' 2.unicode字符串与r连用...转载 2018-07-16 09:32:04 · 969 阅读 · 0 评论 -
python内置函数部分总结
1,find()检测字符串用法格式:str1.find(str2) #在str1中 检索字符串str2是否存在,存在,返回str2的初地址,不存在,返回-1. str1.find(str2,x)#x是表示下标的变量,意为:从下标为x的位置开始检索str2是否存在于str1中. str.find(str2,x,y)#y表示下标整型变量, 意为:从下标x开始,检测到下标y...转载 2018-07-16 09:33:22 · 197 阅读 · 0 评论 -
Python关键字和内置函数介绍
32个关键字1)和:逻辑与2):为导入的模块取一个别名,在python2.6的中新增3)断言:断言,在Python1.5中新增4)断裂:用在循环语句,跳转到语句块的末尾5)类:用来定义一个类6)继续:和突破相对应,跳到语句块的开头7)DEF:用来定义一个函数或方法8)德尔:删除9)elif:全称是其他如果10)其他:另外,用在如果语句的多判断中11)除了:异常处理12)EXEC:内置函数,执行以字...转载 2018-07-16 10:08:11 · 330 阅读 · 0 评论 -
爬虫注意点1
wb_data=requests.get(url,headers=headers)soup=BeautifulSoup(wb_data.text,"html.parser") html=get_html(url)soup=BeautifulSoup(html,'html.parser')原创 2018-07-30 14:48:28 · 444 阅读 · 0 评论 -
requests使用方法简介
迫不及待了吗?本页内容为如何入门 Requests 提供了很好的指引。其假设你已经安装了 Requests。如果还没有,去安装一节看看吧。首先,确认一下:Requests 已安装 Requests 是最新的让我们从一些简单的示例开始吧。发送请求使用 Requests 发送网络请求非常简单。一开始要导入 Requests 模块:>>> import r...原创 2018-07-30 15:33:13 · 2588 阅读 · 0 评论 -
Python - 通过requests实现腾讯新闻抓取爬虫(注意这里没有zip内置函数。需要对比理解)
最近也是学习了一些爬虫方面的知识。以我自己的理解,通常我们用浏览器查看网页时,是通过浏览器向服务器发送请求,然后服务器响应以后返回一些代码数据,再经过浏览器解析后呈现出来。而爬虫则是通过程序向服务器发送请求,并且将服务器返回的信息,通过一些处理后,就能得到我们想要的数据了。以下是前段时间我用python写的一个爬取TX新闻标题及其网址的一个简单爬虫:首先需要用到python中request...原创 2018-07-30 15:43:42 · 560 阅读 · 0 评论 -
Python基础-字符编码与转码
Python全栈开发之Python基础-字符编码与转码详细文章:http://www.cnblogs.com/yuanchenqi/articles/5956943.htmlhttp://www.diveintopython3.net/strings.html需知:1.在python2默认编码是ASCII, python3里默认是utf-82.unicode 分为 utf...转载 2018-07-23 11:03:13 · 289 阅读 · 0 评论
分享