
python
文章平均质量分 69
Yvettre
Fighting!
展开
-
python2.x中使用中文的问题:#coding=utf-8
1. 举个栗子:打算把一个含有中文的长字符串写到txt文本中去,在定义它的时候就报错了。关键代码段如下:#coding = utf-8str_test = "这只是一个例子\nThis is an example"报错信息如下:SyntaxError: Non-ASCII character '\xe8' in file xx\xxxx.py on line xx, but ...原创 2018-03-09 12:03:41 · 4976 阅读 · 0 评论 -
Flask+uwsgi+Nginx的简易搭建(ubuntu)
1. Virtualenv这个其实不是必须的,但是每个项目都应该拥有专属的依赖而不受其他项目的影响,建议还是用一下比较好,具体可以看这里。需要注意的是,在ubuntu下的python2.7的执行文件是/usr/bin/python。创建一个项目文件名为myflask的文件夹,并在此目录下创建名为venv的虚拟环境,然后激活虚拟环境www@ubuntu:~/myflask$ sourc...原创 2018-07-15 15:06:49 · 1600 阅读 · 1 评论 -
python:virtualenv(Centos6.8)
1. 前言继安装好python2.7和pip2.7之后(安装方法可以戳这里),为了更好地在centos上区分python2.6和python2.7的使用,决定学习使用virtualenv,我真的不想再重装系统了=。=vitualenv是用于隔离python工程的packages等环境的,有时候不同的python工程所需的package的版本不同、甚至python版本不同(2.7和3等),这...原创 2018-06-19 11:06:31 · 1083 阅读 · 0 评论 -
Centos6.8:源码安装python2.7.14(和自带的python2.6共存)
1. 前言centos自带python2.6,由于yum指令是依赖python2.6的,为了确保yum的正常使用,千万不要升级python2.6或卸载python2.6,只需要安装python2.7,让它们俩共存就好,使用的时候用python2.7来加以区分。选择源码安装方式,因为全网能搜到的安装方式都是源码安装,我也很绝望啊,虽然有rpm包但不是官方的我很慌啊,什么时候能yum inst...原创 2018-06-19 10:48:35 · 1116 阅读 · 0 评论 -
python:heapq模块对嵌套字典或二维列表取topN
1. 对一维列表或非嵌套字典取topN直接调用python自带的heapq模块就可以了:>>> import heapq>>> a_list = [3, 4, 2, 5, 1, 6]>>> c_dict = {'A':3, 'B':4, 'C':5}>>> topNum = 2>>>原创 2018-05-25 21:02:40 · 3965 阅读 · 1 评论 -
windows下数据挖掘比赛提交文件换行符问题
1. 问题在天池大数据比赛、腾讯算法比赛等中都需要提交结果文件,一般是csv文件win下的默认换行符是CRLF(回车换行),linux或macos下的默认换行符是LF(换行),这些比赛要求提交的文件大多数都需要是LF换行符我是在windows10下使用vscode敲代码的,代码也是在win10下跑的,如果不留心,就会生成CRLF换行符的文件,提交结果总会出现没成绩、格式错误、表头信息错误...原创 2018-04-18 13:54:00 · 613 阅读 · 0 评论 -
python简单爬虫:爬取并统计自己博客页面的信息(二)
python简单爬虫:爬取并统计自己博客页面的信息(一)中介绍了简单的爬虫概念、本文代码的目的、爬虫的整体框架、工程目录结构、全局配置模块以及日志模块,接下来介绍一下简单的URL管理器和html下载器(无登录)的实现7. URL管理器(url_manerger.py)url管理器是用于管理待爬取的url和已爬取的url的,已爬取的url又分为爬取成功的和爬取失败的,主要是为了防止重复...原创 2018-04-12 17:31:16 · 1079 阅读 · 0 评论 -
python简单爬虫:爬取并统计自己博客页面的信息(四)
python简单爬虫:爬取并统计自己博客页面的信息(三)中介绍了html解析器的简单实现,接下来介绍mysql模块、结果输出模块,最后展示一下结果。10. 数据库模块:mysql.py因为结果输出模块中使用到了mysql,因此在讲结果输出模块之前,先讲mysql模块。mysql是一个关系型数据库管理系统(DBMS),而数据库则是通过DBMS创建和操纵的容器。一个DBMS中可以有...原创 2018-04-17 11:43:16 · 1098 阅读 · 3 评论 -
python简单爬虫:爬取并统计自己博客页面的信息(一)
1. 什么是爬虫也叫网络爬虫,简单来说,爬虫就是从一个根网站出发,根据某种规则获得更多的相关网站的url,自动下载这些网页并自动解析这些网页的内容,从中获取需要的数据。例如爬取某种图片、某类文本信息等。爬虫还可以用于编纂搜索引擎的网络索引。爬虫所涉及的知识和技术面非常广,在本文中不作讨论;爬虫有很多种实现方法,本文提供的python方法仅是其中一种简单的实现,适用于规模较小的、自娱自乐的应...原创 2018-04-10 21:49:10 · 2149 阅读 · 2 评论 -
pandas:对dataframe进行groupby后求众数mode
1. 问题有如下一个dataframe,打算对a的每一个类别求b的众数(mode),dir(df.groupby('a'))可以看到是没有mode函数的,因此不能直接使用df.groupby('a').mode().reset_index()>>> import pandas as pd>>> df = pd.DataFrame({'a':['A','...原创 2018-03-28 13:40:42 · 21487 阅读 · 3 评论 -
python简单爬虫:爬取并统计自己博客页面的信息(三)
python简单爬虫:爬取并统计自己博客页面的信息(二)中介绍了URL管理器和html下载器的简单实现,接下来介绍html解析器的简单实现。9. html解析器(html_parser.py)html解析器的主要任务是从下载好的网页中提取所需要的数据解析html的方法主要有两种:一是正则表达式,这是将整个html内容一个超大字符串来看待,匹配出所需数据;二是使用beautifuls...原创 2018-04-14 17:29:18 · 1019 阅读 · 0 评论 -
由numpy.arange函数看双精度浮点数的精度问题
1.发现问题想得到一个长度为57的、从0开始的、间隔为0.01的数组,想当然地如下coding,结果意料之外:>>> import numpy as np>>> t1 = np.arange(0, 0.01*57, 0.01)>>> t1.shape(58L,)但是如果用同样的方法,可以得到正确的长度为58的、从0开始的、...原创 2018-03-13 19:58:41 · 7856 阅读 · 1 评论 -
python中对象的赋值、浅拷贝和深拷贝
1. 赋值:简单的对象引用在python中,变量赋值实际上是简单的对象引用。在创建一个对象后,再把它赋给另一个变量的时候,python并没有拷贝这个对象,而只是简单地拷贝了这个对象的引用。(1)原子类型的赋值>>> x = 3.14>>> y = x>>> x,y(3.14, 3.14)>>> id...原创 2018-03-17 16:50:33 · 5099 阅读 · 2 评论 -
Flask(flask_restful.Api)+vue(webpack)+axios实现简单的前后端分离
前端部分1. 部署webpack脚手架首先按照此博文的步骤在win10本地部署好vuejs的webpack脚手架2. 安装并使用axios进行异步通信搜了一些介绍,现在vue2.0以上官方都是建议使用axios与后台进行异步通信获取数据,vue-resource.js似乎是不维护了;另一方面本来打算自己在vuejs框架内实现原生态的AJAX的,但由于对框架原理的不理解受到了很大...原创 2018-09-14 16:40:17 · 7421 阅读 · 0 评论