
python
cbbing
这个作者很懒,什么都没留下…
展开
-
python 创建mysql数据库
import MySQLdbconn=MySQLdb.Connect(host='localhost',user='root',passwd='')cursor =conn.cursor()cursor.execute('create database if not exists student')#conn.commit()conn.select_db('studen转载 2013-05-22 10:01:01 · 1125 阅读 · 0 评论 -
Python 股票历史数据的获取
本文主要讨论的是pytho免费股票数据的获取及处理。国内提供股票数据的接口如sinajs,money.163.com,yahoo,它们提供的API接口不同,每家提供的数据大同小异,可以选择一家的数据来处理。原创 2015-06-28 12:33:27 · 24975 阅读 · 3 评论 -
Pandas数据分析基础
原文地址:http://kekefund.com/2016/02/23/pandas-anlysis-basic/使用pandas,首先导入包:from pandas import Series, DataFrameimport pandas as pd一、创建Series,DataFrame1,创建Seriesa,通过列表创建obj = Series([4, 7, -5, 3]) obj2原创 2016-02-23 10:53:03 · 17819 阅读 · 0 评论 -
Python 文本分类器
概念朴素贝叶斯算法是一个直观的方法,使用每个属性属于某个类的概率来做预测。你可以使用这种监督性学习方法,对一个预测性建模问题进行概率建模。给定一个类,朴素贝叶斯假设每个属性归属于此类的概率独立于其余所有属性,从而简化了概率的计算。这种强假定产生了一个快速、有效的方法。给定一个属性值,其属于某个类的概率叫做条件概率。对于一个给定的类值,将每个属性的条件概率相乘,便得到一个数据样本属于某个类的概率。1、原创 2016-02-15 13:53:15 · 3961 阅读 · 0 评论 -
python 制作标签云
[原文出处:http://kekefund.com/2016/02/15/py-tag-cloud/] 标签云是比较直观的频率分布表现方式,很多网站和APP在年度盘点和总结时会使用。Python生成标签云有一个比较易用的库 pytagcloud。1,导入头文件from pytagcloud import create_tag_image, make_tagsfrom pytagcloud.lan原创 2016-02-15 10:08:18 · 4330 阅读 · 0 评论 -
python多线程与多进程 超简单使用
Python 的GIL限制了多核CPU的性能,对于IO密集型的程序,采用多线程能显著提高运行速度;但对于计算密集型的程序,多线程就没多少用了,采用多进程编程,就能充分利用多核CPU的性能,CPU占用率能达到100%。下面是在阿里云服务器上测试的数据: 配置:CPU:Xeon, E5-2680, 2.5GHz, 4核; 内存:16G, DDR4; 硬盘:100G, SSDdef run():原创 2016-01-25 14:11:25 · 1192 阅读 · 0 评论 -
IP代理池的Python实现
爬虫采集数据时,如果频繁的访问某个网站,会被封IP,有些是禁止访问3小时,有些是直接拉黑名单。为了避免被禁,一般采取的措施有三种: 放慢抓取的速度,设置一个时间间隔; 模拟浏览器行为,如采用Selenium + PhantomJS; 设置IP代理,定期更换代理IP,让网站不认为来自一个IP。 本文实现其中的第三种方法。 国内提供IP代理的网站有很多,我们以其中的一个为例:h原创 2015-11-19 09:19:51 · 8239 阅读 · 0 评论 -
Python 数据库连接(sqlite, mysql, oracle, postgresql, sql server)
Python 数据库连接(sqlite, mysql, oracle, postgresql, sql server)Python连接数据主要用SQLAlchemy。SQLAlchemy是最有名的ORM框架。 首先通过pip或easy_install 安装 SQLAlchemypip install sqlalchemy数据库连接from sqlalchemy import create_engi原创 2015-10-10 09:40:09 · 2555 阅读 · 0 评论 -
python create_engine 连sql server 中文乱码 解决方案
python 采用sqlalchemy 连接数据库,oracle和mysql出现乱码的概率比较小,而连sql server时总出现中文乱码。代码如下#连接数据库engine_ju = create_engine('mssql+pymssql://%s:%s@%s/%s' % ( cf.ju_db_user,原创 2015-10-29 11:31:14 · 8700 阅读 · 0 评论 -
Python 获取最长单词的两种方法
方法1:一般方法In[7]: text=[u'[', u'Paradise', u'Lost', u'by', u'John', u'Milton', u'1667', u']', u'Book', u'I', u'Of', u'Man', u"'", u's', u'first', u'disobedience', u',', u'and', u'the', u'fruit']In[8]: lo原创 2015-11-13 10:48:20 · 23959 阅读 · 0 评论 -
Python开发环境配置(Windows)
Python开发环境配置最近布置多台阿里云服务器的Python环境,使用的系统是windows server 2008, 每台服务器都得重新安装各种库,有些库的安装方式还比较奇葩,故记下以便后续使用。1,首先下载Python安装包,到官网下载,我用的是python2.7.10。2,添加环境变量:path后加上 ;C:\Python27;3,安装easy_install在https://pypi原创 2015-10-12 09:24:24 · 948 阅读 · 0 评论 -
Python正则表达式
许多语言处理任务都涉及模式匹配。例如,可以使用endswith(‘ed’)找出以“ed”结尾的词。正则表达式提出了一个更加强大和灵活的方法描述感兴趣的字符模式。在Python中使用正则表达式,需要使用import re导入re函数库。下表为正则表达式基本元字符,其中包括通配符、范围和闭包 贪婪模式与非贪婪模式Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的原创 2015-11-11 17:23:17 · 752 阅读 · 0 评论 -
在Python中使用Redis数据库
一、Redis数据库的配置以windows系统为例,下载Redis安装包解压后,配置redis.windows.conf 文件:# The filename where to dump the DBdbfilename dump.rdb# The working directory.## The DB will be written inside this directory, with th原创 2015-07-14 09:54:46 · 3343 阅读 · 0 评论 -
Django 安装
1,先安装python2.7.4(2.7+都可以)2,下载ez_setup.py原创 2014-05-08 11:26:15 · 498 阅读 · 0 评论 -
POST与GET的区别
POST与GET之间有什么不同?当我们提交表单仅仅需要获取数据时就可以用GET; 而当我们提交表单时需要更改服务器数据的状态,或者说发送e-mail,或者其他不仅仅是获取并显示数据的时候就使用POST。转载 2013-05-23 15:34:03 · 726 阅读 · 0 评论 -
python结合G2绘制精美图形
一、简介G2是阿里巴巴内部开放的数据可视化工具,提供丰富的图表类型,并且简单易上手,有比较完善的示例代码。其生成的图表简单漂亮,而且有JS互动显示,比较适合报告和文章插图。G2的数据来源是json格式数据。G2绘制的图形python的pandas库比较擅长对数据处理和分析,其DataFrame生成json也很方便。pandas自身集成了matplotlib的绘图功能,但是绘制的图形没有G2美观。原创 2016-08-08 10:26:38 · 2914 阅读 · 0 评论