- 博客(7)
- 收藏
- 关注
原创 pymysql的一些问题
基于python用pymysql时,会用到很多常见的方法:1. 创建/增/删/改直接执行SQL语句即可。例如:""" insert into table(park_id, park_name, park_status) values (123, '北京市', '紧张') """2. 查询数据sql = """select * from table where city_name...
2018-11-23 16:18:03
325
原创 利用python把pandas的DataFrame格式写入数据库和读出数据库数据
DataFrame <--> sql尝试了各种把Excel,csv格式导入数据库,却总是出现各种各样的额错误,后来发现python的pymasql库不支持"pd.io.sql.to_sql(data, "file_name", con=engine, index=False, if_exists='replace')"方法。接下来用sqlalchemy库做sql ->...
2018-11-23 15:35:43
15056
5
原创 关于Pandas的几个问题
Pandas和numpy.array相互转换:dataframe转化成arraydf=df.valuesarray转化成dataframeimport pandas as pddf = pd.DataFrame(df)判断DataFrame某列中是否含有NAN:np.isnan() 只支持float类型>>> np.isnan(value) # r...
2018-11-15 19:40:00
214
原创 爬虫入门教程之requests,BeautifulSoup库的介绍以及问题解释
HTTP协议HTTP,超文本传输协议(HTTP,HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议。所有的WWW文件都必须遵守这个标准。设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法,HTTP是一种基于"请求与响应"模式的、无状态的应用层协议。HTTP协议采用URL作为定位网络资源的的标识符。http://host[:post]...
2018-11-13 17:25:06
701
原创 基于Python库pymysql操作数据库的方法
适用环境python版本 >=2.6或3.3mysql版本>=4.1安装方法1. 手动安装,请先下载。下载地址:https://github.com/PyMySQL/PyMySQL/tarball/pymysql-X.X。其中的X.X是版本(目前可以获取的最新版本是0.6.6)。下载后解压压缩包。在命令行中进入解压后的目录,执行如下的指令: 1 ...
2018-11-09 17:44:03
499
原创 主要的数据结构及其时间、空间复杂度
基本数据结构:1. 链表链表通常由一组代表一个序列的节点组成。每个节点包含存储的任意类型实际数据以及指向序列中下一个节点的指针。特殊的,还有双向链表,其中每个节点都有两个指针,分别起到承前启后的作用。链表中最基本的操作是插入链表、删除链表以及查询链表。链表时间复杂度:Linked list time complexity Algorithm ...
2018-09-28 16:11:26
4475
原创 Boosting和传统Bagging之间的区别
Boosting:一万小时定律/ 对于等价的弱学习与强学习问题,是一个不断从弱学习提升到强学习的过程,冰冻三尺,非一日之寒;骐骥千里,非一日之功;是一个不断累加的过程。GBDT和xgboost在竞赛和工业界使用都非常频繁,能有效的应用到分类、回归、排序问题,虽然使用起来不难,但是要能完整的理解还是有一点麻烦的。本文尝试一步一步梳理Adaboost、GB、GBDT、Xgboost,它...
2018-08-16 11:19:36
2343
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人