- 博客(17)
- 收藏
- 关注
原创 SQL查询性能优化
通过对一些查询方式和细节的调整,有时能大大提高查询的效率,本次文章整理自《SQL进阶教程》,这本书为大家提供了很多简单易行的查询优化方法,即使你不具备数据库理论知识,也能够很容易的掌握到。笔记纲要:1、使用高效的查询方式2、避免排序3、善用索引4、减少中间表1、使用高效的查询方式①在子查询中,用EXISTS代替INexists只要查到一行数据满足条件就会终止查询。不用像使用in时...
2018-12-04 21:34:10
317
原创 会员(用户)数据化运营——分析模型
在上篇文章中,介绍了《python数据分析与数据化运营》一书中会员数据化运营的相关指标,本次将继续介绍部分分析模型。会员数据化运营指标的文章请点击https://blog.youkuaiyun.com/Taozidede/article/details/84659371 二、会员数据化运营分析模型2.1 会员细分模型①基于属性的细分人口学:性别、年龄、受教育程度等;地理学:南北方、城市规模、中西...
2018-11-30 16:38:20
3574
1
原创 会员(用户)数据化运营——指标介绍
最近看了《python数据分析与数据化运营》一书,受益良多,在这里整理部分笔记,也把自己的一些所得分享给大家。会员(用户)数据化运营是企业运营的重要基础,了解会员数据化运营的角度、相关指标、方法、模型等,建立较为系统的思考逻辑,是非常重要的,本次笔记介绍的是第一部分:会员数据化运营的相关指标。笔记纲要:~~·会员数据化运营指标··········会员整体指标··········会员营销指...
2018-11-30 16:34:30
4049
1
原创 dataframe行列查询
一、可以通过df.shape查询行列数import pandas as pddf = pd.DataFrame([[1,2,3], [7,5,7], [9,7,4], [8,4,6]])# 维度查询>>> df.shape(4, 3)# 获取行数>>> df.shape[0]4# 获取列数>>> df.shape[...
2018-08-21 19:08:54
4856
原创 pandas之创建DataFrame
pandas创建DataFrame的方式主要有两种,通过列表创建与通过字典创建,下面一一演示一下。import pandas as pddf1 = pd.DataFrame([[1,2,3],[7,5,7],[9,7,4]])>>> df1 0 1 20 1 2 31 7 5 72 9 7 4df2 = pd.DataFrame(...
2018-08-21 18:54:18
532
原创 python连接数据库——pymysql
在数据库内很多复杂的操作会受到限制,此时可用python连接到数据库,将数据在py中进行相关处理,可提高运行效率。本文以pymysql模块为例连接数据库。# 导入模块import pymysql# 建立一个字典存储数据库的相关信息db_infor = { 'host': '127.0.0.1', 'user': 'root', 'passwd': '*****...
2018-07-24 19:05:39
384
原创 爬虫案例——淘宝图片爬虫
在淘宝网中搜索某种商品之后会跳转到新的网页,网页的底部有可以进行换页,爬虫之前我们需要找出不同页码之间是否存在某种规律。https://s.taobao.com/search?q=%E7%9F%AD%E8%A3%99&imgfile=&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&s...
2018-03-25 20:09:17
4041
1
原创 爬虫案例——新浪新闻
爬取新浪新闻并存储在本地。import urllib.requestimport redata=urllib.request.urlopen('http://news.sina.com.cn/').read()data=data.decode('utf-8','ignore') #编码出现问题自动忽略pat='href="(http://news.sina.com.cn/.*?)"'a...
2018-03-14 15:29:53
473
原创 爬虫案例——豆瓣出版商
爬取豆瓣出版商名称,并存储在本地文件中。import urllib.requestdata=urllib.request.urlopen('https://read.douban.com/provider/all').read()data=data.decode('utf-8')import repat='<div class="name">(.*?)</div>'...
2018-03-14 15:27:53
312
原创 爬虫——正则表达式
1、原子import re#普通字符作为原子pat='yu' #2个原子string='http://yun.iqianyue.com' a=re.search(pat,string) print(a)#非打印字符作为原子 pat='\n' string='''kalsjflakaksf...
2018-03-14 15:23:48
296
原创 爬虫基础
在之前两篇文章中已经为大家介绍了urllib模块的基础知识及使用方法,本次文章将介绍发送请求,爬虫的异常处理和伪装浏览器三个部分的知识。1、发送请求以百度检索为例:https://www.baidu.com/s?wd=python&ie=UTF-8 wd...
2018-03-14 14:49:54
305
原创 Python基础知识——urllib模块在爬虫中的应用
以一个小例子引入urllib模块import urllib.request#urlretrieve('要爬取的网址','想要将网页保存在本地的地址'),该方法可将网页直接保存在本地,无需read()及写入操作a=urllib.request.urlretrieve('http://www.hellobi.com',filename='D:/python学习/1.html') #urlclea...
2018-03-14 14:32:13
273
原创 Python基础知识——作用域、函数、模块
本次文章将为大家简单介绍介绍一下题目中的三个概念,下次将会对urllib模块进行详细讲解。1、作用域:全局变量和局部变量i=100print(i) #i为全局变量,在之后仍可继续引用def func1(): j=10 print(j) #j为局部变量,只在我们调用func1()时可用print(j) #此时j不存在,无法打印def func2(): global...
2018-03-14 14:15:01
223
原创 Python基础知识——文件操作和异常处理
文件操作是数据处理中的基础操作,包括读取、写入、存储/关闭等#文件不存在时自动创建a=open('D:/1python学习/重新学习python/file.txt','w')b='hello,python'a.write(b)a.write('\nhi,girl')a.close()#文件存在时a=open('D:/1python/file2.txt','r')b=a.read()...
2018-03-12 20:52:24
723
原创 Python基础知识——控制流
控制流可分为顺序结构,条件分支结构,循环结构,中断结构,这里介绍几种常用语句。1.if语句a=3if(a<4): print('CLASS1')elif(a>10): print('CLASS2')else: print('CLASS3')2.while语句a=3while (a<8): print('Hi') a+=13
2018-03-08 18:02:19
257
原创 Learn Python the Hard Way(“笨办法”学python) 第四版 例39笔记
39 列表的操作 python菜鸟最近在学Learn Python the Hard Way这本书,将笔记分享出来和大家一起学习! 小点解析(来自脚本之家和陶子自己的理解): **1.**str.split(str=”“,num=string.count(str)) str——分隔符,默认为所有的空字符,包括空格,换行(\n), 制表符(\t)等,上面的例子中用的是空格 num—
2017-10-19 20:25:56
440
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人