Taozidede-优快云博客

原创 SQL查询性能优化

通过对一些查询方式和细节的调整，有时能大大提高查询的效率，本次文章整理自《SQL进阶教程》，这本书为大家提供了很多简单易行的查询优化方法，即使你不具备数据库理论知识，也能够很容易的掌握到。笔记纲要：1、使用高效的查询方式2、避免排序3、善用索引4、减少中间表1、使用高效的查询方式①在子查询中，用EXISTS代替INexists只要查到一行数据满足条件就会终止查询。不用像使用in时...

2018-12-04 21:34:10 370

在上篇文章中，介绍了《python数据分析与数据化运营》一书中会员数据化运营的相关指标，本次将继续介绍部分分析模型。会员数据化运营指标的文章请点击https://blog.youkuaiyun.com/Taozidede/article/details/84659371 二、会员数据化运营分析模型2.1 会员细分模型①基于属性的细分人口学：性别、年龄、受教育程度等；地理学：南北方、城市规模、中西...

2018-11-30 16:38:20 3790 1

原创会员(用户)数据化运营——指标介绍

最近看了《python数据分析与数据化运营》一书，受益良多，在这里整理部分笔记，也把自己的一些所得分享给大家。会员（用户）数据化运营是企业运营的重要基础，了解会员数据化运营的角度、相关指标、方法、模型等，建立较为系统的思考逻辑，是非常重要的，本次笔记介绍的是第一部分：会员数据化运营的相关指标。笔记纲要：~~·会员数据化运营指标··········会员整体指标··········会员营销指...

2018-11-30 16:34:30 4243 1

原创 dataframe行列查询

一、可以通过df.shape查询行列数import pandas as pddf = pd.DataFrame([[1,2,3], [7,5,7], [9,7,4], [8,4,6]])# 维度查询>>> df.shape(4, 3)# 获取行数>>> df.shape[0]4# 获取列数>>> df.shape[...

2018-08-21 19:08:54 4922

原创 pandas之创建DataFrame

pandas创建DataFrame的方式主要有两种，通过列表创建与通过字典创建，下面一一演示一下。import pandas as pddf1 = pd.DataFrame([[1,2,3],[7,5,7],[9,7,4]])>>> df1 0 1 20 1 2 31 7 5 72 9 7 4df2 = pd.DataFrame(...

2018-08-21 18:54:18 591

原创 python连接数据库——pymysql

在数据库内很多复杂的操作会受到限制，此时可用python连接到数据库，将数据在py中进行相关处理，可提高运行效率。本文以pymysql模块为例连接数据库。# 导入模块import pymysql# 建立一个字典存储数据库的相关信息db_infor = { 'host': '127.0.0.1', 'user': 'root', 'passwd': '*****...

2018-07-24 19:05:39 437

原创爬虫案例——淘宝图片爬虫

在淘宝网中搜索某种商品之后会跳转到新的网页，网页的底部有可以进行换页，爬虫之前我们需要找出不同页码之间是否存在某种规律。https://s.taobao.com/search?q=%E7%9F%AD%E8%A3%99&imgfile=&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&s...

2018-03-25 20:09:17 4140 1

原创爬虫案例——新浪新闻

爬取新浪新闻并存储在本地。import urllib.requestimport redata=urllib.request.urlopen('http://news.sina.com.cn/').read()data=data.decode('utf-8','ignore') #编码出现问题自动忽略pat='href="(http://news.sina.com.cn/.*?)"'a...

2018-03-14 15:29:53 529

原创爬虫案例——豆瓣出版商

爬取豆瓣出版商名称，并存储在本地文件中。import urllib.requestdata=urllib.request.urlopen('https://read.douban.com/provider/all').read()data=data.decode('utf-8')import repat='<div class="name">(.*?)</div>'...

2018-03-14 15:27:53 350

原创爬虫——正则表达式

1、原子import re#普通字符作为原子pat='yu' #2个原子string='http://yun.iqianyue.com' a=re.search(pat,string) print(a)#非打印字符作为原子 pat='\n' string='''kalsjflakaksf...

2018-03-14 15:23:48 327

原创爬虫基础

在之前两篇文章中已经为大家介绍了urllib模块的基础知识及使用方法，本次文章将介绍发送请求，爬虫的异常处理和伪装浏览器三个部分的知识。1、发送请求以百度检索为例：https://www.baidu.com/s?wd=python&ie=UTF-8 wd...

2018-03-14 14:49:54 335

原创 Python基础知识——urllib模块在爬虫中的应用

以一个小例子引入urllib模块import urllib.request#urlretrieve('要爬取的网址','想要将网页保存在本地的地址')，该方法可将网页直接保存在本地，无需read()及写入操作a=urllib.request.urlretrieve('http://www.hellobi.com',filename='D:/python学习/1.html') #urlclea...

2018-03-14 14:32:13 316

原创 Python基础知识——作用域、函数、模块

本次文章将为大家简单介绍介绍一下题目中的三个概念，下次将会对urllib模块进行详细讲解。1、作用域：全局变量和局部变量i=100print(i) #i为全局变量，在之后仍可继续引用def func1(): j=10 print(j) #j为局部变量，只在我们调用func1()时可用print(j) #此时j不存在，无法打印def func2(): global...

2018-03-14 14:15:01 250

原创 Python基础知识——文件操作和异常处理

文件操作是数据处理中的基础操作，包括读取、写入、存储/关闭等#文件不存在时自动创建a=open('D:/1python学习/重新学习python/file.txt','w')b='hello,python'a.write(b)a.write('\nhi,girl')a.close()#文件存在时a=open('D:/1python/file2.txt','r')b=a.read()...

2018-03-12 20:52:24 758

原创 Python基础知识——控制流

控制流可分为顺序结构，条件分支结构，循环结构，中断结构，这里介绍几种常用语句。1.if语句a=3if(a<4): print('CLASS1')elif(a>10): print('CLASS2')else: print('CLASS3')2.while语句a=3while (a<8): print('Hi') a+=13

2018-03-08 18:02:19 290

原创初识Python

python极简基础知识

2018-03-08 17:57:18 267

原创 Learn Python the Hard Way(“笨办法”学python）第四版例39笔记

39 列表的操作 python菜鸟最近在学Learn Python the Hard Way这本书，将笔记分享出来和大家一起学习！小点解析（来自脚本之家和陶子自己的理解）： **1.**str.split(str=”“,num=string.count(str)) str——分隔符，默认为所有的空字符，包括空格，换行（\n），制表符（\t）等,上面的例子中用的是空格 num—

2017-10-19 20:25:56 475

Taozidede的博客