- 博客(45)
- 收藏
- 关注
原创 EXCEL中提取各sheet表中的固定区域到一个表格中
=INDIRECT("Sheet"&ROW(F1)&"!F1")好久不做数据分析了,今天因为要申报一个项目又开始调用其一些公式、函数等等。再次看csdn感觉还是很有感触。毕业后选择了一份稳定的体制内工作,数据分析的思维和经历带给我很多很多,只可惜自己是那条路上半途而废的一员。简洁的代码、编译器,为了一个问题反复思索的图书馆的一个又一个下午。emmmm~~回想自己求学的经历明明擅长数学和文科,对物理化学一窍不通,高二分科却报了理科。上了个中规中矩的大学,学了个文理.
2022-04-24 18:10:06
3990
1
转载 删除PPT固定图片的宏
Sub Test()Dim oSlide As Slide, oShape As ShapeDim myWidth As Single, myHeight As Single, myTop As Single, myLeft As SingleOn Error Resume NextIf ActiveWindow.Selection.ShapeRange.Count <> 1 ThenIf Err.Number <> 0 ThenMsgBox "none" & v
2020-12-22 13:07:41
892
原创 python访问phone包获取运营商、地区等
#!/usr/bin/env python##-*- coding:utf-8 -*-from phone import Phoneimport datetimeinput_csv = open('123.txt',encoding='utf-8')output_csv = open('output4.txt','w')i = 0j = 0for line in input_cs...
2019-07-02 09:11:44
1566
原创 excel:csv文件批量转换为xlsx的宏
1、新建一个excel2、选择alt+F113、选择insert model4、输入程序,选择包含csv文件的文件夹Sub CSVtoXLS()'UpdatebyExtendoffice20170814 Dim xFd As FileDialog Dim xSPath As String Dim xCSVFile As String Dim xWs...
2018-12-05 10:12:12
10616
1
原创 SQL行号选取函数
SQL行号插入函数row_number() over (ORDER BY v.open_id) AS rownum,SELECT row_number() over (ORDER BY v.open_id) AS rownum, v.open_id AS open_idFROM.....
2018-10-23 18:14:55
2289
转载 Presto适用的SQL函数
序号 功能和说明 1 abs(x) 返回x的绝对值 2 cbrt(x) 返回x的多维数据集根 3 ceiling(x) 返回舍入为最接近整数的x值 4 ceil(x) 天花板别名(x) 5 degrees(x) 返回x的度数值 6 e(x) 返回欧...
2018-10-10 10:00:04
37414
1
原创 SNA中心论的相关概念
度中心性(degree)度中心性(Degree Centrality)是在网络分析中刻画节点中心性(Centrality)的最直接度量指标。网络中与该节点直接相连的节点个数,一个节点的节点度越大就意味着这个节点的度中心性越高,该节点在网络中就越重要。 接近中心性(Closeness Centrality)反映在网络中某一节点与其他节点之间的接近程度。某点到网络中其他点的距离总和。将...
2018-09-28 14:44:44
995
转载 盈利模式
❶广告模式新闻类门户网站大多是这种模式,新浪、搜狐、网易三大门户很大部分盈利是靠广告收入获取的。还有视频类平台也多属这种,如爱奇艺、搜狐视频、腾迅视频,在看视频前都要先看一段广告。 广告模式的产品特点是: 低门槛。谁都能进,谁都能看,用户量是此模式收益的主要依托。 内容高质量。内容必须有价值,价值是吸引用户的前题,像现在这个自媒体时代,每个自媒体人的收益很大一部分是来自...
2018-08-08 09:29:17
3399
原创 调用百度API进行情感分析
# -*- coding: utf-8 -*-from aip import AipNlpimport csvimport pandas as pdfrom pandas.core.frame import DataFrameAPP_ID = '******'API_KEY = '888888888'SECRET_KEY = '88888888'client = AipNlp(A...
2018-06-26 12:57:16
7358
2
原创 简单的结巴分词与词频统计
#!/usr/bin/env python# -*- coding: utf-8 -*-import reimport sysimport jiebaimport jsonfrom collections import Counterreload(sys)sys.setdefaultencoding("utf-8")filename = "rowss.txt"f1 = open...
2018-06-10 16:31:54
3484
原创 关于小程序的一点总结
1.小程序优点:A.能给人们带来便捷的游戏体验和休闲的享受; B.借助微信社交圈快速变现,通过社群交互,扩大游戏的覆盖面及影响力,吸引更多的人关注游戏,从而在游戏内做到提高其他游戏曝光度,提高广告流量,公众号引流,充值消费等等进行变现; C.开发成本低,投入少,产出快。2.小程序缺点:A.但是小游戏的开发,运营都比较“轻”,往往对公众来说不具备长时间吸引力; B.小程序小游戏与大型网游相比,成...
2018-06-09 11:53:02
373
原创 在做数据时多问自己几个问题
1. 将历史accrual用总accrual减去当月新签accrual 忽视了数据之间的验证,只是表内数据的加减,应该将历史数据重新在系统中跑出,进行验证。2. Accrual和业绩的表格框架应该达成统一,统一之后方便看业绩和accrual之间的关系。3. 将总计列在表的第二行,可以随时方便验证准确性。4. Accrual摊销不仅仅是到2018年的4月,考虑摊销的时间性,明...
2018-06-01 15:56:44
270
原创 SQL里的按照制定字段排序函数
order by case 'name' //name是列名 when 'tom' then 1 // 当值为tom,排在第一个 when 'jhon' then 2 // 当值为jhon,排在第二个 when 'mary' then 3 // 当值为mary,排在第三个 ...
2018-05-25 15:14:52
748
原创 python txt转换为字典,并用中文导出
#!/usr/bin/env python# -*- coding: utf-8 -*-# -*- encoding: gbk -*-import matplotlib.pyplot as pltfrom wordcloud import WordCloudimport json_dict = {}def load_dict_from_file(filepath): try: ...
2018-05-23 15:00:29
3328
原创 Python自然语言处理的一些资料整理
一、基于PYTHON的简单的自然语言处理https://blog.youkuaiyun.com/qfire/article/details/78786651二、自然语言处理工具包https://www.cnblogs.com/baiboy/p/nltk2.html三、NLTK自然语言处理工具包https://blog.youkuaiyun.com/u010099495/article/details/46776135可能...
2018-05-13 15:37:31
349
原创 presto 扫盲、行列转置函数
presto是什么是Facebook开源的,完全基于内存的并⾏计算,分布式SQL交互式查询引擎是一种Massively parallel processing (MPP)架构,多个节点管道式执⾏⽀持任意数据源(通过扩展式Connector组件),数据规模GB~PB级使用的技术,如向量计算,动态编译执⾏计划,优化的ORC和Parquet Reader等presto不太支持存储过程,支持部分标准sql...
2018-05-13 15:24:07
11619
1
原创 element_at 函数
库里有类似josn形式的字符串数据attr{"a":"123","b":"234"."c":"345","分类":"aaa"}类型的数据redash平台可以识别汉字,直接用element_at(attr,"分类")即可原本想用unicode将汉字进行转码操作,结果失败,可能是平台支持的语句不同temp.elementAt(0) 返
2018-05-10 22:49:19
7259
转载 python一元线性回归
上图中,'x'轴表示匹萨直径,'y'轴表示匹萨价格。 能够看出,匹萨价格与其直径正相关,这与我们的日常经验也比较吻合,自然是越大越贵。 下面就用 scikit-learn 来构建模#!/usr/bin/env python# -*- coding:utf-8 -*-import matplotlib.pyplot as pltfrom matplotlib.font_manager impo...
2018-04-16 11:56:20
6489
转载 CPT CPC CPA CPM 广告投放了解
网络广告发展到今天,经历了从最初的短信联盟到现在的广告联盟,广告形式也有了很大的变化,出现了CPC、CPM、CPA、CPS、CPT等众多广告形式。今天就为大家科普这些广告术语,一次搞懂!1CPM:按展示付费CPM—英文全称Cost Per Mille 或者是Cost Per ThousandImpression, 也称千人印象成本。CPM是一种展示付费广告,只要展示了广告主的广告内容,广告主就为此...
2018-04-15 15:46:54
25191
1
原创 SQL空值处理
空值的处理:1. 应该有值,目前不知道2. 不应该有值3. 不便于填写空值和0不同,具有不缺定性1. 查找年龄或者性别遗漏的信息的记录SELECT *FROM StudentWHERE Ssex IS NULL OR Sage IS NULL 有NOT NULL约束条件的不能取空值加了UNIQUE限制的属性不能取空值码属性不能取空值 空值与另外一个空值的算术...
2018-04-15 14:21:54
2987
原创 SQL视图
l 视图创建CREATVIEW 视图名 列名AS 子查询[WITHCHECK OPTION][WITH CHECK OPTION]:当用视图进行UPDATE\INSERT\DELETE 进行更新、插入、删除时的行需要满足子查询子查询可以是任意SELECT语句视图的属性列名可以全部省略或指定1.全部省略的话由子查询中SELECT中列的诸字段组成。2.明确指定试图的所有列名的话:某个目标列是聚集函数...
2018-04-15 14:20:01
556
原创 SQL数据查询
l 单表查询:SELECT [ALL\DISTINCT]目标列表达式FROM<表名或视图名>[表名或视图名]…[SELECT语句] AS<别名>WHERE条件表达式GROUP BY <列名1>[HAVING<条件表达式>]ORDER BY <列名2>[ASC/DESC]GROUP BY 对查询结果按照指定列进行分组,该属性列值相等的元祖...
2018-04-15 14:18:53
364
原创 SQL函数
聚集函数通常和GROUP BY联合起来使用()必选,[]可选COUNT(*) 统计元组个数,返回被选行数COUNT([DISTINCT|ALL]<列名>) 统计一列中值的个数SUM([DISTINCT|ALL]<列名>) 统计一列值的总和 此列必须为数值型AVG([DISTINCT|ALL]<列名>)计算一列值的平均值 此列必须为数值型MAX([DISTIN...
2018-04-15 14:14:51
539
原创 SQL高级进阶
l 限定返回的行数TOPSELECT TOP number | percent 列名FROM 表名SELECT TOP 2 * FROMPersons SELECT TOP 50 PERCENT * FROMPersonsl LIKE在WHERE字句中搜索制定模式 通配符等(%可以定义通配符,模式中缺少的字母)SELEC...
2018-04-15 14:12:09
1048
原创 scipy- linalg以及矩阵相关知识学习
1.det(A)行列式行列式在数学中,是由解线性方程组产生的一种算式,是取自不同行不同列的n个元素的乘积的代数和。n阶行列式(定义1)设有n²个数,排成n行n列的表 ,作出表中位于不同行不同列的n个数的乘积,并冠以符号(-1)t,的形式如下的项,其中为自然数1,2,...,n的一个排列,t为这个排列的逆序数。由于这样的排列共有n!个,这n!项的代数和称为n阶行列式①行列式A中某行(或列)用同一数k...
2018-04-10 16:31:14
3767
原创 scipy-optimizer优化器
#!/usr/bin/env python# -*- coding:utf-8 -*-import numpy as npfrom scipy.optimize import minimize # 求出最小值 #from scipy.optimize import leastsq # 引入最小二乘法算法 #import matplotlib as pltdef main(): ...
2018-04-10 11:14:37
1833
原创 scipy-integrate 数值积分
#!/usr/bin/env python# -*- coding:utf-8 -*-import numpy as npfrom scipy.integrate import quad, dblquad,nquaddef main(): # 1---Integral# print (quad(lambda x: np.exp(-x), 0, np.inf)) ...
2018-04-10 11:11:58
4159
原创 scipy-interpolation scipy插值运算
Scipy还是需要较强的数学基础。需要学习。#!/usr/bin/env python# -*- coding:utf-8 -*-import numpy as npimport matplotlib.pyplot as pltfrom scipy import interpolatedef main(): x = np.linspace(0, 1, 10) #插...
2018-04-10 11:09:40
2930
原创 SQL初级基础
SQL基础l 选择数据,SELECT语句SELECT LastName,FirstName FROM PersonsSELECT * FROM Persons l 返回不同的值,去除重复值SELECTDISTINCTSELECT DISTINCT 列名称FROM 表名称 l 如需有条件地从表中选取数据,可将 WHERE 子句添加到 SELECT 语句。WHERE语句请注意,我们在例子中的条件...
2018-04-04 17:42:16
188
原创 Access进阶 主要是一些数据库原理的巩固
一次正规化:纵向寻找重复的数据的记录 e.g 客户编号、姓名二次正规化:找出数据绝对依赖的数据 e.g 商品的基本数据信息三次正规化:数据表中相依字段 不一定是1对1,有可能是1:多的关系 e.g 商品分类,商品代码过度正规化:假性依赖 有可能不是1:1的关系...
2018-03-22 20:46:02
362
原创 pandas 时间序列、绘图、存储文件 date_range()
pandas.date_range(start=None, end=None, periods=None, freq=’D’, tz=None, normalize=False, name=None, closed=None, **kwargs)参数start:string或datetime-like,默认值是None,表示日期的起点。end:string或datetime-like,默认值是No...
2018-03-22 19:08:19
1615
原创 pandas库中shift()、diff()等函数的用法
# Statistic#print (df.mean())# 所有属性的均值 #print (df.var())# 属性的方差 #s = pd.Series([1, 2, 4, np.nan, 5, 7, 9, 10], index=dates)print (s)print (s.shift(2))# 行索引数字未发生改变,值向下移动两位 #print (s.diff())# 不填数字...
2018-03-21 16:08:33
11213
原创 pandas库中concat()、merge()、groupby()、pivot_table()相关用法
#!/usr/bin/env python# -*- coding:utf-8 -*-import pandas as pdimport numpy as npimport datetimedef main(): dates = pd.date_range("20180301", periods=8) df = pd.DataFrame(np.random.randn(...
2018-03-21 16:06:59
820
原创 panda库中 reindex重新定义索引函数相关用法
#!/usr/bin/env python# -*- coding:utf-8 -*-import pandas as pdimport numpy as npdef main(): dates = pd.date_range("20180301", periods=8) df = pd.DataFrame(np.random.randn(8, 5), index=da...
2018-03-21 14:47:26
3159
原创 Pandas建立dataframe\ series\ 及相应操作 切片、排序、复制、修改
#!/usr/bin/env python# -*- coding:utf-8 -*-import pandas as pdimport numpy as npdef main(): # Data Structure# s = pd.Series([i * 2 for i in range(1, 11)]) print (s) dates = pd.da...
2018-03-20 21:22:45
3479
原创 matplotlib——热图hot map contour() 以及图像存储
#!/ usr / bin / env python # - * - coding:utf-8 - * - import numpy as np import matplotlib.pyplot as pltDEF主(): #热图# plt.figure( 1) #建立一个数字# plt.subplot( 331) #3行和3列#的图 ...
2018-03-19 22:26:31
4542
原创 matplotlib figure定义一张大的画布 axex/subplot是子图
#!/ usr / bin / env python # - * - coding:utf-8 - * - import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import axes3ddef main(): #scatter## plt.figure(...
2018-03-19 16:11:44
2771
原创 matplotlib极值图画法 ——polar()
#!/ usr / bin / env python # - * - coding:utf-8 - * - import numpy as np import matplotlib.pyplot as pltdef main()#极性 plt.subplot( 335,极性 =真)N = 20 THETA = np.arange(0,2 * np.pi,2 * np.pi ...
2018-03-19 16:07:10
5584
原创 matplotlib柱状图相关用法——bar()
#encoding = utf-8# import numpy as np将 matplotlib.pyplot导入为 pltfig.add_subplot(3,3,2)n = 10 X = np.arange(n)Y1 =(1 - X / 浮动(N))* np.random.uniform(0.5,1.0,N)Y2 =(1 - X / 浮动(N))* np.random.unifor...
2018-03-19 10:08:20
1174
原创 matplotlib热图绘制——inshow()相关用法
#!/ USR / bin中/ env的蟒 # - * -编码:UTF-8 - * - 进口 numpy的作为 NP进口 matplotlib.pyplot作为 PLT DEF主(): 数据 = np.random.rand( 3, 3) plt.imshow(data,interpolation = 'nearest',cmap = plt.get_cmap('cool'...
2018-03-19 10:00:05
2591
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人