
Python高效数据分析
文章平均质量分 94
高效分析数据的方法
逍遥_yjz
主要从事文本处理,实体识别方向;攻读自然语言处理,深度学习。
展开
-
Python 调试更好的方式
在本文中,我介绍了一个很棒的 Python 第三方库,名为"Ice Cream"。它增强了Python 的普通print() 函数,并提供了详细的输出。因此,它使调试变得非常方便。Ice Cream库永远不会取代print() 函数,因为它是为调试目的而设计的。同时,它也不会取代日志系统。转载 2024-05-08 17:13:58 · 65 阅读 · 0 评论 -
numpy列表与数组的相互转换
列表转数组1、转成数组的matrix对象,使用np.mat()方法。In [1]: a = [[2,3,4],[4,7,1]]In [2]: np.mat(a)Out[2]:matrix([[2, 3, 4],[4, 7, 1]])2、转成数组的ndarray对象,使用np.array()方法。In [1]: a = [[2,3,4],[4,7,1]]In [2]: np.arr...翻译 2020-04-19 14:26:29 · 2383 阅读 · 0 评论 -
机器学习中的数学(2):numpy中切片、行列向量,奇异值分解
1.ndarray数组维度-横向量和列向量a = array([1,2,3]) #一维列向量print(a.shape, a)b = array([[1,2,3]]) #二维横向量print(b.shape, b)(3,) [1 2 3](1, 3) [[1 2 3]]{关于numpy数组维度表示上的区别,numpy多维数组横向量和列向量的区别}zeros([5...原创 2018-04-12 09:59:57 · 1157 阅读 · 0 评论 -
python 判断列表中每个元素有几个
使用标准库提供的collections基本用法:import collectionslst = [] # lst存放所谓的100万个元素d = collections.Counter(lst)# 瞬间出结果for k in d: # k是lst中的每个元素 # d[k]是k在lst中出现的次数from collections import Co原创 2017-12-23 20:20:00 · 7031 阅读 · 0 评论 -
python的walk及图片转换格式
1 python walk()函数walk()方法语法格式如下: os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]]) 概述 os.walk() 方法用于通过在目录树中游走输出在目录中的文件名,向上或者向下。 os.walk() 方法是一个简单易用的文件、目录遍历器,可以帮助我们高效的处理文件、目录方面的事情...原创 2018-04-18 11:45:42 · 544 阅读 · 0 评论 -
初识pandas (1)
1.pandas的使用Pandas 是基于 NumPy 的一个非常好用的库,正如名字一样,人见人爱。之所以如此,就在于不论是读取、处理数据,用它都非常简单。1.基本的数据结构Pandas 有两种自己独有的基本数据结构。读者应该注意的是,它固然有着两种数据结构,因为它依然是 Python 的一个库,所以,Python 中有的数据类型在这里依然适用,也同样还可以使用类自己定义数据类型。...原创 2018-05-01 10:43:35 · 277 阅读 · 0 评论 -
初识 pandas (2)
读取 csv 文件 关于 csv 文件csv 是一种通用的、相对简单的文件格式,在表格类型的数据中用途很广泛,很多关系型数据库都支持这种类型文件的导入导出,并且 excel 这种常用的数据表格也能和 csv 文件之间转换。 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)...原创 2018-05-01 16:43:44 · 458 阅读 · 0 评论 -
初识 pandas (3):绘图
>>> import numpy as np>>> import pandas as pdBackend TkAgg is interactive backend. Turning interactive mode on.>>> ts = pd.Series(np.random.randn(1000), i原创 2018-05-01 21:01:13 · 321 阅读 · 0 评论 -
列表转换成自定义矩阵、切片
列表转换成矩阵:m=10;n=7list1 = range(70)print array(list1).reshape(7, 10)sd = array(list1).reshape(7, 10)print sd[:,1:10]print list1X = mat(ones((m,n)))print Xprint '===='print X[:,1:n]结果:...原创 2018-05-23 16:13:37 · 1073 阅读 · 0 评论 -
矩阵求导公式
原文地址:矩阵求导公式【转】 今天推导公式,发现居然有对矩阵的求导,狂汗–完全不会。不过还好网上有人总结了。吼吼,赶紧搬过来收藏备份。 基本公式: Y = A * X –> DY/DX = A’ Y = X * A –> DY/DX = A Y = A’ * X * B –> DY/DX = A * B’ Y = A’ * X’ * B –> DY/DX = B...原创 2018-06-05 10:37:56 · 619 阅读 · 0 评论 -
Python实现字典依据value排序
1.初步理解:具体内容如下:使用sorted将字典按照其value大小排序 如果key值排序x[0] 默认是从小到大顺序排列>>> record ={'a':89, 'b':86, 'c':99, 'd':100}>>> sorted(record.items(), key=lambdax:x[1])[('b', 86), ('a', 89...原创 2018-06-27 11:31:14 · 895 阅读 · 0 评论 -
python 读写csv文件
1.忽略第一行标题的基础上 Python2.7# coding:utf-8import csvcsv_reader = csv.reader(open(r'C:\Users\thinkPad\Desktop\tweets.csv'))for row in csv_reader: # 条件语句忽略第一行文件数据 if csv_reader.line_num == ...原创 2018-07-09 11:40:54 · 631 阅读 · 0 评论 -
python 可视化(一):matplotlib
1.图像属性1.1 figsize=(长,宽)# -*- coding: utf-8 -*-import pylab as pltimport numpy as np# 创建一个长宽为5*4 的图,并设置分辨率为100,分辨率越大,整个图像越清晰,而且图片很大plt.figure(figsize=(5,4), dpi=100)t = np.arange(0.,4.,0....原创 2018-07-09 11:42:17 · 483 阅读 · 0 评论 -
python 遍历List各种方式
1.对zip() 函数进行测试print zip([1, 2, 3], ['a', 'b', 'c']) 结果:#[(1, 'a'), (2, 'b'), (3, 'c')]另外zip(*list)也就是数组前面带个星号,是上述操作的逆操作print zip(*[(1, 'a'), (2, 'b'), (3, 'c')])结果:[...原创 2018-09-15 15:42:40 · 6140 阅读 · 2 评论