
Python系列
Paper易论
AIGC 前沿技术的翻译者与引路人
展开
-
逻辑回归详解及Python实现
转载自:一、逻辑回归(LogisticRegression) Logistic regression (逻辑回归)是当前业界比较常用的机器学习方法,用于估计某种事物的可能性。之前在经典之作《数学之美》中也看到了它用于广告预测,也就是根据某广告被用户点击的可能性,把最可能被用户点击的广告摆在用户能看到的地方,然后叫他“你点我啊!”用户点了,你就有钱收了。这就是为什么转载 2014-11-08 11:04:18 · 5125 阅读 · 0 评论 -
利用Python进行数据分析--数据加载、存储与文件格式
转载自:http://blog.youkuaiyun.com/ssw_1990/article/details/239119011、手工处理分隔符格式大部分存储在磁盘上的表格型数据都能用pandas.read_table进行加载。然而,有时还是需要做一些手工处理。由于接收到含有畸形行的文件而使read_table出毛病的情况并不少见。为了说明这些基本工具,看看下面这个简单的CSV文件:转载 2014-11-18 23:46:22 · 3442 阅读 · 0 评论 -
利用Python进行数据分析--绘图和可视化
转载自:Python有许多可视化工具,但是我主要讲解matplotlib(http://matplotlib.sourceforge.net)。此外,还可以利用诸如d3.js(http://d3js.org/)之类的工具为Web应用构建交互式图像。matplotlib是一个用于创建出版质量图表的桌面绘图包(主要是2D方面)。该项目是由John Hunter于2002年启动的,其转载 2014-11-19 22:49:23 · 29081 阅读 · 4 评论 -
利用Python进行数据分析--时间序列
转载自:http://blog.youkuaiyun.com/ssw_1990/article/details/26612573不管在哪个领域中(如金融学、经济学、生态学、神经科学、物理学等),时间序列(time series)数据都是一种重要的结构化数据形式。在半个时间点观察或测量到的任何事物都可以形成一段时间序列。很多时间序列是固定频率的,也就是说,数据点是根据某种规律定期出现的(比如15秒、转载 2014-11-18 23:47:18 · 3083 阅读 · 0 评论 -
利用Python进行数据分析--数据规整化:清理、转换、合并、重塑
转载自:http://blog.youkuaiyun.com/ssw_1990/article/details/26565069转载 2014-11-19 22:48:12 · 2758 阅读 · 0 评论 -
利用Python进行数据分析--数据聚合与分组运算1
转载自:pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键(可以是函数、数组或DataFrame列名)拆分pandas对象。计算分组摘要统计,如计数、平均值、标准差,或用户自定义函数。对DataFrame的列应用各种各样的函数。应用组内转换或其他运算,如规格化、线性回归、排名或选取子集等。计算透视表或转载 2014-11-18 23:45:19 · 2441 阅读 · 0 评论 -
利用Python进行数据分析--数据聚合与分组运算
转载自:http://blog.youkuaiyun.com/ssw_1990/article/details/224229711、quantile计算Series或DataFrame列的样本分位数:[python]view plaincopy>>>importnumpyasnp>>>importpandasaspd转载 2014-11-18 23:44:02 · 9400 阅读 · 0 评论 -
python pandas库的应用(类比mysql语言)
转载自:http://blog.youkuaiyun.com/awayyao/article/details/17785473create table 我们尝试创建一张表,保存每天的三个值In [6]:from pandas import *import numpy as nprandn = np.random.randnrandom_integers = n转载 2014-11-10 21:42:02 · 772 阅读 · 0 评论 -
Scikit Learn: 在python中机器学习
转载自:翻译自:Scikit Learn:Machine Learning in Python作者: Fabian Pedregosa, Gael Varoquaux先决条件Numpy, ScipyIPythonmatplotlibscikit-learn目录载入示例数据一个改变数据集大小的示例:数码数据集(digits data转载 2014-11-11 22:10:55 · 1580 阅读 · 0 评论 -
Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
转载自:曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图谱也是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python。这些年来,接触和使用了很多Python工具包,特别是在文本处理,科学计算,机器学习和数据挖掘领域,转载 2014-11-11 22:08:42 · 1392 阅读 · 0 评论 -
优秀Python学习资源收集汇总
转载自:Python是一种面向对象、直译式计算机程序设计语言。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用縮进来定义语句块。与Scheme、Ruby、Perl、Tcl等动态语言一样,Python具备垃圾回收功能,能够自动管理内存使用。它经常被当作脚本语言用于处理系统管理任务和网络程序编写,然而它也非常适合完成各种高级任务。P转载 2014-11-08 18:10:53 · 595 阅读 · 0 评论 -
收集了一些python的文章
转载自:http://blog.youkuaiyun.com/xyw_blog/article/details/9128777newthreading - safer concurrency for Python 安全并发(1回应) http://www.starming.com/index.php?action=plugin&v=wave&tpl=union&ac=viewgrouppost&g转载 2014-11-22 17:10:35 · 1645 阅读 · 0 评论