skearn 库是机器学习相关的非常强大的python库,常见的算法在里面都有实现。我计划的学习方法是看懂源代码框架。之前从来没看过这么大的代码量,都是matlab小打小闹的一些东西,看起来感觉还是比较困难的,特别是python 语法也并不特别熟悉。此文做一点学习摘要,鼓励自己坚持下去。
参考文档:scikit learn use guide
1、datasets
也就是reshape ,文档中举了个例子,把每个8*8的image 转化成64位向量.用的是numpy.reshape.(函数详细说明 http://docs.scipy.org/doc/numpy/reference/generated/numpy.reshape.html)
numpy.reshape(a, newshape, order='C')Gives a new shape to an array without changing its data.
2、文档后半部分介绍了各个算法的用法,具体代码实现和公示推到在scikit learn docs 里,所以只大致浏览了一下,画了个提纲。
然后开始看scikit learn docs ,对照着API 看源代码。
首先讲一下我的基础,python语法看了半天。。。所以一开始看我就知道会很慢,比如看的前两行代码,import copy import warnings 我都要问度娘的水平=。=同步开了一个文章:python学习笔记之各种函数各种库。
源代码学习难度真的很大,我决定一步一步来,先学会使用这个库按照useguide 来处理数据,学会调参。具体代码实现通过matlab来做。