- 博客(82)
- 收藏
- 关注
原创 Chapter 5 Deep Learning
梯度是个向量那么如何有效得将百万维的向量计算出来,这时候我们就需要使用Backpropagation。
2022-08-31 16:27:52
596
原创 Chapter 3 New Optimizers for Deep Learning
New Optimizers for Deep Learning
2022-08-21 11:36:39
190
原创 Chapter 4 k-近邻算法与朴素贝叶斯
k-近邻的优缺点(1)k值大小k值取很小:容易受异常点影响k值取很大:容易受最近数据太多导致比例变化(2)优缺点:优点:简单,易于理解,易于实现,无需估计参数,无需训练缺点:懒惰算法,对测试样本分类时的计算量大,内存开销大;必须指定K值,K值选择不当则分类精度不能保证。使用场景:小数据场景,几千~几万样本,具体场景具体业务去测试。k-近邻算法实现:加快搜索速度——基于算法的改进KDTree,API接口里面有实现拉普拉斯平滑系数:问题:从上面的例子我们得到娱乐概率为0,这是不合理的,如果词频
2022-06-22 16:00:50
552
原创 Chpater 3 sklearn数据集与估计器
训练集:75%(推荐)、70%、80%。用于训练,构建模型测试集:25%(推荐)、30%、20%。在模型检验时使用,用于评估模型是否有效sklearn.datasets加载获取流行数据集datasets.load_()获取小规模数据集,数据包含在datasets里datasets.fetch_(data_home=None)获取大规模数据集,需要从网络上下载,函数的第一个参数是data_home,表示数据集下载的目录,默认是 ~/scikit_learn_data/load和fetch返回的数据类型d
2022-06-16 16:31:46
183
原创 Chapter 2 特征工程、机器学习算法
其它特征选择方法神经网络降维案例使用Jupyterps:其他降维方法——线性判别分析LDA监督学习 :特征值+目标值分类(目标值离散型)—— k-近邻算法、贝叶斯分类、决策树与 随机森林、逻辑回归、神经网络回归(目标值连续型)——线性回归、岭回归标注——隐马尔可夫模型 (不做要求)无监督学习:特征值聚类——k-means...
2022-06-15 20:26:32
150
原创 Chapter 1机器学习概述
机器学习是从数据中自动分析获得规律(模型), 并利用规律对未知数据进行预测机器学习的数据:文件csvMySQL:1.性能瓶颈、读取速度慢2.格式不太符合机器学习要求的格式pandas:读取工具构成:Kaggle特点:1、大数据竞赛平台 2、80万科学家 3、真实数据 4、数据量巨大UCI特点:1、收录了360个数据集 2、覆盖科学、生活、经济等领域 3、数据量几十万scikit-learn特点:1、数据量较小 2、方便学习特征值+目标值(有些数据集是可以没有目标值的)导入scikit-learn
2022-06-14 20:11:48
211
原创 Chapter 7 树
树树的定义是一个抽象数据类型(ADT)或是作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它由n个有限节点组成一个具有层次关系的集合。树的特点每个节点有零个或者多个子节点。没有父节点的节点称为根节点。每一个非根节点有且只有一个父节点(重要)。除了根节点外,每个子节点可以分为多个不相交的子树。树的术语节点的度——一个节点含有的子树的个数。树的度——一棵树中,最大的节点的度。叶节点或终端节点——度为0的节点。即没有子节点的节点。父亲节点或父节点——若一个节点含有
2022-05-31 17:20:09
792
原创 Chapter 6 希尔排序、快速排序、归并排序、二分查找
希尔排序希尔排序是插入排序的一种,也称缩小增量排序。希尔排序时间复杂度最优时间复杂度:根据步长序列的步长的不同而不同最坏时间复杂度:O(n²)稳定性:不稳定希尔排序算法的实现#coding = utf-8def shell_sort(alist): '''希尔排序''' #n=9 n=len(alist) #gap=4 gap = n//2 #gap变化到0之前,插入算法执行的次数 while gap>=1: #
2022-05-24 12:21:29
245
原创 Chapter 5 冒泡排序、选择排序与插入排序
排序算法的稳定性排序算法——一种能将一串数据依照特定顺序进行排列的一种算法。稳定性——稳定排序算法会让原本有相等键值的记录维持相对次序。冒泡排序冒泡排序的时间复杂度最坏时间复杂度:O(n²)#coding=utf-8def bubble_sort(alist): '''冒泡排序''' n=len(alist) for j in range(0,n-1): #O(n) #走需要进行的次数 for i in range(0,n-1
2022-05-20 22:14:23
176
原创 Chapter 4 双向链表、栈、队列
双向链表(双面链表)对于头结点来说,prev=None对于尾结点来说,next=None关于双链表的操作双链表的判空、长度、遍历操作与单链表相同,见:Chapter 3 单向链表双链表的头部添加、尾部添加、指定位置添加操作#coding=utf-8class Node(object): '''节点''' def __init__(self,elem): self.elem=elem self.next=None #后继
2022-05-18 22:00:18
313
原创 Chapter 3 单向链表
链表的提出为什么需要链表链表结构可以充分利用计算机内存空间,实现灵活的内存动态管理。链表的定义链表——一种常见的基础数据结构,与顺序表统称为线性表,但是不像顺序表一样连续存储数据,而是在每个节点(数据存储单元)里存放下一个节点的位置信息(即地址)。分为数据区和连接区:数据区存放数据,链接区存放下一个数据的地址。如图所示。单链表的ADT模型Python中变量标识的本质变量a是一个存储空间,当a=10时,10也放在另一个存储空间里面,a会指向10的地址。即:等号存在就是引用一个链接。然后a
2022-05-16 22:10:48
258
原创 Chapter 2 顺序表
数字为8个字节,对应4个字节(存储单元)地址也占4个字节顺序表的基本形式两种基本形式:顺序表:存在一组相同的数据类型的数据,最好使用顺序表来存储它们,如图a。元素外置的顺序表若存在的数据各不相同,则会将其地址重新存放到一个循序表中,如图b。图解如下:左侧是顺序表结构,右侧是元素外置的顺序表结构。顺序表的结构与实现顺序表的结构完整信息:表中元素的集合、表头信息(元素存储区的容量、当前表中已有的元素个数)元素存储区的容量——在存储之前设置的容量。顺序表的两种基本实现方式一体式结
2022-05-15 21:07:55
261
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人