自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 MYSQL索引原理和实现

一、数据库索引介绍数据库索引索引是加速表的查询效率而创建的数据结构日常场景:新华字典的目录类似一个索引。构造一个索引过程例子user_id/索引列 磁盘地址 磁盘地址 order_id/主键 user_id shop_id create_time status amount delivery_amount 1000 0x01 0x01 1 1000 7567 2/19/2020

2021-07-25 14:23:01 535 1

原创 Redis核心原理与实战之Redis特性

一、持久化□ 何为持久化□ 为什么要做持久化□ 持久化方式? 1.将数据写入磁盘(RDB) 2.将操作记录写入磁盘(AOF)□ RDB持久化□ 手动触发RDBSAVE:执行save命令期间,Redis不能处理其他命令,直到RDB过程完成为止。BGSAVE:指定bgsave命令期间,Redis会在后台异步执行RDB,此时Redis仍然可以响应客户端请求。□ 自动触发RDB□ 调用周期函数(serverCron),默认每100毫秒执行一次。□ 检查...

2021-05-03 16:12:49 231

原创 Redis核心原理与实战之Redis对象

一、键(key)的通用操作 命令 描述 KEYS pattern 查找所有符合给定模式(pattern)的key。 DEL key 该命令用于在key存在时删除key EXISTS key 检查给定key是否存在 MOVE key db 将当前数据库的key移动到给定的数据库db当中。 RENAME key newkey 修改key的名称 RENAMENX key newkey 仅当newkey不存在时,将k

2021-05-03 14:08:27 223

原创 【深度学习】变量和模型保存加载

一、可视化学习变量● 变量也是一种OP,是一种特殊的张量,能够进行存储持久化,它的值就是张量,默认被训练变量的创建● tf.Variable(initial_value=None,name=None,trainable=True)● 创建一个带值initial_value的新变量 ●assign(value) 为变量分配一个新值● eval(session=None) 计算并返回此变量的值● name属性表示变量名字变量的初始化● tf.gl...

2020-08-02 21:25:24 327

原创 【深度学习】张量和基本运算

一、张量的阶和数据类型张量简介● TensorFlow基本的数据格式● 一个类型化的N维度数组(tf.Tensor)● 三部分:名字,形状和数据类型张量的阶张量的数据类型张量属性● graph 张量所属的默认图● op 张量的操作名● name 张量的字符串描述● shape 张量的形状张量的动态形状和静态形状● TensorFlow中,张量具有静态形状和动态形状● 静态形状创建一个张量,初始状态的形状: ● tf.Tens...

2020-08-01 18:24:45 1327

原创 【深度学习】初识TensorFlow

一、认识深度学习深度学习使用场景:● 图像理解● 语音识别● 自然语言处理● 机器自主(无人驾驶)深度学习,如深度神经网络、卷积神经网络和递归神经网络已被应用计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并取得了很好的效果。深度学习在人工智能领域的地位:深度学习框架:二、认识Tensorflow● Google Brain计划产物● 应用于Alpha GO,Gmail,Google Maps等1000多个产品● 于2015年11月开

2020-07-28 23:51:47 277

原创 【机器学习】k-means

一、非监督学习(unsupervised learning)K-means1)从原始数据到聚类完毕的数据:2)聚类流程示意图:二、k-means步骤1、随机设置K个特征空间内的点作为初始的聚类中心2、对于其他每个点计算到K个中心的距离,未知的点选择最近的一个聚类中心点作为标记类别3、接着对着标记的聚类中心之后,重新计算出每个聚类的新中心点(平均值)4、如果计算得出的新中心点与原中心点一样,那么结束,否则重新进行第二部过程三、k-means API● sklean.

2020-07-26 19:17:55 542

原创 【机器学习】逻辑回归

一、分类算法-逻辑回归应用场景● 广告点击率● 是否为垃圾邮件● 是否患病● 金融诈骗● 虚假账号(逻辑回归是解决二分类问题的利器)逻辑回归公式二、sigmoid函数趋势图:公式:输出:[0,1]区间的概率值,默认0.5作为阀值注:g(z)为sigmoid函数三、逻辑回归的损失函数、优化(了解)与线性回归原理相同,但由于是分类问题,损失函数不一样,只能通过梯度下降求解对数似然损失函数:完整的损失函数:cost损失的值

2020-07-25 23:43:41 324

原创 【机器学习】线性回归

一、线性关系模型一个通过属性的线性组合来进行预测的函数:w为权重,b称为偏置项,可以理解为:二、线性回归定义:线性回归通过一个或者多个自变量和因变量之间进行建模的回归分析。其中可以为一个或多个自变量之间的线性组合(线性回归的一种)一元线性回归:涉及到的变量只有一个多元线性回归:涉及到的变量两个或两个以上通用公式:其中w,x为矩阵:三、损失函数(误差大小)●为第i个训练样本的真实值●为第i个训练样本特征值组合预测函数总损失定义:又称最小二..

2020-07-20 00:29:23 1135

原创 【机器学习】决策树和随机森林

认识决策树一、决策树决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-then结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法。二、实例:猜谁是世界杯冠军每猜一次给一块钱,告诉我是否猜对了,那么我需要掏多少钱才能知道谁是世界冠军?我可以把球编上号,从1到32,然后提问:冠军在1-16号吗?依次询问,只需要五次就可以知道结果。信息熵“谁是世界杯冠军”的信息量应该比5比特少。香农指出,它的准确信息量应该是:● H的专业术语称之为信息熵,单位为比特。.

2020-07-18 22:13:15 902

原创 【机器学习】朴素贝叶斯算法

一、联合概率和条件概率联合概率:包含多个条件,且所有条件同时成立的概率。记作:P(A,B)P(A,B)=P(A)P(B)条件概率:就是事件A在另外一个事件B已经发生条件下的发生概率。记作:P(A|B)特性:P(A1,A2|B)=P(A1|B)P(A2|B)注意:此条件概率的成立,是由于A1,A2相互独立的结果二、朴素贝叶斯-贝叶斯公式注:w为给定文档的特征值(频数统计,预测文档提供),c为文档类别公式可以理解为:其中c可以是不同类别公式分为三个部分:

2020-07-12 19:36:49 779

原创 【机器学习】K-近邻算法

一、分类算法-k近邻算法(KNN)定义:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。来源:KNN算法最早是由Cover和Hart提出的一种分类算法。案例:电影分类计算距离公式两个样本的距离可以通过如下公式计算,又叫欧氏距离比如说,a(a1,a2,a3),b(b1,b2,b3)二、sklearn k-近邻算法API...

2020-07-11 15:50:09 281

原创 【机器学习】机器学习算法分类以及开发流程

一、机器学习开发流程首先需要明确:(1)算法是核心,数据和计算是基础(2)找准定位大部分复杂模型的算法设计都是算法工程师在做,而我们● 分析很多的数据● 分析具体的业务● 应用常见的算法● 特征工程、调参数、优化我们应该怎么做:1.学会分析问题,使用机器学习算法的目的,想要算法完成何种任务2.掌握算法基本思想,学会对问题用相应算法解决3.学会利用库或者框架解决问题数据类型● 离散型数据:由记录不同类别个体的数目所得到的的数据,又称计数数据,所有这些数据

2020-07-05 20:56:27 503

原创 【机器学习】数据降维

一、特征选择1、特征选择是什么1)什么是特征?鸟:羽毛颜色、眼睛宽度、是否有爪子、爪子长度2)特征选择是什么特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后可以改变或不改变值,但是选择后的特征维数肯定比选择前小,毕竟我们只选择了其中的一部分特征。主要方法(三大武器):Filter(过滤器):VarianceThreshold Embedded(嵌入式):正则化、决策...

2020-07-05 12:21:29 424

原创 【机器学习】数据特征预处理

一、特征预处理是什么通过特定的统计方法(数学方法)将数据转换成算法要求的数据数值型数据:标准缩放: 1、归一化 2、标准化 3、缺失值类别型数据:one-hot编码时间类型:时间的切分sklearn特征处理API:sklean.preprocessing二、特征预处理-归一化特点:通过对原始数据进行变化把数据映射到(默认为[0,1])之间...

2020-06-29 00:43:06 364

原创 【机器学习】特征工程和文本特征提取

一、特征工程是什么特征工程是将原始数据转换未更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测的准确性。二、数据集结构:特征值+目标值举例:房价预测注:有些数据集可以没有目标值三、机器学习工作流程四、scikit-learn库介绍● python语言的机器学习工具● scikit-learn包括许多知名的机器学习算法的实现● scikit-learn文档完善,容易上手,丰富的API,使其在学术界颇受欢迎...

2020-06-27 22:06:57 576

原创 【Redis源码阅读】内存管理之zmalloc

一、内存分配void *zmalloc(size_t size) { //分配内存,保存数据的大小和数据本身 void *ptr = malloc(size+PREFIX_SIZE); //内存溢出处理 if (!ptr) zmalloc_oom_handler(size);//记录内存新增分配的大小#ifdef HAVE_MALLOC_SIZE update_zmalloc_stat_alloc(zmalloc_size(ptr)); retur

2020-06-21 15:54:13 221

原创 【ZMQ源码阅读】数据结构之单向链表zlist

2020-06-20 22:28:21 509

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除