
机器学习
文章平均质量分 94
机器学习
逍遥_yjz
主要从事文本处理,实体识别方向;攻读自然语言处理,深度学习。
展开
-
LightGBM简介
LightGBM 简介及其与XGBoost的比较优缺点原创 2024-06-04 13:55:43 · 866 阅读 · 0 评论 -
机器学习中的数学(3):PCA的降维(协方差和奇异值分解)
1.协方差# coding:utf-8import numpy as npdef testCovariance(): # 测试协方差 X = [[2, 0, -1.4], [2.2, 0.2, -1.5], [2.4, 0.1, -1], [1.9, 0, -1.2]] # print(type(X)) #&l...原创 2018-04-12 10:14:18 · 770 阅读 · 0 评论 -
机器学习中的数学(1):法协方差定义和协方差矩阵计算过程实例
1. 协方差的定义在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。 协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小...原创 2018-04-11 16:26:58 · 2641 阅读 · 0 评论 -
机器学习中的数学(2):numpy中切片、行列向量,奇异值分解
1.ndarray数组维度-横向量和列向量a = array([1,2,3]) #一维列向量print(a.shape, a)b = array([[1,2,3]]) #二维横向量print(b.shape, b)(3,) [1 2 3](1, 3) [[1 2 3]]{关于numpy数组维度表示上的区别,numpy多维数组横向量和列向量的区别}zeros([5...原创 2018-04-12 09:59:57 · 1157 阅读 · 0 评论 -
损失函数中的均方误差以及平方误差
机器学习中的所有算法都依赖于最小化或最大化某一个函数,我们称之为“目标函数”。最小化的这组函数被称为“损失函数”。损失函数是衡量预测模型预测期望结果表现的指标。寻找函数最小值的最常用方法是“梯度下降”。把损失函数想象成起伏的山脉,梯度下降就像从山顶滑下,目的是到达山脉的最低点。损失函数可以大致分为两类:分类损失(Classification Loss)和回归损失(Regression Loss)。下面这篇博文,就将重点介绍5种回归损失。原创 2023-10-23 18:22:53 · 353 阅读 · 0 评论 -
一文搞懂极大似然估计
以下转自 https://zhuanlan.zhihu.com/p/26614750 极大似然估计,通俗理解来说,就是利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的模型参数值!换句话说,极大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。可能有小伙伴就要说了,还是有点抽象呀。我们这样想,一当模型满足某个分布,它的参数值我通过极大似...转载 2018-07-09 11:38:17 · 1300 阅读 · 0 评论 -
基于CRF++词性标注是单个还是成语
用CRF++识别实体,训练集有词、词性。个人标注B、M、E、S。训练集用单个词和词性,还是用成语(多个)和词性作为训练集那?1.单个词包含所有东西(符号什么的),如果识别出一句话里面的人名,地名,组织名。起码是一段话,也会标注识别出各个实体。2.如果是成语,其实更省事,但是也应该加上符号。原创 2017-03-28 17:31:39 · 522 阅读 · 0 评论