
机器学习
文章平均质量分 92
董一峰
苟有恒,何必三更眠五更起;最无益,莫过一日曝十日寒。
展开
-
搜索引擎关键字智能提示实践
搜索关键字智能提示是一个搜索应用的标配,主要作用是避免用户输入错误的搜索词,并将用户引导到相应的关键词上,以提升用户使用体验。原创 2023-02-02 11:27:35 · 1229 阅读 · 0 评论 -
数据结构-AC自动机
AC自动机(Aho-Corasick Automaton)是一种用于字符串匹配的高效算法,尤其适用于在一个文本中查找多个模式字符串的情况。AC自动机最初由 Alfred V. Aho 和 Margaret J. Corasick 在1975年提出,因此得名。该算法在文本搜索、模式匹配等领域有着广泛的应用原创 2024-09-27 11:31:14 · 1162 阅读 · 0 评论 -
机器学习-TopicModel
主题模型(Topic Modeling)是一种用于从文档集合中自动提取隐藏的主题结构的技术。这些主题反映了文档中词汇的共同出现模式,从而揭示了文档集合中的潜在主题。主题模型在文本挖掘、信息检索、自然语言处理等领域有着广泛的应用。原创 2024-09-27 11:01:34 · 932 阅读 · 0 评论 -
机器学习-朴素贝叶斯
朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理的概率分类器,在机器学习和统计学中被广泛用于分类任务。它的“朴素”之处在于假设特征之间相互独立,尽管在现实中这个假设通常不成立,但朴素贝叶斯分类器在许多情况下仍然表现良好。原创 2024-09-27 10:56:58 · 790 阅读 · 0 评论 -
机器学习-SVM
支持向量机(Support Vector Machine, SVM)是一种监督学习模型,主要用于分类和回归分析。SVM的核心思想是通过找到一个超平面(在高维空间中称为超平面,二维空间中称为直线),使得两类样本在该超平面两侧被最大程度地区分开来原创 2024-09-27 10:53:41 · 1261 阅读 · 0 评论 -
机器学习-聚类
聚类算法是一种无监督学习方法,用于将数据集中的对象分成多个组(或簇),使得同一个簇内的对象彼此之间的相似度较高,而不同簇的对象之间相似度较低。聚类的目标是在没有类别标签的情况下,根据对象的特征自动地发现数据内在的结构或分布模式。原创 2024-09-27 10:51:28 · 938 阅读 · 0 评论 -
机器学习-KNN
K-Nearest Neighbors (KNN) 分类器是一种基于实例的学习算法,用于分类和回归任务。KNN的核心思想是根据输入样本的特征值,在特征空间中找到最接近该样本的K个邻居,并根据这些邻居的多数类别来决定输入样本的类别。原创 2024-09-27 10:47:06 · 662 阅读 · 0 评论 -
机器学习-模型集成
XGBoost(Extreme Gradient Boosting)是一种流行的机器学习算法,特别适用于处理具有大量数据的监督学习任务。它基于梯度提升决策树(Gradient Boosting Decision Trees, GBDT)框架,通过优化目标函数并使用正则化技术来提高模型的性能。原创 2024-09-27 10:29:15 · 1362 阅读 · 0 评论 -
机器学习-决策树
决策树(Decision Tree)是一种监督学习算法,用于分类和回归任务。它通过树形结构来表示一系列的规则,从而对输入的数据进行分类或预测。决策树模型易于理解和解释,因此在许多领域得到了广泛应用。原创 2024-09-27 10:18:03 · 1764 阅读 · 0 评论 -
Query 语义聚类
搜索系统优化长尾 query。想了解一下长尾 query 长什么样?大体上都有几类?最好能归类,一类一类处理。原创 2023-02-02 11:32:58 · 605 阅读 · 0 评论 -
Query Kmeans
通过 kmeans 对用户 Query 进行聚类原创 2022-09-14 14:07:58 · 1013 阅读 · 2 评论 -
关联规则挖掘
关联规则挖掘原创 2017-08-03 14:25:12 · 818 阅读 · 0 评论 -
K最邻近算法(K-Nearest Neighbor,KNN)(初探)
http://app.yinxiang.com/shard/s27/sh/73e3a39b-bb22-40b6-9fdd-228d4567422a/4fc90a46d2a45542026af6fcc4e40c53原创 2013-11-06 21:24:24 · 724 阅读 · 0 评论 -
线性感知机和SVM(初探)
https://www.evernote.com/shard/s146/sh/9ff61eb0-e777-4da0-bc11-09f5f0769383/b88a9d30bd7079d540a117e8c77c4f69原创 2013-11-06 21:04:10 · 860 阅读 · 0 评论 -
线性回归和逻辑回归(初探)
线性回归:一元线性回顾,多元线性回归,从概率和Bayesian 后验概率方面来解释线性回归。逻辑回归:梯度下降法,牛顿法,回溯直线搜索来确定步长。正则化框架:常用的正则化项。原创 2013-11-12 21:40:26 · 836 阅读 · 0 评论 -
Topic Model
概率图模型基础,概率潜在语义分析 Probabilistic Latent Semantic Analysis(PLSA),LDA (Latent Dirichlet Allocation) 潜在狄利克雷分配原创 2014-02-24 15:25:56 · 1096 阅读 · 0 评论 -
朴素贝叶斯分类
分类是机器学习最常见的任务不同类型的分类分类器的分类朴素贝叶斯分类(Naive Bayes,NB)评测朴素贝叶斯分类特点原创 2014-02-17 22:43:46 · 865 阅读 · 0 评论 -
机器学习笔记目录
朴素贝叶斯分类器,K最近邻分类器,线性回归,逻辑回归,Topic Model,聚类,关联规则挖掘,Apriori ,FP-Growth原创 2014-03-05 22:04:28 · 951 阅读 · 0 评论 -
直线拟合衡量投资组合收益稳定性
有如下图投资组合的净值走势图,如何去衡量组合的稳定性?组合稳定性,如果理解为组合净值走向可预测,那么我可以拟合一条直线,用图2 中阴影面积来作为稳定性的分值。拟合直线 假设直线:y=kx+by=kx+b k 是斜率,b 是斜率。 训练数据:[(x1,y1),(x2,y2)...(xn,yn)][(x_1,y_1),(x_2,y_2)...(x_n,y_n)] 策略:用最小二乘进行参数估计原创 2015-10-17 19:43:41 · 1067 阅读 · 0 评论 -
聚类(初探)
http://www.evernote.com/shard/s146/sh/1e71a872-5a86-49ad-b8e7-da571e995ca0/a0a5cf3b63d686a140fb6705f9cb96bd原创 2013-11-04 09:42:13 · 492 阅读 · 0 评论