
《机器学习探索之旅》(理论与实践)
文章平均质量分 95
《机器学习探索之旅》专栏,带你解锁机器学习的奥秘。从基础概念到经典算法,从实践应用到前沿技术,我们将为你展现机器学习的全貌。通过生动的案例和通俗易懂的解释,让你轻松掌握机器学习的核心知识。无论你是初学者还是专业人士,都能在这里找到属于自己的学习之旅。一起探索机器学习的无限可能,开启智能时代的新篇章!
程序小勇
本人热爱专研IT技术,广泛且深入学习研究前后端开发、机器学习和深度学习算法,是一名全栈优秀开发高级工程师,曾在华为总部工作3年,负责IT研发,积累丰富开发技术经验。欢迎关注,一起交流学习进步哦,更多精彩等你!
展开
-
Machine Learning机器学习之文本分析的词法分析、句法分析、语义分析(详细讲解)
在机器学习中,文本分析的词法分析通常涉及使用统计和机器学习技术来从文本中提取词汇信息,并将文本切分成有意义的词语。这个过程通常被称为分词(tokenization)。基于统计的分词方法基于频率统计的方法:根据词在文本中的频率信息,将文本分割成词语。常见的方法包括基于词频的分割、基于字符频率的分割等。基于信息熵的方法:利用信息熵原理,将文本划分成最小熵的词组合。常见的方法包括最大熵模型、信息熵分割等。基于机器学习的分词方法。原创 2024-04-01 18:15:14 · 2977 阅读 · 6 评论 -
Machine Learning机器学习之文本分析
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径。在机器学习的应用中,文本分析是一个重要的方向。文本分析是指对文本的表示及其特征项的选取,它是文本挖掘、信息检索的一个基本问题。文本是由一定的符号或符码组成的信息结构体,这种结构体可采用不同的表现形态,如语言的、文字的、影像的等等。原创 2024-03-31 23:44:15 · 4999 阅读 · 55 评论 -
大语言模型定义、概念介绍
在本次讨论中,我们介绍了大型语言模型(LLM)的概念、背景和应用。LLM是一种基于深度学习技术构建的人工智能模型,旨在理解和生成人类语言。这些模型通常拥有数十亿甚至数千亿的参数,通过在大规模文本数据上进行训练,能够学习并捕捉语言数据中的复杂模式和结构。LLM在各种自然语言处理任务中展现了强大的性能,包括文本生成、文本分类、机器翻译、情感分析等。它们通过预训练和微调的方式,逐步提高模型的性能和泛化能力,成为解决各种语言相关问题的重要工具。原创 2024-03-30 23:54:22 · 1111 阅读 · 2 评论 -
Machine Learning机器学习之数据可视化
大数据可视化是指利用各种可视化技术和工具来探索、分析和展示大规模数据集的过程。随着数据规模的不断增大和多样性的增加,传统的数据处理和分析方法已经无法满足对数据进行全面理解和深入挖掘的需求,因此大数据可视化成为了处理大规模数据的重要手段之一。大数据可视化的主要目标是通过图形化展示数据,帮助人们从数据中发现模式、趋势、异常和关联性,从而做出更加明智的决策。它可以帮助用户更直观地理解数据的含义、结构和特征,提供更深入的洞察和见解,以支持各种领域的决策和行动。原创 2024-03-29 20:37:54 · 1862 阅读 · 27 评论 -
Machine Learning机器学习之高维数据降维(主成分分析PCA、线性判别分析、自编码器超级无敌详细讲解)
高维数据降维是指将具有大量特征的数据转换为具有更少特征的数据的过程。在现实世界中,许多数据集具有大量的特征,这可能会增加建模的复杂性,并导致维度灾难(Curse of Dimensionality)问题的出现。高维数据降维的目的是减少特征的数量,同时保留数据中最重要的信息,以便更好地理解数据、可视化数据、加快计算速度和提高模型性能。主成分分析PCA,局部线性嵌入LLE算法应用与实现、自编码器算法原创 2024-03-29 19:55:40 · 2493 阅读 · 6 评论 -
Machine Learning机器学习之统计分析
机器学习是一种人工智能(AI)的分支领域,其目标是通过从数据中学习规律和模式,让计算机系统能够从经验中改善和自我完善。简单来说,机器学习是一种让计算机从数据中学习如何完成任务的方法,而无需明确地编程规则。通常情况下,机器学习算法会分析大量的数据,识别数据中的模式和趋势,并利用这些模式和趋势进行预测或决策。机器学习的关键在于自动化地从数据中发现规律和模式,并利用这些知识来解决新的问题或做出预测。监督学习(Supervised Learning)原创 2024-03-28 23:59:26 · 1292 阅读 · 18 评论 -
Machine Learning机器学习之贝叶斯网络(BayesianNetwork)
贝叶斯网络(Bayesian Network),也称为信念网络(Belief Network)或概率有向无环图(Probabilistic Directed Acyclic Graph,PDAG),是一种用图形表示概率模型的方法,它基于概率推断的贝叶斯定理。贝叶斯网络的背景可以追溯到 1980 年代初期,它是由一些著名的人工智能研究者如Judea Pearl、Peter Spirtes、Clark Glymour等提出和发展起来的。原创 2024-03-28 23:14:39 · 8895 阅读 · 5 评论 -
Machine Learning机器学习之K近邻算法(K-Nearest Neighbors,KNN)
K近邻算法最早由美国的科学家Thomas Cover 和 Peter Hart 在 1967 年提出,并且在之后的几十年中得到了广泛的研究和应用。KNN 算法是一种基于实例的学习方法,它不像其他算法一样需要对数据进行假设或者参数拟合,而是直接利用已知的数据样本进行预测。KNN 算法是一种简单有效的分类和回归算法,算法的核心思想是“近朱者赤,近墨者黑”,即认为与新样本距离较近的训练样本更可能具有相同的类别或者输出。它的基本假设是“相似的样本在特征空间中具有相似的类别”。原创 2024-03-27 23:59:36 · 848 阅读 · 9 评论 -
Machine Learning机器学习之向量机(Support Vector Machine,SVM)
支持向量机(Support Vector Machine,SVM)是由等人于1990年提出的一种监督学习算法。它的核心思想是通过在特征空间中找到一个最优的超平面来进行分类,使得两个类别的样本之间的间隔最大化。SVM 在分类、回归分析、异常检测等领域都有着广泛的应用。SVM 在高维空间中可以非常高效地进行分类,适用于数据维度较高的情况,如文本分类、图像分类等。SVM 的目标是最大化分类边界的间隔,因此具有较好的泛化能力,对于未见过的数据集也有较好的表现。原创 2024-03-27 23:42:09 · 1855 阅读 · 2 评论 -
Machine Learning机器学习之随机森林(Random Forests)
随机森林(Random Forest)是由Leo Breiman和Adele Cutler于2001年提出的一种集成学习方法,首次在其论文《Random Forests》中发表,用于解决分类和回归问题。它是一种决策树的集成方法,通过构建多棵决策树并进行集成,来提高预测性能和稳定性。随机森林的核心思想是通过构建多棵决策树,并将它们集成在一起,来提高整体模型的性能和鲁棒性。原创 2024-03-26 16:52:30 · 2984 阅读 · 7 评论 -
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
决策树是一种经典的机器学习算法,用于解决分类和回归问题。它的基本思想是通过对数据集中的特征进行递归划分,构建一系列的决策规则,从而生成一个树状结构。在决策树中,每个内部节点表示对输入特征的一个测试,每个分支代表一个测试结果,而每个叶子节点表示一个类别或输出值。决策树的发展历史可以追溯到20世纪50年代和60年代。最早的决策树算法是ID3(Iterative Dichotomiser 3),由Ross Quinlan于1986年提出。之后,原创 2024-03-26 15:47:14 · 2017 阅读 · 0 评论 -
机器学习之线性回归与逻辑回归【完整房价预测和鸢尾花分类代码解释】
机器学习的起源可以追溯到人工智能的发展历程。虽然人工智能的概念早在20世纪50年代就已经出现,但直到之后几十年里,随着计算机技术的不断发展和数据的日益增多,机器学习才逐渐成为人工智能领域的主流技术之一。以下是机器学习发展的几个重要时期和里程碑逻辑理论和符号学习: 20世纪50年代末到60年代初,人工智能研究主要集中在基于逻辑理论和符号推理的方法上。这一时期出现了逻辑推理、专家系统等符号学习方法,但受限于计算机技术和数据量的限制,这些方法的应用受到了很大的局限性。连接主义和神经网络。原创 2024-03-25 09:15:00 · 1707 阅读 · 2 评论 -
详解机器学习概念、算法
它的核心思想是通过训练模型来识别数据中的模式和规律,然后利用这些模型进行预测和决策。3. 训练:训练模型是指使用已知数据来调整模型的参数,使其能够更好地适应数据中的模式和规律。5. 预测和决策:训练好的模型可以用于进行预测和决策,根据输入数据生成输出结果。总的来说,机器学习通过让计算机系统从数据中学习,使其能够自动发现数据中的模式和规律,并利用这些知识进行预测和决策,从而实现各种人工智能应用。这些算法在各种机器学习任务中都有广泛的应用,选择适当的算法取决于问题的性质、数据的特点以及所需的性能指标。原创 2024-03-24 23:59:51 · 663 阅读 · 2 评论