
机器学习
文章平均质量分 95
住在天上的云
人工智能领域新星创作者。一直在路上,学习有趣的知识,关注我的朋友们,一起进步呀!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【机器学习笔记】支持向量机SVM
分类算法回顾决策树样本的属性非数值目标函数是离散的贝叶斯学习数值或非数值连续的(概率)K-近邻空间(例如欧氏空间)中的点连续的也可以是离散的支持向量机 (Support Vector Machine)空间(例如欧氏空间)中的点连续的也可以是离散的背景信息当前版本的支持向量机大部分是由 Vapnik 和他的同事在 AT&T贝尔实验室 开发的支持向量机 (Support Vector Machine,SVM)是一个最大间隔分类器(Max Margin Classifier)原创 2024-02-21 10:00:00 · 1063 阅读 · 0 评论 -
【机器学习笔记】基于实例的学习
动机:人们通过记忆和行动来推理学习。原创 2024-02-11 10:00:00 · 1794 阅读 · 0 评论 -
【机器学习笔记】贝叶斯学习
最小二乘法(Least Squares Method),又称最小平方法,是一种数学优化方法,它通过最小化误差的平方和来找到数据的最佳函数匹配。最大后验概率的思想是,在有一些关于参数的先验知识的情况下,根据观测数据来修正参数的概率分布,并选择使后验概率最大的参数值作为估计值。,表示在已知事件 D 发生的情况下,事件 h 发生的概率;,表示在已知事件 h 发生的情况下,事件 D 发生的概率;,表示在没有任何其他信息的情况下,事件 h 发生的概率;,表示在没有任何其他信息的情况下,事件 D 发生的概率;原创 2024-02-10 15:00:00 · 1873 阅读 · 0 评论 -
【机器学习笔记】决策树
例子:每个叶节点都对应单个训练样本 —— 每个训练样本都被完美地分类(查表)在每个节点 N上,我们选择一个属性 T,使得到达当 前派生节点的数据。在有n类时,最大错分类混杂度 = 最大Gini混杂度。a. 真实数据,b. 非过拟合结果,c. 过拟合结果。——当数据的分裂在统计意义上并不显著时,就停止增长。上测试剪去每个可能节点(和以其为根的子树)的影响。:通常 一个节点不再继续分裂,当到达一个节点的。——我们偏向于使用简洁的具有较少节点的树。:设定一个较小的阈值,如果满足。在信息理论中,熵度量了信息的。原创 2024-02-09 15:00:00 · 1666 阅读 · 0 评论 -
【机器学习笔记】机器学习基本概念
什么是机器学习—— 在某种任务上基于经验不断进步T (Task):需要解决什么任务P(Performance):任务确定什么指标E(Experience):通过什么经验学习进步归纳学习假设任一假设若在足够大的训练样例集中很好地逼近目标函数, 它也能在未见实例中很好地逼近目标函数通用机器学习系统设计用于训练的经验——数据、训练过程、特征(训练数据偏差)到底应该学什么——目标函数:正确 vs 可行(假设应该如何表示——函数类型必须依据表达能力仔细选取。原创 2024-02-09 10:00:00 · 807 阅读 · 0 评论 -
【机器学习】某闯关类手游用户流失预测
手游在当下的日常娱乐中占据着主导性地位,成为人们生活中放松身心的一种有效途径。近年来,各种类型的手游,尤其是闯关类的休闲手游,由于其对碎片化时间的利用取得了非常广泛的市场。然而在此类手游中,新用户流失是一个非常严峻的问题,有相当多的新用户在短暂尝试后会选择放弃,而如果能在用户还没有完全卸载游戏的时候针对流失可能性较大的用户施以干预(例如奖励道具、暖心短信),就可能挽回用户从而提升游戏的活跃度和公司的潜在收益,因此用户的流失预测成为一个重要且挑战性的问题。原创 2024-02-01 16:25:14 · 1994 阅读 · 3 评论 -
【机器学习】基于集成学习的 Amazon 用户评论质量预测
随着电商平台的兴起,以及疫情的持续影响,线上购物在我们的日常生活中扮演着越来越重要的角色。在进行线上商品挑选时,评论往往是我们十分关注的一个方面。然而目前电商网站的评论质量参差不齐,甚至有水军刷好评或者恶意差评的情况出现,严重影响了顾客的购物体验。因此,对于评论质量的预测成为电商平台越来越关注的话题,如果能自动对评论质量进行评估,就能根据预测结果避免展现低质量的评论。本案例中我们将基于集成学习的方法对 Amazon 现实场景中的评论质量进行预测。原创 2024-02-01 16:15:51 · 2112 阅读 · 2 评论 -
【机器学习】AAAI 会议论文聚类分析
每年国际上召开的大大小小学术会议不计其数,发表了非常多的论文。在计算机领域的一些大型学术会议上,一次就可以发表涉及各个方向的几百篇论文。按论文的主题、内容进行聚类,有助于人们高效地查找和获得所需要的论文。本案例数据来源于AAAI 2014上发表的约400篇文章,由UCI公开提供,提供包括标题、作者、关键词、摘要在内的信息,希望大家能根据这些信息,合理地构造特征向量来表示这些论文,并设计实现或调用聚类算法对论文进行聚类。最后也可以对聚类结果进行观察,看每一类都是什么样的论文,是否有一些主题。原创 2024-02-01 16:08:40 · 1595 阅读 · 0 评论 -
【机器学习】基于K-近邻的车牌号识别
图像的智能处理一直是人工智能领域广受关注的一类技术,代表性的如人脸识别与 CT 肿瘤识别,在人工智能落地的进程中发挥着重要作用。其中车牌号识别作为一个早期应用场景,已经融入日常生活中,为我们提供了诸多便利,在各地的停车场和出入口都能看到它的身影。车牌号识别往往分为字符划分和字符识别两个子任务,本案例我们将关注字符识别的任务,尝试用 K-NN 的方法对分割好的字符图像进行自动识别和转化。原创 2024-02-01 15:22:02 · 1771 阅读 · 0 评论 -
【机器学习】贝叶斯垃圾邮件识别
电子邮件是互联网的一项重要服务,在大家的学习、工作和生活中会广泛使用。但是大家的邮箱常常被各种各样的垃圾邮件填充了。有统计显示,每天互联网上产生的垃圾邮件有几百亿近千亿的量级。因此,对电子邮件服务提供商来说,垃圾邮件过滤是一项重要功能。而朴素贝叶斯算法在垃圾邮件识别任务上一直表现非常好,至今仍然有很多系统在使用朴素贝叶斯算法作为基本的垃圾邮件识别算法。 本次实验数据集来自Trec06的中文垃圾邮件数据集,目录解压后包含三个文件夹,其中data目录下是所有的邮件(未分词),已分词好的邮件在。原创 2024-02-01 15:00:56 · 2388 阅读 · 9 评论 -
【机器学习】基于回归分析的大学综合得分预测
大学排名是一个非常重要同时也极富挑战性与争议性的问题,一所大学的综合实力涉及科研、师资、学生等方方面面。目前全球有上百家评估机构会评估大学的综合得分进行排序,而这些机构的打分也往往并不一致。在这些评分机构中,世界大学排名中心(Center for World University Rankings,缩写CWUR)以评估教育质量、校友就业、研究成果和引用,而非依赖于调查和大学所提交的数据著称,是非常有影响力的一个。原创 2023-11-23 11:31:24 · 1561 阅读 · 0 评论 -
【机器学习】ID3决策树设计——基于决策树的英雄联盟游戏胜负预测
英雄联盟(League of Legends,LoL)是一个多人在线竞技游戏,由拳头游戏(Riot Games)公司出品。在游戏中,每位玩家控制一位有独特技能的英雄,红蓝两支队伍各有五位玩家进行对战,目标是摧毁对方的基地水晶。水晶有多座防御塔保护,通常需要先摧毁一些防御塔再摧毁水晶。玩家所控制的英雄起初非常弱,需要不断击杀小兵、野怪和对方英雄来获得金币、经验。经验可以提升英雄等级和技能等级,金币可以用来购买装备提升攻击、防御等属性。原创 2023-11-10 16:00:13 · 1552 阅读 · 0 评论