
人工智能
文章平均质量分 95
李昌晋
蓝桥云课业务合作、校蓝桥杯授课讲师、天梯赛教练
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
模型评估与优化
在样本数量较少的情况下,如果将样本划分为训练集、测试集,可能导致单个集合样本数量更少,可以采取交叉验证法来训练和测试模型.将所有数据,划分成N等分,用每份都去训练,用每份都去测试所有的数据,都去训练,所有的数据都去测试“交叉验证法”(cross validation)先将数据集D划分为k个大小相同(或相似)的、互不相交的子集,每个子集称为一个"折叠"(fold),每次训练,轮流使用其中的一个作为测试集、其它作为训练集. 这样,就相当于获得了k组训练集、测试集,最终的预测结果为k个测试结果的平均值.原创 2025-02-08 15:04:35 · 976 阅读 · 0 评论 -
分类——朴素贝叶斯
概率是反映随机事件出现的可能性大小. 随机事件是指在相同条件下,可能出现也可能不出现的事件. 例如:(1)抛一枚硬币,可能正面朝上,可能反面朝上,这是随机事件. 正/反面朝上的可能性称为概率;(2)掷骰子,掷出的点数为随机事件. 每个点数出现的可能性称为概率;(3)一批商品包含良品、次品,随机抽取一件,抽得良品/次品为随机事件. 经过大量反复试验,抽得次品率越来越接近于某个常数,则该常数为概率.我们可以将随机事件记为A或B,则P(A), P(B)表示事件A或B的概率.PA∣BPAPB。原创 2025-02-08 12:32:29 · 604 阅读 · 0 评论 -
分类——支持向量机
支持向量机(Support Vector Machines)是一种二分类模型,在机器学习、计算机视觉、数据挖掘中广泛应用,主要用于解决数据分类问题,它的目的是寻找一个超平面来对样本进行分割,分割的原则是间隔最大化(即数据集的边缘点到分界线的距离d最大,如下图),最终转化为一个凸二次规划问题来求解。通常SVM用于二元分类问题,对于多元分类可将其分解为多个二元分类问题,再进行分类。所谓“支持向量”,就是下图中虚线穿过的边缘点。支持向量机就对应着能将数据正确划分并且间隔最大的直线(下图中红色直线)。原创 2025-02-08 12:26:27 · 928 阅读 · 0 评论 -
分类——决策树
决策树是一种常见的机器学习方法,其核心思想是相同(或相似)的输入产生相同(或相似)的输出,通过树状结构来进行决策,其目的是通过对样本不同属性的判断决策,将具有相同属性的样本划分到一个叶子节点下,从而实现分类或回归. 以下是几个生活中关于决策树的示例.【示例1】【示例2】在上述示例模型中,通过对西瓜一系列特征(色泽、根蒂、敲声等)的判断,最终我们得出结论:这是否为一个好瓜. 决策过程中提出的每个判定问题都是对某个属性的“测试”,例如“色泽=?”,“根蒂=?”. 每个测试的结果可能得到最终结论,也可能需要进行下原创 2025-02-08 12:24:11 · 911 阅读 · 0 评论 -
分类——逻辑回归
1)逻辑回归是分类问题,用于实现二分类问题2)实现方式:利用线性模型计算,在逻辑函数作用下产生分类3)多分类实现:可以将多分类问题转化为二分类问题实现4)用途:广泛用于各种分类问题。原创 2025-02-08 12:20:49 · 1089 阅读 · 0 评论 -
决策树回归
核心思想:相似的输入必会产生相似的输出。例如预测某人薪资:年龄:1-青年,2-中年,3-老年学历:1-本科,2-硕士,3-博士经历:1-出道,2-一般,3-老手,4-骨灰性别:1-男性,2-女性年龄1⎩⎨⎧学历1学历2学历3年龄2⎩⎨⎧学历1学历2学历3年龄3⎩⎨⎧学历1学历2学历3。原创 2024-12-29 01:38:08 · 982 阅读 · 0 评论 -
线性回归问题
设给定一组属性xxx1;x2;;x_2;...;x_n)xxx1;x2;...;xnyw1x1w2x2w3x3wnxnbyw1x1w2x2w3x3...wnxnbywTxbywTxb其中,ww1;w2;;wnxx1;x2;;xnw=(w_1;w_2;原创 2024-12-29 01:35:42 · 1110 阅读 · 0 评论 -
matplotlib
plt.figure方法不仅可以构建一个新窗口,如果已经构建过title='A’的窗口,又使用figure方法构建了title=‘A’ 的窗口的话,mp将不会创建新的窗口,而是把title='A’的窗口置为当前操作窗口。案例:绘制两条曲线: sin_x = sin(x) cos_x = cos(x / 2) / 2 [0-8π]linestyle: 设置线型,常见取值有实线(‘-’)、虚线(‘–’)、点虚线(‘-.’)、点线(‘:’)案例:绘制正弦、余弦曲线,并设置线型、线宽、颜色、透明度。原创 2024-12-29 01:26:21 · 640 阅读 · 0 评论 -
pandas
pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入 了大量库和一些标准的数据模型,提供了高效地操作大型结构化数据集所需的工具。原创 2024-12-29 01:18:41 · 752 阅读 · 0 评论 -
numpy
Numerical Python,数值的Python,补充了Python语言所欠缺的数值计算能力。Numpy是其它数据分析及机器学习库的底层库。Numpy完全标准C语言实现,运行效率充分优化。Numpy开源免费。原创 2024-12-29 01:13:39 · 661 阅读 · 0 评论