
AI理论与实践
文章平均质量分 93
珠峰日记
一位在软件开发领域深耕近20年的资深技术专家。凭借对技术的满腔热忱与不懈钻研,积累了极为丰富且多元的实战经验。
并紧跟技术前沿,对 AI 领域有着深入研究与实践。
展开
-
机器学习之概率论
在本篇中,我们系统学习了概率论和统计推断的基础知识,并探讨了概率统计在AI中的核心应用,包括朴素贝叶斯、贝叶斯网络、隐马尔可夫模型、蒙特卡洛方法以及模型评估。原创 2025-03-20 08:54:32 · 1008 阅读 · 3 评论 -
机器学习之MNIST手写数据集
MNIST数据集源自美国国家标准与技术研究所(NIST),诞生于20世纪80年代。其精心整理与标注的一系列0到9的手写数字图像,成为了机器学习领域图像分类任务的宝贵资源。多年来,它被广泛应用于训练和验证机器学习模型的性能,为无数算法和模型的发展提供了坚实的基础。原创 2025-03-18 10:48:02 · 629 阅读 · 12 评论 -
机器学习之梯度消失和梯度爆炸
在深度学习的神经网络训练过程中,梯度消失和梯度爆炸是较为常见且会严重影响模型训练效果的问题。原创 2025-03-18 10:31:09 · 1009 阅读 · 5 评论 -
机器学习之浅层神经网络
浅层神经网络是一种相对简单的神经网络结构,相较于深度神经网络,其层数较少,一般包含输入层、一个或少数几个隐藏层以及输出层。因其结构简洁,在处理简单任务时,计算量较小、训练速度较快,但在面对复杂的非线性问题时,其特征提取和表达能力相对有限。原创 2025-03-17 11:29:10 · 516 阅读 · 0 评论 -
机器学习之激活函数
激活函数是神经网络的关键组件,作用于神经元输出。神经元汇总输入并计算净输入值,激活函数将其非线性变换,生成神经元最终输出,该输出作为后续神经元输入在网络中传播。原创 2025-03-17 11:19:59 · 1066 阅读 · 10 评论 -
机器学习之特征工程
特征工程是什么:特征工程是将原始数据转化为更能代表预测目标的特征的过程,涉及数据预处理、特征提取、特征选择和特征构造等多个环节,目的是让数据更好地适应机器学习模型,提高模型的性能和效果。特征工程的价值提升模型性能:通过提取和选择有代表性的特征,帮助模型更准确地捕捉数据中的规律,从而提高模型的准确性、泛化能力等性能指标。降低模型复杂度:去除无关或冗余的特征,减少模型训练的参数数量,降低模型过拟合的风险,同时提高模型的训练速度和效率。增强数据理解。原创 2025-03-15 20:56:21 · 1143 阅读 · 3 评论 -
机器学习之向量化
在图像分析中,卷积神经网络(CNN)通过卷积层的卷积核在图像上滑动,自动提取从低级的边缘、纹理到高级的物体局部形状等特征,接着经池化层对特征图下采样,降低数据维度,最终生成特征向量。在文本分类场景中,词袋模型通过统计文本里每个单词的出现次数构建向量,TF - IDF 依据单词在文本中的频率以及在整个文本集合中的逆文档频率,权衡单词对文本特征的贡献,进而将文本转化为向量。通过不同卷积核在图像上的卷积操作,提取图像不同层次的特征,如边缘、角点、纹理等,随着网络层次的加深,逐步提取到更高级、更抽象的特征。原创 2025-03-14 13:35:19 · 1445 阅读 · 5 评论 -
一文看懂神经网络的几个基础问题
神经网络,简单来讲,是一种模拟人类大脑神经元工作方式的计算机模型。我们知道,人类大脑中大约有 860 亿个神经元,这些神经元就如同一个个小小的信息处理站。当我们看到美丽的风景、听到动听的音乐或者感受到温暖的阳光时,神经元们便开始活跃起来,它们相互传递信号,协同合作,帮助我们理解和感知这个丰富多彩的世界。神经网络与之类似,它由大量的神经元(在计算机领域,我们也称之为节点)相互连接组成。为了更好地理解,我们可以把神经网络想象成一个庞大而复杂的快递运输网络。原创 2025-03-14 11:29:19 · 761 阅读 · 0 评论 -
AI科普:一文看懂AI发展历程
长短时记忆网络(LSTM)解决了传统RNN在处理长序列时的梯度问题。想象一下,你读一篇很长的文章,读到后面可能就忘了前面的内容,传统RNN也有类似问题,而LSTM就能很好地记住长时间的信息。注意力机制(Attention Mechanism)就像我们看文章时,会重点关注某些重要的句子和词汇,它能让模型对输入数据中的重要信息更加关注,提高模型的效果。图神经网络(GNN)则是用来处理图结构数据的,比如社交网络里人与人之间的关系,就可以用图来表示,GNN能对这种复杂的关系进行分析和处理。原创 2025-03-12 16:31:25 · 1035 阅读 · 0 评论 -
机器学习之正则化
在机器学习领域,模型的性能至关重要,而过拟合问题常常阻碍模型在实际应用中的表现。正则化技术应运而生,成为解决这一难题的有力武器。它主要分为两大类别,核心目的在于。原创 2025-03-10 14:11:42 · 839 阅读 · 0 评论 -
机器学习之线性代数
向量,在数学上被定义为既有大小又有方向的量,在实际应用中常以有序数字列表的形式呈现。例如在一个三维空间中,向量[1, 2, 3]表示从原点出发,在x轴方向移动1个单位,y轴方向移动2个单位,z轴方向移动3个单位后到达的点所构成的向量。在AI领域,向量的用途极为广泛。在图像识别任务中,图像的特征,如颜色直方图特征,可以用向量来描述。假设我们将图像的颜色空间划分为若干个区间,通过统计每个区间内像素点的数量,就可以得到一个向量,这个向量能够反映该图像在颜色分布上的特点。原创 2025-03-10 11:28:31 · 1406 阅读 · 0 评论 -
一文看懂爆火的Manus
Manus之所以能在众多AI产品中脱颖而出,关键在于其强大的自主操作能力,这构成了它的核心竞争力。自主操作:Manus宛如一位训练有素的专家,能够独立自主地思考问题、规划行动方案并付诸实践,极大程度减少了对用户频繁干预的依赖。用户只需提出大致需求,它便能像经验丰富的老手一样,有条不紊地推进任务流程。任务执行:无论是处理订餐这类生活日常小事,还是投身于市场研究、创建教育内容等复杂专业活动,Manus都能轻松应对,游刃有余。它跨越了不同领域与任务难度的界限,真正实现了全方位服务用户的目标。异步云操作。原创 2025-03-07 08:53:51 · 1257 阅读 · 3 评论 -
机器学习核函数
核函数是一种将低维空间中的向量映射到高维空间中,并计算它们在高维空间中的内积的函数。用数学语言表示,给定低维空间中的两个向量xxx和zzz,核函数KxzK(x,z)Kxz计算的是它们在高维特征空间Φ\PhiΦ中的内积,即KxzΦx⋅ΦzKxzΦx⋅Φz,这里不需要显式地定义映射Φ\PhiΦ的具体形式。原创 2025-03-04 16:00:01 · 827 阅读 · 0 评论 -
机器学习相关知识概述
机器学习:采用非显著式编程(不一步一步定义操作步骤的编程方式)的方式赋予计算机学习能力。规定了行为和收益函数后,让计算机自己去找最大化收益函数的行为。机器学习:一个计算机程序被称为可以学习,是指它能够针对某个任务T和某个性能指标P,从经验E中学习。这种学习的特点是,它在T上的被P所衡量的性能,会随着经验E的增加而提高。(较之定义一更数学化)机器人冲咖啡的例子:任务T: 设计程序让机器人冲咖啡经验E:机器人多次尝试的行为和这些行为产生的结果性能测度P:在规定时间内成功冲好咖啡的次数。原创 2025-03-04 13:57:44 · 1049 阅读 · 0 评论 -
DeepSeek入门介绍(基本原理、首次调用、常见问题)
DeepSeek 是一款由字节跳动等科技力量推动发展的先进人工智能模型。在自然语言处理领域,它如同一位多才多艺的语言大师,能够理解、生成和处理人类语言。随着人工智能技术的飞速发展,对强大且高效的语言模型需求日益增长,DeepSeek 应运而生,旨在为开发者、科研人员和企业提供一个高性能、多功能的语言处理解决方案。原创 2025-02-20 09:57:17 · 1141 阅读 · 0 评论 -
提示词工程(Prompt Engineering,PE)
Prompt提示词工程是一门研究如何设计、优化与大语言模型交互的提示词,以实现特定任务目标的技术。它涉及到对语言模型工作原理的理解,以及如何通过精心构建的文本指令来引导模型生成符合要求的输出。使用简洁、准确的语言表达任务要求,避免歧义。例如,“请对以下文本进行语法纠错:[具体文本]”比“看看这段文字有没有语法问题”更清晰明确。用户可以根据自己的需求定义特定的字符串,用于标识特定的任务或内容,增加提示词的独特性和辨识度。Prompt提示词工程是与大语言模型有效交互的关键技能。原创 2025-02-19 10:26:36 · 396 阅读 · 0 评论