自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 TensorFlow:核心概念与应用实践(含代码)

TensorFlow是由Google开发维护的开源机器学习框架,致力于为机器学习和深度学习提供高效、灵活的开发解决方案。其设计兼顾研究级模型构建与生产级部署需求,现已成为工业界和学术界广泛采用的主流框架。

2025-04-02 22:38:32 328

原创 从思维到行动:Manus通用AI智能体的技术革命与开源生态实践

通过技术解析可见,Manus的成功不仅在于模型性能,更源于对工程化痛点的精准把控。而开源生态的繁荣,或将推动AI智能体从实验室走向千家万户。

2025-03-09 23:00:53 1026

原创 新手入门:如何开始深度学习之旅(附kaggle泰坦尼克号生存预测)

新手应优先掌握Python和基础数学,选择PyTorch或TensorFlow/Keras作为入门框架,结合经典模型(如LeNet、ResNet)进行实践。硬件上建议配置NVIDIA GPU或使用云平台,逐步从简单项目过渡到复杂任务。

2025-02-23 13:36:48 987 1

原创 深度学习革命背后:DBN、AlexNet、GAN 等神级架构,究竟藏着怎样的 AI 崛起密码?(附deepseek)

总参数量达671B的DeepSeek-V3模型中,每个token仅激活37B参数。DBN由多层受限玻尔兹曼机(RBM)堆叠而成,通过无监督预训练初始化权重,再通过反向传播微调。完整实现可参考官方代码及GRPO专项实现,如需特定组件的完整代码示例,可说明具体模块需求。同时预测未来N个token(N=4),训练效率提升3.2倍。其中 ( F ) 是残差函数(如两个卷积层),( x ) 是输入。这些创新构成深度学习的核心骨架,驱动AI从实验室走向工业级应用。为相对优势函数,通过群体策略比较计算。

2025-02-22 23:29:55 1046

原创 神经网络的百年进化:从生物启发到数字革命2

这一时期的突破为21世纪深度学习崛起埋下伏笔:反向传播算法是深度学习的引擎,CNN成为计算机视觉基石,而SVM的竞争则倒逼神经网络改进理论缺陷(如ReLU激活函数解决梯度消失)。反向传播算法通过链式法则将损失函数的梯度从输出层逐层反向传播至输入层,解决了多层神经网络的参数优化问题。这些早期工作为后续深度学习的发展埋下伏笔——尽管短期内受挫,但为1980年代反向传播算法的突破奠定了基础。Frank Rosenblatt的感知机在M-P模型基础上引入。

2025-02-22 17:44:15 965

原创 从神经元到ChatGPT:一文简述神经网络百年进化史以及大语言模型颠覆AI的核心算法1

神经网络从模拟生物神经元起步,历经多次兴衰,最终在算力、数据和算法创新的推动下,催生出以Transformer为核心的大语言模型。LLMs通过自注意力机制和超大规模参数,实现了对人类语言的深刻理解与生成,但其发展仍面临伦理、能耗等挑战。未来,更高效、安全、多模态的模型将是演进方向。

2025-02-16 12:19:00 794

原创 Deepseek原理详解及部署指南(含Windows,Linux,Android,ios)

DeepSeek通过架构创新(如MoE、MLA)和训练优化(如FP8、主动学习),在低算力条件下实现了与顶级模型(如GPT-4)相近的性能,同时兼顾开源与成本效益。其不足在于处理极端复杂多模态场景时仍需优化,且与GPT-4的指令跟随能力存在约20%的差距。未来,随着硬件协同优化和算法迭代,DeepSeek有望进一步突破,推动AI技术的普惠化发展。

2025-02-10 16:18:10 3730 3

原创 人工智能初探4:围棋ai篇2:较复杂规则的完善(含代码)

性能瓶颈MCTS的每次迭代需要神经网络推理,速度较慢。解决方案:实现批量推理(Batch Inference)。训练不稳定自我对弈初期策略随机,生成数据质量低。解决方案:先用人类棋谱进行预训练。规则缺失未实现打劫、眼、禁着点等规则。解决方案:完善GoBoard类中的合法性检查。通过以上简化模拟,可以看到程序的基本流程,但实际开发中需逐步完善细节和优化性能。通过以上代码,我们实现了围棋中的禁着点、眼、打劫等规则。这些规则是围棋AI的基础,确保AI能够合法、合理地落子。

2025-02-07 14:14:59 429

原创 人工智能初探3:围棋ai篇1(含代码)

然而,由于围棋的复杂性和搜索空间的巨大,围棋AI仍然无法与顶级人类棋手匹敌。2016年,Google的AlphaGo在与世界冠军李世石的五番棋比赛中4比1取胜,这是围棋AI历史上的一次重大突破。2006年,IBM的Deep Blue在国际象棋领域击败了世界冠军卡斯帕罗夫,这也启发了研究人员使用深度学习技术来提升围棋AI的水平。围棋AI的发展不仅在围棋领域取得了巨大成功,还对其他领域的人工智能研究产生了深远影响。围棋AI的成功证明了深度学习和强化学习等技术的潜力,也加速了人工智能的发展和应用。

2025-02-03 18:20:28 1227

原创 人工智能初探2(含代码)

超参数是模型训练过程中需要手动设置的参数,它们直接影响模型的性能和训练效率。超参数是模型训练过程中需要手动设置的参数,而不是通过训练数据自动学习的参数。• 较小的batch_size可以提高模型的泛化能力,因为每次更新参数时梯度计算更加随机。• Linear:全连接层,将RNN的输出映射回词汇表大小的向量,用于预测下一个单词。• 较大的batch_size可以提高训练速度,因为每次更新参数时使用了更多的数据。• 更复杂的模型:可以使用LSTM或GRU代替简单的RNN,以提高模型性能。

2025-02-02 15:25:43 575

原创 iphone本地运行ai

本地AI在本地设备上运行,具有数据隐私性强、低延迟、成本低、灵活性高等优势。数据无需上传云端,避免泄露风险,适合医疗、金融等敏感领域;完全控制模型,适配特定硬件。适用于智能家居、医疗健康、自动驾驶等领域。尽管面临硬件限制和部署复杂性等挑战,但随着边缘计算发展,本地AI应用前景广阔。点开左侧栏目,选择models,查看可选择的ai模型,此时直接下载可能会存在网络问题 可打开huggingface镜像站hf-mirror.com选择相应模型下载(注意为gguf格式)尽量选择较小的模型,以提高回答速度。

2025-02-01 16:25:36 182

原创 人工智能训练初探

使用流行的深度学习框架(如TensorFlow、PyTorch、Keras)。- **定义成功标准**:明确如何评估模型的性能(如准确率、F1分数、AUC等)。- **明确任务**:确定AI模型的目标(如分类、回归、生成、预测等)。- **资源评估**:确定可用的计算资源(如GPU、TPU)和数据资源。- 使用预训练模型(如BERT、GPT、ResNet)进行迁移学习。- 对数据进行增强以提高泛化能力(如旋转、翻转、添加噪声等)。- 设置学习率、批量大小、优化器(如Adam、SGD)等。

2025-02-01 14:15:32 541

原创 Caffe

Caffe还提供了丰富的预训练模型,如AlexNet、VGGNet和GoogLeNet等,这些模型在图像分类、目标检测和语义分割等任务上表现出色。Caffe提供了许多常用的层类型,如卷积层、池化层、全连接层等,同时也支持自定义层,使得开发者可以根据自己的需求构建特定的网络结构。它使用了基于GPU的并行计算,可以充分利用现代GPU的并行计算能力,加速模型的训练和推理过程。此外,Caffe还提供了可视化工具,如网络结构可视化和训练过程可视化,帮助开发者理解和调试模型。

2023-07-24 10:43:55 100

原创 Pytorch(含实例)

介绍pytorch(含实例)

2023-07-23 22:07:11 151 1

原创 TensorFlow 的基本概念和使用场景(文字分析详解)(含实例)可直接copy运行

tensorflow简介

2023-07-12 11:33:33 380 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除