五行擒拿术
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
16、围棋程序、服务器及使用亚马逊云服务训练部署围棋机器人指南
本文介绍了两款经典本地围棋程序GNU Go和Pachi的安装与使用方法,推荐了OGS、IGS和Tygem三大英文围棋服务器,并详细指导如何利用亚马逊云服务(AWS)进行深度学习围棋机器人的训练与部署。涵盖从注册AWS账户、启动EC2实例、配置安全组、模型训练到通过HTTP前端共享机器人的完整流程,同时提供成本控制、数据安全和资源管理等实用建议,帮助围棋爱好者和开发者高效提升对弈与开发体验。原创 2025-11-14 07:07:10 · 32 阅读 · 0 评论 -
15、机器学习中的数学基础与反向传播算法详解
本文深入探讨了机器学习中的核心数学基础,涵盖线性代数与微积分的关键概念,并详细解析了反向传播算法的原理与实现。通过丰富的Python代码示例和流程图,文章系统介绍了向量、矩阵、高阶张量的操作,导数与梯度的意义,以及如何利用链式法则进行高效参数更新。同时,还讨论了实际应用中的优化策略,如中间值缓存和操作合并,帮助读者全面理解并掌握构建和训练神经网络所需的数学与计算技能。原创 2025-11-13 16:27:17 · 23 阅读 · 0 评论 -
14、AlphaGo Zero:强化学习与树搜索的融合
AlphaGo Zero 是人工智能领域的里程碑式成果,展示了不依赖人类棋谱、仅通过强化学习和树搜索融合即可在围棋中达到超人类水平的技术路径。本文深入解析其单一神经网络结构、基于MCTS改进的搜索算法、训练流程及关键技术如狄利克雷噪声、批量归一化与残差网络,并介绍开源实现案例,为AI研究者提供理论与实践参考。原创 2025-11-12 10:03:46 · 39 阅读 · 0 评论 -
13、深入解析AlphaGo:从原理到实践
本文深入解析了AlphaGo的核心原理与实现流程,涵盖其结合监督学习、强化学习与树搜索的技术架构。详细介绍了快策略网络、强策略网络和价值网络的训练方法,以及基于这些网络的蒙特卡罗树搜索算法实现。通过代码示例和流程梳理,帮助读者理解AlphaGo如何在围棋中做出超越人类的决策,并探讨了其在人工智能领域的深远影响与未来应用前景。原创 2025-11-11 12:55:16 · 69 阅读 · 0 评论 -
12、基于演员 - 评论家方法的强化学习实践
本文深入探讨了基于演员-评论家方法的强化学习实践,结合围棋AI的训练场景,详细介绍了优势函数在信用分配中的作用、经验收集器的设计改进、双输出神经网络架构的构建与训练过程。通过自对弈生成数据、结合策略与价值学习进行端到端训练,并引入优势来识别关键决策,有效提升了智能体的学习效率。文章还展示了训练流程、网络结构分析、超参数调优策略及实际应用效果,最后展望了与搜索算法结合的未来方向,为构建高效游戏AI提供了完整的技术路径。原创 2025-11-10 11:30:48 · 24 阅读 · 0 评论 -
11、利用价值方法进行强化学习:Q学习算法实战
本文深入介绍了利用Q学习算法进行强化学习的实战方法,重点讲解了如何通过构建行动价值函数Q(s,a)来指导智能体在复杂游戏中做出决策。文章详细阐述了ϵ-贪心策略在探索与利用之间的平衡作用,并展示了如何使用Keras函数式API构建具有棋盘状态和行动双输入的深度神经网络。通过完整的代码示例,涵盖了从网络结构设计、智能体策略实现到模型训练的全过程,帮助读者理解并实践Q学习在游戏AI中的应用。此外,还总结了关键技术对比、实际应用考虑因素及未来发展方向,为深入研究强化学习提供了坚实基础。原创 2025-11-09 12:07:35 · 19 阅读 · 0 评论 -
10、策略梯度强化学习:原理与实践
本文深入介绍了策略梯度强化学习的原理与实践,从简单的'Add It Up'游戏入手,讲解如何通过调整策略提升智能体表现。文章详细阐述了基于神经网络的策略梯度方法、训练流程、优化器调参技巧,并探讨了在围棋等复杂游戏中的应用。同时涵盖了自我对弈训练、性能评估、优势挑战及未来发展趋势,为读者提供了一套完整的策略梯度学习框架与实践经验。原创 2025-11-08 13:34:48 · 15 阅读 · 0 评论 -
9、实践学习:强化学习
本文深入介绍了强化学习的基本概念与核心流程,以构建围棋AI为例,详细阐述了智能体的设计、经验数据的收集与训练方法。通过强化学习循环——收集经验、训练和评估,展示了如何让程序通过实践不断优化策略。文章还探讨了强化学习在机器人控制、自动驾驶等领域的应用,分析了训练速度慢、不稳定及奖励设计难等挑战,并提出了应对策略。最后展望了强化学习与深度学习融合、多智能体协同及复杂环境应用的未来趋势。原创 2025-11-07 10:58:39 · 21 阅读 · 0 评论 -
8、围棋AI机器人的部署与应用
本文详细介绍如何构建一个端到端的围棋AI机器人应用程序,涵盖从创建基于Keras的落子预测代理、使用Flask提供Web前端交互界面,到在云端进行高效模型训练与部署。文章进一步介绍围棋文本协议(GTP)的实现原理,并展示机器人如何通过GTP与其他程序如GNU Go和Pachi进行本地对战。最后,讲解如何将机器人部署到在线围棋服务器(如OGS),实现与人类玩家和其他AI的实时对弈,完整呈现了从模型开发到线上应用的全流程。原创 2025-11-06 09:18:58 · 36 阅读 · 0 评论 -
7、基于深度学习构建强大的围棋机器人
本文介绍了如何基于深度学习构建强大的围棋机器人。通过使用KGS围棋服务器的高水平对局记录,结合SGF文件格式解析技术,实现了从原始数据到深度学习模型输入的完整流程。文中详细阐述了围棋数据的下载、回放与预处理方法,并设计了高效的并行数据处理器和内存友好的数据生成器。在此基础上,构建了多种卷积神经网络模型,采用OnePlane、SevenPlane等编码器进行特征提取,并对比了SGD、Adagrad、Adadelta等优化算法在围棋落子预测任务中的表现。实验表明,利用专业棋谱训练的模型可显著提升预测准确率,结合原创 2025-11-05 10:20:17 · 34 阅读 · 0 评论 -
6、构建用于围棋数据的神经网络
本文详细介绍如何利用深度学习技术构建用于围棋落子预测的神经网络。内容涵盖围棋状态的编码方法、使用MCTS生成训练数据、基于Keras搭建多层感知机与卷积神经网络,并深入探讨了softmax激活函数、交叉熵损失、dropout正则化、ReLU激活函数等关键技术的应用。通过结合CNN、池化、Dropout和优化损失函数,构建高性能的落子预测模型,并展望了模型架构优化、数据处理改进及跨领域应用等未来方向。原创 2025-11-04 13:54:27 · 20 阅读 · 0 评论 -
5、神经网络入门:手写数字识别实战
本文介绍了神经网络的基本概念及其在手写数字识别中的应用。通过使用MNIST数据集,文章从简单的平均数字分类方法入手,逐步引出逻辑回归、前馈网络等模型,并详细讲解了损失函数、梯度下降、反向传播等核心机制。最后,基于Python实现了包含密集层和激活层的顺序神经网络,在手写数字分类任务中取得了超过95%的准确率,帮助读者完成从入门到实战的全过程。原创 2025-11-03 16:57:44 · 23 阅读 · 0 评论 -
4、游戏中的树搜索算法:从基础到实践
本文深入探讨了树搜索算法在游戏中的应用,涵盖极小极大算法、阿尔法-贝塔剪枝和蒙特卡罗树搜索的原理与实现。文章通过井字棋等示例展示算法工作方式,并扩展至路径规划、资源分配和金融投资等实际场景。同时比较了不同算法的优劣,提出了代码优化、并行计算和启发式搜索等性能提升策略,并展望了与深度学习结合、自适应搜索和多智能体系统等未来发展方向。原创 2025-11-02 16:38:19 · 26 阅读 · 0 评论 -
3、从零开始:实现你的第一个围棋AI
本文详细介绍了如何使用Python从零开始实现一个围棋AI。内容涵盖围棋棋盘的数据结构设计、游戏规则的编码实现、GameState状态管理、随机AI的构建,以及通过Zobrist哈希优化性能的方法。同时提供了人机对战和AI自对弈的完整示例代码,为后续结合深度学习等高级技术打下坚实基础。原创 2025-11-01 14:36:08 · 47 阅读 · 0 评论 -
2、围棋:作为机器学习问题的深入剖析
本文深入探讨了围棋作为机器学习问题的研究价值,分析了为何游戏是人工智能研究的理想环境,并详细介绍了围棋规则及其与机器学习的结合方式。文章重点阐述了深度学习在围棋走法选择和局面评估中的优势,展示了监督学习与强化学习在围棋AI中的应用路径。同时提供了围棋人工智能的开发流程、实力衡量方法及未来发展趋势,为理解AI在复杂策略游戏中的应用提供了全面视角。原创 2025-10-31 10:19:13 · 29 阅读 · 0 评论 -
1、深度学习与机器学习入门
本文深入介绍了机器学习与深度学习的基本概念、核心原理及其在实际场景中的应用,特别是以构建围棋AI为例,详细阐述了如何结合深度学习与传统算法实现智能决策。内容涵盖机器学习的三大类型——监督学习、无监督学习和强化学习,并对比了传统编程与机器学习的适用场景。同时介绍了Python在机器学习中的重要作用及相关工具库,如NumPy、Keras和TensorFlow。文章还探讨了深度学习在处理非结构化数据方面的优势,以及在图像识别、自然语言处理和游戏AI等领域的广泛应用,为初学者提供了系统的学习路径和实践指导。原创 2025-10-30 12:25:59 · 27 阅读 · 0 评论
分享