python9snake
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
16、围棋程序、服务器及使用AWS训练部署围棋机器人指南
本文介绍了两款经典本地围棋程序GNU Go和Pachi的安装与使用方法,推荐了OGS、IGS和Tygem三大在线围棋服务器。重点讲解如何利用亚马逊云服务(AWS)中的EC2实例训练和部署基于深度学习的围棋机器人,涵盖从环境搭建、实例配置、模型训练到Web托管的完整流程,并提供了常见问题解决方案与未来拓展方向,帮助开发者高效构建智能围棋AI。原创 2025-11-10 00:15:46 · 25 阅读 · 0 评论 -
15、机器学习中的数学基础与反向传播算法
本文深入探讨了机器学习中的核心数学基础,涵盖线性代数与微积分的基本概念及其在数据表示和优化算法中的应用。文章详细介绍了向量、矩阵、张量的操作,导数与梯度的意义,并系统讲解了反向传播算法的原理与实现流程。通过代码示例和图解,帮助读者理解前馈神经网络中的梯度计算与参数更新机制,强调了数学理论在深度学习中的重要性,同时提供了进一步学习的经典书籍推荐。原创 2025-11-09 14:43:22 · 28 阅读 · 0 评论 -
14、AlphaGo Zero:将树搜索与强化学习相结合
AlphaGo Zero通过结合深度神经网络与强化学习,实现了无需人类棋谱的完全自我训练,并在围棋领域达到超越人类的水平。本文深入解析其核心技术,包括单一神经网络结构设计、基于先验概率引导的树搜索算法、以访问次数为监督信号的训练机制,以及批量归一化、残差网络和狄利克雷噪声等关键技术的应用。同时提供了自我对弈模拟、经验收集与模型训练的实现方法,并展望了该技术在跨领域决策系统中的潜力。原创 2025-11-08 09:48:46 · 26 阅读 · 0 评论 -
13、深入解析AlphaGo:原理、实现与实践考量
本文深入解析了AlphaGo的核心原理、系统架构与实现细节,涵盖其三大神经网络(快速策略网络、强大策略网络和价值网络)的设计与训练方法,详细介绍了基于监督学习与强化学习的训练流程,以及结合策略与价值网络的改进型蒙特卡罗树搜索算法。文章还提供了关键代码实现、实践优化建议,并探讨了AlphaGo在人工智能发展中的意义、未来趋势及面临的计算资源、数据安全与可解释性等挑战,为理解与复现AlphaGo系统提供了全面的技术参考。原创 2025-11-07 09:20:12 · 23 阅读 · 0 评论 -
12、基于演员-评论家方法的强化学习:构建自我提升的游戏AI
本文介绍了基于演员-评论家方法的强化学习技术,用于构建能够自我提升的游戏AI。通过引入优势函数解决信用分配问题,结合策略学习与价值估计,提升训练效率和稳定性。文章详细阐述了神经网络的设计、经验数据的收集与处理、训练流程及评估机制,并展示了如何通过多输出网络实现策略与价值的联合学习,最终构建出具备基本博弈能力的智能代理。原创 2025-11-06 10:01:24 · 11 阅读 · 0 评论 -
11、使用Q学习算法打造自我提升的游戏AI
本文介绍了如何使用Q学习算法训练自我提升的游戏AI,重点讲解了动作价值函数、ϵ-贪婪策略的实现原理及其在Keras中的具体应用。通过构建双输入神经网络模型,结合经验数据进行监督式训练,使AI能够在国际象棋、围棋等策略游戏中不断优化决策能力。文章还对比了Q学习与策略学习、树搜索的异同,并提供了完整的代码实现和训练流程,为开发智能游戏AI提供了系统性的解决方案。原创 2025-11-05 13:22:36 · 13 阅读 · 0 评论 -
10、策略梯度强化学习:从基础到实践
本文深入探讨了策略梯度强化学习的基本原理与实践应用,从简单的'Add It Up'游戏示例入手,讲解如何通过经验数据优化智能体策略。文章涵盖了策略梯度的核心算法、神经网络训练、损失函数设计及优化器调参技巧,并介绍了在围棋等复杂游戏中的应用方法。此外,还拓展到机器人控制和资源分配等实际场景,展望了与其他技术融合的未来趋势,为读者提供了完整的策略梯度学习路径与实战建议。原创 2025-11-04 16:21:39 · 9 阅读 · 0 评论 -
9、强化学习:通过实践学习
本文深入探讨了强化学习的核心思想及其在围棋AI中的应用,介绍了强化学习循环、经验构成、智能体构建与训练过程。通过自对战方式收集经验数据,并结合神经网络实现策略优化。文章还拓展到机器人控制、游戏开发、金融投资和资源管理等多个应用场景,分析了样本效率低、训练不稳定和维度灾难等挑战及解决方案,并展望了强化学习与其他技术融合、多智能体协同、可解释性提升和无模型方法发展的未来趋势。原创 2025-11-03 09:23:31 · 14 阅读 · 0 评论 -
8、围棋机器人的部署与应用
本文详细介绍如何构建和部署一个端到端的围棋机器人系统。内容涵盖落子预测代理的实现与序列化、基于Flask和jgoboard的Web前端开发、在云端(如AWS)进行模型训练与部署的方法、通过围棋文本协议(GTP)与其他机器人对战的机制,以及将机器人连接到在线围棋服务器(如OGS)的完整流程。系统支持本地人机对弈、机器人间对战及长期在线服务,为人工智能在围棋领域的应用提供了完整的实践方案。原创 2025-11-02 16:36:00 · 14 阅读 · 0 评论 -
7、构建深度学习围棋机器人:从数据学习到实战应用
本文详细介绍如何利用KGS服务器的高段位围棋对弈记录,通过智能游戏格式(SGF)解析、数据预处理、特征编码与模型训练,构建一个基于深度学习的围棋机器人。涵盖了从数据下载、SGF解析、多类型编码器设计(如七平面和十一平面)、并行数据处理生成器构建,到使用自适应优化器训练卷积神经网络的完整流程。同时提供了性能评估方法与实验调参建议,为实现高性能围棋AI提供端到端的技术方案。原创 2025-11-01 12:37:51 · 14 阅读 · 0 评论 -
6、构建用于预测围棋落子的神经网络
本文详细介绍如何构建一个用于预测围棋落子的神经网络模型,涵盖从围棋状态的数据编码、使用MCTS生成训练数据、Keras模型搭建,到卷积神经网络(CNN)的应用与优化全过程。通过引入Softmax激活函数、交叉熵损失函数、Dropout正则化和ReLU激活函数,显著提升了模型的预测准确率。文章还探讨了池化方法、网络结构调优及未来改进方向,为构建高性能围棋AI提供了系统性实践指南。原创 2025-10-31 10:47:29 · 12 阅读 · 0 评论 -
5、神经网络入门:手写数字识别实践
本文介绍了神经网络的基本概念及其在手写数字识别中的应用。通过使用MNIST数据集,文章逐步讲解了数据预处理、简单模型尝试、逻辑回归与多层网络结构,并深入探讨了前馈网络、损失函数、梯度下降与反向传播等核心机制。最后,从零实现了一个基于Python的顺序神经网络,展示了如何通过密集层和激活层构建模型,并在训练中达到95%以上的分类准确率,为深度学习入门提供了完整实践路径。原创 2025-10-30 15:46:42 · 11 阅读 · 0 评论 -
4、游戏AI中的树搜索算法全解析
本文深入解析了游戏AI中的各类树搜索算法,重点介绍了极小极大搜索、α-β剪枝和蒙特卡罗树搜索(MCTS)在回合制游戏中的应用。文章从游戏分类出发,详细阐述了确定性与完全信息游戏中的决策机制,并通过井字棋和围棋等实例展示了算法的实现过程。针对复杂游戏的搜索效率问题,提出了深度剪枝和宽度剪枝的优化策略。对于难以评估局面的围棋,引入MCTS结合随机模拟与UCT公式平衡探索与利用,实现了无需先验知识的有效决策。最后总结了各类算法的适用场景及其在现代游戏AI中的重要地位。原创 2025-10-29 15:36:37 · 14 阅读 · 0 评论 -
3、实现首个围棋机器人:从基础到实践
本文详细介绍了如何使用Python从零开始实现一个围棋机器人。内容涵盖围棋游戏的基本表示、棋盘与串(GoString)的设计、游戏状态的管理、自杀与劫规则的判断,并通过Zobrist哈希优化性能。文章实现了首个随机机器人,支持人机对弈和机器人自对弈,同时分析了其局限性,并展望了引入MCTS、深度学习和强化学习等技术来构建更强围棋AI的方向。原创 2025-10-28 12:37:19 · 13 阅读 · 0 评论 -
2、将围棋视为机器学习问题:解锁智能博弈的奥秘
本文探讨了将围棋视为机器学习问题的研究路径,分析了游戏作为AI研究对象的优势,详细介绍了围棋规则及其复杂性。文章重点阐述了深度学习在围棋AI中的两大应用:走法选择与位置评估,并讨论了如何通过树搜索与神经网络结合提升AI实力。同时,介绍了衡量AI水平的方法,包括与已知强度的AI对战及在公共服务器上进行基准测试。最后提供了开发围棋AI的完整流程与进一步学习资源,展示了从规则理解到模型迭代优化的全过程。原创 2025-10-27 15:33:51 · 12 阅读 · 0 评论 -
1、深度学习入门:机器学习概述
本文深入浅出地介绍了机器学习的基本概念、主要类型及其与人工智能的关系,探讨了机器学习在不同场景下的适用性,并通过实际示例展示了其基本流程。文章重点讲解了监督学习、无监督学习和强化学习的特点与应用场景,介绍了深度学习的核心思想及其在图像、语言等非结构化数据处理中的优势。同时,概述了使用Keras进行神经网络设计与训练的学习路径,并展望了机器学习在医疗、金融、交通等领域的广泛应用前景,强调了数据质量、模型选择和参数调优等实践要点。原创 2025-10-26 10:13:31 · 16 阅读 · 0 评论
分享