
智能决策
文章平均质量分 85
超自然祈祷
让计算机成为我们无与伦比的利器
--searching for what I need in the world
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
庙算兵棋推演AI开发初探(支线-AI平台注意及tips)
输出回放数据,在显示中发现一动不动,发现stage字段一直是1部署阶段……这个我每次关机后都得重新来一遍,很讨厌,也没找到解决办法。确定发出了部署命令还没效果,看看你的下有没有这个隐藏文件,你现在是什么用户就在什么下。原创 2025-05-23 09:58:44 · 458 阅读 · 0 评论 -
六边形棋盘格(Hexagonal Grids)的坐标
这种就是把【方格子坐标】做到的具体来说有如下几种情况具体到庙算平台上,是很巧妙的用一个4位整数,前两位为x、后两位为y来进行表示附上计算距离的代码。原创 2025-04-19 23:09:32 · 512 阅读 · 0 评论 -
庙算兵棋推演AI开发初探(7-神经网络训练与评估概述)
前面我们,接下来我们需要训练神经网络了,就是把数据对接好灌进去,训练后查看预测的和实际的结果是否一致——也就是。数据解析提取数据编码为数据集设计神经网络-->>神经网络训练与评估神经网络一个重要指标是,就是用可以逼近任意函数的神经网络是否可以。再重复一遍【特征工程】与【神经网络】的区别:前者就像人发现了牛顿第二定律,显式的找到并处理数据,然后;后者是把包含多余的各种参数都放到神经网络中,然后人为的中,经过训练得到隐含关系,原创 2025-04-28 23:30:19 · 942 阅读 · 2 评论 -
庙算兵棋推演AI开发初探(空想篇-RLHF尝试)
一直没实现,以下写自 2024-07-30 23:27:16。原创 2025-03-30 11:50:56 · 729 阅读 · 0 评论 -
庙算兵棋推演AI开发初探(6-神经网络开发)
本质:不断求导找拟合,使得loss收敛,使得acc预测准确率变高用法:编码映射到标签结构:层级输入输出、loss函数设计、优化器。原创 2025-03-29 23:32:44 · 1228 阅读 · 0 评论 -
庙算兵棋推演AI开发初探(5-数据处理)
兵棋推演的五个要素:态势、动作、地图、想定、武器原创 2025-02-20 00:50:33 · 880 阅读 · 0 评论 -
星际争霸2 sc2replay回放文件, python库sc2reader
项目地址有个说明文档,结果也没说清楚使用方法(至少我没看见)先引入项目地址上说的能处理的东西:Replays 回放重播详情(地图、长度、版本、扩展、日期时间、游戏类型/速度等)玩家详细信息(姓名、种族、团队、颜色、bnet url、赢/输......消息详细信息(文本、时间、玩家、目标、ping 等)Unit Selection 和 Hotkey (Control Group) 事件。资源转移和请求(但不包括收集速率或未花费的总数!原创 2024-11-20 00:57:59 · 939 阅读 · 0 评论 -
RLHF(带有人类反馈的强化学习)初探
这个很难去在复杂的RTS游戏中界定,不像赛车游戏那样有限的操作空间——后来我想到了“策略的提取”,这样能体现一个人的相关思想(比如让某个人年轻时的思维来处理现在的问题,与当下的新思维碰同一个问题,一定很有趣。在深入研究和思考后发现,现有的比较接近的解决方案是【强化学习中的“模仿学习”】,但是这需要大量的对战数据。原创 2024-09-04 00:40:46 · 1058 阅读 · 0 评论 -
python-sc2 星际争霸2接口的运行-随笔
跑出来sc2py的一路踩坑记录原创 2024-07-31 00:27:04 · 833 阅读 · 0 评论 -
庙算兵棋推演AI开发初探(4-调用AI模型)
前面讲了如何开展编写规则脚本型Agent(智能体)的方法,现在探究一下如何调用知识型(一般而言的训练出的模型)智能体的方法。train_red_demo.py 文件,提供与示例ai智能体相匹配的训练示例代码。test_red_demo.py 文件,提供与示例ai智能体相匹配的测试示例代码。转回来,看agent.py文件,这个文件是调用智能体的文件,讲规则智能体的时候我也讲到过。2. 本代码包括1个文件夹,2个文件,需要与 train_env 的目录同级。然后我就奇怪,到底是哪里调用所谓的”训练模型“呢?原创 2024-05-13 23:00:00 · 1116 阅读 · 0 评论 -
庙算兵棋推演AI开发初探(3-编写策略(下))
这里map.gen_move_route函数和self.get_move_type函数又引用自其他地方编写的。仔细看一下,原来是类似于函数指针的写法,将一堆变量指向了一堆函数,然后在代码里定义了诸多的函数。上一篇已经写了,调用起来就是遍历单位、找到合理的动作,再去使用编写的获取具体哪个动作的函数。gen_move函数,就是得到一个路径列表的返回值。这回从解读step函数中的这两句代码开始,返回的。就是上面这段,重点是本篇博文开始时提到的那两行。基本流程至此都看明白了,那么如何编写一个策略呢。原创 2024-01-01 15:44:39 · 1000 阅读 · 2 评论 -
庙算兵棋推演AI开发初探(2-编写策略(上))
它接受一个字典类型的参数,表示当前的游戏状态、环境信息或玩家信息等。以下是态势()最外层的数据结构以及他们代表的含义。obs = {"actions": list, # 上一步接收到的动作"cities": [], # 各个夺控点的信息"communication": [], # 通信相关信息"jm_points": [], # 间瞄点信息"judge_info": [], # 裁决信息"landmarks": {}, # 地标信息,雷场,路障"operators": [], # 算子信息。原创 2023-12-27 23:08:54 · 2142 阅读 · 0 评论 -
庙算兵棋推演AI开发初探(1-调用结构)
庙算兵棋推演平台中的环境对编写AI的调用方式原创 2023-12-23 12:18:41 · 2126 阅读 · 0 评论 -
庙算兵棋推演平台配置(SDK v2.0.6)
9月23开始,9月26完成。因为那时刚从大连回来,十一之后又一个紧急项目当项目负责人,所以隔了这么久才发出来。我尝试进行制作平台AI,想在我的小平板上配好,最好还可以移植。于是我采用WSL(windows自带的)+vscode来进行执行。原创 2023-12-12 00:32:00 · 2656 阅读 · 4 评论