- 博客(299)
- 资源 (2)
- 收藏
- 关注
原创 庙算兵棋推演AI开发初探(6-神经网络开发)
本质:不断求导找拟合,使得loss收敛,使得acc预测准确率变高用法:编码映射到标签结构:层级输入输出、loss函数设计、优化器。
2025-03-29 23:32:44
1124
原创 庙算兵棋推演AI开发初探(5-数据处理)
碎碎念:这最近几个月过得那叫一个难受,研究生开题没过、需求评审会在4月和6月开了2次、7月紧接着软件设计评审会,加班干得都是文档的事情,还有开会前的会务和乱七八糟的琐事,我们干的还被规定弄的束手束脚,领导还在“动态的增加任务”,逼得我和领导发了个火……把人当承载任务的工具和垫脚石,不考虑员工的自身发展、创造性和工作时间,我是怎么还能待到现在的。——2024.7.28以上开题终于在12月过了,刚过去的这周又全周无休准备出差的东西,今天终于有时间在开题后搞一搞了——2025.1.6。
2025-02-20 00:50:33
726
原创 pyTorch笔记
1.前言学人工智能,少不了深度学习和神经网络,之前都是只有理论和新闻的那种大致的、模糊的印象,现在开始学习了。构造神经网络感觉实践的对象就改变了,之前做数据系统、软件界面面对的都是字节流、结构体以及控件,现在面对的是nn(neural network ,神经网络)了。2.神经网络实现的现成框架:Caffe(c++实现的)采用以层为单位的抽象,优点是逻辑清晰,实现简便,但是需要手动实现梯度计算;而Tensorflow是以计算图为基础,是,先编译后计算;pyTorch是。
2025-01-06 22:23:16
757
1
原创 Python小括号( )、中括号[ ]和大括号{}代表什么
python语言最常见的括号有三种,分别是:小括号( )、中括号[ ]和大括号也叫做花括号{ },分别用来代表不同的python基本内置数据类型。python中的小括号( ):代表tuple元组数据类型,元组是一种不可变序列, 它,并且这些元素在元组中是按照特定的顺序排列的。尽管元组内的元素不能直接修改,但可以通过创建新的元组来实现类似修改的效果。
2024-12-27 08:03:15
830
原创 可执行python脚本,latex公式,如何相互转化?(挖坑,待探索)
最后我找到了灵活、包多可以执行的python脚本语言,以及可以在word等文档中显示的纯代码表示的latex公式——如何让这两个媒介进行相互转化?我听说过MatLab,我又找到了maple数学软件,mathematica数学软件。经过搜索,后者是可以通过统一的代码来进行公式的表达。我想到一个问题,书本上的数学公式变成可以运行的代码需要一步翻译,但翻译后的代码又十分不具备直观性,对领域而非代码专家十分不友好。由此我又想到了一个问题,如何使用这种统一描述来对实际上是同一公式的不同形式来进行识别?
2024-12-10 22:03:06
379
原创 星际争霸2 sc2replay回放文件, python库sc2reader
项目地址有个说明文档,结果也没说清楚使用方法(至少我没看见)先引入项目地址上说的能处理的东西:Replays 回放重播详情(地图、长度、版本、扩展、日期时间、游戏类型/速度等)玩家详细信息(姓名、种族、团队、颜色、bnet url、赢/输......消息详细信息(文本、时间、玩家、目标、ping 等)Unit Selection 和 Hotkey (Control Group) 事件。资源转移和请求(但不包括收集速率或未花费的总数!
2024-11-20 00:57:59
823
1
原创 计算机基础算法与人工智能算法盘点
正是由于我在学习ai时发现一种和以往知识的割裂感才突发奇想写这篇博文计算机一般是对进行操作,所以cs算法一般的问题就是:搜索(查找),排序。处理这两种问题的方法,复杂点的就是在某种数据结构上进行(比如树、图,以及更高级的树和图,如B树之流)而人工智能要处理是,所以ai算法的基本问题是:搜索、推理、学习。其中的学习用上了数学上的:统计回归(分类,聚类)拟合概率分布(构建神经网络,优化神经网络)
2024-10-26 21:00:22
350
3
原创 Word办公自动化的一些方法
1.Word部分内容介绍word本身是带有格式的一种文档,有人说它本质是XML,所以一定要充分利用标记了【样式】的特性来迅速调整【格式】,从而专心编辑文档内容本身。样式(集)编号(多级关联样式编号)段落(包括行间距、首行缩进等主要要求)目录(以及题注的域)显示隐藏符号(以及换页符等容易导致灵异的问题)2.Word本身的技巧word本身的功能就很强大,只不过有很多我们找不到或者不会用罢了。1)详见我的2020年6月(文档时间)的一个总结:word样式集技巧小
2024-09-29 23:42:35
1396
原创 Windows PowerShell相关笔记
执行win+x ,点击Windows PowerShell(管理员),显示了个人配置占用时间。之前我写的一篇,把我的PS(power shell)该了配置文件。最近发现打开power shell好慢,每次都conda弄得……要删除个人配置,执行如下可以看到自己的个人配置文件在哪,删掉就行。WSL 的基本命令 | Microsoft Learn。文件里写的自动加载conda。
2024-09-22 13:43:57
318
原创 RLHF(带有人类反馈的强化学习)初探
这个很难去在复杂的RTS游戏中界定,不像赛车游戏那样有限的操作空间——后来我想到了“策略的提取”,这样能体现一个人的相关思想(比如让某个人年轻时的思维来处理现在的问题,与当下的新思维碰同一个问题,一定很有趣。在深入研究和思考后发现,现有的比较接近的解决方案是【强化学习中的“模仿学习”】,但是这需要大量的对战数据。
2024-09-04 00:40:46
1035
原创 强化学习实操入门随笔
态势、奖惩反馈、终止信号从上面的step函数获取在强化学习(Reinforcement Learning, RL)应用于游戏开发中,通常需要游戏提供一系列接口(API)来与RL算法进行交互。
2024-09-01 17:46:53
1142
原创 qss要经常用选择器防止样式继承泛滥影响子控件
我本来想这样,像瀑布一样,有块石头挡住父页面流下来的qss,但是实际实验中发现除非断流这个父瀑布,否则子页面一直收到影响。所以后来用选择器做“水管”,只让qss输送到本页面上,而下面不需要特别设定的控件就可以用瀑布漫灌。我想起来就画了这么一张图。
2024-08-23 22:33:00
582
原创 强化学习课程重温-(乱七八糟)笔记
State用于决定下一步的信息•分为和•反映环境发生什么改变•环境自身的状态和环境反馈给agent的状态并不一定相同•Agent的现在所处状态的表示•RL所用的状态?!是对状态的观察•可能不相同▸是所有ActionStateReward的序列在每个时间步,环境给Agent发送的标量数字定义了强化学习问题中的目标定义了对Agent而言什么是好、什么是坏的事件;是Agent面临问题的即时和决定性的特征,是环境状态即时、本质的期望。
2024-08-11 18:41:06
961
原创 庙算兵棋推演AI开发初探(4-调用AI模型)
前面讲了如何开展编写规则脚本型Agent(智能体)的方法,现在探究一下如何调用知识型(一般而言的训练出的模型)智能体的方法。train_red_demo.py 文件,提供与示例ai智能体相匹配的训练示例代码。test_red_demo.py 文件,提供与示例ai智能体相匹配的测试示例代码。转回来,看agent.py文件,这个文件是调用智能体的文件,讲规则智能体的时候我也讲到过。2. 本代码包括1个文件夹,2个文件,需要与 train_env 的目录同级。然后我就奇怪,到底是哪里调用所谓的”训练模型“呢?
2024-05-13 23:00:00
1019
原创 即时战略游戏AI实现方式的调查整理
我在2013年初开始接触贴吧、同时期接触魔兽争霸地图编辑器,后来到2015年之间做rpg地图小赚过一点钱~对物体编辑器、触发之类的比较熟悉。上面是一点碎碎念,一些东西如果不在想到的时候随手写下可能一辈子也没机会写下了……下面正文开始。
2024-04-07 23:15:54
477
原创 当项目负责人的一点经验(不断更新)
乙方就是乙方,别觉得自己发号施令太官僚主义,他们收钱办事天经地义这本身就是一桩买卖,做不了别收钱啊。要官僚,不然真的能让你教他们用word,教他们怎么做原型,甚至还想让你帮着写代码。契约留痕的模式,让他们的项目经理签字,定要求的时间点,违约多了到时候捅上去也有证据。乙方的外协配套名单要有一份,手伸的太长也得要。发现有问题尽早戳破,不然越隐瞒越大。不催不问,那乙方是真的能不给你做。
2024-04-03 17:13:47
170
原创 论文是怎么一回事
论文都是在期刊上发表的(当然也有会议论文、学位论文),期刊太多就有组织来建立期刊的索引库,所以论文是否被某个索引库收录全看这个期刊是否被索引库收录。硕士毕业一般都有论文要求,要求的SCI、EI就是索引库。SCI(Science Citation Index)、EI(Engineering Index)和核心期刊是国际上常见的学术期刊索引数据库,主要用于评价期刊的学术水平和影响力。IEEE 和 ACM的汇刊【国际四大索引】科学引文索引 (SCI)工程索引 (EI)科学评论索引 (ISR)
2024-02-24 21:45:17
1040
转载 什么是机器学习?
机器学习是人工智能 (AI)和计算机科学的一个分支,专注于使用数据和算法,模仿人类学习的方式,逐步提高自身的准确性。IBM 拥有丰富的机器学习历史。业界广泛认为,Arthur Samuel 在有关跳棋的研究(链接位于 IBM 外部)中创造了"机器学习"这个词。自称跳棋大师的 Robert Nealey 在 1962 年与 IBM 7094 计算机对弈,结果输给了计算机。与机器学习今天的成就相比,这看似微不足道,但被公认为人工智能领域的一个重要里程碑。
2024-02-19 00:20:33
115
原创 pyqt5+vscode 配置坑笔记
这样出来的python版本也是错的(总是全局版本)系统设置允许执行脚本解决无法加载文件WindowsPowerShell\profile.ps1?试试这条指令 - 知乎 (zhihu.com)
2024-01-25 23:59:41
1194
1
原创 庙算兵棋推演AI开发初探(3-编写策略(下))
这里map.gen_move_route函数和self.get_move_type函数又引用自其他地方编写的。仔细看一下,原来是类似于函数指针的写法,将一堆变量指向了一堆函数,然后在代码里定义了诸多的函数。上一篇已经写了,调用起来就是遍历单位、找到合理的动作,再去使用编写的获取具体哪个动作的函数。gen_move函数,就是得到一个路径列表的返回值。这回从解读step函数中的这两句代码开始,返回的。就是上面这段,重点是本篇博文开始时提到的那两行。基本流程至此都看明白了,那么如何编写一个策略呢。
2024-01-01 15:44:39
954
2
原创 庙算兵棋推演AI开发初探(2-编写策略(上))
它接受一个字典类型的参数,表示当前的游戏状态、环境信息或玩家信息等。以下是态势()最外层的数据结构以及他们代表的含义。obs = {"actions": list, # 上一步接收到的动作"cities": [], # 各个夺控点的信息"communication": [], # 通信相关信息"jm_points": [], # 间瞄点信息"judge_info": [], # 裁决信息"landmarks": {}, # 地标信息,雷场,路障"operators": [], # 算子信息。
2023-12-27 23:08:54
2048
原创 C++的nan、inf
( 2022-09-30 00:28:51 编辑完的,雪藏了很久,今天有时间了,把浮点数除法搜来补上)上周地图经纬度出的bug搞得我精疲力竭,总是莫名其妙的就点就飞到不知道哪里去了。qt版本又旧没有isNan函数,愣是找了2天多。最后发现是double数据传递给float出问题了。软件搭架子的工作多了,数值计算这里的经验都空白了,索性记录一下。
2023-12-14 21:18:57
3264
【代码】《c程序设计竞赛实训教程》刘高军 何丽 编著
2017-02-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人