自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

natural_Caduceus

探索求证、总结分享、基础记录

  • 博客(299)
  • 资源 (2)
  • 收藏
  • 关注

原创 庙算兵棋推演AI开发初探(空想篇-RLHF尝试)

一直没实现,以下写自 2024-07-30 23:27:16。

2025-03-30 11:50:56 662

原创 庙算兵棋推演AI开发初探(6-神经网络开发)

本质:不断求导找拟合,使得loss收敛,使得acc预测准确率变高用法:编码映射到标签结构:层级输入输出、loss函数设计、优化器。

2025-03-29 23:32:44 1124

原创 庙算兵棋推演AI开发初探(5-数据处理)

碎碎念:这最近几个月过得那叫一个难受,研究生开题没过、需求评审会在4月和6月开了2次、7月紧接着软件设计评审会,加班干得都是文档的事情,还有开会前的会务和乱七八糟的琐事,我们干的还被规定弄的束手束脚,领导还在“动态的增加任务”,逼得我和领导发了个火……把人当承载任务的工具和垫脚石,不考虑员工的自身发展、创造性和工作时间,我是怎么还能待到现在的。——2024.7.28以上开题终于在12月过了,刚过去的这周又全周无休准备出差的东西,今天终于有时间在开题后搞一搞了——2025.1.6。

2025-02-20 00:50:33 726

原创 2000年到2024年IT行业年度关注度较高的技术

按年份列举IT行业年度关注度最高的东西

2025-02-12 00:29:15 1038

原创 代码如何自己修改自己

用python的dynamic_function函数。

2025-02-11 10:01:15 109

原创 达梦数据库经验笔记

达梦数据库还算好使,这些年的使用经验留作笔记,给后来人或者同行铺路。

2025-01-19 20:47:24 622

原创 pyTorch笔记

1.前言学人工智能,少不了深度学习和神经网络,之前都是只有理论和新闻的那种大致的、模糊的印象,现在开始学习了。构造神经网络感觉实践的对象就改变了,之前做数据系统、软件界面面对的都是字节流、结构体以及控件,现在面对的是nn(neural network ,神经网络)了。2.神经网络实现的现成框架:Caffe(c++实现的)采用以层为单位的抽象,优点是逻辑清晰,实现简便,但是需要手动实现梯度计算;而Tensorflow是以计算图为基础,是,先编译后计算;pyTorch是。

2025-01-06 22:23:16 757 1

原创 Python小括号( )、中括号[ ]和大括号{}代表什么

python语言最常见的括号有三种,分别是:小括号( )、中括号[ ]和大括号也叫做花括号{ },分别用来代表不同的python基本内置数据类型。python中的小括号( ):代表tuple元组数据类型,元组是一种不可变序列, 它,并且这些元素在元组中是按照特定的顺序排列的。尽管元组内的元素不能直接修改,但可以通过创建新的元组来实现类似修改的效果。

2024-12-27 08:03:15 830

原创 如何让ai在游戏中更像一个人?

一年多来研究生学业总结。看开点,失败是成功之母,失败代表着正在探索,而不是原地踏步。

2024-12-14 11:33:38 651 4

原创 可执行python脚本,latex公式,如何相互转化?(挖坑,待探索)

最后我找到了灵活、包多可以执行的python脚本语言,以及可以在word等文档中显示的纯代码表示的latex公式——如何让这两个媒介进行相互转化?我听说过MatLab,我又找到了maple数学软件,mathematica数学软件。经过搜索,后者是可以通过统一的代码来进行公式的表达。我想到一个问题,书本上的数学公式变成可以运行的代码需要一步翻译,但翻译后的代码又十分不具备直观性,对领域而非代码专家十分不友好。由此我又想到了一个问题,如何使用这种统一描述来对实际上是同一公式的不同形式来进行识别?

2024-12-10 22:03:06 379

原创 星际争霸2 sc2replay回放文件, python库sc2reader

项目地址有个说明文档,结果也没说清楚使用方法(至少我没看见)先引入项目地址上说的能处理的东西:Replays 回放重播详情(地图、长度、版本、扩展、日期时间、游戏类型/速度等)玩家详细信息(姓名、种族、团队、颜色、bnet url、赢/输......消息详细信息(文本、时间、玩家、目标、ping 等)Unit Selection 和 Hotkey (Control Group) 事件。资源转移和请求(但不包括收集速率或未花费的总数!

2024-11-20 00:57:59 823 1

转载 对抗智能体人工智能算法索引

摘自:算法中心-人机对抗智能。

2024-11-17 13:18:29 78

原创 人工智能方法映射谚语的胡思乱想(想起来就续上)

没啥,想起啥写啥

2024-11-10 01:53:06 150

原创 计算机基础算法与人工智能算法盘点

正是由于我在学习ai时发现一种和以往知识的割裂感才突发奇想写这篇博文计算机一般是对进行操作,所以cs算法一般的问题就是:搜索(查找),排序。处理这两种问题的方法,复杂点的就是在某种数据结构上进行(比如树、图,以及更高级的树和图,如B树之流)而人工智能要处理是,所以ai算法的基本问题是:搜索、推理、学习。其中的学习用上了数学上的:统计回归(分类,聚类)拟合概率分布(构建神经网络,优化神经网络)

2024-10-26 21:00:22 350 3

原创 又到1024了

留名。

2024-10-24 11:20:58 115

原创 AI类课程的笔记

信息论、导论、模式识别(数据挖掘)、语义网络与知识图谱、深度学习、强化学习

2024-10-06 16:30:44 840 1

原创 Word办公自动化的一些方法

1.Word部分内容介绍word本身是带有格式的一种文档,有人说它本质是XML,所以一定要充分利用标记了【样式】的特性来迅速调整【格式】,从而专心编辑文档内容本身。样式(集)编号(多级关联样式编号)段落(包括行间距、首行缩进等主要要求)目录(以及题注的域)显示隐藏符号(以及换页符等容易导致灵异的问题)2.Word本身的技巧word本身的功能就很强大,只不过有很多我们找不到或者不会用罢了。1)详见我的2020年6月(文档时间)的一个总结:word样式集技巧小

2024-09-29 23:42:35 1396

原创 Windows PowerShell相关笔记

执行win+x ,点击Windows PowerShell(管理员),显示了个人配置占用时间。之前我写的一篇,把我的PS(power shell)该了配置文件。最近发现打开power shell好慢,每次都conda弄得……要删除个人配置,执行如下可以看到自己的个人配置文件在哪,删掉就行。WSL 的基本命令 | Microsoft Learn。文件里写的自动加载conda。

2024-09-22 13:43:57 318

原创 windows下成功运行MicroRTS-Py项目

MicroRTS-Py项目的成功运行

2024-09-21 00:53:57 861

原创 RLHF(带有人类反馈的强化学习)初探

这个很难去在复杂的RTS游戏中界定,不像赛车游戏那样有限的操作空间——后来我想到了“策略的提取”,这样能体现一个人的相关思想(比如让某个人年轻时的思维来处理现在的问题,与当下的新思维碰同一个问题,一定很有趣。在深入研究和思考后发现,现有的比较接近的解决方案是【强化学习中的“模仿学习”】,但是这需要大量的对战数据。

2024-09-04 00:40:46 1035

原创 强化学习实操入门随笔

态势、奖惩反馈、终止信号从上面的step函数获取在强化学习(Reinforcement Learning, RL)应用于游戏开发中,通常需要游戏提供一系列接口(API)来与RL算法进行交互。

2024-09-01 17:46:53 1142

原创 qss要经常用选择器防止样式继承泛滥影响子控件

我本来想这样,像瀑布一样,有块石头挡住父页面流下来的qss,但是实际实验中发现除非断流这个父瀑布,否则子页面一直收到影响。所以后来用选择器做“水管”,只让qss输送到本页面上,而下面不需要特别设定的控件就可以用瀑布漫灌。我想起来就画了这么一张图。

2024-08-23 22:33:00 582

原创 强化学习课程重温-(乱七八糟)笔记

State用于决定下一步的信息•分为和•反映环境发生什么改变•环境自身的状态和环境反馈给agent的状态并不一定相同•Agent的现在所处状态的表示•RL所用的状态?!是对状态的观察•可能不相同▸是所有ActionStateReward的序列在每个时间步,环境给Agent发送的标量数字定义了强化学习问题中的目标定义了对Agent而言什么是好、什么是坏的事件;是Agent面临问题的即时和决定性的特征,是环境状态即时、本质的期望。

2024-08-11 18:41:06 961

原创 python-sc2 星际争霸2接口的运行-随笔

跑出来sc2py的一路踩坑记录

2024-07-31 00:27:04 799

原创 对于人机结合+人工智能的一点思考

最近看了不少人机结合的论文,总结一小下

2024-07-11 00:20:30 1076

转载 研究目标、内容、方案之间的区别

收藏!研究目标、内容、方案之间的区别,终于有人能讲明白了!

2024-06-10 08:33:30 519

原创 vscode快捷键英文单词对照表

了解了一种新的快捷键描述方法

2024-06-03 22:03:15 1465

原创 庙算兵棋推演AI开发初探(4-调用AI模型)

前面讲了如何开展编写规则脚本型Agent(智能体)的方法,现在探究一下如何调用知识型(一般而言的训练出的模型)智能体的方法。train_red_demo.py 文件,提供与示例ai智能体相匹配的训练示例代码。test_red_demo.py 文件,提供与示例ai智能体相匹配的测试示例代码。转回来,看agent.py文件,这个文件是调用智能体的文件,讲规则智能体的时候我也讲到过。2. 本代码包括1个文件夹,2个文件,需要与 train_env 的目录同级。然后我就奇怪,到底是哪里调用所谓的”训练模型“呢?

2024-05-13 23:00:00 1019

原创 奇门辅助软件v2024.5

自制可自定义类象内容辅助的奇门辅助软件

2024-05-05 12:35:46 1390

原创 即时战略游戏AI实现方式的调查整理

我在2013年初开始接触贴吧、同时期接触魔兽争霸地图编辑器,后来到2015年之间做rpg地图小赚过一点钱~对物体编辑器、触发之类的比较熟悉。上面是一点碎碎念,一些东西如果不在想到的时候随手写下可能一辈子也没机会写下了……下面正文开始。

2024-04-07 23:15:54 477

原创 当项目负责人的一点经验(不断更新)

乙方就是乙方,别觉得自己发号施令太官僚主义,他们收钱办事天经地义这本身就是一桩买卖,做不了别收钱啊。要官僚,不然真的能让你教他们用word,教他们怎么做原型,甚至还想让你帮着写代码。契约留痕的模式,让他们的项目经理签字,定要求的时间点,违约多了到时候捅上去也有证据。乙方的外协配套名单要有一份,手伸的太长也得要。发现有问题尽早戳破,不然越隐瞒越大。不催不问,那乙方是真的能不给你做。

2024-04-03 17:13:47 170

原创 论文是怎么一回事

论文都是在期刊上发表的(当然也有会议论文、学位论文),期刊太多就有组织来建立期刊的索引库,所以论文是否被某个索引库收录全看这个期刊是否被索引库收录。硕士毕业一般都有论文要求,要求的SCI、EI就是索引库。SCI(Science Citation Index)、EI(Engineering Index)和核心期刊是国际上常见的学术期刊索引数据库,主要用于评价期刊的学术水平和影响力。IEEE 和 ACM的汇刊【国际四大索引】科学引文索引 (SCI)工程索引 (EI)科学评论索引 (ISR)

2024-02-24 21:45:17 1040

转载 什么是机器学习?

机器学习是人工智能 (AI)和计算机科学的一个分支,专注于使用数据和算法,模仿人类学习的方式,逐步提高自身的准确性。IBM 拥有丰富的机器学习历史。业界广泛认为,Arthur Samuel 在有关跳棋的研究(链接位于 IBM 外部)中创造了"机器学习"这个词。自称跳棋大师的 Robert Nealey 在 1962 年与 IBM 7094 计算机对弈,结果输给了计算机。与机器学习今天的成就相比,这看似微不足道,但被公认为人工智能领域的一个重要里程碑。

2024-02-19 00:20:33 115

原创 pyqt5+vscode 配置坑笔记

这样出来的python版本也是错的(总是全局版本)系统设置允许执行脚本解决无法加载文件WindowsPowerShell\profile.ps1?试试这条指令 - 知乎 (zhihu.com)

2024-01-25 23:59:41 1194 1

原创 即时战略游戏的AI策略思考

这篇博客都是务虚的,没啥干货,全是想法和思考。

2024-01-07 21:08:59 1750 1

原创 庙算兵棋推演AI开发初探(3-编写策略(下))

这里map.gen_move_route函数和self.get_move_type函数又引用自其他地方编写的。仔细看一下,原来是类似于函数指针的写法,将一堆变量指向了一堆函数,然后在代码里定义了诸多的函数。上一篇已经写了,调用起来就是遍历单位、找到合理的动作,再去使用编写的获取具体哪个动作的函数。gen_move函数,就是得到一个路径列表的返回值。这回从解读step函数中的这两句代码开始,返回的。就是上面这段,重点是本篇博文开始时提到的那两行。基本流程至此都看明白了,那么如何编写一个策略呢。

2024-01-01 15:44:39 954 2

原创 庙算兵棋推演AI开发初探(2-编写策略(上))

它接受一个字典类型的参数,表示当前的游戏状态、环境信息或玩家信息等。以下是态势()最外层的数据结构以及他们代表的含义。obs = {"actions": list, # 上一步接收到的动作"cities": [], # 各个夺控点的信息"communication": [], # 通信相关信息"jm_points": [], # 间瞄点信息"judge_info": [], # 裁决信息"landmarks": {}, # 地标信息,雷场,路障"operators": [], # 算子信息。

2023-12-27 23:08:54 2048

原创 庙算兵棋推演AI开发初探(1-调用结构)

庙算兵棋推演平台中的环境对编写AI的调用方式

2023-12-23 12:18:41 1918

原创 C++的nan、inf

( 2022-09-30 00:28:51 编辑完的,雪藏了很久,今天有时间了,把浮点数除法搜来补上)上周地图经纬度出的bug搞得我精疲力竭,总是莫名其妙的就点就飞到不知道哪里去了。qt版本又旧没有isNan函数,愣是找了2天多。最后发现是double数据传递给float出问题了。软件搭架子的工作多了,数值计算这里的经验都空白了,索性记录一下。

2023-12-14 21:18:57 3264

原创 WSL的导出与导入

win10上的WSL导入与导出

2023-12-13 23:47:21 4411

VS写汇编用到的的东西

内含: masm库(lib,include) AsmHighlighter15/17(asm高亮插件)

2018-02-10

【代码】《c程序设计竞赛实训教程》刘高军 何丽 编著

这两位老师是我们学校的,教过我…… 本书适合新手,建议看下前两章。 我把书中所有的注释都敲上去了,都是经过测试可以通过的代码。 《C程序设计竞赛实训教程》是以大学生程序设计竞赛为应用背景的程序设计综合训练教程,以具有初级C语言基础的读者为对象,从C语言的深度解析和程序设计基本方法两方面进行分析介绍,使读者达到深入理解C语言和全面掌握程序设计基本方法的目的。全书内容按常用程序设计方法划分为不同专题,理论联系实际,强调动手实践,深入浅出,便于读者学习和理解。

2017-02-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除