超自然祈祷-优快云博客

原创庙算兵棋推演AI开发初探（空想篇-RLHF尝试）

一直没实现，以下写自 2024-07-30 23:27:16。

2025-03-30 11:50:56 662

原创庙算兵棋推演AI开发初探（6-神经网络开发）

本质：不断求导找拟合，使得loss收敛，使得acc预测准确率变高用法：编码映射到标签结构：层级输入输出、loss函数设计、优化器。

2025-03-29 23:32:44 1124

碎碎念：这最近几个月过得那叫一个难受，研究生开题没过、需求评审会在4月和6月开了2次、7月紧接着软件设计评审会，加班干得都是文档的事情，还有开会前的会务和乱七八糟的琐事，我们干的还被规定弄的束手束脚，领导还在“动态的增加任务”，逼得我和领导发了个火……把人当承载任务的工具和垫脚石，不考虑员工的自身发展、创造性和工作时间，我是怎么还能待到现在的。——2024.7.28以上开题终于在12月过了，刚过去的这周又全周无休准备出差的东西，今天终于有时间在开题后搞一搞了——2025.1.6。

2025-02-20 00:50:33 726

原创 2000年到2024年IT行业年度关注度较高的技术

按年份列举IT行业年度关注度最高的东西

2025-02-12 00:29:15 1038

原创代码如何自己修改自己

用python的dynamic_function函数。

2025-02-11 10:01:15 109

原创达梦数据库经验笔记

达梦数据库还算好使，这些年的使用经验留作笔记，给后来人或者同行铺路。

2025-01-19 20:47:24 622

原创 pyTorch笔记

1.前言学人工智能，少不了深度学习和神经网络，之前都是只有理论和新闻的那种大致的、模糊的印象，现在开始学习了。构造神经网络感觉实践的对象就改变了，之前做数据系统、软件界面面对的都是字节流、结构体以及控件，现在面对的是nn（neural network ，神经网络）了。2.神经网络实现的现成框架：Caffe（c++实现的）采用以层为单位的抽象,优点是逻辑清晰,实现简便,但是需要手动实现梯度计算;而Tensorflow是以计算图为基础,是，先编译后计算；pyTorch是。

2025-01-06 22:23:16 757 1

原创 Python小括号( )、中括号[ ]和大括号{}代表什么

python语言最常见的括号有三种，分别是：小括号( )、中括号[ ]和大括号也叫做花括号{ }，分别用来代表不同的python基本内置数据类型。python中的小括号( )：代表tuple元组数据类型，元组是一种不可变序列，它,并且这些元素在元组中是按照特定的顺序排列的。尽管元组内的元素不能直接修改，但可以通过创建新的元组来实现类似修改的效果。

2024-12-27 08:03:15 830

原创如何让ai在游戏中更像一个人？

一年多来研究生学业总结。看开点，失败是成功之母，失败代表着正在探索，而不是原地踏步。

2024-12-14 11:33:38 651 4

原创可执行python脚本，latex公式，如何相互转化？（挖坑，待探索）

最后我找到了灵活、包多可以执行的python脚本语言，以及可以在word等文档中显示的纯代码表示的latex公式——如何让这两个媒介进行相互转化？我听说过MatLab，我又找到了maple数学软件，mathematica数学软件。经过搜索，后者是可以通过统一的代码来进行公式的表达。我想到一个问题，书本上的数学公式变成可以运行的代码需要一步翻译，但翻译后的代码又十分不具备直观性，对领域而非代码专家十分不友好。由此我又想到了一个问题，如何使用这种统一描述来对实际上是同一公式的不同形式来进行识别？

2024-12-10 22:03:06 379

原创星际争霸2 sc2replay回放文件, python库sc2reader

项目地址有个说明文档,结果也没说清楚使用方法(至少我没看见)先引入项目地址上说的能处理的东西:Replays 回放重播详情（地图、长度、版本、扩展、日期时间、游戏类型/速度等）玩家详细信息（姓名、种族、团队、颜色、bnet url、赢/输......消息详细信息（文本、时间、玩家、目标、ping 等）Unit Selection 和 Hotkey （Control Group）事件。资源转移和请求（但不包括收集速率或未花费的总数！

2024-11-20 00:57:59 823 1

转载对抗智能体人工智能算法索引

摘自:算法中心-人机对抗智能。

2024-11-17 13:18:29 78

原创人工智能方法映射谚语的胡思乱想（想起来就续上）

没啥，想起啥写啥

2024-11-10 01:53:06 150

原创计算机基础算法与人工智能算法盘点

正是由于我在学习ai时发现一种和以往知识的割裂感才突发奇想写这篇博文计算机一般是对进行操作，所以cs算法一般的问题就是：搜索（查找），排序。处理这两种问题的方法，复杂点的就是在某种数据结构上进行（比如树、图，以及更高级的树和图，如B树之流）而人工智能要处理是，所以ai算法的基本问题是：搜索、推理、学习。其中的学习用上了数学上的：统计回归（分类，聚类）拟合概率分布（构建神经网络，优化神经网络）

2024-10-26 21:00:22 350 3

原创又到1024了

留名。

2024-10-24 11:20:58 115

原创 AI类课程的笔记

信息论、导论、模式识别（数据挖掘）、语义网络与知识图谱、深度学习、强化学习

2024-10-06 16:30:44 840 1

原创 Word办公自动化的一些方法

1.Word部分内容介绍word本身是带有格式的一种文档，有人说它本质是XML，所以一定要充分利用标记了【样式】的特性来迅速调整【格式】，从而专心编辑文档内容本身。样式（集）编号（多级关联样式编号）段落（包括行间距、首行缩进等主要要求）目录（以及题注的域）显示隐藏符号（以及换页符等容易导致灵异的问题）2.Word本身的技巧word本身的功能就很强大，只不过有很多我们找不到或者不会用罢了。1）详见我的2020年6月（文档时间）的一个总结：word样式集技巧小

2024-09-29 23:42:35 1396

原创 Windows PowerShell相关笔记

执行win+x ，点击Windows PowerShell(管理员)，显示了个人配置占用时间。之前我写的一篇，把我的PS（power shell）该了配置文件。最近发现打开power shell好慢，每次都conda弄得……要删除个人配置,执行如下可以看到自己的个人配置文件在哪，删掉就行。WSL 的基本命令 | Microsoft Learn。文件里写的自动加载conda。

2024-09-22 13:43:57 318

原创 windows下成功运行MicroRTS-Py项目

MicroRTS-Py项目的成功运行

2024-09-21 00:53:57 861

原创 RLHF（带有人类反馈的强化学习）初探

这个很难去在复杂的RTS游戏中界定，不像赛车游戏那样有限的操作空间——后来我想到了“策略的提取”，这样能体现一个人的相关思想（比如让某个人年轻时的思维来处理现在的问题，与当下的新思维碰同一个问题，一定很有趣。在深入研究和思考后发现，现有的比较接近的解决方案是【强化学习中的“模仿学习”】，但是这需要大量的对战数据。

2024-09-04 00:40:46 1035

原创强化学习实操入门随笔

态势、奖惩反馈、终止信号从上面的step函数获取在强化学习（Reinforcement Learning, RL）应用于游戏开发中，通常需要游戏提供一系列接口（API）来与RL算法进行交互。

2024-09-01 17:46:53 1142

原创 qss要经常用选择器防止样式继承泛滥影响子控件

我本来想这样，像瀑布一样，有块石头挡住父页面流下来的qss，但是实际实验中发现除非断流这个父瀑布，否则子页面一直收到影响。所以后来用选择器做“水管”，只让qss输送到本页面上，而下面不需要特别设定的控件就可以用瀑布漫灌。我想起来就画了这么一张图。

2024-08-23 22:33:00 582

原创强化学习课程重温-（乱七八糟）笔记

State用于决定下一步的信息•分为和•反映环境发生什么改变•环境自身的状态和环境反馈给agent的状态并不一定相同•Agent的现在所处状态的表示•RL所用的状态?!是对状态的观察•可能不相同▸是所有ActionStateReward的序列在每个时间步，环境给Agent发送的标量数字定义了强化学习问题中的目标定义了对Agent而言什么是好、什么是坏的事件；是Agent面临问题的即时和决定性的特征，是环境状态即时、本质的期望。

2024-08-11 18:41:06 961

原创 python-sc2 星际争霸2接口的运行-随笔

跑出来sc2py的一路踩坑记录

2024-07-31 00:27:04 799

原创对于人机结合+人工智能的一点思考

最近看了不少人机结合的论文，总结一小下

2024-07-11 00:20:30 1076

转载研究目标、内容、方案之间的区别

收藏！研究目标、内容、方案之间的区别，终于有人能讲明白了！

2024-06-10 08:33:30 519

原创 vscode快捷键英文单词对照表

了解了一种新的快捷键描述方法

2024-06-03 22:03:15 1465

原创庙算兵棋推演AI开发初探（4-调用AI模型）

前面讲了如何开展编写规则脚本型Agent（智能体）的方法，现在探究一下如何调用知识型（一般而言的训练出的模型）智能体的方法。train_red_demo.py 文件，提供与示例ai智能体相匹配的训练示例代码。test_red_demo.py 文件，提供与示例ai智能体相匹配的测试示例代码。转回来，看agent.py文件，这个文件是调用智能体的文件，讲规则智能体的时候我也讲到过。2. 本代码包括1个文件夹，2个文件，需要与 train_env 的目录同级。然后我就奇怪，到底是哪里调用所谓的”训练模型“呢？

2024-05-13 23:00:00 1019

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

VS写汇编用到的的东西

【代码】《c程序设计竞赛实训教程》刘高军 何丽 编著

空空如也

【代码】《c程序设计竞赛实训教程》刘高军何丽编著