自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(107)
  • 收藏
  • 关注

原创 强化学习原理与应用作业三-多智能体

多智能体强化学习VDN、QMIX、MATD3

2022-06-11 00:20:56 4004 4

原创 Matlab(多元)线性回归、非线性回归、多项式拟合、(自定义函数)曲线拟合-回归分析代码分享

Matlab(多元)线性回归、非线性回归、多项式拟合、(自定义函数)曲线拟合-代码示例

2021-08-25 00:38:40 5913

原创 C/C++贪吃蛇游戏(彩色版)

罗列用到的一些知识:1.指定控制台光标2.设置控制台文字颜色3.监听键盘的函数kbhit4.生成随机数5.暂停函数Sleep6.函数cin.get()思路:1.初始化边界墙,初始化蛇,生成第一个食物2.进入循环:通过键盘得到方向移动蛇(打印时只需要修改原蛇蛇尾、原蛇蛇头和新蛇蛇头)并判断蛇头和食物坐标是否相等,是则产生新食物,更新分数、速度、蛇长度。/* *Author: Jin *Time : 2020/11/10 */#include&lt

2020-11-10 17:23:03 1305

原创 DeepSeek-R1学习

推出了第一代推理模型reasoning model:DeepSeek-R1-Zero and DeepSeek-R1。Zero版预训练之后没有SFT,而是直接进行RL训练,其表现出强大的推理能力,但是存在可读性较差,语言混杂的问题。为了处理这个问题,并进一步增强性能,推出DeepSeek-R1,其在RL之前使用了多阶段训练和冷启数据,实现与OpenAI-o1-1217可比的性能,并使用R1蒸馏了Qwen和LLama的小模型各种推理benchmark和知识benchmark上的结果。。

2025-03-17 17:49:34 589

原创 Python 定时调度任务

代码开源传统的推荐系统严重依赖ID特征,存在冷启和泛华问题。建模预先提取的内容特征能够减缓这些问题,但这仍然是次优的,源于训练任务和模型参数之间的差异。端到端训练提供了解决方法,但多数已有工作集中在检索模型,未使用多模态技术。本文提出工业级的多模态推荐框架:EM3:“End-to-end training of Multimodal Model and ranking Model” () ,充分使用多模态信息,能够获得任务特定的内容特征。

2024-11-02 18:17:02 590

原创 编程中的闭包概念

闭包概念

2023-10-02 18:31:03 242

原创 Apollo自动驾驶课程学习

f value = g value + h value = 到下一候选点的成本 + 从下一候选点到目的地的估计成本。路线规划:粒度粗一点。Graph的边可以对任何东西建模,如行驶成本。:将道路分成一个一个小格子,然后在每个格子内随机选点,然后随机连线成多个候选轨迹。对象:静态(墙壁、树木等),动态交通参与者(行人、机动车、非机动车):基于偏移、碰撞、限速等,对不同轨迹评估,选择最好的一条。最大限度降低车辆状态与目标轨迹的偏差,最高乘客满意度。轨迹生成:粒度更细,低级别规划。控制输出包括:转向、加速、制动。

2023-07-14 20:05:35 457

原创 Master Theorem:递归关系的渐进时间复杂度推导

证明Master Theorem递归关系的时间复杂度分析

2022-07-05 23:05:17 490

原创 TSP with Miller-Tucker-Zemlin (MTZ) model

TSP with Miller-Tucker-Zemlin 建模与解释

2022-06-16 00:39:22 4132 2

原创 割线法求根

割线法求根

2022-06-08 00:24:43 837

原创 食谱问题Diet Problem

食谱问题Diet Problem线性规划

2022-06-07 16:20:59 1283

原创 强化学习原理与应用作业二

DQN、REINFORCE、DDPG、TD3

2022-05-12 23:20:25 998

原创 FFD for bin packing装箱问题的FFD算法

FFD for bin packing (hard)

2022-05-12 15:28:47 561

原创 Python多进程、多线程编程

Python全局解释器锁、伪多线程

2022-05-10 18:00:16 484

原创 安装atari,出现错误“self._handle = _dlopen(self._name, mode) OSError: [WinError 126] 找不到指定模块”

如题,安装过atari_py,但在import时出现"lib\ctypes\__init__.py", line 364, in __init__ self._handle = _dlopen(self._name, mode) OSError: [WinError 126] 找不到指定的模块。"打印了self.name,其值为D:\software\Anaconder3\envs\testrl\lib\site-packages\atari_py\ale_interface/ale_c.dll

2022-05-08 15:52:52 3835

原创 KKT条件与SVM

结合KKT条件,分析SVM并编程实现

2022-05-04 15:37:39 1010

原创 强化学习原理与应用作业一

策略迭代、值迭代、DQN

2022-03-31 11:46:48 209

原创 非参数检验

统计性假设检验方法总结

2022-03-04 15:06:42 1497

原创 Dijkstra迪杰斯特拉算法Python版本

Dijkstra算法Python实现

2022-01-31 19:59:14 1261

原创 高级人工智能课程笔记

课程部分笔记,依据《人工智能 一种现代化方法》第三版智能概述Rational Decisions理性决策rational理性意味着最大化期望效用maximize your expected utilityAn agent is an entity that perceives and acts.感知和行动(决策)的主体A rational agent selects actions that maximize its (expected) utility.智能:能够理性的思考和行动,理性意味着

2022-01-14 12:33:29 995 1

原创 计算机体系结构

动态调度,使指令可以乱序执行,减少停顿,但名称相关会导致WAW和WAR冒险,并且使异常处理变得复杂。Tomasulo算法:寄存器重命名功能由保留站提供,由Qj Qk跟踪操作数Vj Vk何时可用,以最小化乱序导致的WAR(反相关导致)、WAW(输出相关导致)冒险。保留站类似草稿纸,在草稿纸上进行演算,确认正确后再誊写到正式作业本。...

2022-01-11 17:03:52 515

转载 Multi-Agent Particle Environment MPE

Status: Archive (code is provided as-is, no updates expected)Multi-Agent Particle EnvironmentA simple multi-agent particle world with a continuous observation and discrete action space, along with some basic simulated physics.Used in the paper Multi-Age

2021-12-16 15:57:10 1098

原创 TensorFlow tf.get_variable实现共享变量

【代码】TensorFlow tf.get_variable实现共享变量。

2021-12-07 16:19:57 254

原创 python记录日志,保存控制台输出

首先,保存控制台的信息不等于保存代码中的输出print的内容。控制台上的信息不仅仅只有代码中print的信息仅保存代码中print的信息。即重定向标准输出。定义日志类:class Logger(object): def __init__(self, filename='default.log', stream=sys.stdout): self.terminal = stream self.log = open(filename, 'a') def

2021-11-29 11:17:55 4380 1

原创 优快云发文样例

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar

2021-11-22 15:08:53 553

原创 python seaborn绘制阴影图

seaborn-lineplot绘制阴影图

2021-10-27 20:38:34 2757

原创 tensorflow离散采样tf.multinomial、tf.distributions.Categorical

#!/usr/bin/env python3# -*- coding: utf-8 -*-# @Time : 2021/10/21 21:51# @Author : XXX# @File : test_multinomial.py"""记:logits: 为网络最后一层的输出,无激活函数p = softmax(logits): 概率log_p = log_softmax(logits) = log(p): log概率结论:"""import tensorflow as tf

2021-10-25 18:44:42 587

原创 如何对shape为None的张量使用tf.random

背景tensorflow中需要对张量x添加噪声,x是占位符,其shape的第一维为None(即我们的batch_size不固定),若直接使用noise = tf.random_uniform(shape=(None, 2),报错“TypeError: Failed to convert object of type <class ‘tuple’> to Tensor. Contents: (None, 2). Consider casting elements to a supported t

2021-09-21 14:13:36 1930

原创 人工智能作业2021-09-15

Q1def add(a, b): "Return the sum of a and b" "*** YOUR CODE HERE ***" return a + b # return 0Q2def buyLotsOfFruit(orderList): """ orderList: List of (fruit, numPounds) tuples Returns cost of order """ totalCost

2021-09-15 20:54:46 987 1

原创 C++指针和引用、智能指针

三种智能指针的定义都在头文件中定义独占指针1.独占指针存在析构函数,由析构函数释放内存(通过delete),所以独占指针必须赋值(初始化)为动态分配得到的内存。不然普通内存不是new出来的,也没有delete,自然析构函数出错。2.独占指针不能赋值给另一个独占指针3.独占指针不能直接赋值给裸指针...

2021-07-10 14:58:00 620 1

原创 断言assert与if

程序分为debug版本和release版本1.断言是仅在debug版本起作用的宏当断言的表达式为逻辑真时,程序才继续往下执行,否则,终止程序2.何时用断言?assert和if的区别if下,所有的情况都是合理的,每一种合理情况用if-else分别处理,例如栈不空时进行出栈操作,栈空时跳出循环;而断言下,是程序中的错误,遇到时必须终止程序。当检测到为逻辑假时,意味着我们假设的错误出现了。#include<iostream>#include<assert.h>using n

2021-06-30 14:11:36 1841

原创 算法知识--二叉树

对二叉树的很多问题,一定牢记递归方法。不要层层推导陷入死循环,只需要三步走(打开冰箱,放入大象、关闭冰箱)。先明确递推关系:ans_root = root->val + ans_left * ans_right这里+和*都是抽象的运算符。一般模式如下:int Fun(node *root) { if(NULL == root) { return 0; or其他 } else { ... Fun(root->left); //当Fun有返回值时,此时的返回值必然会用到

2021-06-06 10:05:15 90

原创 二叉树-左右子树结点之和再求积

二叉树,每次可以切分为左右两个子树,对两边子树所有结点的值求和,再乘积。求遍历所有切分点情况下乘积的最大值来自面经熊,快手算法/* *二叉树,每次可以切分为左右两个子树,对两边子树所有结点的值求和,再乘积。 *求遍历所有切分点情况下乘积的最大值 *来自面经熊,快手算法 */ #include<iostream>#include<vector> #include<algorithm>#define ll long longusing namespac

2021-06-06 09:51:14 546

原创 智能算法优化神经网络

用智能算法优化网络的权重和偏置搭建网络,随机给参数赋初值智能算法的决策变量为网络的所有w b

2021-05-24 22:37:03 1564 1

原创 Friedman检验的平均排名

Friedman检验的平均排名实际上也就是一个平均排名format shortdata = rand(28, 6); % 六个算法28个测试函数[~, ~, rk] = friedman(data);rk = rk.meanranks[~, idx] = sort(data, 2); % 按行排序,第idx(i,j)个算法在第i函数上的排名为j[~, rktmp] = find(idx==6); % 得到第六个算法在每个函数上的排名rk6 = sum(rktmp)/length(rkt

2021-04-26 18:16:50 7605 19

原创 P问题、NP问题

P、NP、NPC与NPH1. 基本概念多项式时间(Polynomial time)在计算复杂度理论中,指一个问题的计算时间不大于问题规模的多项式倍数,即在表示时间复杂度时问题的规模n作为底数,例如O(nk), O(log n), 而不是O(an), O(n!)。与多项式时间对应的是“超多项式时间”,表示只要问题规模足够大,超多项式时间所需的解题时间终究会大大超过任何多项式时间。多项式时间被看作是计算机解决问题的分水岭。非确定性算法非确定性算法将问题分解成猜测和验证两个阶段,算法的猜测阶段是

2021-03-20 19:36:21 2721

原创 秩和检验-matlab函数ranksum用法详解

Wilcoxon 检验之秩和检验rank-sum test

2021-03-19 21:15:23 16676 1

原创 【成功解决】错误使用 mex 未找到支持的编译器或 SDK。您可以安装免费提供的 MinGW-w64 C/C++ 编译器

MATLAB调用C代码,报错如题。需要给MATLAB安装配置MinGW-w64 C/C++ 编译器。方法一直接在MATLAB中安装,参考博客,方法简单,但是我下载过程中总是出错。可以试下这个方法。方法二参考博客、或者博客其中,第三步设置环境变量,也可以直接在MATLAB命令行键入,两种方法等效。setenv('MW_MINGW64_LOC','C:\TDM-GCC-64')注意第二个单引号里的路径是你自己下载的路径低版本链接:https://freefr.dl.sourceforge.

2021-03-13 13:35:54 7175 5

原创 LeetCode11盛最多水的容器

11. 盛最多水的容器给你 n 个非负整数 a1,a2,...,an,每个数代表坐标中的一个点 (i, ai) 。在坐标内画 n 条垂直线,垂直线 i 的两个端点分别为 (i, ai) 和 (i, 0) 。找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。说明:你不能倾斜容器。 示例 1:输入:[1,8,6,2,5,4,8,3,7]输出:49 解释:图中垂直线代表输入数组 [1,8,6,2,5,4

2021-02-14 20:44:34 541

原创 Keras关于trainable的实验

对Keras中trainable的生效过程存在疑问,编写了简单的实验探索一下。

2021-01-28 20:36:59 982

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除