毕业论文【1】——Q-Learning

最新推荐文章于 2024-07-10 01:10:32 发布

夏天蓝车

最新推荐文章于 2024-07-10 01:10:32 发布

阅读量943

点赞数

分类专栏：日常使用

本文链接：https://blog.youkuaiyun.com/weixin_42447161/article/details/114379000

版权

毕业论文已经选好题目了，这里记录下研究历程。

先学的是强化学习的经典算法——Q-Learning

看了这么多博客介绍，对Q-Learning算法也有了一定的认知。

我从国外一学生的个人博客中，找到了一篇关于Q-Learning的介绍和推导，大概发布于2010年左右，读完他的博客，我豁然开朗。

这位作者确实有很强的计算机思想，他告诉我，Q-Learning本质上是一个带权有向图据权值随节点移动的问题，如此重要的强化学习算法，背后原理却是最简单的“图”问题，正是这一点让我对他很钦佩。

可是他在2013年后就不再更新博客，还是挺遗憾的，据他个人介绍，他是自学的人工智能算法，看来他是毕业了，没有时间和精力再去学习和写博客了。

但是他的文章给了我很大的启迪，感谢他！

记录一下Q-Learning的一些问题：

状态之间的权值 = (1 - alpha)*状态之间的权值 + alpha*(当前奖励 + gamma*远期奖励)

这里把远期奖励*gamma 是因为考虑到每行动一次，就会消耗一次步数，这样设置，旨在在有左右两条通往出口的路中，选择最近的一条。
gamma值越小，每一步的损失就越大，就越能选择最近的一条路。

关于设置学习率alpha，保留当前(1 - alpha)的Q值，剩余alpha更新为新值。
alpha的含义可以近似理解为“记忆奖励的保留度”，
经过我数学公式推导，可以证明，

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

夏天蓝车

关注关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【什么是容器】Docker基础知识、相关概念以及基本使用命令

也言的博客

05-20

452

Docker 是一种轻量级的容器技术，可以在容器内运行应用程序和服务。它可以让开发人员和运维人员更轻松地打包、交付和运行应用程序，从而提高了应用程序的可移植性、可靠性和安全性。

2 条评论您还未登录，请先登录后发表或查看评论

Docker初识及使用研究

最新发布

周陽讀書

07-10

1209

记录自己使用docker一点一滴。

docker初识之五分钟认识docker

09-30

Docker 是一个开源的应用容器引擎，让开发者可以打包他们的应用以及依赖包到一个可移植的容器中，然后发布到任何流行的 Linux 机器上，也可以实现虚拟化。通过本文学习可以快速了解docker，本文介绍的非常不错具有参考借鉴价值，感兴趣的朋友一起看看吧

docker学习入门篇

mijichui2153的博客

03-08

1万+

docker官网： www.docker.comdockerhub官网： hub.docker.comdocker文档官网：docs.docker.comDocker是基于Go语言实现的云开源项目。Build, Ship and Run Any App, Anywhere(构建，装载任何应用在任何地方)，也就是通过对应用组件的封装、分发、部署、运行等生命周期的管理，使用户的APP及其运行环境能做到一次镜像,处处运行。

docker入门(利用docker部署web应用)

仰望星空

05-26

41万+

前言:本课程是在慕课网上学习第一个docker化的java应用课程时所做的笔记,供本人复习之用目录第一章什么是docker 1.1 docker的发展史 1.2 docker国内应用史 1.3 什么是Docker 第二章了解docker 2.1 docker思想 2.1.1 集装箱 2.1.2 标准化 2.1.3 隔离 2.2 docker解决的问题 2.2.1...

超详细docker基础教程(全)

weixin_67102357的博客

03-08

1万+

docker的安装、卸载、docker基本命令大全，容器数据卷，镜像推送，镜像加速，镜像的安装，以及常规安装redis，mysql，tomcat等服务

Docker入门

qq_43538925的博客

12-13

1533

Docker如何解决依赖的兼容问题？因为打包程序时，肯定是在同一个系统中打包的，那对于不同环境的操作系统，Dcoker如何解决？首先看一下操作系统的结构：那Dcoker如何解决不同系统环境的问题？虚拟机先启动一个操作系统，然后再操作系统之上再启动应用。Docker直接启动应用。dockerHub官方网站为：hub.docker.com步骤1）进入容器。命令解读：docker exec ：进入容器内部，执行一个命令。

Docker基本管理

sukapulai的博客

06-23

1294

是一个开源的应用容器引擎，基于go语言开发并遵循了apache2.0协议开源是在Linux容器里运行应用的开源工具是一种轻量级的“虚拟机"Docker的容器技术可以在任意一台主机上轻松为任何应用创建一个轻量级的、可移植的、自给自足的容器。Docker的设计宗旨：Build，Ship and Run Any App，Anywhere，即通过对应用组件的封装、发布、部署、运行等生命局期的管理，达到应用组件级别的“一次封装，到处运行”的目的这里的组件，既可以是一个应用，也可以是一套服务，甚至是一个完整的操作系统

docker安装

qq_42772089的博客

10-20

2119

docker安装 1、卸载docker $ sudo yum remove docker docker-client docker-client-latest docker-common docker-latest docker-latest-logrotate docker-logrotate docker-engine 2、使用存储库安装 $ sudo yum install -y yum-utils $ sudo yum-config-manager –add-repo https:

Docker简介与安装

nnn717的博客

07-05

564

Docker是一个用于开发、发布和运行应用程序的开放平台。Docker使您能够将应用程序从基础设施中分离出来，从而可以快速交付软件。使用Docker，您可以像管理应用程序一样管理基础设施。通过利用Docker的方法来快速发布、测试和部署代码，可以显著减少编写代码和在生产环境中运行代码之间的延迟。 Docker的官网图标是一个抽象化的鲸鱼驮着一堆的集装箱。在容器中运行的应用就像集装箱一样，不需要关注底层运行的环境，总能够通过任意平台达成应用运行的目的。虽然Docker不是唯一的容器引擎，但在目前任然是最流行的

Docker初识与安装

测试

04-04

374

Doker的基本概念和安装：简介Docker就是虚拟化的一种轻量级替代技术。Docker的容器技术不依赖任何语言、框架或系统，可以将App变成一种标准化的、可移植的、自管理的组件，并脱离服务器硬件在任何主流系统中开发、调试和运行。通俗来说Docker是在Linux系统上迅速创建一个容器（类似虚拟机）并在容器上部署和运行应用程序，通过配...

Docker——初识和安装

01-07

什么是Docker Docker 是一个开源的应用容器引擎，基于 Go 语言并遵从 Apache2.0 协议开源。 Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中，然后发布到任何流行的 Linux 机器上，也...

Docker核心概念与基本组成

飞月程序人生

04-21

1462

Docker引擎 Docker Engine是具有以下主要组件的客户端-服务器应用程序：服务器是一种长期运行的程序，称为守护程序进程（ dockerd命令）。 REST API，它指定程序可以用来与守护程序进行通信并指示其操作的接口。命令行界面- - （CLI）客户端（docker命令）。 Docker架构 Docker使用客户端-服务器架构。Docker 客户端与Docker 守护进程...

Docker之网络配置

热门推荐

2401_84152109的博客

04-30

56万+

小编也是很有感触，如果一直都是在中小公司，没有接触过大型的互联网架构设计的话，只靠自己看书去提升可能一辈子都很难达到高级架构师的技术和认知高度。向厉害的人去学习是最有效减少时间摸索、精力浪费的方式。我们选择的这个行业就一直要持续的学习，又很吃青春饭。虽然大家可能经常见到说程序员年薪几十万，但这样的人毕竟不是大部份，要么是有名校光环，要么是在阿里华为这样的大企业。年龄一大，更有可能被裁。送给每一位想学习Java小伙伴，用来提升自己。

Docker - 基本概念、与虚拟机的区别、架构、镜像操作、容器操作、数据卷挂载

CYK_byte的博客

07-09

1万+

p ：将宿主机端口与容器端口映射，冒号左侧是宿主机端口，右侧是容器端口（配置映射是因为用户只能通过 http 请求访问到服务器，不能直接访问到对应的容器，因此需要服务器端口与容器端口建立映射关系）这里我们有两种启动 redis 的方式，第一种是直接启动 redis ，第二种是以 AOF 持久化的方式启动容器（--appendonly yes），如下图。如果需要持续查看日志信息可以添加 -f 参数，例如：docker logs -f mn ，这里 mn 是自定义容器名称， ctrl + c 可以停止跟踪。

两小时入门Docker

weixin_33755649的博客

01-20

283

引入 Docker是什么? Docker 最初是 dotCloud 公司创始人 Solomon Hykes 在法国期间发起的一个公司内部项目，于 2013 年 3 月以 Apache 2.0 授权协议开源，主要项目代码在 GitHub 上进行维护。Docker 使用 Google 公司推出的 Go 语言进行开发实现。docker是linux容器的一种封装，提供简单易用的容器使用接口。它是最流...

docker的介绍和使用

LZW_6688的博客

08-16

523

一、什么是docker 二、docker的基本概念 三、比较容器和虚拟机四、centos系统上安装docker引擎五、Ubuntu系统上安装docker引擎六、docker的使用七、使用卷目录一、什么是docker 二、docker的基本概念 三、比较容器和虚拟机四、centos系统上安装docker引擎五、Ubuntu系统上安装docker引擎六、docker的使用七、使用卷一、什么是docker 二、docker的基本概念 三、比较容器和虚拟机