
笔记
文章平均质量分 57
葫芦串
这个作者很懒,什么都没留下…
展开
-
WebRTC-网络基础
最近在学习WebRTC和网络知识,这篇文章主要是记录看到的一些较为优质的文章以及相关阅读笔记。一、网络基础网络编程基础/基本知识这篇文章主要是介绍了各层协议的基本概念以及网络通信的基本流程,包括TCP建断连,子网划分,DNS协议以及ARP协议原理。...原创 2022-02-15 10:55:04 · 1280 阅读 · 0 评论 -
1.什么是强化学习
强化学习组成部分:状态/观测值(state/observation):当前情况;动作(action):当前采取的动作以及下一步的动作;奖励(reward):基于当前的state和action会获得的奖励;策略(policy):如何做决策;动态环境(environment dynamics):包括转移矩阵或者环境的核函数强化学习有以下特点:无监督反馈滞后时间重要,顺序进程无独立同分布假设,agent根据环境影响采取行动即通过积累求最大化的问题记录历史参数:Ht原创 2021-05-21 10:36:57 · 1522 阅读 · 0 评论