- 博客(265)
- 收藏
- 关注
原创 19. 给reference条目标记为蓝色
这一行代码是用于定义一个自定义的字段格式,它可以让biblatex在处理特定文献条目时将某些字段(如标题、作者等)显示为蓝色。
2024-12-03 15:13:57
1958
原创 22. 差异检验
t-检验更适合于数据符合正态分布的情况。Mann-Whitney U 检验则适用于数据不符合正态分布或其他非参数条件下。选择哪种检验方法取决于你的数据特性和研究目的。如果你的数据满足正态分布的前提条件,那么使用 t-检验可能是更好的选择;如果数据不符合这些前提条件,或者你更关心的是两个样本的分布是否相同而不是均值的差异,那么 Mann-Whitney U 检验可能更适合。
2024-11-20 16:56:38
2081
原创 20.使用标准差剔除异常值
我有个记录数据采集后格式是的文档,里面只有一列数据,10*10000行数据,没有表头,分别代表奖励数值。因为有些数据点峰值 和 峰谷很高,抖动大。现在需要在分10段,每段10000条数据。读取原始数据之后,在画折线图前,这中间增加一个对原始数据过滤的功能,将过滤后的数据保存到一个新的文件中,。要求:这个区间里的数据,把抖动很大的数据,给过滤到剔除掉,不再使用这种抖动大的数据,然后用新过滤后的数据,再画图。
2024-11-16 18:52:21
1614
原创 6. 参数打包
*kwargs可以使用的形式将多个参数传入函数,然后在函数体内部解包。Python 中可以使用**kwargs打包关键字参数。这样一来,可以在__init__方法中将所有参数作为一个字典传入,然后在函数体内解包赋值给各个变量。
2024-11-15 12:43:28
914
原创 5. ε-greedy 探索
ε−greedyε-greedyε−greedy在每个时间步中,以 ε 的概率进行随机探索,即选择一个随机动作;以 (1 - ε) 的概率选择当前策略网络输出的最优动作,即 Actor 网络的确定性输出。在离散动作空间中,ε-greedy 的随机探索通常是从离散动作集中随机选择一个动作。而在连续动作空间中,我们可以稍作修改,使 ε-greedy 策略与 DDPG 的确定性策略结合。这段代码实现了 ε-greedy 探索策略,在每个时间步中以ϵ\epsilonϵ。
2024-11-15 12:31:06
1763
原创 4. 奖励函数设置
奖励函数的设计取决于具体的任务目标,因为奖励函数直接影响智能体的行为和学习效果。在设计奖励函数时,通常需要根据任务的特性和最终目标来定义一个合理的奖励信号,使智能体能够通过最大化累积奖励来达到预期的效果。以下是一些奖励函数设计的基本原则和常见示例。
2024-11-14 20:05:46
1525
原创 0. 渲染游戏画面
1 用到的函数# initialize envenv = gym.make() frame = env.render() frame = np.transpose(frame, (1, 0, 2)) # 调整图像方向frame = pygame.surfarray.make_surface(frame)screen.blit(frame, (0, 0))pygame.display.flip()1.1 检查图像的形状首先,我们需要确认从 env.render() 返回的图像的形状。通
2024-11-10 16:29:17
992
原创 3.DDPG
DDPG(Deep Deterministic Policy Gradient)是一种用于连续动作空间的强化学习算法,属于Actor-Critic方法的变体,结合了DQN(Deep Q-Network)和DPG(Deterministic Policy Gradient)的思想。DDPG在强化学习中的优势在于能够处理高维、连续的动作空间,适合于复杂的控制任务,比如机器人控制和自动驾驶等。
2024-11-10 15:53:50
941
原创 1. 倒立摆: Pendulum-v1
是一个经典的强化学习环境,属于 OpenAI Gym 库的一部分。这个环境模拟了一个倒立摆的问题,目标是通过施加适当的扭矩使摆杆保持在竖直向上的位置。:控制摆杆使其保持在竖直向上的位置(即角度为 0 弧度)。theta[-π, π]theta_dot[-8, 8]cos(theta)sin(theta)[-2, 2]r−θ20.1⋅θdot20.001⋅torque2θθdottorque最小的奖励是,当摆杆处于竖直向下位置(θπ),角速度最大(θdot8。
2024-11-10 11:15:38
885
原创 0. CUDA环境安装
1 CUDA设备如果你的电脑显示 device = torch.device("cuda" if torch.cuda.is_available() else "cpu") 后的结果是 Using device: cpu,这通常意味着以下几个可能的问题之一:没有安装NVIDIA显卡驱动程序:确保你的计算机上安装了NVIDIA显卡及其驱动程序。你可以访问NVIDIA官方网站下载并安装最新的驱动程序。没有安装CUDA Toolkit:安装CUDA Toolkit是使用GPU进行深度学习的
2024-11-10 10:54:46
1118
原创 2. actor loss
Actor(演员):负责学习策略(Policy)πθsπθs,即给定当前的状态 (s),输出每个可能动作的概率分布。演员的目标是基于学习到的策略直接与环境交互,选择动作。Critic(评论员):负责评估当前策略的表现。具体来说,它估计每个状态或状态-动作对的价值Value,通常用状态价值函数VsV(s)Vs或动作价值函数QsaQ(s, a)Qsa表示。Critic 主要用于指导 Actor 改进其策略。
2024-11-06 18:44:59
1287
原创 42. 将数值保留两位小数
在 Java 中,可以使用多种方法将数值保留两位小数。下面是几种常见的方法:比如把 0.72579646 保留两位小数。
2024-10-17 15:14:40
627
原创 10.对指定目录下的所有txt文档提取内容并计算平均值
每个txt文档的数据格式为: 1 slot, 2 allocate quality, 3 display quality,4 delay,5 varQuality,6 throughput,7 size。
2024-10-16 17:07:37
376
原创 13.整数规划问题(Integer Programming, IP)
整数规划问题(Integer Programming, IP)是运筹学中的一类优化问题,它涉及到决策变量不仅限于实数,而是必须取整数值。整数规划问题可以分为纯整数规划问题和混合整数规划问题。纯整数规划问题中,所有决策变量都必须是整数,而混合整数规划问题中,只有部分决策变量必须是整数,其余可以是实数。整数规划问题的目标是在满足一系列线性或非线性约束条件的前提下,最大化或最小化一个线性目标函数.
2024-09-24 19:21:48
1290
原创 12. Scenario Analysis for greedy algorithm
在实际应用中,贪婪算法可能会结合机器学习技术,如多模态空间-时间注意力变换器,来预测用户的视点,并据此动态调整视频分块的权重和传输优先级.这种方法可以在保证视频质量的同时,有效减少数据体积和改善视频播放体验。动态规划在实时VR视频流媒体系统中可能不适用,因为动态规划通常需要解决问题的所有子问题,并存储这些子问题的解,这在实时系统中可能会导致不可接受的延迟。系统可以采用基于FoV的视频分块和优先级排序策略,结合实时的网络状态评估,来动态调整视频数据的传输,从而实现低延迟和高质量的视频流.
2024-09-23 23:37:15
1076
原创 11.对于贪心算法,该方法如何平衡长期效果和短期最大利用率?
在某些问题中,贪婪算法能够自然地平衡这两个因素,因为局部最优解恰好也是全局最优解的一部分。然而,在其他问题中,贪婪算法可能会过早地锁定在次优解上,因为它没有考虑到未来选择的累积效应。贪婪算法在每一步选择中都采取当前状态下看起来最优的选择,即局部最优解,希望这些局部最优解的累积能够导致全局最优解。这种算法的关键假设是问题具有贪心选择性质,即每一步的选择不会影响到未来的选择,或者说局部最优解的累积可以直接导致全局最优解。在设计算法时,选择合适的策略取决于问题的具体特性和对解的质量要求。
2024-09-23 23:27:44
450
原创 10. Dynamic programming (DP)
Dynamic programming has applications across various fields such as computer science, operations research, economics, and engineering. It is commonly used in optimization problems, including but不限于背包问题、最短路径问题、序列对齐问题、股票 price prediction, and many others.
2024-09-23 23:24:11
632
原创 9.Branch-and-Bound 方法
Branch-and-Bound 方法的优势在于它能够保证找到问题的最优解,并且在搜索过程中通过剪枝减少了不必要的计算。对于最小化问题,如果子问题的界限大于当前已知的最优解的界限,那么这个子问题及其所有后代节点可以被排除(剪枝),无需进一步搜索。Branch-and-Bound 方法的有效性很大程度上依赖于问题的特性和限界函数的选择,良好的限界函数可以显著提高算法的效率.分支:从待搜索列表中选择一个节点进行扩展,为该节点的每个子节点计算界限,并将这些子节点加入到待搜索列表中。
2024-09-23 23:22:55
568
原创 8.Greedy Algorithm
The greedy algorithm is a problem-solving strategy used in computer science and mathematics, particularly in the field of algorithm design. This method follows the problem-solving heuristic of making the locally optimal choice at each stage with the hope o
2024-09-23 23:21:36
800
原创 18.数学公式中,“点”“乘”的样式
在数学公式中,点乘(标量乘法)通常用一个中心对齐的点来表示。在 LaTeX 中,这个操作可以通过多种方式实现,具体取决于你想要的点的样式。这可以产生一个较大的实心点,虽然不常见于表示乘法,但在某些上下文中可能适用。简单的点号也可以表示乘法,但默认情况下,这个点可能较小且位置较低。虽然更常用于表示向量积或普通的乘法,但在某些情况下也可以用于点乘。这是最常用的方法,它产生一个中点,通常用于表示点积或标量乘法。,因为它在数学公式中是最标准的表示方式,并且在视觉上也更清晰。对于点乘(标量乘法),推荐使用。
2024-09-21 09:06:34
895
原创 17.给文字公式打框
通过使用上述任一方法,你都可以在 LaTeX 中给文本或公式添加框。选择最符合你需求的方法,无论是简单快速,还是高度定制。在 LaTeX 中,要给文本或公式打一个框,有几种不同的方法。包也提供了给文本添加框的功能。这些包提供了更多的选项来定制框的样式。是一个简单的命令,可以用来给文本或公式添加一个边框。如果你需要更复杂的边框,或者想要自定义边框的颜色、宽度等,可以使用。包来创建更复杂或自定义的框。下面我将介绍如何使用这些方法。这需要更多的 LaTeX 知识,但提供了极大的灵活性。
2024-09-19 09:34:28
1051
原创 [git] MacBook 安装git
当 git 配置成功后,也可以用 GUI 工具去管理仓库文件,比如 snailSVN, Smartgit, Github Desktop。在使用多个账户的情况下,如果以前全局配置过Git的用户名和邮箱,就需要取消全局配置的信息,改为对每个仓库单独配置。Mac一般自带Git工具,也就是说已经安装好了 ,如果没有安装,可以去官网下载安装,或者直接使用。同样的方法,可以绑定 GitHub 账户,过程是和gitee一样的。应该替换为你生成的 SSH 密钥的文件名。可以看出来,这git的 两个账户都是成功的。
2024-09-14 17:17:12
16615
1
原创 [Android studio]无法联网
我的Android studio 更新软件到 Android Studio Koala | 2024.1.1 Patch 1 这个版本后,当前的项目无法正常编译。可这次遇到的问题发现是软件无法联网去下载匹配的gradle文件。因为这次用新版本的Android studio 建立一个空项目时,gradle文件业一直无法下载。这样,原项目,在更新后的软件里,就更新gradle配置,去自动下载对应的文件,成功的再次编译。因为之前有次更新版本后,我也遇到这个无法编译的问题,后面给解决掉了。想着这次应该也没有事情。
2024-08-23 21:17:52
533
原创 15.常用缩写
模板中有定义一些命令,可以更方便地输入这些缩写,那不是。这里记录自定义缩写的方法,以后可以按需加到自己。其中有些要斜体,如果每次都要用。
2024-05-23 11:00:28
406
原创 3.SCI论文结构
本部分最后写。不要太长,突出重点,一般在150词左右。第1句:介绍工程背景。第2-3句:由工程问题引出本文研究内容,强调研究内容对解决该工程问题的重要意义。如:Thus, the XX is the key problem in the engineering design of XX.第4-5句:介绍本文核心工作。
2024-05-11 11:50:06
1159
原创 7.Jain Fairness Index
是一种用于衡量资源分配公平性的指标,特别适用于网络服务的质量保证和资源管理。该指标是由印度工程师和学者Ravi Jain在1984年提出的。Jx1x2...xnn⋅∑i1nxi2∑i1nxi2其中,xi表示第i个用户(或设备)的资源分配量,n为用户(或设备)的数量。的取值范围是n11,值越接近1表示资源分配越公平。n1在网络服务质量管理中,
2024-05-10 11:13:16
1315
1
原创 6.已知CDF图形,怎么利用这个图形计算均值和方差
如果已经有了一个累积分布函数(CDF)的图形,函数图形为Fxμ∫−∞∞x∗F′x)]dxVarXσ2∫[(x−μ2∗F′x)]dxVari1∑Nxi−μ2⋅PxixiiPxixi通过这些步骤,可以利用CDF图形计算出均值和方差。但是若知道概率密度函数PDF图形,函数图形为$f(x)$,则μ∫−∞∞x∗fx)]dx;σ2∫−∞∞。
2024-04-24 09:21:39
1187
原创 18.读取指定目录下的txt文档时,调用另外一个python文件
遍历4K_phone和4K_VR目录下的所有txt文件,并将它们的内容合并到一个名为4k_decoding.txt的文件中。但是,假设你有一个名为another_script.py的Python文件,你想在合并txt文件之前执行它生成要处理的txt文档。最后统计完原始的txt文件个数后,删除原始文件。
2024-04-17 21:47:46
412
原创 17.随机抽取txt文档里一半的数据另存为新的txt文档
要对输出的, 和里的文件内容随机任意抽取其中数据的一半,分别保存为新的txt文档,文件名为原文件名加上 _half.txt 后缀。
2024-04-17 21:27:52
346
原创 3. WiFi基本原理
WiFi的全称是Wireless Fidelity。它是一种无线网络通信技术,由Wi-Fi联盟拥有,目的是改善基于IEEE802.11标准的无线网络产品之间的互通性,允许电子设备在没有物理连接的情况下进行高速数据传输。此外,WiFi也被视为IEEE 802.11标准的同义词。802.是网络协议。具体来说,802.是国际电工电子工程师学会(IEEE)制定的局域网和城域网标准的一部分。这些标准涵盖了一系列的无线和有线技术,包括以太网、令牌环、无线局域网等。每个标准都有一个特定的编号,例如802.11。
2024-03-31 17:20:45
10673
6
原创 10.带宽和下载速率
通信公司一般说的带宽是按比特(bit)计算每秒的,拿20M的宽带来说吧,20M是指传输速度能达到20Mbit/s。而我们平时下载的速度是按照字节(Byte)每秒计算的,20Mbit/s=(20/8)MB/s=2.5MB/s,要除以8是因为1Byte=8bits。所以:宽带的带宽为20Mb,下载速度最高为2.50MB/s(20/8);宽带的带宽为50Mb,下载速度最高为6.25MB/s(50/8);宽带的带宽为100Mb,下载速度最高为12.5MB/s(100/8)。
2024-03-28 16:50:21
2404
原创 15.统计指定txt文档里所有数据的mean value
1)读取指定txt文档,对里面的所有数据求和并算出平均值mean value;2)算平均值时,先对txt文档里的数据做处理,只统计数值小于40.0的数据,把过滤出的数据保存为新的txt文档3) 对新的文档统计文件的行数。
2024-03-27 20:51:13
373
原创 14.对指定 txt文件里的特定列数据计算平均值
程序 运行时,在控制台里 输入 report 里收集的 log文件,如。程序会把文件里的第3列数据提取出来,并计算对应的平均值.计算平均值前,要统计并比较这些文件的长度,以最短文件的长度为基准,进行截断处理。这样保证了文件里的 item num 一致。note:支持输入多个文件同时处理。
2024-03-27 13:19:24
453
原创 13.处理指定目录下的所有文件夹里的特定文件
1)对于指定4K_phone目录下,有好几个文件夹,比如等等quality_xx。获取每一个quality_xx文件夹里的。例如,2)对每一个文件夹里的特定文件的第2列和第3列数据进行处理,并将处理后数据保存到一个以当前文件夹名称命名的txt文件中。例如,如果当前文件夹的名称是quality_15,那么数据将被保存到名为的文件中。
2024-03-27 12:21:39
412
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人