- 博客(18)
- 收藏
- 关注
原创 【学习笔记】Numpy和Tensor的区别
转换后的 Tensor 仍然在 CPU,如果要在 GPU 计算,需要。:转换后的 NumPy 数组和原始 Tensor。,两者的格式在数据存储和计算方式上有所不同。,而 PyTorch 使用的是。,修改其中一个会影响另一个。如果 NumPy 数组在。NumPy 使用的是。
2025-03-11 15:16:33
342
原创 token是什么
在自然语言处理(NLP)和机器学习的背景下,是指模型在处理文本时的最小单位。通常,这个单位可以是单词、字符,或者词的一部分。具体来说,token 的定义取决于你使用的模型和它的分词方式。在这种情况下,这句话就有 4 个 tokens。
2025-02-20 16:39:14
409
原创 .pth文件的解析和用法
pth文件是 PyTorch 中用于存储模型权重、优化器状态和训练过程信息的文件格式。它支持灵活的保存和加载机制,可以方便地进行模型的恢复、训练中断的恢复以及模型的部署。通过理解.pth文件的使用方法,可以高效地管理和使用深度学习模型。
2025-02-19 17:39:49
1354
原创 pip install -e .的用法解读
是一个用于开发中的安装命令,它将当前目录下的 Python 包安装为可编辑模式。使用该命令,你可以方便地在开发时测试包的变化,而不需要每次修改代码后都重新安装包。为了使用该命令,当前目录必须包含setup.py文件。
2025-02-18 23:29:09
1064
原创 【论文阅读|具身智能】Sparse Diffusion Policy: A Sparse, Reusable, and Flexible Policy for Robot Learning
随着机器人任务复杂性的增加,对多任务和持续学习的高效策略提出了更高要求。传统模型通常依赖于一个适用于所有任务的通用策略,但在学习新任务时面临计算成本高和灾难性遗忘等挑战。为了解决这些问题,我们提出了一种稀疏、可重用且灵活的策略——稀疏扩散策略(Sparse Diffusion Policy, SDP)。通过在基于变换器(transformer)的扩散策略中引入专家混合模型(Mixture of Experts, MoE),SDP能够有选择地激活专家和技能,从而实现高效且任务特定的学习,无需重新训练整个模型。
2024-12-04 23:08:29
1472
2
原创 【论文阅读|计算机视觉】 3D Gaussian Splatting for Real-Time Radiance Field Rendering
辐射场方法最近在基于多张照片或视频的场景新视角合成方面引发了革命。然而,要实现高视觉质量,仍需依赖昂贵的神经网络训练和渲染成本,而最近一些更快的方法则不可避免地在速度与质量之间做出了妥协。对于无边界的完整场景(而非孤立的物体)以及1080p分辨率的渲染,目前尚无方法能够实现实时显示(≥30帧/秒)。我们引入了三个关键要素,既能实现当前最先进的视觉质量,同时保持具有竞争力的训练时间,并且尤其能实现高质量的1080p分辨率实时新视角合成(≥30帧/秒)。
2024-11-29 18:28:53
730
1
原创 【论文阅读|具身智能】RoboGSim: A Real2Sim2Real Robotic Gaussian Splatting Simulator
现实世界的真实数据获取变得日益重要。然而,通过远程操作捕获的大规模示范数据通常成本极高,难以高效地扩展数据规模。在模拟环境下采样任务数据是一种实现大规模数据收集的有前景方法,但现有的模拟器在纹理和物理的高保真建模方面存在不足。为了解决这些限制,我们提出了RoboGSim,一种基于真实到模拟再到真实(real2sim2real)转换的机器人模拟器,集成了3D高斯点云(Gaussian Splatting)技术和物理引擎。高斯重建器(Gaussian Reconstructor)
2024-11-28 16:35:51
1387
1
原创 【论文阅读|具身智能】Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI
具身智能(Embodied AI)对于实现人工通用智能(Artificial General Intelligence,AGI)至关重要,也是连接网络空间和物理世界的各种应用程序的基础。近年来,多模态大模型(MLMs)和世界模型(WMs)的出现因其显著的感知、交互和推理能力而引起了广泛的关注,使其成为具身智能体的大脑中一个很有前途的架构。然而,在mlm的时代,目前还没有对具身智能的全面调查。在本次调查中,我们对具身智能的最新进展进行了全面的探索。
2024-11-25 22:36:03
2511
1
原创 【数据结构03】lab1多项式乘法
其次是用数组,数组存放的思路是,数组的下标是多项式中某项的次数,数组的内容是该项的系数。当把所有代码写完后调试发现,忘了考虑了一个很重要的事情,次数也是有负数的,但是我把次数作为了数组的下标,数组下标是不能有负数了,我这里参考使用移码形式,把代码大改后解决了这个问题。输入的依次是系数,次数,存放的方式是用一个for循环,循环次数较多,最后说系数输入0结束,在for循环中用break跳出,代码如下。输入的多项式最多为20项,系数为任意值,最后输出的多项式的次数在±500之间。(1)输入并建立多项式;
2023-04-16 16:32:42
660
原创 【数据结构01】线性表的相关习题和解答(附加注释)
已知线性表中的元素以值递增有序排列,并以单链表作存储结构。试写一高效的算法,删除表中所有值大于mink且小于maxk的元素(若表中存在这样的元素),同时释放被删结点空间,并分析你的算法的时间复杂度(注意,mink和maxk是给定的两个参变量,它们的值可以和表中的元素相同,也可以不同)。假设有两个按元素值递增有序排列的线性表A和B,均以单链表作存储结构,请编写算法将A表和B表归并成一个按元素值递减有序(即非递增有序,允许表中含有值相同的元素)排列的线性表C,并要求利用原表(即A表和B表)的结点空间构造C表。
2023-04-14 19:36:38
832
原创 【计算机系统基础05】Lab3数据溢出
Fizz的起始地址已在上图标出,ebp+4为栈帧返回地址,道理与somke类似,由于参数地址为旧EBP+4+8,我们需要在下方额外添加8个字节以作为函数参数,其中前四个字节可以随意更改,后四个字节为cookie的地址,且采用小端方式。由于test的栈空间不能破坏,我们在buf缓冲区的对应位置存回test的esp,返回地址存放在buf缓冲区首地址,攻击代码为修改eax的值为cookie并重新回到test。这些字节的内容可以随意更改,接下来的位置属于溢出的部分,它可以覆盖EBP的值。
2023-04-13 07:30:00
2940
原创 【算法基础01】快速排序和归并排序
定义i j为 int 指针,i j分别指向q[ l ], q[ r ](涉及到while的边界问题,实操时需指向l-1和r+1), i j与q中元素比较,i需满足小于等于x,j需满足大于等于x,满足则往中间进一,不满足立即停止,两指针都停止,则交换q[ i ],q[ j ],然后继续while循环,直到i j相遇。与快速排序不同,归并排序先递归处理两边,i j 分别指向两个区间的起点,之后借助辅助数组,参照快速排序方法一的思路,对当前函数中划分好的区间进行排序,递归到区间只剩下一个函数结束,排序完成。
2023-04-12 22:33:24
145
原创 【计算机系统基础04】Lab2拆弹实验
由、,0 和输入的第一个数字比较,如果不相等就引爆炸弹,所以我们推知第一个要输入的数字应该是 0,同理,和可得,输入的第二个数字是 1,又根据到这四行,发现第三个数为前两个数相加。下面一共给出了两个明码,打印其内容得。不过根本不需要去看 fun4 的具体内容,因为第一个数的范围太小了,直接从 13 开始试,很快便得出了答案,为 11 18,进入下一关。分析可知,我们需要输入两个数,第一个数小于 14,第二个数是确定的,为 18,该程序为一个递归。
2023-04-11 08:58:34
2470
1
原创 【计算机系统基础02】二进制,八进制,十进制,十六进制的表示与转换
计算机内二进制可以表示的类型一般有两种,指令和数据。指令用于识别、处理数据,但指令和数据本质上都是一串二进制序列。其中,数据的类型分为数值数据和非数值数据。数值数据可比较大小,分为整数(定点数)和实数(浮点数),而定点数有分为无符号整数和带符号整数两种。所以数值数据一共有四小类,这四类数据编码方式还是不同的。而非数值数据是一个没有大小之分的位串,主要用于表示字符数据和逻辑数据在计算机内部,数值数据的表示方法共有两大类,一种是直接用二进制表示,一种是采用二进制编码的十进制数(BCD)表示。
2023-04-10 22:58:08
3818
3
原创 【计算机系统基础03】Lab1数据表示
解释:uf&0x7fffffff 最高位置0,如果结果大于0x7f800000,那么x的阶码全都为1,但是尾数不全为0,也就是x是NAN,返回uf。解释:x先乘三,如果符号位和末位都是1,那就是负数除2后有小数部分,是朝小取整,需要加一,否则直接处二取整。解释:如果符号位为1,那就减1再取反,也可以取反再加1,如果符号位为0,那绝对值就是x本身。解释:一直对半异或,最后最高位为1则x里有奇数个1,然后右移再和0x1和取,得到1或0。解释:如果x和y的符号位不同且x和相减结果的符号位也不同,那么返回0。
2023-04-09 20:25:09
1420
1
原创 【计算机系统基础01】冯·诺依曼结构及其主要思想
冯·诺依曼结构的主要思想:1、计算机应由运算器、控制器、存储器、输入输出设备五个基本部件组成存储器不仅存放数据,而且还可以存放指令,形式上两者没有区别(都是01序列),但计算机应能区分数据还是指令控制器应能自动取出指令来执行运算器应能进行加/减/乘/除四种基本运算,并且能进行一些逻辑运算和附加运算操作人员可通过输入输出设备和主机进行通信3、内部以二进制表示指令和数据(ENIAC是十进制表示指令和数据,而IAS计算机采用的是二进制),每条指令由操作码和地址码两部分组成。.........
2022-08-31 23:20:02
10718
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人