- 博客(16)
- 收藏
- 关注
原创 【论文阅读】| Watermark Anything with Localized Messages
文章链接:https://arxiv.org/abs/2411.07231作者团队:Meta动机: 从像素层面来讨论水印强度的问题目标类型: 解决实际需求1. 将水印定义为分割任务,提出一个局部图像水印方法:设置掩码 (随机或图像分割产生),在一幅图像中的不同区域实现不同水印内容的嵌入2. 应对小区域含水印图像的判别问题 (检测到小区域水印后直接认为有:对于用AI辅助创作的人来说,直接由此认定他侵犯版权是不公平的)3. 保证小区域水印鲁棒性 (如果对于图像拼接不具有鲁棒性,即水印容易被拼接操作抹去
2025-01-05 21:28:15
847
1
原创 【代码复现】WAM: watermark-anything
SSH链接:git@github.com:facebookresearch/watermark-anything.git。对于COCO数据集上的训练,需要注意命名文件夹命名:大写的。,指定是COCO,指令里的地址是coco的话读不了的。,不能是小写的coco(真的被坑惨了)需要科学上网一下,界面如图。可见如下代码中展示了数据读取过程。分布式训练(多个GPU):采用。
2025-01-02 15:01:24
764
原创 【论文笔记】Hidden论文阅读笔记
目标:为图像隐写和水印开发一个可学习的端到端模型,该模型可以对任意类型的图像失真具有鲁棒性JPEG通过执行离散余弦变换(DCT)来压缩图像,JPEG-Mask(中右)对一组固定的高频系数进行置零,JPEG-Drop(右)对高频系数进行置零。在测试时,用这两种近似训练的模型在真实的JPEG压缩下表现良好;使用JPEG-Mask(蓝色,DCT系数的零掩蔽)/ JPEG-Drop(红色,DCT系数的dropout)训练的模型的位精度。
2024-12-25 20:36:50
219
1
原创 【问题解决】python地址显示
因为安装了anaconda,默认python版本最新,导致代码运行的时候不知道到底在用哪一个,想要找到各版本python的位置。在执行地址显示指令的时候又出现了终端没有响应的问题,因此需要进一步解决。,但是我遇到了power shell没有返回值的情况,因此需要加上.exe来显示调用。PowerShell中,
2024-12-25 11:35:19
207
原创 【问题解决】解决powershell禁止运行脚本的问题
根据提示,找到网站https:/go.microsoft.com/fwlink/?配置环境的过程中修改过终端设置,导致一打开终端就会有报错,提高权限也没有用。power shell中执行指令。重启powershell,报错消失。
2024-12-23 15:22:08
282
原创 【过程记录】windows安装triton
triton只适用于Linux操作系统,对于Windows不适用,需要做相应的转换。的时候遇到报错:没有对应的版本。
2024-12-23 15:01:33
495
原创 【报错解决】fatal: unable to access ‘https://github.com/xxx.git/‘: Failed to connect to github.com
原因:网络连接问题或代理设置不正确。
2024-12-18 10:10:34
10233
2
原创 【报错解决】 OSError: [Errno 22] Invalid argument
要打开的arg文件名称中包含了非法符号,需要将其替换为"-“或”_"
2024-03-22 15:51:17
2752
1
原创 【报错解决】记录pydensecrf库的安装报错
安装pydensecrf库的时候总是各种报错,根据pycharm给出的修改建议安装pyproject库之后依然不能正常安装pydensecrf库。由于我的python版本是3.10.10,所以选择安装pydensecrf‑1.0rc2‑cp310‑cp310‑win_amd64.whl。显示amd64,说明后续选择wheel版本的时候在win_32和amd_64中可以选择amd64。2.有人通过conda方式安装成功,但是我没有安装anaconda,所以又去找了别的方法。3.使用轮子wheel,成功解决。
2024-03-22 14:54:23
1190
1
原创 【深度学习基础】全局平均池化与全连接层
假设前一层的输出为W*H*C:C个W*H那么全连接的任务就是:通过设置卷积核的参数,给这C个W*H分配,使得最后能得到一组长为L的特征向量,这个特征向量最终被用于分类或数值预测。全连接可以被视为是一种极端情况的卷积层,为了使每个W*H最后的输出是1*1,这个每个卷积核的尺寸也要是输入矩阵尺寸(W*H)。对每个通道都要设置不同的参数,且输出通道数为多少就要设置多少组大小为W*H*C的卷积核。由此可以看出,假设输出通道数为L,则全连接的参数量为L*C*W*H。参数量大,且容易导致过拟合。
2024-03-01 09:26:27
983
原创 【深度学习基础】CNN中卷积层的计算细节
x 1 卷积没有什么神秘的,其作用就是将输入矩阵的通道数量缩减后输出(512 降为 32),并保持它在宽度和高度维度上的尺寸(227 x。权重矩阵(卷积核)格式:同样是四个维度,但维度的含义与上面两者都不同,为:卷积核高度、卷积核宽度、输入通道数、输出通道数(卷积核个数)实际上,全连接层也可以被视为是一种极端情况的卷积层,其卷积核尺寸就是输入矩阵尺寸,因此输出矩阵的高度和宽度尺寸都是1。输出矩阵格式:与输出矩阵的维度顺序和含义相同,但是后三个维度(图像高度、图像宽度、图像通道数)的尺寸发生变化。
2024-02-29 10:40:27
553
原创 【报错解决】one of the variables needed for gradient computation has been modified by an inplace operation
HiDDen的jpeg()的训练,要求的torch版本是0.1,我的是1.11,考虑过降低版本号,但如果要降版本的话还要改python版本、cuda版本,而且刚开始复现代码,希望能提高自己读代码和纠正错误的能力,所以决定就在这个基础上直接改。
2024-01-12 16:39:19
1374
2
原创 【报错解决】记录学习CNN过程中遇到的错误
代码中的配置要求DATa Loader使用多线程操作,而如果已经存在了多线程操作,或者程序中存在其他有些问题的多线程操作时,有可能会导致 线程套线程 的情况,从而容易出现程序被死锁的现象。将函数DATa Loader中对应参数num_workers的配置部分注释掉,不对数据加载通道的数量进行要求。
2024-01-08 16:25:22
424
1
原创 [学习记录]python项目迁移后对虚拟环境的修改步骤
目录下会看到activate 和 activate.bat,分别是对应linux(或其他系统)和 windows 的虚拟环境激活文件。定位到 " VIRTUAL_PATH= ",将等号后面的路径更改为当前虚拟环境Scripts的路径。修改完成后重启pycharm,等待后台工作完成。打开pycharm里自带的terminal终端,查看在提示符最前面是否有虚拟环境的标识符出现(如venv)。记事本打开待修改文件,找到文件中的路径参数VIRTUAL_ENV。打开虚拟环境下的目录venv/Scripts,
2024-01-06 14:31:44
1124
1
原创 LaTex的下载与安装记录
(如果想使用外部PDF查看的话,需要下载SumatraPDF,并且json的配置需要再添加一部分,这篇参考的第11部分有完整的配置。下载 texlive202x.ios 即可。| 推荐下载system版本,可以更改下载目录的位置。(反向同步)从PDF中定位到tex文件中,高亮:选中文字后直接按A,或者右键。,真的是主打一个快、轻、简约。
2023-12-27 15:01:24
422
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人