自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(132)
  • 资源 (3)
  • 收藏
  • 关注

原创 扩散模型(Diffusion Models)的革命性进展

阶段核心突破代表模型应用影响基础理论原始扩散模型证明扩散模型可行性加速采样低成本高质量生成,推动AIGC普及可控生成精细化编辑,工业落地多模态扩展突破动态内容生成未来方向一步生成 / DiT实时生成,超大模型扩散模型的革命尚未结束,未来可能在实时交互、3D生成、世界模拟等领域继续突破,成为AGI(通用人工智能)的核心组件之一。

2025-05-07 17:29:27 740

原创 文生图(Text-to-Image)的发展

文生图模型从早期受限的GAN架构,发展到如今以扩散模型为核心、结合多模态预训练的技术体系,实现了从“能生成”到“高质量、可控、开放生态”的跨越。未来随着多模态大模型的演进,文生图技术将进一步融入创作工具、娱乐和教育等领域,成为AI基础设施的重要组成部分。

2025-05-07 17:26:27 689

原创 DDPM(Denoising Diffusion Probabilistic Models,去噪扩散概率模型)

DDPM即去噪扩散概率模型(Denoising Diffusion Probabilistic Models),是一种生成式模型,在图像生成、视频生成等领域有广泛应用。

2025-05-07 16:49:31 543

原创 Diffusion Transformer(DiT)

DiT通过Transformer的全局注意力机制和ViT的patch处理方式,解决了传统U-Net在长距离依赖和扩展性上的局限,成为扩散模型的新范式。其处理过程结合了条件控制、噪声预测和逐步去噪,适用于图像、视频等多种生成任务。以下是针对论文中。

2025-05-06 20:00:05 544

原创 Stable Diffusion 3(SD3)

SD3 的推理流程主要包括文本编码、初始化噪声、逐步去噪和解码生成。训练流程则包括数据预处理、噪声添加、训练扩散模型、验证和调整、微调和保存模型。通过这些步骤,SD3 能够高效地生成高质量的图像,并且在文本到图像合成任务中表现出色。去噪过程:从 t = T 开始,逐步减少时间步 t,直到 t = 0。每一步中,模型预测当前噪声,并从当前表示中减去预测的噪声。时间步的设置:时间步 t 通常是一个从 1 到 T 的整数序列,其中 T 是总的时间步数。每一步的时间步 t 对应一个特定的噪声水平。

2025-04-28 12:02:23 831

原创 Diffusion Model综述

Diffusion(扩散)在 Stable Diffusion 中指的是“加噪-去噪”的生成过程,核心思想是通过学习如何逆转噪声的扩散过程来生成数据。使其高效,条件扩散使其可控,从而能够根据文本生成高质量的图像。生成的图像质量高,细节丰富。可以通过调节噪声步数(如 DDIM 的)平衡生成速度和质量。结合文本条件,实现高度可控的图像生成。

2025-04-25 16:35:57 1012

原创 XAttention

XAttention是韩松团队提出的一种创新的块稀疏注意力机制,旨在解决传统Transformer模型在处理长上下文时面临的计算效率瓶颈问题。该论文通过引入反斜对角线评分(antidiagonal scoring)方法,实现了在不牺牲模型性能的前提下显著加速Transformer推理过程,特别是在多模态任务中表现出色。本文将详细介绍XAttention的核心思想、技术实现、实验验证及其在长上下文Transformer模型(LCTMs)中的应用价值。

2025-04-22 19:36:22 512

原创 XAttention

XAttention是韩松团队提出的一种创新的块稀疏注意力机制,旨在解决传统Transformer模型在处理长上下文时面临的计算效率瓶颈问题。该论文通过引入反斜对角线评分(antidiagonal scoring)方法,实现了在不牺牲模型性能的前提下显著加速Transformer推理过程,特别是在多模态任务中表现出色。本文将详细介绍XAttention的核心思想、技术实现、实验验证及其在长上下文Transformer模型(LCTMs)中的应用价值。随着大语言模型(LLMs)和多模态模型的快速发展,长上下文T

2025-04-21 21:54:58 1056

原创 Transformer :Encoder vs Decoder

Transformer 的编码器和解码器在自然语言处理(NLP)、计算机视觉(CV)、语音识别等多个领域有着广泛的应用,并且在不同任务中展现出强大的能力。两部分组成,二者在结构、功能和数据流上存在显著差异。Transformer 模型由。

2025-04-18 14:16:20 552

原创 SDPA:Scaled Dot-Product Attention(缩放点积注意力)

Scaled Dot-Product Attention(缩放点积注意力)是 Transformer 架构中的核心机制,由。它用于计算输入序列中不同位置之间的相关性,从而动态调整权重,使模型能够关注最重要的信息。如果你在实现 Transformer 或阅读相关论文时遇到它,现在应该能清晰理解它的原理了!

2025-04-17 20:13:11 692

原创 SageAttention2

研究背景:随着序列长度增加,注意力机制的二次时间复杂度使其高效实现变得关键。现有优化方法各有局限,如线性和稀疏注意力方法适用范围有限,常用的注意力方法如FlashAttention、xformers和SageAttention等虽有不错性能,但SageAttention存在INT8矩阵乘法速度慢和特定GPU加速受限的问题。相关工作:将注意力计算中的矩阵按token维度分块并行计算,降低计算复杂度,提升计算效率。量化:通过将高精度矩阵转换为低精度格式加速矩阵乘法,不同量化器在数值格式和粒度上有差异。

2025-04-11 18:29:48 727

原创 Synopsys Design Compiler(DC)

工艺角:在集成电路制造过程中,由于光刻、掺杂等工艺步骤存在一定的偏差,会导致实际制造出来的晶体管参数(如阈值电压、载流子迁移率等)与设计值存在差异。为了确保芯片在不同的工艺条件下都能正常工作,通常会定义几种典型的工艺条件组合,即工艺角。常见的工艺角包括 FF(Fast - Fast,快速工艺、高电压、低温)、SS(Slow - Slow,慢速工艺、低电压、高温)等。

2025-04-03 15:17:11 660

原创 makefile+LSF

LSF(Load Sharing Facility)是一种常用的集群作业调度系统,bsub命令用于提交作业到 LSF 集群,而若要关闭(终止)一个正在运行的作业,需要使用bkill。

2025-02-19 22:23:43 396

原创 DW:Design ware

DW_fifo_s1_sf 和 DW_fifo_s2_sf 是 DesignWare 提供的两种 FIFO IP 核,主要用于数据缓冲和同步。DW_fp_flt2i 专门用于将符合 IEEE 754 标准的浮点数转换为整数。

2025-02-19 21:53:41 416

原创 搭建仿真环境-vcs

环境变量作用: 这是Synopsys DesignWare库的根目录,通常包含DesignWare IP核的源代码、仿真模型、综合脚本等。内容:sim_ver: Verilog仿真模型。synthesis: 综合脚本和约束文件。docs: 文档。用途: 用于仿真和综合过程中调用DesignWare IP核。作用: 这是DesignWare库的仿真模型目录,专门用于仿真。通常包含Verilog或SystemVerilog的仿真模型文件。

2025-02-18 14:29:58 749

原创 Miniforge 安装器

https://github.com/conda-forge/miniforge/?tab=readme-ov-file#download简介Miniforge 是一个由社区驱动的软件包管理器和环境管理器,旨在提供一个轻量级的替代品来安装和管理 Python 及其相关库。以下是关于 Miniforge 的详细介绍:简介:优势:安装:在 macOS 或 Linux 上,使用终端运行下载的 sh 脚本,例如:配置环境变量:~/.bashrc文件来添加环境变量,例如:初始化 Conda:更新 Conda

2024-07-18 12:30:49 1211

原创 Verilog ,SV文件操作

Verilog 文件操作

2024-02-19 17:06:47 2254

原创 vscode debug

vscode debug

2024-01-23 18:37:46 1346 1

原创 数字IC设计流程

数字IC设计流程IC的设计过程可分为两个部分,前端设计(也称逻辑设计)和后端设计(也称物理设计)并没有统一严格的界限,涉及到与工艺有关的设计就是后端设计。

2023-12-13 15:57:49 516

原创 SystemVerilog的数据类型

logic类型logic是reg类型的改进,可以被过程赋值、连续赋值,门单元和模块所驱动。编译器可自动推断logic是reg还是wire。唯一的限制是logic只允许一个输入,不能被多重驱动,所以inout类型端口不能定义为logic。所以单驱动时用logic,多驱动时用wire。单驱动时logic可完全替代reg和wire,除了Evan提到的赋初值问题。多驱动时,如inout类型端口,使用wire。定宽数组...

2023-11-06 18:15:52 265

原创 AMBA-AXI协议详解

AXI协议详解(1)-协议简介。AXI协议详解(2)-信号描述。AXI协议详解(3)-通道握手。

2023-11-03 19:37:55 512

原创 仿真中文件读写

u unformatted 2 value data 二值类型(不区分x/z)%z unformatted 4 value data 四值类型(区分x/z)%g 指数或者十进制(输出实型数,输出较短结果)%f 十进制(输出实型数)%e (exponential) 指数(输出实型数)

2023-10-13 10:56:06 302

原创 verdi

verdi技巧

2023-09-19 20:59:29 93

原创 AIGC问答

深度学习知识点

2023-08-17 16:21:38 240

原创 深度学习-相关概念

它结合了RMSProp和Momentum两种优化算法的思想,并且对参数的更新进行了归一化处理,使得每个参数的更新都有一个相似的量级,从而提高训练效果。是2014年提出的一种万金油式的优化器,使用起来非常方便,梯度下降速度快,但是容易在最优值附近震荡。Adam优化器是一种梯度下降算法的变体,用于更新神经网络的权重。Adam优化器计算出每个参数的独立自适应学习率,不需要手动调整学习率的大小,因此在实践中被广泛使用。Adam 优化器的主要功能是根据梯度信息来更新神经网络参数,从而最小化损失函数。

2023-07-31 11:47:49 457

原创 shell脚本

nohup 命令,在默认情况下(非重定向时),会输出一个名叫 nohup.out 的文件到当前目录下(如果不将 nohup 命令的输出重定向),如果当前目录的 nohup.out 文件不可写,输出重定向到 $HOME/nohup.out 文件中。如果不添加任何逻辑符号,脚本中的命令将会按照行的顺序进行执行,当第一行命令 comman1 执行完后,然后才会启动第二行执行命令 command2。&& 左边的命令(命令 1)返回真(即返回 0,成功被执行)后,&& 右边的命令(命令 2)才能够被执行;

2023-07-31 03:35:21 267

原创 cuda log

使用nvcc -V报错如下 not fondnvidia-sminvcc -VCUDA有两个主要的API,runtime API(nvcc -V 显示的cuda)和driver API(nivdia-smi中显示的cuda),两者都有相应的版本(例如8.0、9.0等)。对driver API的必要支持(e.g. libcuda.so on linux),是由GPU驱动安装程序安装的。

2023-06-28 19:17:02 177

原创 GCC-march -mabi

RISCV 入门。

2023-04-17 16:09:00 633

原创 电路设计的一些概念

论述1(转)时序电路,生成触发器,触发器是有使能端的,使能端无效时数据不变,这是触发器的特性。组合逻辑,由于数据要保持不变,只能通过锁存器来保存。第一个代码,由于是时序逻辑,生成的触发器在enable无效时就可以保存数据。跟锁存器无关。第二个代码就是在enable为低时,数据不变,因此要生成锁存器。论述2(转)所谓生成latch其实是针对使用always语句描述一个组合逻辑而言。因为如果描述时序逻辑总是使用时钟或者时钟+复位作为敏感列表条件,所生成的电路总是组合逻辑+DFF;如果是描述组合逻辑

2023-03-23 21:43:36 2400 1

原创 spyglass笔记

spyglass lint

2022-12-29 17:55:36 4620

原创 conda笔记

conda

2022-12-28 19:34:29 241

原创 VNC笔记

VNC

2022-12-28 00:43:42 578

原创 shell

shell

2022-08-10 21:02:51 286

原创 vcs Options

vcs Options help

2022-08-10 16:23:32 3263

原创 VCS-Makefile

vcs makelist

2022-08-01 03:50:13 759

原创 vcs手册

vcs command

2022-07-29 21:29:37 9008

原创 Linux工具tmux

工具tmux

2022-06-23 18:21:08 305

原创 yum和apt-get的区别详解

yum和apt-get的区别详解

2022-06-23 17:20:57 310

原创 vim 实用教程

VIM 详细教程https://www.runoob.com/linux/linux-vim.html命令模式 (一般模式):用户刚刚启动 vi/vim,便进入了命令模式。i 切换到输入模式,以输入字符。x 删除当前光标所在处的字符。: 切换到底线命令模式,以在最底一行输入命令。在一般模式中按下 :wq 储存后离开 vi底线命令模式在命令模式下按下:(英文冒号)就进入了底线命令模式。按ESC键可随时退出底线命令模式输入模式在命令模式下按下i就进入了输入模式。ESC,退出输入模式,切

2022-05-11 16:03:06 326 1

原创 尺八假名谱入门

尺八乐谱的种类尺八的乐谱主要有两种,不同流派使用的乐谱也不同。这里所说的流派具体指“琴古流”和“都山流”,以下是这两种流派的乐谱。左边是琴古流乐谱,右边是都山流乐谱。看乐谱标题大家应该能明白这是同一首曲子,都是代表性的《六段调》。《六段调》作成于江户时代,为了让琴古流和都山流都能演奏,两种流派版本曲谱都被出版了。虽然是同一首曲子,但不同流派的谱子写法不同,乐句也有些许不同。在这类细节上就能感受到各个流派的异同。琴古流和都山流乐谱的不同那么到底应该怎么读尺八乐谱呢?第一次看到尺八谱的朋友应该不知道这是

2022-05-05 17:19:22 1081

Go语言编程 epub电子书

《Go语言编程》首先引 领读者快速浏览Go 语言的全貌,迅速消除读者对这门语言的陌生感,然后循序渐进地介绍了Go 语言的面向程和面向对象的编程语法,其中穿插了一些与其他主流语言的比较以让读者理解Go 语言的设计动机,接着探讨了Go 语言重要的并行编程方法,之后介绍了网络编程、工程管理、安全编程、开发工具等非语法相关但非常重要的内容,**后为一列关于Go 语言的文章,可以帮助读者更深入了解这门全新的语言。 《Go语言编程》适合所有层次的开 发者阅读。

2018-09-21

区块链技术指南—电子书

本书第1-2章为基础和入门内容,着重是区块链入门介绍,并讲解区块链的一些基础概念。本书详细、全面地介绍了区块链的基础知识与概念,剖析了区块链的架构、底层实现细节以及加密技术,并配合行业应用案例,常见问题等,全面解读大热的区块链技术实现与应用。第3-10章,着重是区块链架构剖析,并讲解区块链的关键技术,包括密码学和共识算法;提供比特币开发指南以及以太坊智能合同开发指南;同时介绍HyperLedger,讨论区块链的常见问题和典型的解决方案。第11章,从架构变革的角度探讨IT发展的原动力,并提供对区块链对未来IT发展的一些展望。

2018-09-21

单片机教程

第一部分:单片机基础知识

2008-07-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除