不爱吃香菇的干饭少年-优快云博客

原创论文阅读能级D1D2线

系统确实包含6个标识态，但物理本质是3个电子态（基态、中间态、里德伯态）各自具有超精细结构分裂——基态F=3/4两个超精细能级、中间态两个不同的6P态（6P_{1/2}和6P_{3/2}各选一个超精细能级）、里德伯态则对应59D_{5/2}和60P_{3/2}两个不同的激发态。传统术语中D线指钠黄线（589nm），在铯原子体系延伸为：D1线对应6S_{1/2}→6P_{1/2}（895nm），D2线对应6S_{1/2}→6P_{3/2}（852nm）。（图中耦合光对应D1线，探测光对应D2线）

2025-06-20 10:46:36 1260 1

原创文章阅读非线性Non-Linearities In Atomic Quantum Receivers: Harmonic And Intermodulation Distortion

该工作通过单音测试系统揭示了原子接收器的非线性行为，验证了其谐波生成机制与传统电子器件的本质差异。实验结果表明，原子接收器在可控场强下表现出可预测的非线性响应（如谐波斜率接近理论值），并具备抑制高阶失真的潜力。这一特性为安全通信、射频指纹识别等应用提供了物理层新思路，但需进一步解决带宽与环境稳定性问题以实现工程化应用。

2025-05-20 17:27:32 1183

原创计算频谱的方法

两段代码分别从幅度谱和功率谱密度两个角度分析信号，方法论的差异（单次FFT vs 分段平均、幅度 vs 功率、窗函数影响、单位转换）导致图形在平滑度、分辨率、纵轴量纲和数值上显著不同。选择哪种方法需根据具体需求（如关注幅度细节或功率分布）决定。不同方法从不同角度揭示信号特性，选择需结合实际需求（如分辨率、平滑性、泄漏抑制、计算资源）。FFT和Welch是最基础的“黄金标准”，其他方法则针对特定场景优化。，还有多种频谱分析方法，它们在噪声抑制、分辨率、计算复杂度等方面各有优劣。

2025-05-12 16:22:43 1151

原创三种信号本振

线性调频本振通过调频斜率优化和周期性调制，有效解决了宽带信号的频谱混叠和NZ标号估计问题，适用于雷达、电子侦察等宽带信号接收场景。设计时需权衡调频参数与硬件复杂度，并结合动态算法（如谱峰搜索、盲源分离）提升性能。

2025-05-06 11:33:07 453

原创折叠机处理流程

NYFR的核心创新：通过非均匀采样脉冲串的频谱折叠特性，以低速ADC实现超宽带信号接收。参数设计要点：• (f_s)决定NZ划分和硬件成本，需权衡监视带宽与ADC性能。• 本振类型影响频谱扩展方式和解模糊算法选择。未来方向：结合压缩感知理论，优化采样脉冲的非均匀性，进一步提升抗混叠能力和解模糊效率。

2025-04-29 16:03:37 763

原创希尔伯特变换

【代码】希尔伯特变换。

2025-03-19 21:10:34 392

原创多信道接收机

生成和展示一个简单的正弦信号：通过时域和频域展示该信号。实现一个多相滤波器组：用于将信号分成多个子带，并对每个子带进行滤波和处理。频率估计：通过对不同频率信号的相位信息进行分析，估计其频率。需要注意的是，代码中有一些未定义的函数（如Filter_FFT），这可能是自定义函数或库函数。如果需要完整运行此代码，需确保所有函数都已定义或导入。此外，代码中的一些变量和逻辑可能需要根据具体需求进一步调整和优化。clear all;close all;clc;figure;FS=2.4e+9;

2025-02-19 19:45:23 928

原创最新版最详细Anaconda新手安装+配置+环境创建教程

最详细Anaconda新手安装+配置+环境创建教程。Anaconda安装教程（使用Spyder）

2025-01-15 11:26:05 214

原创从基态到激发态再到里德伯态的双光子激发过程

并通过数值计算和图形化展示来研究不同失谐条件下的拉比频率、AC Stark位移差以及散射概率的变化。结果显示，在给定的实验参数下，拉比频率较低，而AC Stark位移显著，尤其是对于里德伯态。

2024-12-05 19:26:43 506

原创【无标题】

∣κ0∣信号微波拉比频率：信号微波与里德堡态相互作用强度的大小局部微波场拉比频率：微波局部场与里德堡态相互作用的强度大小信号微波相对于局部微波场的频率失谐量：信号微波频率与局部微波频率之间得到差异信号微波相位，代表信号微波波动的起始点EIT线宽：EIT光谱中透明窗口的宽度。

2024-11-04 11:33:51 794 2

原创 3维索引二维

ny根据提供的索引计算，可以得出每个线程的全局坐标(X, Y, Z)由其所属的 block 和 grid 的索引决定。在二维的情况下，每个 block 由索引。而(bx, by)这两个维度的坐标决定了每个 block 在 grid 中的起始位置。假设lx和ly这意味着 block(bx, by)在 grid 中的起始位置为。其中，bx的范围是by的范围是blockIdx.x和blockIdx.y的范围是和。在三维的情况下，grid 由索引。在我们的情况下，只考虑了两个维度(bx, by)

2024-03-26 17:25:59 774

原创 Fast.ai

克隆此存储库后，请确保您已 nbdev_install_hooks在终端中运行。这将安装 Jupyter 和 git hooks 以自动清理、信任和修复笔记本中的合并冲突。在存储库中进行更改后，您应该运行nbdev_prepare并进行其他必要的更改，以便通过所有测试。网址：https://colab.research.google.com/

2024-01-12 17:30:07 583

原创优化的 MCM-GPU 比具有相同 SM 总数和 DRAM 带宽的同等配备的多 GPU 系统快 26.8%。

基于GPU的计算加速是推动高性能计算（HPC）系统[12]–[29]、大规模云安装中的机器学习和数据分析应用以及个人计算设备[15]–[47]性能的主要工具。在此类设备中，每个计算节点或计算设备通常由具有一个或多个 GPU 加速器的 CPU 组成。这些领域的前进道路，无论是在HPC中实现百万兆次级性能，还是使用深度卷积神经网络实现人类水平的人工智能，都依赖于持续扩展GPU性能的能力[29]，[47]。

2023-12-06 17:47:10 1339

原创 CNN,DNN,RNN,GAN,RL+图像处理常规算法(未完待续)

好的，让我们先介绍一些常见的神经网络模型，然后再讨论图像处理的常规算法。

2023-12-04 14:30:05 2470 1

原创人工智能算法

选择合适的损失函数（用于衡量模型预测与实际标签的差异）和优化器（用于更新模型参数以最小化损失函数）。

2023-12-04 10:31:59 1578

原创电磁建模的分布式并行计算技术

本文提出了一种新的分布式并行电磁建模技术，以加快电磁结构的神经网络建模过程。现有的电磁建模技术通常需要反复改变微波器件的参数，驱动电磁模拟器以获得足够的训练和测试样本。随着电磁建模问题复杂性的增加，由于单台计算机的性能有限，。一个例子表明，我们的技术比传统技术更快，同时保持良好的模型精度。

2023-11-24 19:20:42 545

原创电磁优化的并行空间映射方法

空间映射(SM)是一种公认的加速电磁优化的方法。现有的SM方法大多基于顺序计算机制。本文提出了一种用于电磁优化的并行SM方法。在该方法中，每次迭代开发的代理模型被训练以同时匹配多个点的精细模型。多点训练和SM使代理模型在比标准SM更大的邻域内有效。本文提出的多点代理模型训练方法本质上适合于并行计算，并通过并行计算实现。这包括并行的多个精细模型评估和使用并行算法的多点代理训练。与标准模型相比，该方法进一步减少了模型的迭代次数，加快了优化过程。通过三个微波滤波器实例说明了该技术。SM优化公式。

2023-11-22 21:37:59 729

原创 open mp笔记

Open mp在cpu上并行计算，统一内存访问(OPEN MP pthreads)，同一块内存共享多个CPU非统一内存访问（MPI），每个CPU都有自己对应的内存，通过blus interconnect链接起来,cpu不能直接访问他们的内存，需要进行通信才可以访问到他们所属的memory,OPEN MP pthreads他们都是针对共享内存编程的API哪个线程要指定Open mp，只加简单的预定义，编译器自动编译并行，

2023-11-02 10:26:36 319

原创 Multi-gpu问题（1）

_mul24提供了传统32位乘法的24位整数乘法，相比于12个时钟周期，__fdividef执行20个时钟周期的单精度浮点除法，优于划分浮点值[1]通常需要的36个时钟周期。，num_gpus -1）上的磁场和电场分量需要分别来自设备k+1和k-1的场值，因此我们需要在多GPU域分解边界上增加额外的nx×ny细胞来存储这些数据。域在z方向划分为num_gpus段，其中num_gpus表示可用GPU的数量，然后每个GPU相应地负责一个大小为nx×ny×（nz/num_gpus）的子域。

2023-10-30 17:22:38 321

原创等离子体共振和ENZ模式的场增强效应提高ITO对THz产生的非线性响应

等离子体纳米结构在控制光、发展光致发光增强、光学传感、太阳能电池、超材料和光学天线 [1] –[5]。这些潜在的应用来自表面等离子体共振（SPR）[6]，由等离子体之间的相互作用诱导金属纳米结构和外部电磁场。SPR 可以通过修改几何形状和纳米结构材料[7]。特别是，它们对他们的固有的非线性光学效应。报道了基于非线性效应的各种光子官能团在最近的工作中，如光学传感，超短脉冲产生，纳米天线和光信号处理[8]-[11]而与线性相互作用相比，非线性相互作用本质上是弱的。他们严重依赖激励的场振幅。

2023-10-26 20:06:39 1037 1

原创 c语言对三个数进行比较找出其中的最值

您可以使用条件运算符（三元运算符）来比较三个数并找出其中的最小值及其位置。在这个例子中，我们首先使用嵌套的条件运算符来比较三个数，找出最小值，然后使用类似的方法找出最小值的位置。根据条件运算符的工作原理，它会根据条件的真假来返回一个值，从而实现了这种比较和选择的逻辑。

2023-09-04 22:10:15 2542

原创实现链表相加，链表 1为 3-＞7-＞2，链表 2 为 2-＞4，最后生成新的结果链表为 3-＞9-＞6

【代码】实现链表相加，链表 1为 3-＞7-＞2，链表 2 为 2-＞4，最后生成新的结果链表为 3-＞9-＞6。

2023-08-26 17:08:43 140

原创 gpu之间数据传输-cudaMemcpyPeerAsync，cudaMemcpyPeerAsync、cudaEventRecord

要在第tid个 GPU 上的数据传送到第tid+1个 GPU 上的，需要使用函数和 CUDA 事件来确保传输的顺序性和正确性。在这个示例中，首先在源 GPU 上的流中记录一个事件，然后在目标 GPU 上的流中等待这个事件。这样可以确保传输操作在正确的顺序下进行，避免了数据的竞争和错误。在传输完成后，再在目标 GPU 上的流中记录传输完成的事件。这种方式可以保持数据传输的正确顺序。实现将第tid个GPU上的和数据传输到第tid + 1这句代码的目的是将第tid个GPU上的数据异步传输到第tid + 1。

2023-08-25 16:17:09 1489 1

原创 linux多线程

4100000请记住，多线程编程需要仔细考虑和测试，以正确处理同步并避免潜在问题。

2023-08-24 12:32:20 178

原创 cuda面试准备（一），架构调试

这个错误往往会伴随fatal error LNK1169: 找到一个或多个多重定义的符号出现。在此吐槽一下英某达链接器的程序猿——只能链接多个lib和一个.cu文件。并建议开发者们摒弃原有的多文件编程方法，函数和类声明即实现：传统多文件编程技巧——头文件声明函数，源文件实现函数cuda正确的多文件编程方法，声明即实现。

2023-08-22 10:45:04 1811 1

原创 cuda gdb调试

如果cudaDeviceEnablePeerAccess函数不支持或不起作用，您仍然可以尝试其他方法来实现GPU之间的数据交换和通信。以下是一些替代方法：通过主机内存进行数据传输：如果GPU之间的数据交换不是非常频繁，您可以将数据从一个GPU复制到主机内存，然后再从主机内存复制到另一个GPU。这可以通过cudaMemcpy函数来实现。使用Unified Memory：CUDA的Unified Memory允许多个GPU共享同一块内存。您可以在多个GPU之间创建统一内存分配，并在它们之间共享数据。

2023-08-21 17:36:25 1600

原创 ubuntu22.04+cuda11.5+gcc11.4第一个cuda程序示例

VisualStudio 2019是微软的集成开发环境(IDE)，通常在Windows操作系统上使用。然而，并不直接支持在Linux上安装。如果想在Ubuntu上进行开发，可以考虑以下几个选项:使用替代的IDE或文本编辑器: Ubuntu上有许多适用于C++等编程语言的开发工具，比如Visual Studio Code、 Code.:Blocks、 Eclipse等。

2023-08-13 17:15:35 2581 1

原创从一个GPU到多个GPU

在多GPU运行应用程序时，需要正确设计GPU之间的通信，GPU间数据传输的效率取决于GPU是如何连接在一个节点上并跨集群的。多GPU通过单个节点连接到PCIe总线上。多GPU连接到集群中的网络交换机上。在多GPU系统里有两种连接方式。

2023-08-13 15:15:09 408

原创摸鱼（三）消失的三十年

日本政府，疯狂加息，希望迅速撕破泡沫，在15个月内加息5次，收紧货币和房贷，工厂倒闭，大学生毕业即失业-------被国家抛弃的一代（所以鼓励消费，扩大内需不是一条正确的道路，发展实业，夯实基础资源根基才是本源之水）1980年日本汽车工业取代美国成为世界第一，出口贸易繁荣，资产价格疯涨，民族主义泛滥，对美摩擦不断-----民众到高层的狂欢，强烈的民族自豪感，摔跟头后躺平摆烂，信息永远是最具价值的资源。美国越南战争，中东问题，石油危机–滞涨危机，失业率10%，美国贸易赤字的1/3都来自于日本。

2023-08-10 21:38:22 252

转载如何处理GPU上Error Number:700 an illegal memory access was encounter

步骤2：执行步骤1的操作后问题不复现，也就是同步执行的这种方式下没有问题，基本上可以确定是有算子里依赖同步执行的结果，因为正常device算子执行是异步执行，所以拿的结果不是预期值，同步执行就掩盖了这个问题。步骤1：由于GPU的算子执行是host下发到device上异步执行的，因此执行报错的地方不一定是真凶，大概率是前面的算子有问题，但是device是异步执行的，所以执行到后面才会报错。案例代码：https://gitee.com/mindspore/mindspore/pulls/962。

2023-07-21 10:11:31 1495

原创摸鱼（2）---像一个真正的好朋友那样同情你自己

2.孤独会导致心理不健康，研究表明长期的孤独会导致很多疾病4.失败也会导致心理不健康，人们被自己会失败的思维困住，很快放弃，认定自己不能成功，导致心理不健康。5.被拒绝是十分痛苦的，会导致心理不健康6.停止重思苦想，改变反复回味不愉快回忆的习惯。7.当你又在思考伤心的事情的时候，就强迫自己专注于其他事情上。就是事后反复咀嚼回味一件事。反复回味不愉快的事很容易变成习惯，而这个习惯代价很大。

2023-07-20 20:35:54 155

原创 cuda sample_MultiGPU（3）

该代码片段展示了一个使用多个GPU进行并行计算的示例。初始化多个GPU设备并打印它们的计算能力。根据GPU的数量将数据均匀分配给每个GPU。通过循环遍历每个GPU，将dataN设置为DATA_N / GPU_N，其中DATA_N是数据的总大小。这样可以均匀地将数据分配给每个GPU。对于余数部分，通过将dataN递增1来处理。这样可以确保所有数据都被正确地分配给每个GPU。为每个GPU分配内存空间，并将输入数据从主机内存复制到各个GPU设备。为每个GPU分配相关的内存和流。

2023-07-11 15:41:51 518

原创 AI的建议

通过深入学习 GPU 架构、CUDA 编程模型、CUDA API、并行算法和优化技术，并结合实际应用领域的知识，您将能够开发出高效的 GPU 加速应用程序，并在相关领域中找到工作机会。这些工具可以帮助您调试和优化 CUDA 程序，提高代码的可靠性和性能。需要注意的是，展开循环可能会增加生成的代码的大小，因此需要权衡代码大小和性能提升之间的关系，并根据具体情况进行选择。CUDA 编程模型：学习 CUDA 的编程模型和编程范式，包括主机代码和设备代码的编写、内存管理、线程和线程块的组织、核函数的编写等。

2023-07-07 11:28:22 375

原创 cuda sample(2)矩阵乘法

/ CUDA示例演示了一个__nv_bfloat16 (E8M7) GEMM计算，使用的是CUDA 11.0中引入的和。

2023-07-07 11:06:43 924

原创 cuda sample-asyncAPI(01)

需要注意的是，代码中的计时器函数（如 sdkStartTimer 和 sdkStopTimer）可能是特定的SDK或库函数，需要确认代码所使用的具体环境和库。该代码片段展示了一种典型的异步数据传输和核函数调用的模式，旨在提高CUDA程序的性能。通过使用 exit() 函数，可以在程序的任何地方进行终止，并根据条件决定程序的退出状态码，从而可以在后续的处理中识别程序的执行结果。给出的代码片段使用了 exit() 函数来退出程序，并根据条件 bFinalResults 的值决定返回的退出状态码。

2023-07-06 20:59:51 280

原创摸鱼（1）

后边苏联解体了（没客户了），同时爆发了海湾战争，油价涨了（能源进口的价格），所以印度的资金流非常紧张------向世界贸易组织借钱了—不是无偿-----要求他们全面整改，1991年，搞西方的政治经济自由，所以在稳步上升，----主要业务：外包（漂亮国的IT产业）----便宜，人力成本低，大量的信息技术人才，印度的理工科，说英语的人多（被殖民过，虽然有口音）单程序多份数据进行任务并行。世界人口第一多，人均GDP低，人口结构比较好，人口多，就业压力大，没有就业岗位，农业，工业（拉胯–印度制造），服务业，

2023-07-04 10:38:56 144

空空如也

空空如也