sprite
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
15、内存计算技术:架构、分类与应用
本文探讨了内存计算技术的架构、分类与应用,重点分析了近内存计算(NM)和内存内计算(IM)的实现方式及其解决内存墙问题的潜力。内容涵盖了内存墙问题的背景、计算与内存融合的思路、处理内存(PIM)的发展、3D芯片堆叠技术的影响,以及主流内存计算技术的实现方式。同时,文章详细分类并比较了近内存计算与内存内计算的不同架构,并讨论了它们在通用处理器和加速器中的应用。最后,文章分析了内存计算的编程模型与编译器需求,并展望了未来发展方向。原创 2025-09-04 11:18:43 · 53 阅读 · 0 评论 -
14、内存内/近内存计算技术综述
本文综述了内存内和近内存计算技术,探讨了其在解决冯·诺依曼架构中‘内存墙’问题方面的潜力。文章从基础概念出发,详细分析了DRAM、SRAM和非易失性存储器在计算中的应用,并讨论了它们在不同领域如机器学习、图计算等的加速作用。同时,还介绍了相关的编程模型和未来技术发展趋势,为理解内存中心计算架构提供了全面的视角。原创 2025-09-03 12:04:13 · 104 阅读 · 0 评论 -
13、内存内/近内存计算:概念、挑战与机遇
本文探讨了内存内/近内存计算的概念、原理、优势与挑战,以及其在深度学习、数据中心和机器人计算等领域的应用机遇。文章还分析了相关出版物的发展趋势,并总结了推动该技术发展的关键要素和未来展望。原创 2025-09-02 12:47:29 · 69 阅读 · 0 评论 -
12、计算能力内存技术:现状与未来展望
本文全面探讨了计算能力内存技术的基础、不同内存技术的特点及其在多个领域的应用前景。计算能力内存技术作为一种新兴解决方案,具有加速数据密集型应用的潜力。文章还分析了SRAM、DRAM和NVM等内存技术的优劣势,并讨论了定制化内存层次结构的重要性及未来研究方向。此外,安全性、编程模型和统一框架的构建也被视为推动该技术发展的关键因素。原创 2025-09-01 14:49:23 · 37 阅读 · 0 评论 -
11、内存内和近内存处理架构的编程模型
本文深入探讨了内存内和近内存处理架构的编程模型,包括高级特定领域框架(如TensorFlow、PyTorch)、数据并行编程模型(如SIMD和SIMT)以及自定义低级API模型。文章分析了不同编程模型的优劣和适用场景,并讨论了卸载粒度、地址转换、缓存一致性等关键设计决策。此外,还介绍了内存内计算在实际应用中的操作流程,如图处理任务的编程步骤和优化方法。最后,文章展望了未来发展趋势,包括更通用的编程模型、自动化优化技术、与新兴技术的融合以及安全性与可靠性的提升。原创 2025-08-31 14:47:36 · 44 阅读 · 0 评论 -
10、基因组学中的数据处理与编程模型探索
本博客探讨了基因组学中的数据处理挑战与编程模型创新。随着基因组测序成本降低和数据量激增,传统的通用CPU处理方式面临内存带宽和计算效率的瓶颈。文章分析了基因组学中精确字符串匹配、近似字符串匹配和K-mer计数等关键数据密集型内核,并介绍了通过近数据处理架构(如LRDIMMs、ReRAM等)提升计算效率的策略。此外,博客还比较了不同加速器技术的适用场景,如自动机处理器在特定模式匹配中的优势,以及各类编程模型(包括Active Pages、DIVA和旅行线程)的设计权衡。最后,博客总结了数据并行编程模型和编译策原创 2025-08-30 16:54:06 · 42 阅读 · 0 评论 -
9、特定领域加速器:自动机、图与数据库处理技术
本博客探讨了特定领域加速器中的自动机处理、图处理和数据库处理技术。详细分析了自动机处理在性能提升和内存基板利用方面的挑战与解决方案,图处理在不规则内存访问和近内存/内存内计算架构中的难点与策略,以及数据库处理在近数据计算中的优化与瓶颈。通过硬件与软件协同设计,这些领域在性能、资源利用和计算效率方面均取得了显著进展。原创 2025-08-29 11:35:44 · 32 阅读 · 0 评论 -
8、特定领域加速器:机器学习与自动机处理的创新方案
本博客探讨了特定领域加速器在机器学习和自动机处理方面的创新方案。内容涵盖了基于ReRAM、SRAM和DRAM的内存计算架构,如PipeLayer、Neural Cache和DRISA,用于提升深度神经网络的性能与能效。同时,博客还深入分析了有限状态自动机(FSM)的处理挑战及优化策略,包括传统CPU、GPGPU等处理方式的局限性,并重点介绍了基于内存中心架构的Micron自动机处理器(AP)的设计、实现与编程支持,展示了其在大规模NFA处理中的显著优势。原创 2025-08-28 16:52:50 · 33 阅读 · 0 评论 -
7、新兴内存技术与机器学习加速
本文深入探讨了多种新兴内存技术(如NAND闪存、STT-MRAM、PCM和ReRAM)的特点及其在机器学习加速和其他计算领域的应用。文章分析了这些技术在性能、可靠性及适用场景中的表现,同时讨论了内存计算在提升机器学习、自动机处理、图计算、数据库操作和基因组学等领域的潜力与挑战。通过对比不同技术的优劣,文章为未来硬件创新和系统优化提供了方向。原创 2025-08-27 12:03:55 · 28 阅读 · 0 评论 -
6、基于忆阻器的非易失性内存计算技术解析
本文深入解析了基于忆阻器的非易失性内存计算技术,特别是以ReRAM为代表的存储技术在神经网络加速中的应用。文章探讨了使用忆阻器所面临的挑战,包括变化性、操作成本、写入耐久性、ADC/DAC开销以及数据表示和操作的局限性。同时,详细介绍了ReRAM内存计算的关键技术优化,如数据表示方法(PRIME、ISAAC)、支持各种算术运算(Pinatubo、Feinberg方案、FloatPIM)、降低模拟计算开销(PipeLayer、CASCADE)以及门映射技术(PLiM、IMPLY、MAGIC)。此外,还比较了其原创 2025-08-26 15:01:49 · 66 阅读 · 0 评论 -
5、内存计算技术:从SRAM到非易失性存储器的探索
本文探讨了内存计算技术从传统SRAM到新兴非易失性存储器(如忆阻器)的发展与应用。重点分析了SRAM内存计算的架构改进、模拟与数字混合信号计算方法、多比特精度实现以及执行模型;同时介绍了忆阻器计算的原理、应用优势及面临的挑战。文章还展望了内存计算技术在混合架构、人工智能和边缘计算等领域的未来发展方向,并提供了深入学习该技术的操作建议。原创 2025-08-25 15:21:00 · 46 阅读 · 0 评论 -
4、SRAM计算技术:原理、优势与实现方法
本博客深入探讨了SRAM计算技术的原理、优势与实现方法。文章从SRAM的基础知识与缓存架构出发,详细介绍了其在数字计算、模拟/混合信号计算以及近SRAM计算中的应用。博客还分析了SRAM计算技术在人工智能、数据中心和嵌入式系统等领域的广泛应用前景,并对SRAM计算技术的未来发展进行了展望,包括提高计算精度、增强兼容性及拓展应用领域等方向。原创 2025-08-24 12:40:50 · 118 阅读 · 0 评论 -
3、DRAM计算技术:从近存到存内的全面解析
本文全面解析了DRAM计算技术,涵盖从近存计算到存内计算的发展与挑战。详细介绍了3D堆叠DRAM的架构类型及其在近存处理中的应用,并分析了其优缺点。同时,探讨了商用近DRAM计算芯片如UPMEM和HBM-PIM的设计与应用场景。文章还深入解析了存内计算中的电荷共享技术,包括Ambit和ROC等代表性方案,并讨论了其优势与面临的挑战。最后,对不同计算架构进行了对比总结,展望了其在未来高性能计算和低功耗设备中的应用前景。原创 2025-08-23 11:06:37 · 126 阅读 · 0 评论 -
2、内存计算与DRAM计算技术解析
本文深入解析了内存计算与DRAM计算技术,对比了冯·诺伊曼架构、近内存计算(NM)、IM-P和IM-A架构的特点,探讨了离散加速器与集成加速器的优劣势,并回顾了DRAM计算的历史与技术演变。同时,分析了3D堆叠DRAM的优势及其在现代数据密集型应用中的重要性,提供了不同架构的应用场景及选择决策流程,展望了未来发展趋势。原创 2025-08-22 15:26:59 · 38 阅读 · 0 评论 -
1、内存计算技术:突破传统架构瓶颈
本文深入探讨了内存计算技术如何突破传统计算机架构中的‘内存墙’瓶颈。随着数据密集型应用的增加,传统架构中内存和计算单元分离的问题日益突出。内存计算技术,包括处理内存(PIM)、近内存计算和内存内计算,通过将计算与内存紧密结合,显著提高了能源效率和计算性能。文章还介绍了内存计算技术在机器学习、数据库和基因组学等领域的应用,并展望了其未来发展前景及面临的挑战。原创 2025-08-21 13:08:56 · 76 阅读 · 0 评论
分享