- 博客(720)
- 收藏
- 关注

原创 Arm AMBA 协议集相关文章汇总(AHB/APB/AXI/CHI等),10.14更新
整理自:极术社区整理:极术社区团队如想加入极术社区AMBA技术交流群,请加微信 aijishu20 (备注优快云)进入。可即时获取极术公开课及Arm相关资料。1.AMBA协议集的相关技术文档PDF下载,包含AMBA specifications- 5文档,MBA specifications- 4文档,example AMBA SYstems,AMBA compliance and checks,AMBA design and integrationAMBA协议集技术文档PDF下载2. I2.
2020-07-20 19:39:12
1550
原创 深入浅出 | 谈谈MNN GPU性能优化策略
MNN(Mobile Neural Network)是一个高性能、通用的深度学习框架,支持在移动端、PC端、服务端、嵌入式等各种设备上高效运行。MNN利用设备的GPU能力,全面充分“榨干”设备的GPU资源,来进行深度学习的高性能部署与训练。
2024-11-04 12:23:17
977
原创 利用GPU加速在Orange Pi 5上跑LLMs:人工智能爱好者High翻了!
利用GPU加速在Orange Pi 5上跑LLMs:人工智能爱好者High翻了!
2024-11-01 10:16:09
736
原创 遥遥领先!手把手带你用国产香橙派部署清华AI语言模型,比肩GPT,树莓派做得到吗?
遥遥领先!手把手带你用国产香橙派部署清华AI语言模型,比肩GPT,树莓派做得到吗?
2024-10-31 10:14:05
844
原创 GiantPandaCVARM Neon Intrinsics 学习指北:从入门、进阶到学个通透
Neon是ARM平台的向量化计算指令集,通过一条指令完成多个数据的运算达到加速的目的,常用于AI、多媒体等计算密集型任务。本文主要是一篇对ARM官方资料的导读。笔者根据自己Neon学习经历,将这些资料按照逻辑进行组织,以期减少读者的学习成本。本文讨论的是Neon 的intrinsics,而非assembly。intrinsics是以类似调用C语言函数的方法调用Neon,并由编译器生成最终的二进制代码,assembly则是手工嵌入Neon汇编,直接生成二进制代码。
2024-10-30 09:53:38
1086
原创 使用 Ollama AI 在本地 Raspberry Pi 运行大语言模型
使用 Ollama AI 在本地 Raspberry Pi 运行大语言模型
2024-10-28 10:08:50
936
原创 手把手教你在树莓派4B上运行LLaMA 7B模型
LLaMA全称是Large Language Model Meta AI,是由Meta AI研究人员发布的一个预训练语言模型。与最近爆火的ChatGPT相比,LLaMA架构更小,但训练过程和单GPU推理速度更快,成本更低。今天在刷推特的时候无意中看到了这样一条消息,@ggerganov在GitHub上发布了llama.cpp,使用了4-bit量化将模型尽可能缩小,并能在多种移动设备上运行。这我就不淡定了,正好手里有个闲置的Raspberry Pi 4B 4GB版本,赶紧搞起。
2024-10-25 10:13:20
1682
原创 DPRNN 学习
双路径循环语音分离神经网络(Dual-Path RNN)由三个处理阶段组成, 编码器、分离和解码器。首先,编码器模块用于将混合波形的短段转换为它们在中间特征空间中的对应表示。然后,该表示用于在每个时间步估计每个源的乘法函数(掩码)。最后利用解码器模块对屏蔽编码器特征进行变换,重构源波形。 DPRNN被广泛的应用在语音分离等任务上,取得了显著的效果。
2024-10-23 09:37:12
1003
原创 Wav2vec 系列:从原始音频中学习语音的结构
本文主要梳理Facebook AI Research 从2019年开始的发表的wav2vec系列工作,主要包括了Wav2vec、Wav2vec 2.0
2024-10-17 09:52:08
1395
原创 WaveNet结构与推断
WaveNet是2016年Google DeepMind 提出的一种Neural Vocoder 架构,模型主体为一个基于空洞因果卷积(Dilated Causal Convolution)的概率模型。即基于Condition(Mel Spectrogram),以及之前时间节点的语音生成一个概率分布,再采样得到下一采样点。反复执行该步骤,最后得到完整语音。
2024-10-15 09:48:41
1148
原创 【3D计算机视觉】PU-Net:点云上采样网络(CVPR2018-6)
由于点云数据的稀疏性和不规则性,所以用深度神经网络学习和分析3D点云一直以来是一个具有挑战性的工作。这篇文章中我们提出了一种数据驱动的点云上采样技术。核心思想是学习每个点的多层次特征,然后利用不同的卷积分支在特征空间的中进行扩充,然后将扩充后的特征进行分解并重建为上采样点云集。我们的网络应用于块状点云上,并且使用了联合的损失函数使得上采样后的点在潜在的曲面上分布一致。
2024-10-14 10:04:38
872
原创 PointNet系列论文阅读与理解
PointNet是斯坦福大学研究人员提出的一种点云处理网络,其可以直接输入无序点云集合进行处理,而不像基于投影的方法需要先对点云进行预处理再输入网络。其可以用作与点云分类和点云分割。由于其可以直接输入无序点云,因此对深度学习点云处理产生了巨大的影响。而同一个作者的进阶版网络PointNet++ 则解决了PointNet局部特征使用不足的问题,提高了其局部特征的处理能力。
2024-10-12 14:11:46
987
1
原创 图像超分经典网络 SRGAN 解析 ~ 如何把 GAN 运用在其他视觉任务上
图像超分经典网络 SRGAN 解析 ~ 如何把 GAN 运用在其他视觉任务上
2024-09-30 09:59:48
895
原创 图片、视频修复并超分 – Real-ESRGAN项目使用(一) | 机器学习
图片、视频修复并超分 – Real-ESRGAN项目使用(一) | 机器学习
2024-09-29 10:14:59
1035
原创 语义分割专栏(一)解读FCN
本文将介绍全卷积神经网络(Fully Convolutional Network,简称FCN)的基础知识,包括它的网络结构、起源、应用、输入输出格式和pytorch代码实现等内容。
2024-09-26 10:39:19
946
原创 在 v5e Cloud TPU 虚拟机上进行 JetStream PyTorch 推断
在 v5e Cloud TPU 虚拟机上进行 JetStream PyTorch 推断
2024-09-12 10:02:09
448
原创 在 v5e Cloud TPU 虚拟机上进行 JetStream MaxText 推理
在 v5e Cloud TPU 虚拟机上进行 JetStream MaxText 推理
2024-09-11 14:10:39
682
原创 使用 Cloud TPU 进行 BERT 微调:句子和句对分类任务 (TF 2.x)
本教程介绍如何在 Cloud TPU 上训练基于 Transformer 的双向编码器表示法 (BERT) 模型。
2024-09-09 10:27:47
1089
原创 在 Cloud TPU 上训练 DLRM 和 DCN (TF 2.x)
本教程介绍如何训练 DLRM 和 DCN v2 排名模型, 用于预测点击率 (CTR) 等任务。查看以下语言版本的备注 设置以运行 DLRM 或 DCN 模型,了解如何设置参数 来训练 DLRM 或 DCN v2 排名模型。
2024-09-04 10:25:12
1017
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人