极术社区-优快云博客

原创 Arm AMBA 协议集相关文章汇总（AHB/APB/AXI/CHI等），10.14更新

整理自：极术社区整理：极术社区团队如想加入极术社区AMBA技术交流群，请加微信 aijishu20 （备注优快云）进入。可即时获取极术公开课及Arm相关资料。1.AMBA协议集的相关技术文档PDF下载，包含AMBA specifications- 5文档，MBA specifications- 4文档，example AMBA SYstems,AMBA compliance and checks,AMBA design and integrationAMBA协议集技术文档PDF下载2. I2.

2020-07-20 19:39:12 1550

原创深入浅出 | 谈谈MNN GPU性能优化策略

MNN(Mobile Neural Network)是一个高性能、通用的深度学习框架，支持在移动端、PC端、服务端、嵌入式等各种设备上高效运行。MNN利用设备的GPU能力，全面充分“榨干”设备的GPU资源，来进行深度学习的高性能部署与训练。

2024-11-04 12:23:17 977

原创利用GPU加速在Orange Pi 5上跑LLMs：人工智能爱好者High翻了！

利用GPU加速在Orange Pi 5上跑LLMs：人工智能爱好者High翻了！

2024-11-01 10:16:09 736

原创遥遥领先！手把手带你用国产香橙派部署清华AI语言模型，比肩GPT，树莓派做得到吗？

遥遥领先！手把手带你用国产香橙派部署清华AI语言模型，比肩GPT，树莓派做得到吗？

2024-10-31 10:14:05 844

原创 GiantPandaCVARM Neon Intrinsics 学习指北：从入门、进阶到学个通透

Neon是ARM平台的向量化计算指令集，通过一条指令完成多个数据的运算达到加速的目的，常用于AI、多媒体等计算密集型任务。本文主要是一篇对ARM官方资料的导读。笔者根据自己Neon学习经历，将这些资料按照逻辑进行组织，以期减少读者的学习成本。本文讨论的是Neon 的intrinsics，而非assembly。intrinsics是以类似调用C语言函数的方法调用Neon，并由编译器生成最终的二进制代码，assembly则是手工嵌入Neon汇编，直接生成二进制代码。

2024-10-30 09:53:38 1086

原创 1-2B参数规模大模型使用心得及模型汇总

1-2B参数规模大模型使用心得及模型汇总

2024-10-29 09:39:45 1257

原创使用 Ollama AI 在本地 Raspberry Pi 运行大语言模型

使用 Ollama AI 在本地 Raspberry Pi 运行大语言模型

2024-10-28 10:08:50 936

原创手把手教你在树莓派4B上运行LLaMA 7B模型

LLaMA全称是Large Language Model Meta AI，是由Meta AI研究人员发布的一个预训练语言模型。与最近爆火的ChatGPT相比，LLaMA架构更小，但训练过程和单GPU推理速度更快，成本更低。今天在刷推特的时候无意中看到了这样一条消息，@ggerganov在GitHub上发布了llama.cpp，使用了4-bit量化将模型尽可能缩小，并能在多种移动设备上运行。这我就不淡定了，正好手里有个闲置的Raspberry Pi 4B 4GB版本，赶紧搞起。

2024-10-25 10:13:20 1682

原创 DPRNN 学习

双路径循环语音分离神经网络（Dual-Path RNN）由三个处理阶段组成, 编码器、分离和解码器。首先，编码器模块用于将混合波形的短段转换为它们在中间特征空间中的对应表示。然后，该表示用于在每个时间步估计每个源的乘法函数（掩码）。最后利用解码器模块对屏蔽编码器特征进行变换，重构源波形。 DPRNN被广泛的应用在语音分离等任务上，取得了显著的效果。

2024-10-23 09:37:12 1003

原创 KWS语音识别技术简介

KWS语音识别技术简介

2024-10-22 10:23:40 1092

原创人人都能看懂的GRU

人人都能看懂的GRU

2024-10-21 10:34:43 1160 1

原创 LSTM模型分析

LSTM模型分析

2024-10-18 09:25:33 815

原创 Wav2vec 系列：从原始音频中学习语音的结构

本文主要梳理Facebook AI Research 从2019年开始的发表的wav2vec系列工作，主要包括了Wav2vec、Wav2vec 2.0

2024-10-17 09:52:08 1395

原创 DeepSpeech理论与实战

本文介绍基于CTC的End-to-End语音识别系统——DeepSpecch，包括简单的原理介绍和代码介绍。

2024-10-16 09:52:30 1355

原创 WaveNet结构与推断

WaveNet是2016年Google DeepMind 提出的一种Neural Vocoder 架构，模型主体为一个基于空洞因果卷积(Dilated Causal Convolution)的概率模型。即基于Condition(Mel Spectrogram)，以及之前时间节点的语音生成一个概率分布，再采样得到下一采样点。反复执行该步骤，最后得到完整语音。

2024-10-15 09:48:41 1148

原创【3D计算机视觉】PU-Net：点云上采样网络（CVPR2018-6）

由于点云数据的稀疏性和不规则性，所以用深度神经网络学习和分析3D点云一直以来是一个具有挑战性的工作。这篇文章中我们提出了一种数据驱动的点云上采样技术。核心思想是学习每个点的多层次特征，然后利用不同的卷积分支在特征空间的中进行扩充，然后将扩充后的特征进行分解并重建为上采样点云集。我们的网络应用于块状点云上，并且使用了联合的损失函数使得上采样后的点在潜在的曲面上分布一致。

2024-10-14 10:04:38 872

原创 PointNet系列论文阅读与理解

PointNet是斯坦福大学研究人员提出的一种点云处理网络，其可以直接输入无序点云集合进行处理，而不像基于投影的方法需要先对点云进行预处理再输入网络。其可以用作与点云分类和点云分割。由于其可以直接输入无序点云，因此对深度学习点云处理产生了巨大的影响。而同一个作者的进阶版网络PointNet++ 则解决了PointNet局部特征使用不足的问题，提高了其局部特征的处理能力。

2024-10-12 14:11:46 987 1