[HEVC/H265] 008.使用OpenCL优化?

探讨了OpenCL在HEVC硬件编码器架构中的潜在价值,分析了不同平台的OpenCL开发环境及其限制,计划先简化软件模型再利用OpenCL进行优化。
部署运行你感兴趣的模型镜像

 今天还抽空看了下OpenCL文档,似乎非常适合我的硬件编码器架构,也许可以考虑暂时降低FPGA编码器的优先级,完成软件模型后直接使用OpenCL做出一个版本来,这样很多带GPU的嵌入式设备都能使用HEVC了。

    目前发现的OpenCL开发环境存在一些问题:

    1. Intel的实现是纯CPU的,无法启用其集成显卡支持,估计效率不行。另外Intel只支持Vista或者Win7平台,我的WinXP下无法安装和使用;

    2. AMD APP环境可以支持WinXP环境,并且看起来集成在VS2008里面的Profile系统对开发高效OpenCL程序帮助很大,但是我目前还没升级到VS2008,稍后再进一步测试。另外比较可惜的是笔记本的X300显卡不被支持[HEVC] 008.可能的OpenCL优化 - chenm003 - 回忆

    3. OpenCL开发可以使用我的多PU并行算法,不过其初始化以及Kernel编写的规则需要时间去掌握,只能过几个月有环境和时间再说;

 

    整体来说OpenCL对我的HEVC实现还是有很大价值,但是目前受限于条件,只能滞后考虑,先处理简化软件模型的事情。设计模型时可以适当考虑多PU并行以适应OpenCL。

    OpenCL编程时要注意的主要限制:

    1. Global内存不要超过32KB,大约8个TreeBlock大小;

    2. Local内存不要超过16KB,大约4个TreeBlock大小;

    3. 矢量的分量个数不能超过16个;

您可能感兴趣的与本文相关的镜像

Wan2.2-I2V-A14B

Wan2.2-I2V-A14B

图生视频
Wan2.2

Wan2.2是由通义万相开源高效文本到视频生成模型,是有​50亿参数的轻量级视频生成模型,专为快速内容创作优化。支持480P视频生成,具备优秀的时序连贯性和运动推理能力

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值