
程序性能优化
STN_LCD
这个作者很懒,什么都没留下…
展开
-
浅谈代码的执行效率(1):算法是关键
http://blog.zhaojie.me/2010/01/short-code-is-not-always-fast-1-algorithms.html前一段时间在博客园里看到这样一篇文章,那位兄弟谈到程序效率的关键是“简短”。他说,“程序越简短,其可执行代码就越少,就越有效率”,而在编写程序的时候,“要尽量改进我们的算法,而改进算法中最重要的一条,就是减少语句”。这句转载 2017-08-14 17:48:44 · 704 阅读 · 0 评论 -
X264中的汇编:sad-a.asm——002
http://blog.youkuaiyun.com/xiaoyi247/article/details/7913360版权声明:本文为博主原创文章,未经博主允许不得转载。1.SAD即绝对误差和(sum of absolute differences),应用非常广泛,是一种测量两个图像块的差异的最简单的办法。顾名思义,其公式为: 2.为什么要优化SAD转载 2017-08-14 20:12:27 · 691 阅读 · 0 评论 -
x264中的汇编:x86inc.asm——001
http://blog.youkuaiyun.com/xiaoyi247/article/details/7904906版权声明:本文为博主原创文章,未经博主允许不得转载。 龙哥以前说过,不懂汇编,就别说自己懂264,确实汇编在视频编解码中的作用太大了。在非opencl等显卡并行优化的平台上,SIMD就成了算法并行处理的唯一渠道。整个X264的代码的精华都在转载 2017-08-14 20:11:20 · 1148 阅读 · 0 评论 -
HEVC中需要汇编优化的关键耗时函数——005
http://blog.youkuaiyun.com/xiaoyi247/article/details/8239500版权声明:本文为博主原创文章,未经博主允许不得转载。下面整理出HEVC中需要汇编优化的一些关键函数,其中HAD是比较简单,但是占CPU比重非常高的函数,从此入手TComPrediction::predIntraLumaAngTComRdCost转载 2017-08-14 20:16:28 · 615 阅读 · 0 评论 -
x264中的汇编:DCT变换 dct-a.asm——004
http://blog.youkuaiyun.com/xiaoyi247/article/details/7918719版权声明:本文为博主原创文章,未经博主允许不得转载。1.什么是傅里叶变换傅里叶变换能将满足一定条件的某个函数表示成三角函数(正弦和/或余弦函数)或者它们的积分的线性组合。在不同的研究领域,傅里叶变换具有多种不同的变体形式,如连续傅里叶变换和离散傅里叶变转载 2017-08-14 20:14:50 · 734 阅读 · 0 评论 -
C代码调用汇编&使用指令集优化——x264汇编代码原理
http://www.cnblogs.com/JeroZeng/p/4782438.html 最近研究x264汇编代码,感觉使用到的优化思想和手法非常不错,在此写一个demon来记录我学习过程从搭建环境开始 x264使用汇编优化的思想是将汇编代码编译到一个静态库里,供C代码调用,所以首先需要构建一个汇编函数得静态库。因为手动配置使用yasm来编译汇编文件转载 2017-08-14 18:01:10 · 1390 阅读 · 0 评论 -
浅谈代码的执行效率(4):汇编优化
http://blog.zhaojie.me/2010/01/talk-about-code-performance-4-asm-optimization.html终于谈到这个话题了,首先声明我不是汇编优化的高手,甚至于我知道的所有关于汇编优化的内容,仅仅来自于学校的课程、书本及当年做过的一些简单练习。换句话说,我了解的东西只能算是一些原则,甚至也有一些“陈旧”了——不过我转载 2017-08-14 17:53:37 · 563 阅读 · 0 评论 -
浅谈代码的执行效率(3):缓存与局部性
http://blog.zhaojie.me/2010/01/talk-about-code-performance-3-locality.html在前两篇文章里,我们讨论了程序性能的两个方面,一是算法(广义的算法,即解决问题的方法),二是编译器。通过这两个方面,我想表达的意思是,一段程序的执行效率,是很难从表面现象得出结论的,至少从一些简单的层面,如代码的长度是几乎难以说转载 2017-08-14 17:51:32 · 342 阅读 · 0 评论 -
浅谈代码的执行效率(2):编译器的威力
http://blog.zhaojie.me/2010/01/talk-about-code-performance-2-compiler.html在上一篇文章中,我主要表达了这样一个观点:影响程序效率的关键之一是算法,而算法的选择与优化,和是否多一个赋值少一个判断的关系不大。关于算法的选择,我谈到其理论上的复杂度,并不直接反映出效率。因为在实际运用时,数据的规模,特征等等转载 2017-08-14 17:49:59 · 525 阅读 · 0 评论 -
x264中的汇编:cpu-a.asm——003
http://blog.youkuaiyun.com/xiaoyi247/article/details/7917537版权声明:本文为博主原创文章,未经博主允许不得转载。 CPUID指令是用来搜集当前程序正在运行的处理器信息的,包括厂商和信号信息。在IA-32中,CPUID指令使用EAX寄存器作为输入,EAX寄存器用来指定需要查看的信息的类型,根据EAX的转载 2017-08-14 20:13:49 · 502 阅读 · 0 评论