基于机器学习的编译器启发式生成与函数内联优化
1. 基于机器学习的启发式生成
在编译器启发式生成中,对象 i 代表一个优化候选,如函数或指令,由特征向量 xi 来表征。标签则表达了针对特定成本函数对 i 进行优化的效果。例如,优化 i 后程序的最坏情况执行时间(WCET)降低了,可标记为 “YES”,否则标记为 “NO”。
1.1 基于监督学习的启发式生成步骤
基于监督学习的启发式生成,首先要明确针对哪种编译器优化生成改进的启发式方法,之后按以下步骤进行:
1. 程序表示 :使用编译器内部数据结构来表示被测程序,如高级或低级中间表示、抽象语法树或控制流图。
2. 特征提取与标签确定 :开发者需根据程序表示,确定能最好表征待优化程序部分的特征,并将其提取出来。可能的特征包括给定基本块的后继数量或块内浮点指令的数量。这些特征要转换为合适的向量表示,作为机器学习工具的输入,此过程即特征提取。此外,要为每个特征向量确定一个代表期望输出的标签,这一步的结果是构建出训练集。
3. 机器学习算法与参数选择 :选择合适的监督学习器及其参数。机器学习领域在过去几十年里开发了大量不同的学习器,且许多学习器有多个用户定义的参数,会导致不同性能的模型。因此,选择合适的学习算法并非易事。
4. 模型归纳 :所选的分类器(学习器)归纳出一个预测模型,代表编译器启发式方法,可用于预测对未知数据是否以
超级会员免费看
订阅专栏 解锁全文
3

被折叠的 条评论
为什么被折叠?



