Performance - tuning BIMC turbo mode and cpu

本文介绍了一种通过调整CPU频率、内存频率及总线投票值等参数来最大化BIMC性能的方法,并展示了USB速度测试结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

bumping up BIMC(NoCs) to Turbo and with scaling governor set to performance mode
put IB/AB values for bus voting to get max theoretical requirement
scaling governor set to performance mode
Set DDR to max freq
Get DDR current freq
stop thermal-engine
echo 1 > /sys/devices/system/cpu/cpu1/online ;\
echo 1 > /sys/devices/system/cpu/cpu2/online ;\
echo 1 > /sys/devices/system/cpu/cpu3/online ;\
echo 1 > /sys/devices/system/cpu/cpu4/online ;\
echo 1 > /sys/devices/system/cpu/cpu5/online ;\
echo 1 > /sys/devices/system/cpu/cpu6/online ;\
echo 1 > /sys/devices/system/cpu/cpu7/online ;\
echo performance >/sys/devices/system/cpu/cpu0/cpufreq/scaling_governor ;\
echo performance > /sys/devices/system/cpu/cpu1/cpufreq/scaling_governor ;\
echo performance > /sys/devices/system/cpu/cpu2/cpufreq/scaling_governor ;\
echo performance > /sys/devices/system/cpu/cpu3/cpufreq/scaling_governor ;\
echo performance > /sys/devices/system/cpu/cpu4/cpufreq/scaling_governor ;\
echo performance > /sys/devices/system/cpu/cpu5/cpufreq/scaling_governor ;\
echo performance > /sys/devices/system/cpu/cpu6/cpufreq/scaling_governor ;\
echo performance > /sys/devices/system/cpu/cpu7/cpufreq/scaling_governor ;\
echo 1 > /sys/kernel/debug/msm-bus-dbg/shell-client/mas ;\
echo 512 > /sys/kernel/debug/msm-bus-dbg/shell-client/slv ;\
echo 1000000000  > /sys/kernel/debug/msm-bus-dbg/shell-client/ib ;\
echo 1 > /sys/kernel/debug/msm-bus-dbg/shell-client/update_request

cat /sys/kernel/debug/clk/bimc_clk/clk_measure

After these settings, do the usb speed test

2018-05-11 10:59:01,530 INFO Loopback:  total write : 95.8073868141 MBps
2018-05-11 10:59:01,530 INFO Loopback:  total  read : 95.8073868141 MBps
2018-05-11 10:59:32,358 INFO Loopback:  total write : 97.9647575235 MBps
2018-05-11 10:59:32,358 INFO Loopback:  total  read : 97.9647575235 MBps
2018-05-11 11:00:03,184 INFO Loopback:  total write : 95.4331970533 MBps
2018-05-11 11:00:03,186 INFO Loopback:  total  read : 95.4331970533 MBps
2018-05-11 11:00:34,019 INFO Loopback:  total write : 88.9473514704 MBps
2018-05-11 11:00:34,019 INFO Loopback:  total  read : 88.9473514704 MBps
2018-05-11 11:01:05,053 INFO Loopback:  total write : 83.0419871686 MBps
2018-05-11 11:01:05,055 INFO Loopback:  total  read : 83.0419871686 MBps
2018-05-11 11:01:05,655 INFO Loopback: (524288, 191.64807477055675)
2018-05-11 11:01:05,655 INFO Loopback: (262144, 195.96282506311428)
2018-05-11 11:01:05,655 INFO Loopback: (131072, 190.8663941066034)
2018-05-11 11:01:05,657 INFO Loopback: (65536, 177.9280040832467)
2018-05-11 11:01:05,657 INFO Loopback: (32768, 166.1172710440973)



### Prompt-Tuning 和 P-Tuning 的区别 #### 实现方式 Prompt-Tuning 主要通过固定预训练模型参数的方式,在输入端引入可学习的连续向量表示作为提示 (soft prompts),这些提示被嵌入到原始输入序列中[^3]。相比之下,P-Tuning 则进一步扩展了这一思路,不仅使用软提示 (soft prompts),还额外引入了一个基于 LSTM 或 MLP 的编码器模块来优化提示的质量和表达能力[^4]。 #### 参数更新范围 在 Prompt-Tuning 中,仅需调整少量新加入的提示向量参数,而无需修改原生大语言模型中的任何权重[^1]。这种策略显著降低了计算成本并提高了效率。然而对于 P-Tuning 而言,除了上述提到的 soft prompts 外还需要训练其内部所含有的复杂神经网络组件(即LSTM/MLP),因此涉及到了更多的可变参数。 #### 训练难度与资源消耗对比 由于 P-Tuning 需要同时处理更多类型的变量并且依赖于更复杂的架构设计,所以在实际操作过程中可能会面临更高的技术挑战以及更大的硬件需求。与此同时,Prompt-Tuning凭借简单明了的设计理念及其较低的学习曲线成为了一种更为轻便的选择方案之一[^2]。 #### 应用场景分析 当目标领域数据规模较小或者希望快速部署解决方案时,可以优先考虑采用相对简单的 Prompt-Tuning 方法来进行任务定制化改造工作;而对于那些追求极致性能表现且具备充足算力支持条件下的项目,则可能更适合选用功能强大但配置较为繁琐一些的 P-Tuning 技术路线去达成预期成果。 ```python # 示例代码展示如何定义一个基本的 Soft Prompts 结构用于 Prompt Tuning import torch.nn as nn class SimpleSoftPrompts(nn.Module): def __init__(self, num_tokens=10, embedding_dim=768): super(SimpleSoftPrompts, self).__init__() self.soft_prompts = nn.Parameter(torch.randn(num_tokens, embedding_dim)) def forward(self): return self.soft_prompts # 对应地,如果我们要构建一个带有LSTM增强版的Soft Prompts(类似于P-Tuning),则如下所示: import torch class AdvancedSoftPromptsWithLSTM(nn.Module): def __init__(self,...): # 省略部分初始化逻辑... ... ... # 进一步实现细节省略... ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值