并行计算与特征选择:提升机器学习效率的关键
1. 并行计算概述
并行算法能通过整合多个进程的输出来更快得到最终答案,但并非适用于所有问题。若两个任务需按特定顺序执行,则无法进行并行化处理。
1.1 测量执行时间
为衡量不同方法节省的时间,可使用 system.time() 函数。例如:
system.time(mean(vitalsigns$Pulse))
输出结果如下:
## user system elapsed
## 0 0 0
这表明计算 vitalsigns 数据集中 Pulse 列的均值耗时少于 0.001 秒。这些值会因计算机、操作系统和操作状态的不同而有所差异。
1.2 多核并行处理
可使用 multicore 和 snow 两个包进行并行计算,它们的核心组件包含在 parallel 包中。运行这些包需相对现代的多核计算机,可使用 parallel::detectCores() 函数检查计算机的核心数量:
library(parallel); detectCores()
输出结果
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



