贪心算法实战：集合覆盖问题解析与Kotlin实现-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00645/article/details/148392943

贪心算法实战：集合覆盖问题解析与Kotlin实现

grokking_algorithms Code for the book Grokking Algorithms (https://amzn.to/29rVyHf) 项目地址: https://gitcode.com/gh_mirrors/gr/grokking_algorithms

算法背景与问题定义

集合覆盖问题(Set Covering Problem)是计算机科学中一个经典的优化问题，属于NP难问题。该问题的核心是：给定一个全集和若干子集，找出数量最少的子集，使这些子集的并集等于全集。

在实际应用中，集合覆盖问题有着广泛的应用场景，例如：

广播电台信号覆盖问题
物流配送中心选址
课程安排优化
网络节点部署

问题实例分析

我们来看一个具体的例子：假设有若干个广播电台，每个电台可以覆盖若干个州。我们的目标是选择最少数量的电台，确保所有的州都能被覆盖。

代码中定义了两个关键数据结构：

statesNeeded：需要覆盖的所有州的集合
stations：各个电台及其覆盖州的映射关系

贪心算法解决方案

贪心算法是一种在每一步选择中都采取当前状态下最优的选择，从而希望导致结果是全局最优的算法。对于集合覆盖问题，贪心算法的策略是：

选择覆盖最多未覆盖州的电台
将该电台加入解决方案
从需要覆盖的州集合中移除已被覆盖的州
重复上述步骤直到所有州都被覆盖

Kotlin实现详解

让我们深入分析代码实现的关键部分：

var statesNeeded = setOf("mt", "wa", "or", "id", "nv", "ut", "ca", "az")
val stations = mapOf(
    "kone" to setOf("id", "nv", "ut"),
    "ktwo" to setOf("wa", "id", "mt"),
    "kthree" to setOf("or", "nv", "ca"),
    "kfour" to setOf("nv", "ut"),
    "kfive" to setOf("ca", "az")
)

这部分定义了问题的初始状态：8个需要覆盖的州和5个电台及其覆盖范围。

主算法实现：

fun main() {
    val finalStations = mutableSetOf<String>()  // 存储最终选择的电台
    while (statesNeeded.isNotEmpty()) {  // 当还有州未被覆盖时继续循环
        var bestStation: String? = null  // 当前最优电台
        var statesCovered = setOf<String>()  // 当前最优电台覆盖的州
        
        // 遍历所有电台，寻找覆盖最多未覆盖州的电台
        stations.forEach { (station, states) ->
            val covered = statesNeeded.intersect(states)
            if (covered.size > statesCovered.size) {
                bestStation = station
                statesCovered = covered
            }
        }
        
        // 更新需要覆盖的州集合
        statesNeeded = statesNeeded - statesCovered
        // 将最优电台加入最终解决方案
        bestStation?.let { finalStations.add(it) }
    }
    println(finalStations)
}

算法执行过程分析

让我们跟踪算法的执行过程：

初始状态：需要覆盖所有8个州
第一轮迭代：
- kone覆盖3个州(id,nv,ut)
- ktwo覆盖3个州(wa,id,mt)
- kthree覆盖3个州(or,nv,ca)
- kfour覆盖2个州(nv,ut)
- kfive覆盖2个州(ca,az)
- 选择kone、ktwo或kthree中的任意一个（都覆盖3个州）
- 假设选择kone，剩余需要覆盖的州：wa,or,mt,ca,az
第二轮迭代：
- ktwo覆盖2个未覆盖州(wa,mt)
- kthree覆盖2个未覆盖州(or,ca)
- kfive覆盖1个未覆盖州(ca,az)
- 选择ktwo或kthree
- 假设选择ktwo，剩余需要覆盖的州：or,ca,az
第三轮迭代：
- kthree覆盖2个未覆盖州(or,ca)
- kfive覆盖1个未覆盖州(ca,az)
- 选择kthree，剩余需要覆盖的州：az
第四轮迭代：
- 只有kfive覆盖az
- 选择kfive