字符串按相似度排序

原创已于 2022-04-30 01:16:44 修改 · 706 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#c++ #算法 #qt

于 2022-04-30 01:13:38 首次发布

算法专栏收录该内容

7 篇文章

订阅专栏

这篇博客详细介绍了如何使用动态规划实现计算两个字符串之间的Levenshtein距离，并利用该算法进行字符串排序。通过一个名为`YxObjectLessThan`的比较结构体，将排序逻辑应用于一个数据列表，使得列表中的元素根据其与目标字符串的相似度进行升序排列。这种方法在信息检索和文本处理中有着广泛的应用。

字符串按相似度排序

int calcDistance(const QString& source, const QString& target)
{
    int n = source.length();
    int m = target.length();

    if (m == 0) return n;
    if (n == 0) return m;

    QVector <QVector <int>> matrix(n + 1);
    for (int i = 0; i <= n; i++) matrix[i].resize(m + 1);
    for (int i = 1; i <= n; i++) matrix[i][0] = i;
    for (int i = 1; i <= m; i++) matrix[0][i] = i;

    for (int i = 1; i <= n; i++)
    {
        const QChar si = source.at(i - 1);

        for (int j = 1; j <= m; j++)
        {
            const QChar dj = target.at(j - 1);
            int cost;

            if (si == dj)
                cost = 0;
            else
                cost = 1;

            const int above = matrix[i - 1][j] + 1;
            const int left = matrix[i][j - 1] + 1;
            const int diag = matrix[i - 1][j - 1] + cost;
            matrix[i][j] = std::min(above, std::min(left, diag));
        }
    }

    return matrix[n][m];
}

struct YxObjectLessThan {
    QString target;
    YxObjectLessThan(const QString& target_) {
        target = target_;
    }
    bool operator()(const QVariantMap& a, const QVariantMap& b) const {
        QString na = a.value("yxmc", "").toString();
        QString nb = b.value("yxmc", "").toString();
        int da = calcDistance(na, target);
        int db = calcDistance(nb, target);
        return da < db;
    }
};

//用法
std::sort(m_dataList.begin(), m_dataList.end(), YxObjectLessThan(val));