PAT A1053 Path of Equal Weight (30 分) 树遍历 DFS

本文介绍了一种基于深度优先搜索(DFS)的算法,用于在一棵树形结构中寻找所有从根节点到叶子节点的数据域和等于特定值S的路径,并使用C++实现。该算法将所有满足条件的路径存储在vector容器中,最后使用greater比较器进行降序排序并输出。

    题目大意:给出一棵树,找到所有满足数据域和为S的从根节点到叶子节点的路径,并按降序输出所有的序列。

    dfs方法搜索所有的路径,存储到vector<vector<int>>中,然后用greater<vector<int>>()进行排序输出即可。

AC代码:

#include <vector>
#include <algorithm>
#include <cstdio>
#include <set>

using namespace std;

struct Node
{
    int data;
    vector<int> child;
};

void dfs(int index, int sum, int S, vector<Node> &tree, vector<int> &tmp, vector<vector<int>> &ans)
{
    if(tree[index].child.size() == 0)
    {
        if(sum == S) ans.push_back(tmp);
        return;
    }
    for (int i = 0; i < tree[index].child.size(); ++i)
    {
        int child = tree[index].child[i];
        tmp.push_back(tree[child].data);
        dfs(child, sum + tree[child].data, S, tree, tmp, ans);
        tmp.pop_back();
    }
}

int main()
{
    int N, M, S;
    scanf("%d%d%d", &N, &M, &S);
    vector<Node> tree(N);
    for (int i = 0; i < N; ++i)
        scanf("%d", &tree[i].data);
    for (int i = 0; i < M; ++i)
    {
        int index, childNum;
        scanf("%d%d", &index, &childNum);
        for (int j = 0; j < childNum; ++j)
        {
            int child;
            scanf("%d", &child);
            tree[index].child.push_back(child);
        }
    }
    vector<vector<int>> ans;
    vector<int> tmp;
    tmp.push_back(tree[0].data);
    int sum = tree[0].data;
    dfs(0,sum, S, tree, tmp, ans);
    sort(ans.begin(), ans.end(), greater<vector<int>>());
    for (int i = 0; i < ans.size(); ++i)
    {
        for (int j = 0; j < ans[i].size(); ++j)
        {
            printf("%d", ans[i][j]);
            if(j < ans[i].size() - 1) printf(" ");
            else printf("\n");
        }
    }
    return 0;
}


 

你遇到的错误 `size of weight must equal to number of rows` 是在使用 XGBoost 时出现的一个常见错误,表示你传入的样本权重(`sample_weights`)的长度与训练数据的行数不一致。 --- ## 🧾 错误原因析 XGBoost 的 `DMatrix` 允许你为每个样本配一个权重,这个权重可以用于调整训练过程中样本的重要性。但是: - **权重数组的长度必须等于数据样本的数量** - 如果你传入了错误长度的 `sample_weights`,就会触发 `size of weight must equal to number of rows` 错误 例如: ```python import xgboost as xgb dtrain = xgb.DMatrix(X_train, label=y_train, weight=sample_weights) ``` 如果 `len(sample_weights) != len(X_train)`,就会报错。 --- ## ✅ 解决方案 ### ✅ 1. 确保 `sample_weights` 的长度与数据一致 ```python assert len(sample_weights) == len(X_train), "样本权重长度必须与数据行数一致" ``` ### ✅ 2. 在 `apply_sampling` 中正确处理样本权重 你之前在 `apply_sampling` 函数中使用了 `weighted` 方法,但可能在采样后没有同步更新 `sample_weights`。你需要在采样后保留原始权重或重新计算权重。 ```python def apply_sampling(X, y, method): if method == 'weighted': # 仅计算权重,不改变数据weight_ratio = len(y[y == 0]) / len(y[y == 1]) sample_weights = np.where(y == 1, weight_ratio, 1.0) return X, y, sample_weights elif method == 'smote': sampler = SMOTE(random_state=42) X_res, y_res = sampler.fit_resample(X, y) return X_res, y_res, None else: # raw return X, y, None ``` ### ✅ 3. 构建 DMatrix 时根据是否使用权重判断 ```python def train_and_evaluate(X_train, y_train, X_val, y_val, params, sample_weights=None): dtrain = xgb.DMatrix(X_train, label=y_train) dval = xgb.DMatrix(X_val, label=y_val) if sample_weights is not None: dtrain.set_weight(sample_weights) evals_result = {} model = xgb.train( params, dtrain, num_boost_round=1000, evals=[(dtrain, 'train'), (dval, 'val')], early_stopping_rounds=50, evals_result=evals_result, verbose_eval=False ) return model, evals_result ``` ### ✅ 4. 完整调用示例 ```python X_res, y_res, sample_weights = apply_sampling(X_train, y_train, 'weighted') model, evals_result = train_and_evaluate(X_res, y_res, X_val, y_val, params, sample_weights) ``` --- ## 🧪 示例:加权样本训练 ```python from sklearn.datasets import make_classification import xgboost as xgb # 生成模拟数据 X, y = make_classification(n_samples=1000, n_features=20, n_informative=15, n_redundant=5, weights=[0.98, 0.02], random_state=42) # 计算权重 weight_ratio = len(y[y == 0]) / len(y[y == 1]) sample_weights = np.where(y == 1, weight_ratio, 1.0) # 构建 DMatrix dtrain = xgb.DMatrix(X, label=y) dtrain.set_weight(sample_weights) # 设置样本权重 # 参数 params = { 'objective': 'binary:logistic', 'eval_metric': 'auc', 'eta': 0.1, 'max_depth': 3 } # 训练模型 model = xgb.train(params, dtrain, num_boost_round=100) ``` --- ## 🔍 常见错误场景排查 | 场景 | 问题描述 | 解决方式 | |------|----------|----------| | 采样后未更新权重 | 使用 SMOTE 后,`sample_weights` 仍为原始长度 | 采样后不应再使用原始权重 | | 误将原始权重用于采样后数据 | 如 SMOTE 生成新样本,但权重仍使用旧数据 | 采样后无需设置权重 | | 权重数组缺失或填充错误 | 某些样本未配权重 | 检查 `np.where()` 条件逻辑 | | 权重未正确绑定到 DMatrix | 直接传入 `weight=` 参数 | 使用 `dtrain.set_weight()` | --- ## ✅ 总结 - ✅ 确保 `sample_weights` 长度与当前数据集一致 - ✅ 在采样后不再使用原始权重 - ✅ 使用 `dtrain.set_weight()` 设置样本权重而不是构造时传入 - ✅ 加权方法和采样方法要开处理,避免混淆 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值