PAT1 1053 Path of Equal Weight

本文介绍了一种解决特定树形结构问题的算法,通过树的遍历寻找从根节点到叶子节点,其权值和等于给定值的所有路径。算法在输入时将子节点按权值降序排列,确保搜索时能以非递减顺序输出符合要求的路径。

题目链接
我的github

题目大意

给一棵树,求从根节点到叶子节点的权值和是给定的 S S S的路径

输入

每组包含一个测试用例
第一行是 N ≤ 100 N\leq100 N100表示树的节点数, M &lt; N M&lt;N M<N表示非叶子节点数, S &lt; 2 30 S&lt;2^{30} S<230表示所给的和
第二行有 N N N个正数表示每个节点的权值,且权值都小于1000
之后有 M M M行,表示每个非叶子节点的信息,格式为ID K ID[1] ID[2] ... ID[K]ID表示节点的编号,K表示子节点数,之后跟着K个数表示每个子节点的编号,所有编号都是一个两位数字

输出

对每个样例,如果路径不止一条就以非递减的顺序输出路径权值
非递减:序列 A 1 , A 2 . . . A n A_1, A_2...A_n A1,A2...An大于序列 B 1 , B 2 . . . B m B_1, B_2...B_m B1,B2...Bm,当且仅当存在 1 ≤ k &lt; m i n { n , m } 1\leq k&lt;min\{n,m\} 1k<min{n,m}使得 A i = B i A_i=B_i Ai=Bi( i = 1... k i=1...k i=1...k)并且 A k + 1 &gt; B k + 1 A_{k+1}&gt;B_{k+1} Ak+1>Bk+1

样例输入

20 9 24
10 2 4 3 5 10 2 18 9 7 2 2 1 3 12 1 8 6 2 2
00 4 01 02 03 04
02 1 05
04 2 06 07
03 3 11 12 13
06 1 09
07 2 08 10
16 1 15
13 3 14 16 17
17 2 18 19

样例输出

10 5 2 7
10 4 10
10 3 3 6 2
10 3 3 6 2

解析

这题就是树的遍历,从树的根节点遍历到叶子节点,同时计算权值和,在输入的时候将子节点按照权值降序排列,这样在搜索时就会按照要求的顺序输出每条符合题意的路径

# -*- coding: utf-8 -*- 
# @Time : 2019/6/10 11:23 
# @Author : ValarMorghulis 
# @File : 1053.py
class node:
    def __init__(self, weight):
        self.weight = weight
        self.child = list()

    def toString(self):
        return "weight:%d\n" % self.weight + str(self.child)


tree = list()
n, m, s = 0, 0, 0
path = list()


def dfs(root, sum):
    global path
    if sum > s:
        return
    if sum == s:
        if tree[root].child:
            return
        for i in range(len(path)):
            print("%d" % path[i], end=('\n' if i == len(path) - 1 else ' '))
        return
    for i in range(len(tree[root].child)):
        path.append(tree[tree[root].child[i]].weight)
        dfs(tree[root].child[i], sum+tree[tree[root].child[i]].weight)
        path.pop()


def solve():
    global n, m, s, tree, path
    n, m, s = map(int, input().split())
    w = list(map(int, input().split()))
    for i in range(n):
        t = node(w[i])
        tree.append(t)
    for i in range(m):
        line = list(map(int, input().split()))
        id = line[0]
        tree[id].child = line[2:]
        tree[id].child = sorted(tree[id].child, key=lambda x: tree[x].weight, reverse=True)
    path.append(tree[0].weight)
    dfs(0, tree[0].weight)


if __name__ == "__main__":
    solve()

你遇到的错误 `size of weight must equal to number of rows` 是在使用 XGBoost 时出现的一个常见错误,表示你传入的样本权重(`sample_weights`)的长度与训练数据的行数不一致。 --- ## 🧾 错误原因分析 XGBoost 的 `DMatrix` 允许你为每个样本分配一个权重,这个权重可以用于调整训练过程中样本的重要性。但是: - **权重数组的长度必须等于数据样本的数量** - 如果你传入了错误长度的 `sample_weights`,就会触发 `size of weight must equal to number of rows` 错误 例如: ```python import xgboost as xgb dtrain = xgb.DMatrix(X_train, label=y_train, weight=sample_weights) ``` 如果 `len(sample_weights) != len(X_train)`,就会报错。 --- ## ✅ 解决方案 ### ✅ 1. 确保 `sample_weights` 的长度与数据一致 ```python assert len(sample_weights) == len(X_train), "样本权重长度必须与数据行数一致" ``` ### ✅ 2. 在 `apply_sampling` 中正确处理样本权重 你之前在 `apply_sampling` 函数中使用了 `weighted` 方法,但可能在采样后没有同步更新 `sample_weights`。你需要在采样后保留原始权重或重新计算权重。 ```python def apply_sampling(X, y, method): if method == 'weighted': # 仅计算权重,不改变数据分布 weight_ratio = len(y[y == 0]) / len(y[y == 1]) sample_weights = np.where(y == 1, weight_ratio, 1.0) return X, y, sample_weights elif method == 'smote': sampler = SMOTE(random_state=42) X_res, y_res = sampler.fit_resample(X, y) return X_res, y_res, None else: # raw return X, y, None ``` ### ✅ 3. 构建 DMatrix 时根据是否使用权重判断 ```python def train_and_evaluate(X_train, y_train, X_val, y_val, params, sample_weights=None): dtrain = xgb.DMatrix(X_train, label=y_train) dval = xgb.DMatrix(X_val, label=y_val) if sample_weights is not None: dtrain.set_weight(sample_weights) evals_result = {} model = xgb.train( params, dtrain, num_boost_round=1000, evals=[(dtrain, 'train'), (dval, 'val')], early_stopping_rounds=50, evals_result=evals_result, verbose_eval=False ) return model, evals_result ``` ### ✅ 4. 完整调用示例 ```python X_res, y_res, sample_weights = apply_sampling(X_train, y_train, 'weighted') model, evals_result = train_and_evaluate(X_res, y_res, X_val, y_val, params, sample_weights) ``` --- ## 🧪 示例:加权样本训练 ```python from sklearn.datasets import make_classification import xgboost as xgb # 生成模拟数据 X, y = make_classification(n_samples=1000, n_features=20, n_informative=15, n_redundant=5, weights=[0.98, 0.02], random_state=42) # 计算权重 weight_ratio = len(y[y == 0]) / len(y[y == 1]) sample_weights = np.where(y == 1, weight_ratio, 1.0) # 构建 DMatrix dtrain = xgb.DMatrix(X, label=y) dtrain.set_weight(sample_weights) # 设置样本权重 # 参数 params = { 'objective': 'binary:logistic', 'eval_metric': 'auc', 'eta': 0.1, 'max_depth': 3 } # 训练模型 model = xgb.train(params, dtrain, num_boost_round=100) ``` --- ## 🔍 常见错误场景排查 | 场景 | 问题描述 | 解决方式 | |------|----------|----------| | 采样后未更新权重 | 使用 SMOTE 后,`sample_weights` 仍为原始长度 | 采样后不应再使用原始权重 | | 误将原始权重用于采样后数据 | 如 SMOTE 生成新样本,但权重仍使用旧数据 | 采样后无需设置权重 | | 权重数组缺失或填充错误 | 某些样本未分配权重 | 检查 `np.where()` 条件逻辑 | | 权重未正确绑定到 DMatrix | 直接传入 `weight=` 参数 | 使用 `dtrain.set_weight()` | --- ## ✅ 总结 - ✅ 确保 `sample_weights` 长度与当前数据集一致 - ✅ 在采样后不再使用原始权重 - ✅ 使用 `dtrain.set_weight()` 设置样本权重而不是构造时传入 - ✅ 加权方法和采样方法要分开处理,避免混淆 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值