PAT 1053 Path of Equal Weight

题目地址
在这里插入图片描述

# include<stdio.h>
# include<cstdio>
# include<cstring>
# include<vector>
# include<algorithm>
using namespace std;

struct node {
	int weight;
	vector<int>child;
}node[110];
int n, m, s;
vector<vector<int>> res;
vector<int>path;
bool cmp(int a, int b) {
	return node[a].weight > node[b].weight;
}

void dfs(int index,int num,int sum) {
	if (sum > s) return;
	if (sum == s) {
		if (node[index].child.size() != 0) return;
		res.push_back(path);
		return;
	}
	for (int i = 0; i < node[index].child.size(); i++) {
		int child = node[index].child[i];
		path.push_back(node[child].weight);
		dfs(child, num + 1, sum + node[child].weight);
		path.pop_back();
	}
}


int main() {
	scanf("%d%d%d", &n, &m, &s);
	for (int i = 0; i < n; i++) {
		scanf("%d", &node[i].weight);
	}
	int id, k, child;
	for (int j = 0; j < m; j++) {
		scanf("%d%d", &id, &k);
		for (int i = 0; i < k; i++) {
			scanf("%d", &child);
			node[id].child.push_back(child);
		}
		sort(node[id].child.begin(), node[id].child.end(), cmp);
	}
	path.push_back(node[0].weight);
	dfs(0, 1, node[0].weight);
	sort(res.begin(), res.end());
	reverse(res.begin(), res.end());
	for (int i = 0; i < res.size(); i++) {
		for (int j = 0; j < res[i].size(); j++) {
			printf("%d", res[i][j]);
			if (j < res[i].size() - 1) printf(" ");
		}
		if (i < res.size() - 1) printf("\n");
	}
	return 0;
}

算法笔记有坑
这位博主写了
https://blog.youkuaiyun.com/zxc0074869/article/details/122786262

你遇到的错误 `size of weight must equal to number of rows` 是在使用 XGBoost 时出现的一个常见错误,表示你传入的样本权重(`sample_weights`)的长度与训练数据的行数不一致。 --- ## 🧾 错误原因分析 XGBoost 的 `DMatrix` 允许你为每个样本分配一个权重,这个权重可以用于调整训练过程中样本的重要性。但是: - **权重数组的长度必须等于数据样本的数量** - 如果你传入了错误长度的 `sample_weights`,就会触发 `size of weight must equal to number of rows` 错误 例如: ```python import xgboost as xgb dtrain = xgb.DMatrix(X_train, label=y_train, weight=sample_weights) ``` 如果 `len(sample_weights) != len(X_train)`,就会报错。 --- ## ✅ 解决方案 ### ✅ 1. 确保 `sample_weights` 的长度与数据一致 ```python assert len(sample_weights) == len(X_train), "样本权重长度必须与数据行数一致" ``` ### ✅ 2. 在 `apply_sampling` 中正确处理样本权重 你之前在 `apply_sampling` 函数中使用了 `weighted` 方法,但可能在采样后没有同步更新 `sample_weights`。你需要在采样后保留原始权重或重新计算权重。 ```python def apply_sampling(X, y, method): if method == 'weighted': # 仅计算权重,不改变数据分布 weight_ratio = len(y[y == 0]) / len(y[y == 1]) sample_weights = np.where(y == 1, weight_ratio, 1.0) return X, y, sample_weights elif method == 'smote': sampler = SMOTE(random_state=42) X_res, y_res = sampler.fit_resample(X, y) return X_res, y_res, None else: # raw return X, y, None ``` ### ✅ 3. 构建 DMatrix 时根据是否使用权重判断 ```python def train_and_evaluate(X_train, y_train, X_val, y_val, params, sample_weights=None): dtrain = xgb.DMatrix(X_train, label=y_train) dval = xgb.DMatrix(X_val, label=y_val) if sample_weights is not None: dtrain.set_weight(sample_weights) evals_result = {} model = xgb.train( params, dtrain, num_boost_round=1000, evals=[(dtrain, 'train'), (dval, 'val')], early_stopping_rounds=50, evals_result=evals_result, verbose_eval=False ) return model, evals_result ``` ### ✅ 4. 完整调用示例 ```python X_res, y_res, sample_weights = apply_sampling(X_train, y_train, 'weighted') model, evals_result = train_and_evaluate(X_res, y_res, X_val, y_val, params, sample_weights) ``` --- ## 🧪 示例:加权样本训练 ```python from sklearn.datasets import make_classification import xgboost as xgb # 生成模拟数据 X, y = make_classification(n_samples=1000, n_features=20, n_informative=15, n_redundant=5, weights=[0.98, 0.02], random_state=42) # 计算权重 weight_ratio = len(y[y == 0]) / len(y[y == 1]) sample_weights = np.where(y == 1, weight_ratio, 1.0) # 构建 DMatrix dtrain = xgb.DMatrix(X, label=y) dtrain.set_weight(sample_weights) # 设置样本权重 # 参数 params = { 'objective': 'binary:logistic', 'eval_metric': 'auc', 'eta': 0.1, 'max_depth': 3 } # 训练模型 model = xgb.train(params, dtrain, num_boost_round=100) ``` --- ## 🔍 常见错误场景排查 | 场景 | 问题描述 | 解决方式 | |------|----------|----------| | 采样后未更新权重 | 使用 SMOTE 后,`sample_weights` 仍为原始长度 | 采样后不应再使用原始权重 | | 误将原始权重用于采样后数据 | 如 SMOTE 生成新样本,但权重仍使用旧数据 | 采样后无需设置权重 | | 权重数组缺失或填充错误 | 某些样本未分配权重 | 检查 `np.where()` 条件逻辑 | | 权重未正确绑定到 DMatrix | 直接传入 `weight=` 参数 | 使用 `dtrain.set_weight()` | --- ## ✅ 总结 - ✅ 确保 `sample_weights` 长度与当前数据集一致 - ✅ 在采样后不再使用原始权重 - ✅ 使用 `dtrain.set_weight()` 设置样本权重而不是构造时传入 - ✅ 加权方法和采样方法要分开处理,避免混淆 ---
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一——一

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值