PAT 1053 Path of Equal Weight dfs

这道题和 1018 Public Bike Management(题解)解题思路上是一样的。
    使用dfs从根结点开始搜索,使用temppath记录路径,如果之前经过的结点的权值总和加上当前访问的结点的权值之和恰好等于目标权值并且当前结点为叶节点,则将temppath记录下来( paths.push_back(temppath) ),最后对paths进行排序,注意排序函数的书写,严格按照题目中给的排序规则写。
    本题的主要难点就在于路径的记录,具体实现见代码,注意push_back,pop_back的使用。

代码:

#include <bits/stdc++.h>
using namespace std;

typedef long long ll;

int N,M,T,k,node,temp;
int weight[105];
vector<int> G[105];
vector<vector<int> > paths;
vector<int> temppath;

bool cmp(vector<int>& v1,vector<int>& v2)
{
	int len = min(v1.size(),v2.size());
	for(int i = 0;i < len; i++)
	{
		if(v1[i] > v2[i]) 	
			return true;
		else if(v1[i] < v2[i])
			return false;
	}
	return false;
}

void dfs(int id,int curr_weight)
{
	temppath.push_back(weight[id]);
	
	if(curr_weight + weight[id] == T && G[id].size() == 0)  // 权值和恰好等于T,且为叶节点 
		paths.push_back(temppath);
	else if(curr_weight + weight[id] < T)
	{
		for(int i = 0;i < G[id].size(); i++)
			dfs(G[id][i],curr_weight + weight[id]);
	}
	temppath.pop_back();
}


int main(int argc, char const *argv[])
{
	cin >> N >> M >> T;
	
	for(int i = 0;i < N; i++)
		cin >> weight[i];
	
	for(int i = 0;i < M; i++)
	{
		cin >> node >> k;
		for(int j = 0;j < k; j++)
		{
			cin >> temp;
			G[node].push_back(temp);
		}
	}
	
	dfs(0,0);
	
	sort(paths.begin(),paths.end(),cmp);
	
	for(int i = 0;i < paths.size(); i++)
	{
		for(int j = 0;j < paths[i].size(); j++)
		{
			cout << paths[i][j] ;
			if(j != paths[i].size()-1)
				cout << " ";
		}
		cout << endl;
	}
	
	
	return 0;
}


你遇到的错误 `size of weight must equal to number of rows` 是在使用 XGBoost 时出现的一个常见错误,表示你传入的样本权重(`sample_weights`)的长度与训练数据的行数不一致。 --- ## 🧾 错误原因分析 XGBoost 的 `DMatrix` 允许你为每个样本分配一个权重,这个权重可以用于调整训练过程中样本的重要性。但是: - **权重数组的长度必须等于数据样本的数量** - 如果你传入了错误长度的 `sample_weights`,就会触发 `size of weight must equal to number of rows` 错误 例如: ```python import xgboost as xgb dtrain = xgb.DMatrix(X_train, label=y_train, weight=sample_weights) ``` 如果 `len(sample_weights) != len(X_train)`,就会报错。 --- ## ✅ 解决方案 ### ✅ 1. 确保 `sample_weights` 的长度与数据一致 ```python assert len(sample_weights) == len(X_train), "样本权重长度必须与数据行数一致" ``` ### ✅ 2. 在 `apply_sampling` 中正确处理样本权重 你之前在 `apply_sampling` 函数中使用了 `weighted` 方法,但可能在采样后没有同步更新 `sample_weights`。你需要在采样后保留原始权重或重新计算权重。 ```python def apply_sampling(X, y, method): if method == 'weighted': # 仅计算权重,不改变数据分布 weight_ratio = len(y[y == 0]) / len(y[y == 1]) sample_weights = np.where(y == 1, weight_ratio, 1.0) return X, y, sample_weights elif method == 'smote': sampler = SMOTE(random_state=42) X_res, y_res = sampler.fit_resample(X, y) return X_res, y_res, None else: # raw return X, y, None ``` ### ✅ 3. 构建 DMatrix 时根据是否使用权重判断 ```python def train_and_evaluate(X_train, y_train, X_val, y_val, params, sample_weights=None): dtrain = xgb.DMatrix(X_train, label=y_train) dval = xgb.DMatrix(X_val, label=y_val) if sample_weights is not None: dtrain.set_weight(sample_weights) evals_result = {} model = xgb.train( params, dtrain, num_boost_round=1000, evals=[(dtrain, 'train'), (dval, 'val')], early_stopping_rounds=50, evals_result=evals_result, verbose_eval=False ) return model, evals_result ``` ### ✅ 4. 完整调用示例 ```python X_res, y_res, sample_weights = apply_sampling(X_train, y_train, 'weighted') model, evals_result = train_and_evaluate(X_res, y_res, X_val, y_val, params, sample_weights) ``` --- ## 🧪 示例:加权样本训练 ```python from sklearn.datasets import make_classification import xgboost as xgb # 生成模拟数据 X, y = make_classification(n_samples=1000, n_features=20, n_informative=15, n_redundant=5, weights=[0.98, 0.02], random_state=42) # 计算权重 weight_ratio = len(y[y == 0]) / len(y[y == 1]) sample_weights = np.where(y == 1, weight_ratio, 1.0) # 构建 DMatrix dtrain = xgb.DMatrix(X, label=y) dtrain.set_weight(sample_weights) # 设置样本权重 # 参数 params = { 'objective': 'binary:logistic', 'eval_metric': 'auc', 'eta': 0.1, 'max_depth': 3 } # 训练模型 model = xgb.train(params, dtrain, num_boost_round=100) ``` --- ## 🔍 常见错误场景排查 | 场景 | 问题描述 | 解决方式 | |------|----------|----------| | 采样后未更新权重 | 使用 SMOTE 后,`sample_weights` 仍为原始长度 | 采样后不应再使用原始权重 | | 误将原始权重用于采样后数据 | 如 SMOTE 生成新样本,但权重仍使用旧数据 | 采样后无需设置权重 | | 权重数组缺失或填充错误 | 某些样本未分配权重 | 检查 `np.where()` 条件逻辑 | | 权重未正确绑定到 DMatrix | 直接传入 `weight=` 参数 | 使用 `dtrain.set_weight()` | --- ## ✅ 总结 - ✅ 确保 `sample_weights` 长度与当前数据集一致 - ✅ 在采样后不再使用原始权重 - ✅ 使用 `dtrain.set_weight()` 设置样本权重而不是构造时传入 - ✅ 加权方法和采样方法要分开处理,避免混淆 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值