CF724F Uniformly Branched Trees

本文探讨了无根树的统计问题,提出通过重心位置判断树的不同构性,并运用DP算法解决CF724F Uniformly Branched Trees题目。关键在于避免重复计算,通过枚举子树大小进行状态转移。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

CF724F Uniformly Branched Trees 

有根树可以统计。无根树难以统计。因为可以换根。

所以不让换根:只要两个无根树在重心位置不同构,就一定不同构

每个本质不同的树在重心位置统计上。

f[i][j][k]i个点根节点度数j,最大子树不超过k。枚举k大小的子树个数转移。

重心两个?

特殊考虑。两端f[n/2][d-1][n/2-1]=x,x*(x-1)/2+x

边界考虑到。

#include<bits/stdc++.h>
#define reg register int
#define il inline
#define numb (ch^'0')
using namespace std;
typedef long long ll;
il void rd(int &x){
    char ch;x=0;bool fl=false;
    while(!isdigit(ch=getchar()))(ch=='-')&&(fl=true);
    for(x=numb;isdigit(ch=getchar());x=x*10+numb);
    (fl==true)&&(x=-x);
}
namespace Miracle{
const int N=1005;
int mod,n,d;
int f[N][11][N];
int jie[11],inv[11];
int qm(int x,int y){
    int ret=1;while(y){
        if(y&1) ret=(ll)ret*x%mod;x=(ll)x*x%mod;y>>=1;
    }return ret;
}
int dp(int i,int j,int k){
    //cout<<" dp "<<i<<" "<<j<<" "<<k<<endl;
    if(f[i][j][k]!=-1) return f[i][j][k];
    if(i==1) {
         if(j==d-1||!j) return f[i][j][k]=1;
         return f[i][j][k]=0;
    }
    if(i==0){
        if(k==0&&j==0) return f[i][j][k]=1;
        else return f[i][j][k]=0;
    }
    if(j>i-1) return f[i][j][k]=0;
    if(i>1&&k==0) return f[i][j][k]=0;
    
    int C=1;
    int ret=0;
    int tmp=dp(k,d-1,k-1);
   // cout<<" tmp "<<tmp<<" i j k "<<i<<" "<<j<<" "<<k<<endl;
    for(reg m=0;m<=j&&m*k<=i-1;++m){
        ret=(ret+(ll)dp(i-m*k,j-m,k-1)*C%mod*inv[m]%mod)%mod;
        C=(ll)C*(tmp-1+m+1)%mod;
    }
    //cout<<" ret "<<ret<<endl;
    return f[i][j][k]=ret;
}
int main(){
    rd(n);rd(d);rd(mod);
    if(n<=2){
        puts("1");return 0;
    }
    memset(f,-1,sizeof f);
    jie[0]=1;
    for(reg i=1;i<=10;++i) jie[i]=(ll)jie[i-1]*i%mod;
    inv[10]=qm(jie[10],mod-2);
    for(reg i=9;i>=0;--i) inv[i]=(ll)inv[i+1]*(i+1)%mod;
    ll ans=0;
    ans=(ans+dp(n,d,(n-1)/2));
   // cout<<"ans1 ------"<<ans<<endl;
    if(n%2==0){
        ll tmp=0;
        tmp=dp(n/2,d-1,n/2-1);
        ans=(ans+(tmp*(tmp+1)/2%mod))%mod;
    }
    printf("%I64d",ans);
    return 0;
}

}
signed main(){
    Miracle::main();
    return 0;
}

/*
   Author: *Miracle*
   Date: 2019/3/3 18:21:10
*/

在某个位置为代表统计所有情况,

既可以不重不漏,还可以有的放矢

转载于:https://www.cnblogs.com/Miracevin/p/10483570.html

<think>我们面对的问题:在使用某些Encoder(比如OneHotEncoder或LabelEncoder)时,出现错误:TypeError:Encodersrequiretheirinputtobeuniformlystringsornumbers.Got['int','str']或者类似地,混合类型错误,例如['NAType','str']。原因分析:许多sklearn中的编码器要求输入的数据列必须是单一类型(全部为字符串或全部为数值)。如果一列中同时包含字符串和数值(或者包含NaN等特殊类型),就会导致类型不一致的错误。解决方案:将目标列统一转换为字符串类型(str)可以解决此问题。这样,无论是数值、字符串还是NaN(在转换为字符串后会变成'nan'或'NaN')都会变成字符串类型。具体步骤:1.确定需要转换的列:通常是分类特征(categoricalfeatures)所在的列。2.将这些列转换为字符串类型:使用`astype(str)`方法。示例代码:```python#假设df是你的DataFrame,sparse_cols是需要转换的列名列表sparse_cols=['col1','col2','col3']#请替换为实际的列名#将这些列转换为字符串类型df[sparse_cols]=df[sparse_cols].astype(str)#然后使用编码器fromsklearn.preprocessingimportOneHotEncoderencoder=OneHotEncoder()encoder.fit(df[sparse_cols])```注意事项:1.**缺失值处理**:在转换前,如果列中有缺失值(NaN),转换为字符串后会变成字符串'nan'。这可能会被编码器视为一个单独的类别。如果你不希望这样,可以在转换前填充缺失值(例如用空字符串''或特定标记如'Missing')。2.**数值转换**:将数值转换为字符串可能会改变数值的原始含义(比如1和1.0都会变成字符串'1',但1.1会变成'1.1')。如果这些数值实际上代表类别(如ID),则没有问题;但如果代表连续数值,则不应该用分类编码(应该用标准化或分桶)。针对你提到的错误信息中包含的['NAType','str'],这通常表示列中同时存在NaN(在pandas中表示为`pd.NA`或`NaN`)和字符串。通过`astype(str)`可以将NaN转为字符串'nan',从而统一类型。另外,如果某些列已经是字符串类型,而其他列是混合类型,那么转换整个DataFrame中需要编码的列是安全的。更健壮的代码:```python#确保所有要编码的列都是字符串类型forcolinsparse_cols:#检查列中是否有NaN,如果有,可以选择填充,这里我们选择转换为字符串df[col]=df[col].astype(str)```如果问题仍然存在,可以检查转换后的列是否确实都是字符串类型:```pythonprint(df[sparse_cols].dtypes)```这样,编码器在fit时就不会再报类型不统一的错误了。引用参考:在引用[1]中提到了类似的问题,即通过将列转换为字符串类型来解决编码器的类型错误[^1]。§§相关问题§§1.在Pandas中如何检查DataFrame各列的数据类型?2.如何用scikit-learn的OneHotEncoder处理包含缺失值的分类特征?3.除了转换为字符串,还有其他方法处理混合类型数据吗?4.在机器学习中,处理分类特征有哪些常用方法?</think>### 解决 Encoders 输入类型不一致错误:混合类型(NaT/str)问题 当使用 Scikit-learn 的编码器(如 `OneHotEncoder`, `LabelEncoder`)处理 Pandas DataFrame 时,如果列中包含混合数据类型(如 NaT/NaN 与字符串混合),会遇到以下错误: ```python TypeError: Encoders require their input to be uniformly strings or numbers. Got ['NaTType', 'str'] # 或 ['int', 'str'] 等其他混合类型 ``` #### 解决方案步骤: 1. **统一转换为字符串类型**(推荐方法) ```python # 将目标列统一转为字符串类型 df[target_columns] = df[target_columns].astype(str) # 现在可以安全使用编码器 from sklearn.preprocessing import OneHotEncoder encoder = OneHotEncoder() encoder.fit(df[target_columns]) ``` - ✅ **优点**:简单高效,兼容所有编码器 - ⚠️ **注意**:`NaN/NaT` 会转为字符串 `'nan'/'nat'`,会被视为独立类别 2. **处理缺失值后转换** ```python # 先用特定值填充缺失值 df[target_columns] = df[target_columns].fillna("MISSING") # 再转换为统一类型 df[target_columns] = df[target_columns].astype(str) ``` 3. **分类型处理数值和字符串** ```python # 分离数值型和字符串型数据 num_cols = df[target_columns].select_dtypes(include=['number']).columns str_cols = df[target_columns].select_dtypes(include=['object']).columns # 分别处理 encoder.fit(pd.concat([ df[num_cols].astype(float), # 数值转浮点 df[str_cols].astype(str) # 字符串保持 ], axis=1)) ``` #### 关键注意事项: 1. **数据类型检查**:执行转换前先用 `df.dtypes` 检查列数据类型 2. **缺失值处理**: - `astype(str)` 会将 `NaN/NaT` 转为 `'nan'/'nat'` - 使用 `fillna()` 可控制缺失值的表示方式 3. **编码器兼容性**: ```python # 新版本OneHotEncoder可直接处理混合类型 encoder = OneHotEncoder(handle_unknown='ignore', dtype=np.float32) ``` 4. **管道集成**:在生产环境中建议使用 Pipeline ```python from sklearn.compose import ColumnTransformer from sklearn.pipeline import Pipeline preprocessor = ColumnTransformer( transformers=[ ('cat', OneHotEncoder(), target_columns) ], remainder='passthrough' ) pipe = Pipeline(steps=[ ('preprocessor', preprocessor), ('classifier', RandomForestClassifier()) ]) ``` #### 错误原因分析: - 编码器要求单列数据必须为**统一数据类型**(全字符串或全数值) - 混合类型常见场景: - 列中同时存在日期时间(`datetime`)和字符串 - 数值列中包含字符串类型的占位符(如 `"N/A"`) - 读取 CSV 时自动类型推断失败 > 通过统一转换为字符串类型,可确保编码器接收一致的数据类型输入,解决 `TypeError` 问题[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值