文章目录 1、场景 2、文章长度特征示例 3、引入文章长度特征(机器学习模型) 3.1、示例语料 3.2、单用分词编码 3.3、单用文章长度 3.4、合体模型 4、深度学习方法 1、场景 现有4种类文章,分别为: 1、护肤品广告 2、护肤医学 3、体育用品广告 4、体育新闻 其中1和2的文字内容很像,3和4的文字内容很像 单用【分词编码+逻辑回归】不能分出 而1234的文章长度如图 对此可引入文章长度特征来优化准度 2、文章长度特征示例 from sklearn.linear_model import LogisticRegression y = [