- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 “达观杯”文本智能处理挑战赛-任务五
一、LightGBM模型 1.简介 顾名思义,lightGBM包含两个关键点:light即轻量级,GBM 梯度提升机。 LightGBM 是一个梯度 boosting 框架,使用基于学习算法的决策树。它可以说是分布式的,高效的,有以下优势: 更快的训练效率 低内存使用 更高的准确率 支持并行化学习 可处理大规模数据 2. 特点 概括来说,lightGBM主要有以下特点: 基于Histogram的决...
2019-04-13 22:14:53
191
原创 “达观杯”文本智能处理挑战赛-任务四
一、逻辑回归(LR)模型 1. 逻辑回归(LR)原理 LR模型是在线性回归的基础上,把特征进行线性组合,再把组合的结果通过一层sigmoid函数映射成结果是1或是0的概率。 2. 代码实现 import pickle from sklearn.linear_model.logistic import LogisticRegression from sklearn.model_selection ...
2019-04-11 21:32:20
147
原创 “达观杯”文本智能处理挑战赛-任务二
一、TF-IDF理论 1.百科介绍: TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)。 2.原理 TF 在一份给定的文件里,词频(term frequency, TF)指的是...
2019-04-07 20:56:12
617
第1章 数据库基础知识
2017-09-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人