- 博客(5)
- 资源 (1)
- 问答 (3)
- 收藏
- 关注
原创 文本预处理
在nlp工程中,文本预处理的流程通常包含以下步骤:获取原始文本、分词、文本清洗、标准化、特征提取、建模等。下面我们会分步骤,分别对每一个步骤的常用方法和常用库进行介绍。中英文在分词上,由于语言的特殊性导致分词的思路也会不一样。大多数情况下,英文直接使用空格就可以进行分词。...
2020-02-14 18:33:58
596
原创 小花不说笑话说闲话之专栏写作计划
写在前面 先小小介绍下自己。一只每天都在“自己真菜、自己为啥这么菜、这么菜以后可如何是好”的想法中挣扎的机器学习菜鸡。菜鸡想挣扎一下,看看用自己脆弱的小翅膀能向前扑愣多远,目前的学习状态太混乱无章了,真的仿佛是一只菜鸡,东啄啄,西叮叮,吃的是什么都不知道。因此我打算开一个专栏,专门记录自己的学习计划、学习笔记。因本人确实是一只菜鸡,所以疏漏之处不能说难免,而是必然会出现,还请各位...
2019-04-26 16:04:21
270
2
原创 基于python的网贷平台Prosper数据分析
1. 项目背景2. 数据准备及预处理2.1 数据预处理缺失值异常值相关性、多变量无用数据删除2.2 探索数据3. 构建预测模型3.1 特征选择3.2 构建模型3.3 模型验证 1. 项目背景及问题定义1.1 项目背景P2P网络借贷来源于p2p小额借贷,P2P小额借贷是一种将非常小额度的资金聚集起来借贷给游资净需求人群的一种商业模式,p2p借贷是指不需要以银行等传统金融机构为中介,借贷双方直接通过...
2018-06-01 16:55:04
9649
6
原创 基于在线学习行为的评价模型的设计与实现
基于在线学习行为的评价模型的设计与实现1.评估模型的需求分析学习评价是学习者在学习过程中非常重要的部分,但因为在线学习和传统学习方式在学习环境、方式上的区别,所以在传统方式中的评价模式不太适用于在线学习。因此,在当代,伴随着计算机技术与互联网技术高速发展的在线学习的发展,构建出一套针对在线学习实际情况对学习行为分析与评价体系非常重要。在线学习分析的评价模型主要是对学生的在线学习行为进行一个分析...
2018-05-24 16:35:06
12230
8
原创 基于python的信用卡评分模型
基于python的信用卡评分模型1. 项目背景介绍1.1 信用风险和评分卡模型的基本概念 信用风险指的是交易对手未能履行约定合同中的义务造成经济损失的风险,即受信人不能履行还本付息的责任而使授信人的预期收益与实际收益发生偏离的可能性,它是金融风险的主要类型。 借贷场景中的评分卡是一种以分数的形式来衡量风险几率的一种手段,也是对未来一段时间内违约、逾期、失联概率的预测。一般来说...
2018-05-24 01:25:32
46017
16
怎么用MFC实现哈希表的建立,插入,删除和查找呢?有没有前辈有源代码可供参考呢?
2015-09-01
关于unixV6++文件系统代码分析
2015-08-28
grails打开8080端口时总是显示Page not found
2015-04-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人