一、经典算法
1、K-NN最近邻
2、线性回归
3、逻辑回归
4、凸优化
5、朴素贝叶斯
6、支持向量机
7、决策树
8、随机森林
9、GBDT
10、XGBoost、catboost、lightGBM
11、矩阵分解
12、K-Means
13、GMM
14、LDA主题模型
15、EM
16、PCA
二、学习内容
1)算法的基本原理
2)项目应用细节
3)原理基础优化
4)新模型优化调试
5)完整项目调试
三、项目学习
1、图像识别系统搭建
具体内容:利用knn算法实现图像识别算法引擎学会如何表示图像和训练及优化KNN模型
2、基于主题(LDA)下的吧情感分析系统
具体内容:分词、文本表示、信息定位、抽取、平滑技术、调参及特征选择。
3、消费金融风控引引擎
利用集成学习技术完成评分卡模型、数据去噪、特征工程、算法评估
4、基于用户行为的个性化营销系统
行为数据分层、用户分层、社区网络模型生成。
5、搭建广告点击率预测系统
实现CTR预测、海量信息数据的特征提取和选择、逻辑回归预测、F1指标评分
6、集成学习模型的股票预测
量化模型构建、随机森林调试和Sharp、Ratio的评分系统
7、门户网站的新闻推荐系统
2C互联网新闻推荐、新闻标签抽取、搜索引擎技术倒序表、推荐排序、A/B测试优化算法。
8、聊天机器人意识引擎
智能客服、NLU及意图识别、SVM意图识别、文本特征工程。
三、工程开发实践
回归分析身高预测
利用KNN筛选简历
二手车价格预估
量化投资之股票价格预测
预测广告点击率
利用L1正则模拟神经科学中的稀疏性
垃圾邮件分类
员工离职率预测
基于随机森林的疾病分析
利用GBDT解决搜索中的排序问题
人脸识别
基于聚类的消费群分类
内容推荐算法的电影推荐引擎
基于协同过滤算法的音乐推荐引擎
搭建OCR识别引擎
利用聚类算法压缩图片
基于主题模型和SVM的文本分类
问答系统搭建
利用kemel SVM识别医疗图片
利用聚类算法压缩图片
从零搭建方向传播算法