
机器学习项目
文章平均质量分 84
ML
HJZ11
记录学习之路,欢迎交流
展开
-
Kaggle-Digit Recognizer-ML
# 1.导入包import pandas as pdimport numpy as npimport time# 2.忽略警告import warningswarnings.filterwarnings("ignore")from sklearn.neighbors import KNeighborsClassifier# 3.读取数据# C:\Users\hjz\AI\project\02_lianxi\01_DigitRecognizer\0_data\train.csvd原创 2020-07-15 17:05:57 · 208 阅读 · 0 评论 -
手写数字识别-传统机器学习
# 1.导包import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.datasets import load_digitsfrom sklearn.preprocessing import MinMaxScaler, StandardScalerfrom sklearn.model_selection import train_test_splitfrom sklearn.neighb原创 2020-07-02 10:19:53 · 764 阅读 · 0 评论 -
腾讯广告算法大赛2020-广告产品种类单特征-入门级
文章目录1.导入包2.读取文件1.导入包2.读取文件#读取训练集数据df_train = pd.read_csv("./data/train_preliminary/train90w.csv")print(df_train.head())C:\Anaconda3\python.exe D:/hjz-py/Project/08-腾讯广告/train_model.py user_id 1 2 3 4 5 6 7 ... 13 14 15 16 17 18原创 2020-07-15 14:50:18 · 1685 阅读 · 0 评论 -
机器学习项目常用代码-导入包-忽略警告-数据分析-数据清洗-特征工程-模型选择-可视化
文章目录1.导入工具包2.导入训练包2.1忽略警告2.2 不采用科学计数法2.3 设置字体3.读取文件3.1 常用读取文件3.2 读取index和label之间的映射关系4.数据分析与处理4.1 查看数据4.2 分段,分类4.3 时间特征处理5.异常值,缺失值,删除数据5.1 replace5.2 drop5.3 fillna6.特征工程6.1 离散连续处理6.2 相关性,正交矩阵6.3 标准化,归一化7.数据划分8.模型选择8.1 线性回归8.2 随机森林8.3 GBDT8.4 SVM8.5 KNN9.模原创 2020-05-30 12:16:58 · 1562 阅读 · 1 评论 -
机器学习项目-金融反欺诈模型
#coding:utf-8#先读取数据,用pandas 读入表,再进行分析和处理 import pandas as pdimport numpy as np df = pd.read_csv('../data/LoanStats3a.csv', skiprows = 1, low_memory = False)#......................# print(df.info())#大约是145列,对其进行特征处理,凭借经验可以降维操作#删除id 和 member_iddf.d原创 2020-07-27 11:06:27 · 1029 阅读 · 0 评论 -
机器学习项目-音乐系统推荐系统-音乐分类-Pydub-python_speech_featrures MFCC-SVM
1.项目说明#声音处理接口属性:nfft = 2048接口每次处理音乐数据的量#声音文件处理需要安装的包:python_speech_featrures MFCCMFCC分两步,第一做傅里叶变换,第二步再做梅尔倒谱#pydub包,做mp3与wav之间的转换,因为Scipy的wavfile接口只能调用wav格式的文件#第一步,把MP3转换成wav第二步,读入wav格式文件第三步,进行mfcc转换================》矩阵需要有点音乐常识如何计算空间向量相似度:第一,欧里几何距原创 2020-05-28 23:37:03 · 2507 阅读 · 11 评论 -
机器学习项目-垃圾邮件分类-KNN-SVM-DT-RF-GBDT-Bayes
文章目录1.读取文件2.数据预处理3.模型训练预测3.1 KNN3.2 SVM3.3 Decision Tree3.4 Random forest3.5 GBDT3.6 Bayes4.算法模型对比5.总结1.读取文件#-*-coding:utf-8 -*-import os#读取文件索引,把spam ../data/000/000 改为 000/000 1def read_index_file(file_path): type_dict = {"spam": "1", "ham": "原创 2020-05-28 13:35:35 · 4665 阅读 · 5 评论