
机器学习
爱学习的大白菜
网络安全小学生,兴趣为流量分类,自然语言处理。
箴言:What I cannot create, I don't understand.
展开
-
交叉熵计算公式
交叉熵计算公式如下原创 2022-07-17 22:40:52 · 913 阅读 · 0 评论 -
scikit-learn:打印分类报告,求准确率、精确率、召回率、F1值等指标
一、打印分类报告(使用scikit-learn库中的函数)from sklearn.metrics import classification_report# y_test为测试集真实标签, y_pred为测试集预测的标签print(classification_report(y_test, y_pred))例子:# Standard scientific Python importsimport matplotlib.pyplot as plt# Import datasets, cl原创 2021-10-15 21:53:26 · 4619 阅读 · 0 评论 -
划分训练集,验证集,测试集
利用scikit-learn库中提供的train_test_split()函数即可进行划分。import pandas as pddf = pd.read_csv('/kaggle/input/bluebook-for-bulldozers/TrainAndValid.csv', parse_dates=['saledate'], low_memory=False)from sklearn.model_selection import train_test_split# Let's say w原创 2021-10-14 15:02:13 · 972 阅读 · 0 评论 -
画混淆矩阵sklearn
""" 画混淆矩阵,需要(真实标签,预测标签,标签列表) y_test, y_pred, display_labels 混淆矩阵用: sklearn库中的confusion_matrix 混淆矩阵画图用: sklearn库中的ConfusionMatrixDisplay matplotlib库中的pyplot 这里用iris数据集做例子,SVM做分类器。"""import matplotlib.pyplot原创 2021-10-14 11:05:36 · 14242 阅读 · 1 评论 -
机器学习中,跑实验常用到的一些API【自用,更新ing】
sklearn库中1.混淆矩阵:https://scikit-learn.org/stable/auto_examples/model_selection/plot_confusion_matrix.html#sphx-glr-auto-examples-model-selection-plot-confusion-matrix-pyhttps://scikit-learn.org/stable/modules/model_evaluation.html#confusion-matrix2. 分原创 2021-10-13 21:01:35 · 162 阅读 · 0 评论 -
利用t-SNE可视化Glove向量
一、GloVe词向量简介GloVe:全称Global Vectors for Word Representations。其文献[2]是2014年在EMNLP会议上提出来的。其结合了词向量与矩阵分解的思想对原始语料进行预训练,得到了低维、连续、稀疏的表示形式。对预训练后的词向量进行可视化可以发现发现某些词与词之间的联系。(附:2种常用于估计词向量的方法,1是基于神经网络的语言模型和word2vec的词向量预训练方法,其本质都是利用文本中词与词在局部上下文中的共现信息作为自监督学习信号。2.基于矩阵分解原创 2021-10-02 00:22:27 · 1328 阅读 · 0 评论 -
利用t-SNE对mnist数据集可视化
我把所有的过程全写入下面的代码注释中了。主要流程有:将mnist数据集的64维转化为2维矩阵向量。(利用scikit-learn库中的TSNE库)将转化好的矩阵输出到二维空间中即可。参考了官方的代码:scikit-learn/t-SNE得到的结果如下图所示:图1 选择Mnist数据集前100张图片 图2 用t-SNE可视化Mnist数据集前6种类 大约花了49s的时间,通过可视化发现每个样本降维后相同的类基本可以聚到一起。代码如下:# 1.引入数据库,取6种类。原创 2021-10-01 22:51:53 · 3355 阅读 · 1 评论 -
【吴恩达机器学习】【实验二:Logistic Regression】
1.visuallizing the data.可视化数据。(在plotData.m中填写)其中有一个文件叫ex2data1.txt存放了100行3列,每一行的三个数据分别是,第一门成绩,第二门成绩,是否录取(录取设为1,未录取设为0)。于是我们输入代码来对这些数据可视化以便有个大致的认识,% Find Indices of Positive and Negative Example...原创 2019-10-27 16:29:01 · 1073 阅读 · 0 评论 -
【机器学习】吴恩达机器学习作业无法提交
在我提交吴恩达的ML作业的时候,出现了以下错误代码:[error] submission with curl() was not successful!! Submission failed: 错误使用 submitWithConfiguration>validateResponse (line 158)Grader sent no responseFunction: va...原创 2019-08-29 08:41:26 · 2609 阅读 · 1 评论