
数据挖掘
ZhuojunChen
这个作者很懒,什么都没留下…
展开
-
C++ 读取csv文件(复制即可用)
C++读取csv文件原创 2022-07-22 14:28:22 · 7099 阅读 · 6 评论 -
pandas输出csv不带自动添加的行和列的序号
在用pandas输出csv时,如果不对第一行和第一列进行定义,pandas会自动用数字序号补齐,但有时候我们只想单纯输出数据,不想要表头或者序号,那么就需要以下的操作:output = pd.DataFrame(data=list1)output.to_csv('save_path', header=None, index=None)将header和index赋值成None即可。...原创 2021-06-07 15:52:40 · 13474 阅读 · 1 评论 -
万能通用版 csv文件导入,多种形式的数字字符串转float(C++)
本文主要实现的是输入文件地址,以字符串的形式读取csv文件中的数据(正数、负数、科学计数法数据混合),在将这多种形式的数据转化成float。vector<vector<vector<float>>> c;vector<vector<float> >a; vector<float>b; inline void file_to_string(vector<string> &record, const stri原创 2021-06-07 15:31:57 · 753 阅读 · 0 评论 -
【数据分析】单个csv文件导入与输出,多个csv文件按顺序批量导入和输出(Python)
csv文件是常见的数据存储格式,经常用它来保存大量的实验数据。为了便于分析,需要将其导入Python中进行进一步的处理,并在处理之后重新输出为csv文件。下面就来介绍利用Python对单个csv文件进行导入与输出操作,以及对多个csv文件按顺序进行批量的导入和输出操作。单个csv文件的导入import pandas as pddata = pd.read_csv(data_path)data_lists = data.values.tolist()这样就可以将csv导入并转化为list的形原创 2021-05-28 10:38:47 · 2120 阅读 · 0 评论 -
【数据分类】利用随机森林的方法进行数据分类
关于随机森林的原理,可以参考这篇博文:随机森林算法及其实现(Random Forest)关于sklearn中随机森林分类器参数和属性和含义(中文版),可以参考这篇博文:sklearn随机森林分类类RandomForestClassifier下面用一个类来实现随机森林:from sklearn.ensemble import RandomForestClassifierclass CipvRandomForest(): def __init__(self): self.c原创 2021-05-21 15:41:28 · 2202 阅读 · 0 评论 -
【神经网络-数据分类】利用深度学习神经网络(DNN)来对数据进行分类
对于数据量大,适合以一维数据作为输入且难以探索数据内部规律的数据集,可以尝试利用深度学习神经网络(DNN)来对数据进行分类。由于是分类问题,使用Adam作为优化器,交叉熵作为损失函数,大概的网络结构代码如下:import torchimport torch.nn as nnimport torch.nn.functional as Ffrom torch.utils.data.dataset import Datasetfrom torch.utils.data import DataLoade原创 2021-05-21 11:30:21 · 4373 阅读 · 1 评论 -
【神经网络-数据分类】利用卷积神经网络(CNN)对数据进行分类
对于数据量大,维度高,且难以找到数据之间内在关系的数据集,可以尝试用卷积神经网络对数据进行分类。 以下为卷积神经网络数据分类的大致结构,采用Adam作为优化器,交叉熵作为损失函数。import torchimport torch.nn as nnfrom torch.utils.data.dataset import Datasetfrom torch.utils.data import DataLoaderclass CipvCNN(nn.Module): def __ini.原创 2021-05-21 10:25:56 · 6690 阅读 · 11 评论