
机器学习
文章平均质量分 88
歌者And贰向箔
迷茫的人儿
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
WHISTLE特征提取
WHISTLE特征提取论文:发表期刊:Nucleic Acids Research(JCR-Q1,11.5)位点预测任务传统的特征:Sequence-derived featureWHISTLE中加入的新的特征: Genome-derived featuresWHISTLE集成35个Genome-derived features与传统Sequence-derived feature,重建了m6A表转录组的高精度地图Genome-derived features:基于序列特征本原创 2021-03-10 21:14:18 · 474 阅读 · 0 评论 -
记录这段时间Python学习时常用的一些代码2
对行列的索引X = iris_1['data'][:,[0,2]]取iris_1中data的未知行数,第1第3列 2.为数据增加列名X=pd.DataFrame(X)Y=pd.DataFrame(Y)X.columns=["Sepal length","petal length"]Y.columns=["target"]在增加列名时一般使用columns函数,因此需要把数据转换为Dataframe 3.loc()函数取某几列的值train_data1 ...原创 2020-09-02 12:45:16 · 562 阅读 · 0 评论 -
泰坦尼克问题数据分析
import matplotlib.pyplot as pltimport pandas as pdplt.rcParams['font.sans-serif'] = ['KaiTi']##注意地址的格式\\train_path = "D:\\Spyder\\exercise\\data\\titanic\\train.csv"test_path = "D:\\Spyder\\exercise\\data\\titanic\\test.csv"train_data = pd.read_csv(.原创 2020-09-01 21:24:57 · 211 阅读 · 0 评论 -
使用Sklearn实现K-means
import matplotlib.pyplot as pltfrom sklearn import datasetsfrom sklearn.cluster import KMeansiris = datasets.load_iris() X = iris.data[:, :4] # #表示我们取特征空间中的4个维度print(X.shape) # 绘制数据分布图#plt.figure(figsize=(15,8),dpi=80)plt.scatter(X[:, 0], X[:, 1].原创 2020-09-01 21:22:24 · 527 阅读 · 0 评论 -
Logistic Regression实现iris分类
import matplotlib.pyplot as pltimport pandas as pdfrom sklearn.datasets import load_irisfrom sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_scoreiris_1 = load_iris()#print(dir(iris_1))#查看数据的属性['DESCR', 'data', '.原创 2020-09-01 21:20:35 · 943 阅读 · 1 评论 -
神经网络实现波士顿房价预测
神经网络实现波士顿房价预测import numpy as npimport matplotlib.pyplot as pltdef load_data(): # 从文件导入数据 datafile = 'housing.data' data = np.fromfile(datafile, sep=' ') # 每条数据包括14项,其中前面13项是影响因素,第14项是相应的房屋价格中位数 feature_names = [ 'CRIM', 'ZN', 'I原创 2020-09-01 21:16:08 · 2380 阅读 · 0 评论 -
SVR实现波士顿房价预测
基于Sklearn的SVR实现波士顿房价预测from sklearn.model_selection import train_test_splitfrom sklearn.model_selection import GridSearchCVfrom sklearn.feature_selection import SelectPercentile, f_regressionfrom sklearn.preprocessing import StandardScalerfrom sklear原创 2020-09-01 21:10:46 · 1686 阅读 · 0 评论 -
记录这段时间Python学习时常用的一些代码1
数据读入与保存 hd = pd.read_excel(data_path,header=None)print(hd)hd.shape train_path = "D:\\Spyder\\exercise\\data\\titanic\\train.csv" 有时关于文件的路径会报错,可以试试上面用\\, header=None为添加新的索引 column_x=['CRIM','ZN','INDUS','CHAS','NOX','RM','AGE','DIS','RAD',...原创 2020-09-01 20:50:00 · 155 阅读 · 0 评论 -
波士顿房价线性回归
波士顿房价数据集已经上传资源,免积分下载from matplotlib import pyplot as pltfrom sklearn import linear_modelfrom sklearn.model_selection import train_test_splitimport numpy as npimport pandas as pdplt.rcParams['font.sans-serif'] = ['KaiTi']data_path1 = 'housing_true.原创 2020-08-14 21:09:48 · 431 阅读 · 0 评论 -
打开.data文件的步骤
老师最近给了一组.data格式的文件,当我直接强行改为.csv或者.xls文件再使用Python打开,发现数据在Python中只有一列,后面无法对数据进行索引,在搜了一些方法后,分享一种比较方便的方法1.首先还是对.data文件强行改格式为.txt,然后打开wps(我用的WPS)新建空白表格2.如图中点击数据——导入数据点击——选择数据源——下一步——分隔符号如下图下一步——完成——保存为.xls文件这样的数据用Python读取时列的数目正确...原创 2020-08-14 21:01:27 · 43117 阅读 · 5 评论 -
Auto-encoder和Variational auto-encoder(自编码器和变分自编码器)
Auto-encoder属于Unsupervised Learning问题 经常用于数据集预处理 进行数据降维或者特征的提取某些数据集使用时需要变为计算机能够更好处理的形式,需要先进行预处理,我们希望预处理后的数据能够最大保留原数据集信息,并且使最后的编码信息能够最大还原原数据,过程包含encoder和decode自编码器其损失函数则定义为重建输出与原始输入之间的均方差/交叉熵,作...原创 2020-01-05 09:50:25 · 819 阅读 · 0 评论 -
对于GAN的描述Generative Adversarial Network(生成对抗网络)
流程:一个随机噪声经过生成器generator产生假的图片,且输入到判别器discriminator欺骗判别器生成器希望自己生成的图像骗过判别器,判别器不断增强自己分辨真伪的能力,这两者能力不断对抗,分别不断增强能力,直到最后判别器无法判别生成器产生的图像内容,则达到目的,网络拟合。 ...原创 2020-01-04 11:37:15 · 599 阅读 · 0 评论 -
Zero-shot Learing /One-shot Learing
Zero-shot Learing /One-shot Learing 属于同类问题,就是指训练样本中某类数据太少或直接就没有时,这时训练的模型依然可以满足这个类,这应该就是指模型的泛化能力了。分别来讲Zero-shot Learing训练样本里面没有这个类,但是训练好模型后 输入这个类的数可以达到效果One-shot Learing类别下训练样本只有一个或者很少,但是依然可以...原创 2020-01-04 11:24:38 · 187 阅读 · 0 评论 -
tensorflow 优化 MNIST数据集分类 Jupyter
上篇文章简单实现了mnist数据集的分类,并在文章最后提到了对神经网络的优化,我们可以对基本神经网络进行优化,得到更加准确的数据分类。先来看一看可以进行优化的地方,我们将在不使用卷积神经网络的前提下对代码进行优化:可以测试将mnist数据集按不同批次分类,代码中是20,可以改为30、50、100等,然后测试发现准确率最高的批次 可以优化代价函数,将基本的二次代价函数变为交叉熵释然代价函...原创 2018-08-29 10:39:38 · 512 阅读 · 0 评论 -
tensorflow 简单理解 TensorBoard
tensorboard是tensorflow的可视化工具,它可以通过tensorflow程序运行过程中输出的日志文件可视化tensorflow程序的运行状态。我们在简单理解tensorboard的过程中仍然以以前写过的tensorflow识别mnist手写数字为例。我们先用最简单的识别手写数字的神经网络为例,学习tensorboard的可视化。先上代码:import tenso...原创 2018-09-05 11:10:54 · 333 阅读 · 0 评论 -
tensorflow 简单实现MNIST数据集分类 Jupyter Notebook
首先需要先完成tensorflow的安装 直接送上前辈已经写好的链接 tensorflow安装步骤奉上链接 https://blog.youkuaiyun.com/lxy_2011/article/details/79181990 我也是一名小白 所以在学长的建议下使用了 Jupyter Notebook 编辑代码,它很容易上手用起来非常方便,是个对新手非常友好的工具。同样直接送上关于 Jupyter...原创 2018-08-29 09:14:39 · 2538 阅读 · 0 评论