GUI Research Group
机器学习, 生物信息
展开
-
JupyterNotebook随记(part3)--jupyter notebook study
学习笔记,仅供参考,有错必纠文章目录jupyter notebook study使用问号查看帮助文档使用叹号执行命令行语句多行输出超链接公式快捷键扩展插件集 nbextensions魔法命令的概述行魔法命令单元格魔法命令运行其他编程语言jupyter notebook study使用问号查看帮助文档a = 's'?a使用叹号执行命令行语句!dir 驱动器 D 中的卷是 学习工作 卷的序列号是 A7BF-8827 D:\MyStudio\JupyterNotebook 的原创 2021-04-12 11:27:58 · 325 阅读 · 3 评论 -
pyecharts学习(part5)--散点图,地图,词云图
学习笔记,仅供参考,有错必究文章目录pyecharts学习散点图设置散点图点的大小设置散点图点的形状词云地理图形绘制pyecharts学习散点图from pyecharts.charts import Scatterfrom pyecharts import options as optsimport numpy as npx = np.linspace(0,10,30)y1 = np.sin(x_data)y2 = np.cos(x_data)figsize = opts原创 2021-03-31 12:45:20 · 284 阅读 · 0 评论 -
pyecharts学习(part4)--pyecharts饼图
学习笔记,仅供参考,有错必究文章目录pyecharts学习pyecharts饼图pyechart 圆弧状Piepyecharts学习pyecharts饼图Pie 需要的数据格式:[[x1,y1],[x2,y2]]绘制饼图的操作步骤:构建Pie 的数据为Pie 示例对象添加数据设置标题设置每一项占比from pyecharts.charts import Piefrom pyecharts import options as opts# 构建Pie的数据x = ['直原创 2021-03-31 11:59:43 · 767 阅读 · 0 评论 -
pyecharts学习(part3)--简单图表绘制及参数优化
学习笔记,仅供参考,有错必究文章目录pyecharts学习简单图表绘制及参数优化表格反转文本倾斜图像放大设置区域缩放折线图 and 柱状图pyecharts学习简单图表绘制及参数优化from pyecharts.charts import Barfrom pyecharts import options as optsx = ['Python 数据可视化库 seaborn', 'Python 数据可视化库 plotly', 'Python 数据可视化库 matplotlib']y1 =原创 2021-03-31 09:20:46 · 325 阅读 · 0 评论 -
pyecharts学习(part2)--pyecharts Line
学习笔记,仅供参考,有错必究文章目录pyecharts学习pyecharts Line折线图添加标题与图例增加提示项工具箱的设置pyecharts学习pyecharts Line折线图from pyecharts.charts import Linefrom pyecharts import options as opts# 散点图数据x = ['seaborn', 'plotly', 'matplotlib', 'pyecharts', 'python']y1 = [1140, 5原创 2021-03-30 22:24:05 · 346 阅读 · 0 评论 -
pyecharts学习(part1)--绘制图表的三种方式
学习笔记,仅供参考,有错必究文章目录pyecharts学习绘制图表的三种方式绘制的图表生成HTMLjupyter notebook 内嵌展示pyecharts生成图片pyecharts学习pyecharts的安装pip install pyecharts绘制图表的三种方式import pyechartspyecharts.__version__'1.9.0'绘制的图表生成HTMLfrom pyecharts.charts import Barfrom pyecharts原创 2021-03-30 21:38:16 · 323 阅读 · 0 评论 -
文献学习(part5)--Clustering by Passing Messages Between Data Points
学习笔记,仅供参考文章目录Clustering by Passing Messages Between Data PointsClustering by Passing Messages Between Data Points通过在数据点之间传递消息进行聚类Clustering data by identifying a subset of representative examples is important for processing sensory signals and det原创 2020-10-29 13:09:16 · 339 阅读 · 0 评论 -
文献学习(part4)--Unsupervised Deep Embedding for Clustering Analysis
学习笔记,有错必纠文章目录AbstractIntroductionRelated workDeep embedded clusteringClustering with KL divergence(KL散度聚类)ExperimentsDatasetsEvaluation Metric(评估指标)ImplementationExperiment results(实验结果)DiscussionAssumptions and ObjectiveContribution of Iterative Optimiz原创 2020-10-16 16:56:32 · 961 阅读 · 0 评论 -
文献阅读疑问(202010)
学习笔记,仅供参考文献阅读疑问Unsupervised Deep Embedding for Clustering Analysis原文:Determining hyperparameters by cross-validation on a validation set is not an option in unsupervised clustering. Thus we use commonly used parameters for DNNs and avoid dataset原创 2020-10-16 12:43:34 · 267 阅读 · 0 评论 -
Django从理论到实战(part52)--登录、注销及登录限制
学习笔记,仅供参考,有错必纠文章目录登录、注销及登录限制登录注销登录限制登录、注销及登录限制登录在使用authenticate进行验证后,如果验证通过了。那么会返回一个user对象,拿到user对象后,可以使用django.contrib.auth.login进行登录。示例代码如下:user = authenticate(username=username, password=password)if user is not None: if user.is_active:原创 2020-10-10 20:19:16 · 251 阅读 · 1 评论 -
Django从理论到实战(part48)--Django表单
学习笔记,仅供参考,有错必纠Django表单首先,我们创建一个新的项目myproject01,在项目下创建一个应用front和一个模板文件夹templates。现在,我们开始我们的表单学习之旅。在主urls.py中键入urlfrom django.contrib import adminfrom django.urls import pathfrom . import viewsfrom django.conf.urls import includeurlpatterns =原创 2020-09-29 06:24:16 · 313 阅读 · 0 评论 -
Django从理论到实战(part49)--ModelForm
学习笔记,仅供参考,有错必纠参考自:某网课ModelForm我门在写表单的时候,会发现表单中的Field和模型中的Field基本上是一模一样的,而且表单中需要验证的数据,也就是我们模型中需要保存的。那么这时候我们就可以将模型中的字段和表单中的字段进行绑定。比如现在有个Article的模型。示例代码如下:from django.db import modelsfrom django.core import validatorsclass Article(models.Model):原创 2020-10-01 11:48:03 · 278 阅读 · 0 评论 -
R语言观察日志(part11)--好用的R命令之高效安装
学习笔记,仅供参考,有错必纠PS:别看名字是高效安装,还有一些其他方法高效安装命令查看操作系统相关信息Sys.info()输出: sysname release version nodename machine "Windows" ">= 8 x64" "build 9200" "GOAT" "x86-64" login u原创 2020-07-23 00:29:09 · 366 阅读 · 0 评论 -
Django从理论到实战(part35)--QuerySetAPI
学习笔记,仅供参考,有错必纠参考自:Django打造大型企业官网–Huang Y;官方文档QuerySet API我们通常做查询操作的时候,都是通过模型名字.objects的方式进行操作。其实模型名字.objects是一个django.db.models.manager.Manager对象,而Manager这个类是一个“空壳”的类,他本身是没有任何的属性和方法的。他的方法全部都是通过Python动态添加的方式,从QuerySet类中拷贝过来的。所以,我们如果想要学习ORM模型的查找操作,必须首先原创 2020-07-19 05:14:22 · 280 阅读 · 0 评论 -
Django从理论到实战(part34)--聚合函数
学习笔记,仅供参考,有错必纠参考自:Django打造大型企业官网–Huang Y;官方文档聚合函数聚合函数是通过aggregate方法来实现的,在学习些聚合函数的用法之前,我们来看一下我们的模型: from django.db import models class Author(models.Model): """作者模型""" name = models.CharField(max_length = 100) age = models.IntegerFi原创 2020-07-14 21:42:50 · 272 阅读 · 1 评论 -
Django从理论到实战(part33)--表关系
学习笔记,仅供参考,有错必纠参考自:Django打造大型企业官网–Huang Y;表关系表与表之间都是通过外键来进行关联的,而表之间的关系,无非就是三种关系:一对一、一对多(多对一)、多对多。一对多一对多或者多对一,都是通过ForeignKey来实现的: class User(models.Model): username = models.CharField(max_length=20) password = models.CharField(max_length原创 2020-07-14 18:34:56 · 271 阅读 · 0 评论 -
数据挖掘学习日志(part2)--主成分法确定权重与R实现
学习笔记,仅供参考,有错必纠参考文献:基于主成分分析的指标权重确定方法–韩小孩;主成分法确定权重原理构造样本阵其中,xijx_{ij}xij表示第iii组样本数据中的第jjj个变量的值。对样本阵XXX进行变换变换后得到Y=[yij]n×pY=[y_{ij}]_{n \times p}Y=[yij]n×p对YYY做标准化变换得标准化阵其中,zij=yij−yj‾sjz_{ij}= \frac{y_{ij}- \overline{y_j}}{s_j}zij原创 2020-07-13 23:58:11 · 1529 阅读 · 0 评论 -
Django从理论到实战(part31)--Django数据库查询操作
学习笔记,仅供参考参考自:Django打造大型企业官网–Huang Y;Django数据库查询操作查找是数据库操作中一个非常重要的技术,查询一般就是使用filter、exclude以及get三个方法来实现。我们可以在调用这些方法的时候传递不同的参数来实现查询需求。在ORM层面,这些查询条件都是使用field+__+condition的方式来使用的查询条件exact该参数使用精确的=进行查找,如果提供的是一个None,那么在SQL层面就是被解释为NULL。示例代码如下:article原创 2020-07-09 12:45:49 · 277 阅读 · 0 评论 -
Django从理论到实战(part29)--Field的常用参数
学习笔记,仅供参考参考自:Django打造大型企业官网–Huang Y;Field的常用参数null如果设置为True,Django将会在映射表的时候指定是否为空。默认是为False。在使用字符串相关的Field(CharField/TextField)的时候,官方推荐尽量不要使用这个参数,也就是保持默认值False。因为Django在处理字符串相关的Field的时候,即使这个Field的null=False,如果你没有给这个Field传递任何值,那么Django也会使用一个空的字符串""来作为原创 2020-07-09 10:05:40 · 409 阅读 · 0 评论 -
Django从理论到实战(part28)--ORM常用Field详解
学习笔记,仅供参考参考自:Django打造大型企业官网–Huang Y;ORM常用Field详解AutoField映射到数据库中是int类型,可以有自动增长的特性。一般不需要使用这个类型,如果不指定主键,那么模型会自动的生成一个叫做id的自动增长的主键。如果你想指定一个其他名字的并且具有自动增长的主键,使用AutoField也是可以的。BigAutoField64位的整形,类似于AutoField,只不过是产生的数据的范围是从1-9223372036854775807。Boolea原创 2020-07-09 10:00:56 · 339 阅读 · 0 评论 -
过拟合与模型调优(part3)--数据划分及模型选择
学习笔记,仅供参考,有错必纠PS : 本BLOG采用中英混合模式,有些英文下有中文翻译文章目录选择调优参数值数据划分建议不同模型间的选择Logistic回归与支持向量机选择调优参数值In general, it may be a good idea to favor simpler models over more complex ones and choosing the tuning parameters based on the numerically optimal value may原创 2020-06-06 17:05:34 · 463 阅读 · 0 评论 -
过拟合与模型调优(part2)--重抽样技术
学习笔记,仅供参考,有错必纠PS : 本BLOG采用中英混合模式,有些英文下有中文翻译文章目录重抽样技术k折交叉验证重复训练/测试集划分Bootstrap方法重抽样技术Generally, resampling techniques for estimating model performance operatesimilarly:先用一个子样本去拟合模型,然后用其余的样本评估模型。这过程会重复多次,然后对结果进行汇总归纳,不同的重抽样技术的差别往往体现在怎么选取子样本上。k折交叉验原创 2020-06-06 14:14:37 · 456 阅读 · 0 评论 -
过拟合与模型调优(part1)--过拟合,模型调优,数据分割
学习笔记,仅供参考,有错必纠PS : 本BLOG采用中英混合模式,有些英文下有中文翻译文章目录名词解释模型调优过拟合问题模型调优数据分割名词解释模型调优we will assume that data quality is sufficient and that it is representative of the entire sample population.Working under these assumptions, we must use the data at hand原创 2020-06-06 12:21:06 · 503 阅读 · 0 评论 -
数据预处理(part3)--缺失值处理和区间化
学习笔记,仅供参考,有错必纠文章目录处理缺失值移除预测变量预测变量间的相关性区间化预测变量处理缺失值在很多时候,某些预测变虽会在一些样本上缺少观测。这些缺失值可能是结构性缺失,如一个男子的后代数目.了解缺失值发生的原因是很重要的,首先,应该调查数据缺失是否和结果变量有关,这种情形被称为"有信息量的缺失",因为缺失情况本身是结构性的。缺失数据不应该和删失数据相混淆,对于后者具体的观测依是缺失了,但我们仍知道一些信息,例如,出租碟片公司在建模时如果使用用户持有碟片时长这一变量,如果客户还未归还原创 2020-06-06 10:13:12 · 698 阅读 · 0 评论 -
数据预处理(part2)--多个预测变量数据变换
学习笔记,仅供参考,有错必纠文章目录多个预测变量数据变换离群值数据降维和特征提取多个预测变量数据变换离群值我们通常将离群值定义为远离数据主要部分的样品。我们通常可以通过观察图像来确定一些不寻常的点。当一个或多个样本为疑似离群值时。第一步,是保证这些数据在科学上是有效的(比如,理论上是正数),而且没有数据输人的错误。要非常小心不要草率地移除或改变观测值,尤其当样本量很小的时候,在小样本量的情况下,明显的离群可能因为数据来自于一个有偏分布,而我们没有足够的数据观测到这个偏度.此外,离群点可能原创 2020-06-06 01:03:37 · 825 阅读 · 0 评论 -
数据预处理(part1)--单个预测变量数据变换&R语言
学习笔记,仅供参考,有错必纠文章目录单个预测变量数据变换中心化与标准化知识补充R语言实现数据变换解决偏度问题R语言实现单个预测变量数据变换中心化与标准化中心化是将所有变量减去其均值,其结果使变换后的变量均值为0;标准化是将每个变量除以其自身的标准差,其结果使变换后的变量标准差为1.这些操作普遍用来提升计算的稳健性。这些变换的唯一缺点是失去了观测的可解释性,因为它们不再使用原本的单位。中心化公式:xi∗=xi−x‾x^*_i=x_i-\overline{x}xi∗=xi−x统计原创 2020-06-05 11:44:15 · 747 阅读 · 0 评论