自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 matplotlib画boxplot并添加pvalue

matplotlib 画 boxplot 并添加 pvalue

2024-11-05 14:04:32 195

原创 用survival包计算事件累积频率并可视化

用survival package画事件发生累积频率图,并手动推导频率计算

2024-11-02 17:09:51 738

原创 在dplyr包中使用动态变量

在dplyr包中,使用动态变量

2024-11-01 09:23:21 179

原创 sklearn 分类变量转换

在用进行机器学习模型建立时,我们拿到的数据总是包含有分类变量和数值型变量,但是sklearn模型要求的输入都是数值型的。因此,在构建模型之前,我们需要对分类变量进行转换。

2024-10-28 10:33:30 387 1

原创 xgboost cross validation

xgboost cross validation 训练

2024-09-29 22:37:09 247

原创 卷积神经网络--LeNet的解释与实现

根据《动手学习深度学习》中的卷积神经网络章节记录自己的学习笔记,下面是对LeNet的学习与理解,并用pytorch进行实践。

2024-09-28 17:16:09 915

原创 R整理数据技巧

R处理数据小技巧

2024-09-24 22:40:07 282

原创 ggtree 合并metadata

在ggtree中给tree中的tips添加metadata

2024-09-12 08:50:20 229

原创 多组样本两两差异分析

在r中构建两两Wilcox test的比较的函数

2024-09-12 08:48:26 191

原创 微生物数据的sparcc网络分析

微生物数据的sparcc网络分析及可视化

2024-09-11 13:29:12 766

原创 R 调整图片的内容大小一致

为了固定图片的边框大小一致,可以使用 egg::set_panel_size(pp, width=unit(480, “pt”), height=unit(200, “pt”))这样在排版的时候,图片的坐标轴边框的大小是一致的。

2024-09-11 08:59:29 342

原创 ggplot boxplot 添加1分位线和4分位线

在R语言ggplot画图中,添加1分位线和4分位线,并合理显示小提琴和点图。

2024-09-10 13:30:17 345

原创 python中multiprocessing的Pool的用法注意

在python的multiprocessing模块中,可以使用Pool类进行多进程任务。

2024-09-07 22:41:35 362 2

原创 scBERT--单细胞测序数据深度学习模型

单细胞测序技术越来越流行,很多文章都在做单细胞测序数据的分析工作,在2022年腾讯AI实验室发表了一篇scBERT的文章,就是用深度学习模型对单细胞数据进行预训练,并进行下游任务设计,比如单细胞的类型注释任务。本文主要是记录我对这篇文章预训练和分类任务部分的理解与实现。旨在理解BERT模型框架在单细胞数据中的运用,并根据数据的生物学特征,进行模型框架的调整。

2024-09-07 19:02:55 1363

原创 python多进程数据传递

python multiprocessing多进程数据传递使用列队太多bug了,有限制,可以使用multiprocessing.Manager()来传递数据可以解决queues列队的阻塞问题import multiprocessingdef fun(q,number,lst): arr = [] for i in lst: arr.append(i) ...

2019-10-24 13:58:31 561

原创 python | argparse 一个选项多个参数设定

import argparsedef fun(): print(i)parser = argparse.ArgumentParser(description='........')#nagrs="+" 至少给-l 选项传递1个参数,parser.add_argument("-l","--list",dest="list",nargs='+',help="list")args = pa...

2019-10-23 16:10:55 11455

原创 python多进程

import multiprocessing #多进程模块def fun(q,number,lst): #自定义执行函数 arr = [] for i in lst: arr.append(i) q.put(arr) #将结果放入列队if __name__=='__main__': lst = list(range(99)) thread_input_list...

2019-10-23 15:56:00 130

原创 Linux多进程实现方法

Linux多进程实现方法主要是通过将程序放到后台去执行,例如:function fun{echo "hello,world"}for ((i=0;i<=10;i++))do fundone & #放入后台运行,相当于11个进程wait # 等待所有进程结束echo "Finished" #进入主进程...

2019-10-22 13:44:25 185

原创 awk正则表达式和复合条件筛选

复合条件筛选awk '($1 > 2) && ($2<=4){print $1,$2,$3}' file.txt正则匹配awk '$1 ~ /^[0-9]+/ {print $1,$2}' file.txt 筛选出以数字开头的awk '$1 ~ /[a-z]$/ {print $1,$2}' file.txt 筛选以字符串结尾的更改输出分隔符awk 'BEG...

2019-10-22 12:00:57 1361

原创 Linux 在awk中的正则表达式中使用shell变量

var=echoecho "echo 1 1 1" | awk '$1 ~ /'$var'/{print $1,$2}'

2019-10-14 15:55:16 1748

原创 vim使用

vim file 打开文件准备编辑,若文件不存在则新建一个文件vim 的两种模式普通模式插入模式首先进入的是普通模式,可以对文件执行命令i键进入插入模式,Esc键退出插入模式移动光标的命令:h:左移j:下移k:上移l:右移翻页命令:PageDown 下翻一页PageUp 上翻一页G:移到缓冲区的最后一行num G:移动到缓冲区中的第num行。gg:移到缓冲区的第一行...

2019-08-14 11:05:57 142

原创 kaggle--房价预测模型

kaggle中的竞赛是练习数据分析的好地方,最近我也尝试着入门kaggle数据分析,并把自己的想法写出来,排名不好,大家有想法的可以一起讨论哈!#导入各种模块,用的是增强决策树算法和梯度回归算法import numpy as npimport pandas as pdfrom sklearn import cross_validationfrom sklearn import prepr...

2019-08-09 10:04:18 651

原创 python pandas 数据分析笔记

使用python pandas做数据分析的一点小笔记,记在这里以便经常翻看,

2019-08-08 16:57:36 849

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除