- 博客(38)
- 收藏
- 关注
原创 通过染色体pos定位到cytoband
加载包# 构建查询 URL(chr:start-end)# 默认 grch 38# 可选 grch 37# 查询。
2024-12-23 11:20:14
419
原创 如何使用 MungeSumstats
1、怎么读取 vcf 数据?2、不同方法需要的汇总数据格式不尽相同,每次处理都好麻烦。3、怎么这个 GWAS 缺失 SNP 列。4、怎么去除ambiguous SNPs?5、一些 SNP 号都不对,还有重复。MungeSumstats 可以解决这一切!!!
2024-12-19 16:29:19
1020
原创 通过交互式网页学习相机成像原理
入门摄影这门艺术,你是否有以下这些问题?焦距、光圈、CMOS是什么?为什么光圈越大,背景虚化效果越好?什么是过曝?今天我将分享一个简单的、可交互的相机成像模型,可供大家以可视化的方式深入学习和理解这些术语。
2024-11-10 12:49:13
477
原创 Markdown、Latex公式教程推荐
在Markdown中编写时,文本存储在扩展名为.md或.markdown的明文文件中。然后呢?如何将标记格式的文件转换为HTML或可打印的文档?简单地说,您需要一个能够处理Markdown文件的Markdown应用程序。有很多可用的应用程序——从简单的脚本到看起来像Microsoft Word的桌面应用程序。尽管他们的视觉差异,所有的应用程序做同样的事情。和Dillinger一样,它们都将markdown格式的文本转换为HTML,以便在web浏览器中显示。
2024-11-01 09:50:50
484
原创 写 R 包教程
usethis::create_package("myRpkg") # 在当前路径创建 myRpkg/ 文件夹(包框架)# 1、只需要引用包中的某个函数,在你的函数中需 通过:package::fun() 使用。# 即从函数的代码和注释中生成标准化的帮助文档文件、以及 namespace 文件。# 当我们的包依赖于其它包/函数时,需要说明,以在函数安装及调用过程中正确处理。# 3、建议下载 (安装过程中不会安装此包),通常是代码示例需要。# 1、在 myRpkg/R/ 下创建 R 脚本。
2024-10-20 18:00:45
521
原创 如何安装以及使用 Jupyter
或安装完成后,可查看安装的 jupyter 相关软件有哪些以及版本选装 jupyter_contrib_nbextensions或jupyter labextension install @jupyterlab/git # 安装扩展pip install jupyter_contrib_nbextensions # 安装扩展jupyter contrib nbextension install --user # 启用扩展。
2024-10-16 11:55:25
1135
原创 项目数据处理及管理
1、将一个项目拆成多个部分,每个部分有每个部分的code:按编号记录 code 顺序,每个script 包含注释data:存放处理后的 rawdatares:结果部分,可根据改 part 生成存放不同结果的路径tmp:临时存放中间文件数据的地方2、最外层有个生成所需路径的 bash 或 ipynb 文件。
2024-09-27 12:30:53
428
原创 不打开markdown文件运行其中的代码
Rmd 文件转化为 R 脚本,不运行 R 代码# doucumenation:0、不输出注释# 1、输出函数外注释# 2、输出所有注释。
2024-09-26 19:40:56
337
原创 descrTable常用方法
一个 “公式” 类的对象(或可以转换为该类的对象)。的右侧必须以加减法方式纳入包含项,或为纳入所有变量。左侧必须包含分组变量的名称,或者可以留空(在这种情况下,将为整个样本提供描述性统计数据,并且不进行测试)。: 一个可选的数据框、列表或环境(或可通过强制转换为数据框的对象),包含模型中的变量。如果在data中找不到变量,则这些变量会从中获取。: 逻辑值,指示是否显示 ‘[ALL]’ 列(未按组分层的所有数据)。如果定义了分组变量,则默认值为 FALSE;如果没有组,则为 FALSE。
2024-09-21 23:00:37
1531
原创 解决R包依赖版本不兼容问题
install.packages(“路径/包名.tar.gz”, repos = NULL, type = “source”)等工具管理项目的依赖,这些工具允许您锁定项目中使用的包的版本,从而确保在不同的开发环境中包的版本一致。如果包的版本不兼容,您可以到CRAN或包的GitHub页面查找以前的版本,并手动下载旧版本的。有时候新版本的包可能不兼容或者带来了一些不需要的变化,您可以指定安装旧版本的包。函数来查看包的依赖关系,确保安装的其他包满足依赖版本要求。#使用remotes包安装指定版本的包。
2024-09-21 00:21:39
3579
原创 R包compareGroups详细用法
一个命名字符向量,包含 ‘all’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’ 组件,指示 ‘[ALL]’、‘p.overall’、‘p.trend’、‘ratio’、‘p.ratio’ 和 ‘N’(可用数据)的标签。可能的值有:‘tiny’、‘scriptsize’、‘footnotesize’、‘small’、‘normalsize’、‘large’、‘Large’、‘LARGE’、‘huge’、‘Huge’ 或 ‘same’(允许部分匹配)。
2024-09-20 22:51:39
1626
原创 使用源代码编译R包的过程
R 包编译过程包含配置、编译源代码、链接库、安装等多个步骤。每个步骤都依赖于包的内容(是否有 C/C++ 代码、外部库依赖等)。编译时的控制:通过指定头文件路径,通过PKG_LIBS指定库文件路径和库名。动态链接器不会在编译时使用,它仅用于运行时查找共享库。
2024-09-18 21:11:23
1448
原创 卷积公式的几何学理解
以 X 为例,根据代码 marginal_x = np.sum(f_XY, axis=1) * (y[1, 0] - y[0, 0]) 可知,这就是对公式的代码化表达。当 Z=0 时,概率密度为 0.25左右,对应图 B 中过原点,斜率为 0.5 的直线上对应的 X和Y 值。事件A和事件B同时发生的概率等于事件A发生的概率乘以事件B发生的概率,即:事件A,B是否发生不受另一事件的影响。之前讲了单个随机变量的概率密度函数,两个随机变量的概率密度函数,那么两个随机变量组成的新的随机变量,其概率密度函数是什么?
2024-09-01 22:15:41
1654
原创 为什么 from . import * 不会导入子模块
它只会导入当前模块中定义的顶层变量和函数,而不会递归地导入子模块。文件中显式导入你希望包含的子模块。并不会自动导入子模块。模块被正确导入,并且可以在。时,Python 会根据。通过这种方式,你可以确保。在 Python 中,
2024-07-25 16:55:47
313
原创 解决R语言找不到系统库导致的报错
系统库(System library)是一组预先编写和编译好的软件模块集合,用于支持操作系统的基本功能和提供一些常见的服务。这些库通常由操作系统或第三方开发者提供,并且在系统安装过程中被预装或者用户可以额外安装。常见的系统库包括标准C库(如libc)、图形用户界面库(如GTK+、Qt)、网络库(如libcurl)、数据库访问库(如libmysqlclient)、加密库(如OpenSSL)等。
2024-07-21 20:51:11
1538
原创 教程分享:通过python库自动化操作windows软件
Pywinauto是一个用于Windows应用程序的GUI自动化库,适用于Python脚本。这个库提供了简洁的API来访问和操作Windows GUI元素,使自动化各种Windows应用程序变得简单。通过模拟用户操作,它可以驱动Windows应用程序,并且不仅支持传统的Win32 API,也支持微软的UI自动化(UIAutomation API, UIA)技术。使用pywinauto,测试者和开发者可以创建脚本来自动执行按钮点击、文本输入、窗口控制等典型的GUI操作,实现测试用例的自动化执行。
2024-04-21 21:54:22
2105
1
转载 解决Rstudio automatically be signed out
该提示的作用即字面意思:60 mins 不操作就退出,此举虽是出于保护用户的目的,但是对我来说并不需要。auth-stay-signed-in-days=30 #自动保持登录的天数。rsession-which-r=/usr/bin/R # R的路径。形象的的来说,就是将上面左图变成右图,具体操作也比较简单。auth-timeout-minutes=0 #自动退出的时间。修改或添加如下参数,若只需达到上图效果则只用改动。,其余参数可在需要的时候再进行修改。www-port=8787 # 端口。
2024-04-18 10:47:39
301
1
原创 R运行LDpred时bigparallelr 报错:Error: Two levels of parallelism are used. See `?assert_cores`.
在并行设置中存在问题,即同时应用了两种冲突的并行层次。这在R中会发生,当计算设置了大于1的核心数目,同时默认启用了并行BLAS库时。
2024-04-16 21:34:43
443
1
原创 Slurm作业系统
在公共集群中使用SLURM作业调度系统进行任务的调度和管理。SLURM (Simple Linux Utility for Resource Management)是一种可用于大型计算节点集群的高度可伸缩和容错的集群管理器和作业调度系统,被世界范围内的超级计算机和计算集群广泛采用。控制节点(Head Node)和计算节点(Compute Node)。这是Slurm集群的主节点,负责整个集群的管理和协调。在控制节点上,需要安装Slurm的控制节点组件,包括slurmctld。
2024-03-01 23:19:36
2231
原创 并行计算:利用多线程跑循环
在数据分析和计算密集型任务中,利用多线程运行循环非常重要,这种操作成为并行计算(Parallel Computing)。并行计算利用了多核处理器的能力,将复杂的计算任务分散到多个处理单元上同时执行,可以大幅度提高计算效率和节省宝贵的时间。随着现代计算机多核心处理器的普及,我们可以通过并行处理技术同时在多个核心上执行任务,相比于传统的单线程顺序执行,这种方法能更好地利用硬件资源。多线程特别适合于独立重复的任务,比如大数据集的处理,模型的多参数模拟,以及需要重复计算的情景。
2024-02-20 22:29:19
1169
原创 安装Linux系统(单/双系统)
装Linux系统或设置双系统有其必要性。首先,Linux开源操作系统提供更高度的自定义和灵活性,使用户能够根据需求定制系统。其次,Linux系统在稳定性和安全性方面优于其他操作系统,对于注重这些方面的用户更为吸引。另外,一些开发人员和技术爱好者可能需要Linux进行软件开发和系统调优。对于需要同时运行不同操作系统的用户,设置双系统提供了在同一设备上切换操作系统的便利,满足多样化的使用需求。总的来说,装Linux系统或设置双系统可以满足不同用户的不同需求,提供更灵活、安全和稳定的操作环境。
2024-02-13 17:24:11
1706
1
原创 本地和服务器之间文件自动同步备份
Rsync(Remote Sync)是一个用于在本地和远程系统之间同步文件和目录的开源工具。它专注于高效、快速和智能的数据传输,具有一些独特的特性,使其成为广泛应用的文件同步和备份工具。我们可以通过该命令将本地文件同步到服务器,同样也可以将服务器文件同步到本地!!如果想优雅地实现同步备份任务,单靠这一个工具是行不通的,(每次传输文件都要输入密码的话太麻烦)(运行一次 rsync 命令只能同步一次)
2024-02-12 16:40:19
2515
1
原创 Shell 编程
Shell编程语言是一种脚本语言,主要用于编写Shell脚本。这种语言的主要目的是简化和自动化与操作系统的交互,通过一系列命令和控制结构来完成特定的任务。Shell编程语言并非像传统编程语言(如C、Java)那样被编译成机器码,而是由Shell解释器逐行解释执行。
2024-02-09 16:53:32
1075
1
原创 肺功能单数据提取与自动录入(三):图像方向识别模型训练
本文干货满满,强烈建议仔细阅读并跟着项目运行一下!!!本文将分享:①方向分类识别模型训练数据集准备;②通过Paddle AIstudio平台训练并导出模型;③批处理图像获得方向标签并根据标签信息转正图像。
2024-01-28 22:55:46
1841
1
原创 肺功能单数据提取与自动录入(二):Demo展示
可以看到,用户只需将肺功能单图片打包并传到 /home/aistudio 工作路径,再点击运行全部cell即可获得结果文件。可以说是非常的方便!感兴趣的小伙伴可以先看一看本项目的资源和代码。下一篇文章将分享如何准备方向分类训练数据、如何训练方向分类模型以及如何根据推理结果转正图像。
2024-01-21 10:30:00
425
原创 Windows上配置完整Linux开发环境(五):Ubuntu系统安装Rstudio-server
虽然在Linux系统上可以直接运行R程序,或者用VScode编辑运行R代码,但终究不如Rstudio方便。因此,在wsl下的Ubuntu系统安装Rstudio-server(即Rstudio服务器),再通过window浏览器连接Ubuntu系统的Rstudio-server即可优雅地使用Rstudio。
2024-01-20 19:13:59
1594
1
原创 肺功能单数据提取与自动录入(一):流程分析
肺功能测试是一种用于评估和测量个体呼吸系统功能的医学检查。这种测试可以提供有关肺部健康和功能的重要信息,对于诊断和监测呼吸系统疾病非常有帮助。肺功能检测单包含了患者的肺功能测试结果,以及可能的解释和评估。然而要录入大量肺功能单数据并不是一件容易的事,不仅耗时耗力,还极易出错。在此,分享如何基于百度飞桨(PaddlePaddle)开源深度学习平台开发肺功能单数据提取与自动录入程序。
2024-01-14 14:02:42
1089
1
原创 单片机入门课程与实践(推荐)
江协课程+普中开发板:江协课程讲解得非常细,还配套完整的学习资料(软件,PPT,单片机电路图等等),对于什么都不懂的新人非常友好。如果你有编程经验和计算机硬件基础,但从来没玩过单片机,本课程也是非常适用。但其中部分内容可能过于简单,推荐倍速观看,重点内容细细品。
2023-12-08 11:47:01
312
1
原创 Windows上配置完整Linux开发环境(四):Windows与Linux系统文件互项访问
当Windows上安装好WSL的Linux发行版后,打开文件资源管理器后就会出现“小企鹅”。整个Linux发行版数据都在此处。Windows只能通过文件资源管理器访问Linux系统文件。在Winows系统下,不能直接下载内容到Linux内。比如:不能直接从网盘指定下载路径到Linux系统的 /root/,必须下载到Window后再拖动到指定路径。
2023-12-06 08:45:00
214
1
原创 Windows上配置完整Linux开发环境(三):安装集成开发环境IDE(VScode)
IDE是集成开发环境(Integrated Development Environment)的缩写。它是一种软件应用程序,提供了开发者在一个统一界面中进行软件开发所需的工具和功能。通常,IDE包括代码编辑器、调试器、编译器和构建工具,以及其他辅助工具,使开发过程更加高效和方便。使用IDE可以帮助开发者更容易地编写、调试和测试他们的代码,提高开发效率。
2023-12-05 11:30:00
294
原创 Windows上配置完整Linux开发环境(二):Linux发行版Anaconda安装与使用
Anaconda是python编写的一个用于科学计算、数据分析和机器学习的开源发行版,它包含了一系列常用的Python库和工具,以及一个强大的包管理系统。是Anaconda提供的包管理工具,用于安装、更新、卸载软件包,以及创建、导出、列出和移除环境。Conda还可以跨平台工作,支持Windows、macOS和Linux。Anaconda默认安装了最新版本的Python解释器。是一个图形用户界面,提供了可视化的方式来管理和操作Anaconda环境、包、虚拟环境以及其他与数据科学和机器学习相关的工具。
2023-12-03 19:01:53
1589
3
原创 Windows上配置完整Linux开发环境(一):通过WSL在Window上安装Linux发行版
Linux发行版(Distribution,简称distro)是基于Linux内核的操作系统的不同变体。尽管Linux内核是操作系统的核心组件,但发行版包含了额外的软件、库、工具和用户界面,使其成为一个完整的操作系统。不同的Linux发行版可以有不同的目标和用途,适用于各种场景,从服务器和嵌入式系统到桌面计算机和个人设备。一些常见的Linux发行版包括Ubuntu、Fedora、Debian、CentOS、Arch Linux等。每个发行版都有自己的包管理系统,用于安装、更新和删除软件包。
2023-12-01 11:35:24
4922
2
PRScs源代码详解以及代码步骤测试
2024-08-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人