
跟无神学生信
21世纪是属于生物的,用CS的手法研究生信更是最优解!欢迎生物er点点关注哦!
竹杖芒鞋序行
专攻AI相关内容,目前聚焦于大模型相关技术。
黑暗学渣硕一枚。
欢迎关注博主一起学习AI领域的相关知识,不定期会进行论文解读和算法题整理以及算法的核心面经总结。
也曾有一天,你屹立世界之巅,为大千宇宙中最闪亮的星,世界再无阴霾,阳光明媚。
展开
-
跟无神学生信之R语言语法
赋值号在R中为原创 2024-02-19 23:25:07 · 428 阅读 · 0 评论 -
跟无神学生信之R语言的Debug工具
可见R语言作为一个数据处理所用的语言,其中的traceback和python中的十分类似,当执行错误时会打印出函数调用栈;debug和browser也在pycharm中有类似功能;trace和recover的作用分别为在一个函数的某个位置插入修正漏洞的代码;而recover则允许修改出现bug时的行为。JHU教授的R语言课程总的来说比较基础,内容浅薄,博主对此的学习也到了尾声。Bug中文为虫子,在cs领域为漏洞的意思。觉得有用的话请给个一键三连哦!欢迎关注无神一起学生信!原创 2024-02-18 15:17:24 · 412 阅读 · 0 评论 -
生物信息学高质量刊物
ncs上文章水平越来越差,没有发现变好的趋势。属于普通人可达到的巅峰,PHD中一篇基本可以在几乎任何学校躺平到毕业了,中国内地的phd student能发到前两档的两只手都数的过来。比4略低,周围的朋友一般在NC悲剧之后转投这三个,但个人认为因为稿源原因,会和4逐渐拉开差距。难度稍低于2档,这两本侧重点不同,ng数据量和结论更突出,nmi算法更突出。,很少有纯计算能上的,一般都需要一定的湿实验验证,在计算领域某些场合认可度甚至高于正刊。as会有少量生信文章,cr关系稿较多,nar会有些惨不忍睹的。原创 2024-01-30 13:03:04 · 1874 阅读 · 0 评论 -
生物信息学及其研究方向与应用
生物信息学是生物er在AI以及cs时代的出路,所以AI以及生信一定是生物er的出路,21世纪的生物只有和最具生产力的行业结合,才能爆发出生命力,哦不,拿到高薪。在《生物信息学与基因功能组学》中,其作者将生物信息学定义为使用计算机数据库和计算机算法来分析蛋白质、基因和组成生命体的DNA的完整集合(基因组)的学科。其核心课题是识别和建立不同生物体的基因或其他基因组结构的关系和功能,通过比价不同物种的同源基因可以大大提高预测的精度和准度。据说该领域是颜宁院士的领域,随着大模型的出现走向没落。原创 2024-01-14 18:25:07 · 895 阅读 · 0 评论 -
生物信息学之同源性、相似性、一致性和直旁系同源
直系同源:在物种分化过程中,相同的祖先序列被保留到各个分化物种中的序列。比如人类和啮齿动物的血红蛋白基因。(故现在可以用小白鼠来模拟人体,其也是最常用的实验材料之一)同源性:具有共同进化祖先的两条序列称为同源序列。同源性没有程度之分,要么是同源,要么非同源,高度同源这种说法是错误的。旁系同源是通过基因复制机制产生的同源序列,是在同一个物种内部的同源基因。相似性指相同和相似残基所占的程度。当两条序列同源时,常常二者具有较强的相似性。直系同源被认为具有相似的生物学功能。一致性即序列完全一致。原创 2024-01-15 22:33:13 · 3012 阅读 · 0 评论 -
程序员的基本素养之——R语言起源、特点以及应用
R语言支持多种统计方法,如回归分析、方差分析、时间序列分析等,同时还提供了机器学习和深度学习的扩展包,使得用户能够进行复杂的模型建立和预测。R语言是一个开源的、免费的统计分析和图形化编程语言。同时,R语言拥有强大的图形绘制功能,用户可以生成高质量的图表、散点图、直方图等,以便更好地理解和展示数据。作为用于数据统计的必备技能语言,博主目前正在对R语言进行基本的学习,这也是生物信息学领域进行统计分析的必备语言之一。R语言和MATLAB都是在科学和数据分析领域中常见的编程语言,各有各的特点和适用场景。原创 2024-01-28 16:22:56 · 2016 阅读 · 0 评论 -
生物信息学之序列比对
在分析所克隆的DNA序列的一致性时;蛋白质和基因相关性分析可以通过基因比对来完成,当完成对多个物种的基因组测序后,一个重要的工作是找到特定物种内和物种之间的蛋白质或核酸在进化中的相关性。同源序列为生物进化中的核心概念:如果两个基因或者蛋白质由一个共同的祖先进化而来,那么这两个基因或蛋白质是同源的。但是,通过BLAST搜索等,DNA和蛋白质的转换是很方便的,因此二者之间可以比较方便地关联起来。1.由于DNA的遗传密码的简并性,尤其是密码子的第三个位点的变化,不会改变其所编码的氨基酸。原创 2024-01-13 10:18:20 · 1661 阅读 · 0 评论 -
第三代 DNA测序技术
以SMRT芯片为测序载体,基本原理:使用DNA聚合酶以及不同标记的四种dNTP,根据其与所测模板链结合后的发出的不同光的波长来判断碱基的类型。其关键技术是零模波导孔(Zero Mode Waveguide)——每一个SMRT包含上万个ZMW,外径100nm,波长大于其小孔直径,所以无法穿过,从而能量被限制在一个很小的范围中,这个范围正好能够覆盖当前碱基,游离的碱基仍然在黑暗中,从而能够将背景的干扰降到最低。缺点(错误率高,百分之15左右,出错是随机发生的,可以通过多次测序改正。错误率低(1-4,随机产生)原创 2024-01-24 18:49:43 · 726 阅读 · 0 评论