- 博客(21)
- 收藏
- 关注
原创 Nature点评:目前对科研最适配的5个AI工具(DeepSeek-R1上榜)
当然,选择合适的大模型只是第一步。掌握高级提示词技巧以及将AI有效整合到科研工作流程中同样至关重要。最近我在研究如何使用Cherry Studio来整合API到统一工作区、对模型进行微调、建立提示词库以及构建本地知识库进行问答。总的来说,我非常看好这款开源软件的发展前景。AI模型的迭代速度非常快,谁也无法预测下个月或下半年会出现什么更强大的模型。因此,建立自己的知识管理系统,并将AI合理地整合到科研工作流程中,才是最重要的。欢迎关注我,专注AI在科研工作流中的应用。
2025-02-19 19:11:52
1147
原创 一周时间看完了最近疯传的清华大学《DeepSeek:从入门到精通》,我知道了如何在科研中把AI 用得更出彩
当人人都会用AI时,你如何用得更好更出彩?——《DeepSeek:从入门到精通》
2025-02-15 19:33:28
506
原创 github 16.1k星,最适合科研人员的AI翻译工具,保持原版排版,精准读取上下文内容|pdfmathtranslate
PDFMathTranslate是一款强大的开源PDF文档翻译工具,具有以下特点:保留原始PDF排版样式:翻译后的文档会完整保持原文的格式、图片、公式等元素支持双语对照:可以同时显示原文和译文,方便对比学习数学公式处理:能够准确识别和保留数学公式,不会破坏公式的结构开源免费:软件完全开源,用户可以免费使用和修改这个工具特别适合需要阅读外文学术论文的学生和研究人员,可以帮助他们快速理解文献内容,同时保持专业术语和数学公式的准确性。
2025-01-31 12:26:38
790
原创 24年高分上岸,上海海洋大学水产考研复试经验贴(水产养殖和渔业发展均适用)
简单介绍一下自己,24年跨考上海海洋大学水产养殖,初试400+(鱼增130,数农120,英一86),复试排名10,最后进入心仪课题组(全校最难进的组)。人脉比较广,可以帮你联系师兄师姐,提前了解导师情况,避免再踩我们踩过的坑。
2025-01-30 21:10:31
322
原创 一文讲清楚原理 常用转录组的表达量定量工具RSEM与Salmon | 生信笔记10
主要包含FPKM、RPKM、还有TPM,作为归一的工具,让不同重复、不同组别的表达量可以进行比较。其中TPM被认为是更优的归一方法,用于映射单个基因的表达量在整体表达量中的情况。
2025-01-15 12:04:51
390
原创 转录组表达量的常规标准化方法(FPKM、RPKM、TPM)| 生信笔记09
上期我们讲完了转录组的基本原理、实验设计和上游分析,在开始差异基因分析之前,我们先来了解一下常见的RNA-seq的定量方式RPKMFPKMTPM。
2025-01-14 13:23:13
1862
原创 批量从ncbi下载线粒体基因组,几句话让cursor写一个自动化的python脚本,替代了我原本一天的工作量
脚本和测试我放到我的公众“小竹读研在养鱼”上面了,有需要的可以在后台回复“mit download”,在文末获取。
2025-01-12 15:25:36
400
原创 大数据时代为生物人推荐的三本Python书籍:开启数据科学的新篇章
获取方式可以搜索我的公众号“小竹读研在养鱼”,后台回复python就可以自动获取啦都是我自己在用的pdf电子版,我觉得电子版阅读起来会方便不少。方便携带,可以三端同步。而且电子版加批注,全文搜索会方便不少。可以转发给有需要的人。Martin Jones 博士是一位经验丰富的生物信息学家和教育工作者。他在英国爱丁堡大学获得生物信息学博士学位,曾在多个研究机构从事生物信息学研究和教学工作。
2025-01-11 11:22:22
464
原创 一篇文章讲清RNA-seq原理与应用 | 生信笔记07
RNA测序(RNA-Seq、转录组)是一种高通量测序技术,用于研究细胞中的RNA群体,包括mRNA、非编码RNA、小RNA等。这项技术为我们提供了一个全面了解基因表达、识别转录本结构、研究RNA编辑和变异以及发现新的RNA分子的手段。RNA-Seq的基本步骤包括RNA提取、RNA分离和富集、cDNA合成、文库构建和测序。事实上,比起RNA——表型,蛋白质能更好地与表型联系起来。毕竟RNA大多数情况承担了遗传信息传递的中间信使的职责。
2025-01-10 15:56:43
1340
原创 序列比对结果文件SAM和BAM| 生信笔记06
序列比对结果文件是用于存储高通量测序数据与参考基因组比对结果的文件,它们记录了每个测序片段(read)在参考基因组上的位置、比对质量、可能的变异等信息。这些文件通常以SAM或BAM格式存在,是生物信息学分析中不可或缺的数据类型。首先我们要有参考基因组,使用bwa的index先根据参考基因组建立索引。然后使用bwa的mem程序(使用Maximal Exact Matches算法),进行比对。这个算法是bwa软件包中的一个比对算法,用于将测序reads与参考基因组进行比对。
2024-12-26 16:31:25
566
原创 BWT和LF算法(压缩和解压缩)加快序列比对运算速度 | 生物人最值得看的哈佛生信课05
从矩阵中取出最后一列字符,这些字符组成了BWT的输出字符串。
2024-12-23 16:29:13
1104
原创 序列映射(mapping)与对齐(alignment)转录组必看的内容| 生物人最值得看的哈佛生信课04
在转录组数据分析中,假设我们已经使用fastqc进行了QC,使用了trimmomatic对序列进行清洗,现在得到了一组高质量的双端测序的reads文件。但是当你打开这个文件时,发现这里面只有一堆ATGC组成的序列,这和网上说的差异基因分析似乎还有一点距离。而且现在我们有两个双端测序的文件,对于大脑来说有点难以理解。
2024-12-22 17:50:33
1228
原创 全局比对&Needleman-Wunsch算法 | 生物人最值得看的哈佛生信课03
全局比对是指将参与比对的两条序列里面的所有字符进行比对。全局比对在全局范围内对两条序列进行比对打分,找出最佳比对,主要被用来寻找关系密切的序列。其可以用来鉴别或证明新序列与已知序列家族的同源性,是进行分子进化分析的重要前提。其代表是Needleman-Wunsch算法。
2024-12-20 13:26:55
501
原创 局部匹配&Smith Waterman 算法 | 生物人最值得看的哈佛生信课02
序列匹配是理解生物序列信息、揭示生物学过程和开发治疗方法的基础。当我们测序完,获得的只是一堆ACTG的字符串的组合,我们看着这一串字符,并不会直接得到新的简介。:确定一个新序列是否与数据库中的已知序列有同源关系,即它们是否来自共同的祖先。:找到与查询序列相似的序列,即使它们没有共同的祖先,这有助于发现保守区域或功能域。:通过序列匹配,可以识别属于同一基因家族的多个基因,并研究它们的共同特征。:在疾病研究中,通过序列匹配可以发现特定的生物标志物,用于诊断、预后或治疗反应的预测。使用mega11进行。
2024-12-20 09:06:17
1332
原创 fastq和fastqc测序格式介绍 | 生物专业最值得看的哈佛生信笔记01
第一代测序技术,即Sanger测序,通过在四条不同的车道上进行反应,最终确定DNA序列。目前主流的第二代测序技术,即lllumina的测序技术,通过在玻璃片上进行大规模平行测序,实现快速、高效的DNA测序。第三代测序技术,虽然目前还处于原型阶段,但具有单分子测序的潜力。字幕中还提到,第三代测序也许更好,但在需要精确计数的情况下,第二代测序更为合适。
2024-12-18 15:47:48
499
原创 Rian Doris 如何利用咖啡因快速进入“心流”
在视频中Rian Doris 认为咖啡因促进了启蒙运动、工业革命和 IT革命。新的科学研究指出,事实上,可以促进人们进入**“心流状态”“心流”**(最早由《心流》的作者米哈赖提出)指的是,你处于一种精神高度集中,专注当前任务,甚至意识不到时间流逝的状态,此时你的身心都处于最佳状态。应试教育背景下的我很早就开始喝咖啡了,最早的印象是在初中就开始了,直到现在读研了,咖啡更是我工作日的必需品。**但是不得不承认的是,没人教过我如何正确地使用咖啡因。**但是一些最近的科学研究可以促进我在这方面的认知。
2024-12-13 20:33:38
547
原创 多倍体基因组调查 | KMC+GenomeScope2 0+Smudgeplot
现在是2024.12.13,由于本人在进行基因组调查分析时,发现网上流传的大多数步骤在最后一步Smudgeplot.py plot时会报错。研究了两天之后,发现是Smudgeplot更新导致的新版本不支持旧版的语法导致的,且新版Smudgeplot不支持使用KMC的结果文件。同时Smudgeplot软件缺少相关的使用说明,作者在wiki上也没及时更新,导致对报错的勘误花费时间较长。于是就打算重新纠正一下优快云上的流程,并在一些细节的地方加以修改。多倍体基因组调查的原理部分大家可以看其他的文章。
2024-12-13 18:08:51
1543
2
原创 2024上岸|314数农备考攻略
💡 本文档是用于314数学(农)的备考指南。因为身边有很多考研的同学,因为心仪的专业院校需要考数学,同时本身数学基础不好,而望而却步。尤其是我身边生物、水产的同学,此文章的初衷是帮助大家正视314的难度,了解复习的周期和相应用到的一些资料。本人 24 年考研上岸上海海洋大学王牌专业(水产养殖),从 8 月份选定考研目标开始,总用时约 4.5 个月。总分400分,其中。建议基础不好的同学提早开始规划和看课程学习。
2024-08-05 21:50:15
3554
原创 2024上岸|鱼类增养殖学(927)129备考攻略
这里顺带一提,927的真题每年是不会公布的,所以都是回忆版,选择题肯定是想不起来的。前面也说了,真题是没有公开的,所以都是学长学姐的回忆版,网上买到手的可能准确度都七七八八吧,不过都能用。有时间精读的就精读吧,选择题考的比较细,没时间的也没办法,也不要求所有的分都拿到。问答题就像前面说的,几乎都是从旧版大纲里出的,买资料最好是有答案标注页码的,方便自己对照着看,真的方便很多。名词解释就没什么好说的,因为总的名词解释不是很多,然后每年都是来回出,师兄师姐整理好的一般都比较齐全,可以自己对照着再看一遍书。
2024-08-01 15:36:57
888
1
原创 《深度工作》| 如何在新时代保持竞争力
在工作质量和速度都达到精英层次,同样也需要深度工作,如果一个任务是刷手机、和人聊天就能完成的,而不需要去阅读专业文献、写作的,这样的任务是没有门槛的。客观来看,这是一个坏习惯,而且不利于我的知识的增长,因为正是我不会做的难题(而不是已经会的简单题目)才是我分数的增长点。客观来讲,早上9点来图书馆,晚上9点走,排除中间3小时的中晚饭,算成每天8小时的时间是合理的吗?最后,就算不认同书中的这种专注哲学,也希望作为知识工作者的你能有所启发,尝试着用新的视角来看待自己平时的工作学习,这就是我最大的荣幸了。
2024-07-30 09:36:34
359
原创 2024上岸 英语(一)86备考指南(更适合懒人宝宝的体质)
本人 24 年考研上岸上海海洋大学王牌专业(水产养殖),从 8 月份选定考研目标开始,总用时约 4.5 个月。总分400分,其中,总结出一套极简备考的方案。从英语学习的底层逻辑出发到实际应用与应试。所谓懒,也是想要聪明地偷懒。以最小的精力来获得最大的产出。我的备考思路,注重的一个是简单,一个是实用。引用b站一个up主的话来说就是“网上考研英语的教程就和造原子弹一样”。网络上的各种英语网课有的,全部从零基础开始,讲的很细枝末节;要求你每天花大量时间在英语上,而;
2024-07-24 15:17:23
1060
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人