
科研笔记与实践
文章平均质量分 93
随笔记录&知识整理
分享科研过程中的笔记和实践经验,包括机器学习、数据挖掘和密码学等领域。本专栏适合渴望将理论知识应用于实践的科研人员。
是Yu欸
这里是我读博期间的笔记本,记录学习和成长,争取顺利毕业ing
展开
-
【MM】2025投稿重点记录
摘要截止 3.11-4.4正文截止 4.12Sat Apr 12th 2025 19:59:59 CST (2025-04-11 23:59:59 UTC-12)Reproducibility companion paper submission 可重复性伴侣论文提交 4.18注意,和官网顺序不一样,把我认为的重点提前了原创 2025-03-17 17:04:36 · 4859 阅读 · 7 评论 -
【图像分类】ImageNet32 数据集下载指南
ImageNet 是一个大规模的计算机视觉数据集,广泛用于图像分类、目标检测和其他深度学习任务。由于其数据量庞大,官方提供的下载方式相对严格,本文将介绍如何正确申请并下载 ImageNet 数据集。ImageNet32 是对原始 ImageNet 数据集进行下采样得到的版本,图像尺寸为 32×32。原创 2025-03-17 17:03:41 · 1008 阅读 · 0 评论 -
【科研】11BibTool:在.bib文件中,1、去掉latex论文中没有用到的引用;2、去掉重复的引用(2025更新版)
BibTool 允许你自定义去重的规则,例如按文献的某些字段(如title或author)进行比较。在BibTool配置文件中定义规则:创建一个配置文件,例如config.btselect {上述配置将根据key和title字段来检测重复。原创 2025-01-22 17:48:21 · 1189 阅读 · 1 评论 -
【IJCAI】2025 投稿重点记录
摘要为单段简要总结,需清晰描述论文的主要论点和结论。不超过 200 字。原创 2025-01-22 17:47:11 · 3910 阅读 · 20 评论 -
【ccfddl-ICML投稿时间确认】CST是China Standard Time,不是默认的Central Standard Time。了解时区:北京时间(CST)、UTC-0 和 UTC-12
平台时间基准截止时间转换为北京时间(CST, UTC+8)CCFOpenReviewUTC-0ICML 官网UTC-12北京时间(CST, China Standard Time)是中国的标准时间,采用东八区时间,相较于协调世界时(UTC)快8小时。UTC(Coordinated Universal Time)是全球时间的基准。它没有偏移量,通常称为“零时区”或“格林尼治时间”(虽然严格来说,两者略有不同)。UTC-12 是最靠近国际日期变更线的时区之一,比协调世界时晚12小时。原创 2024-12-31 12:44:09 · 1514 阅读 · 2 评论 -
【ICML】7 开源代码与共享数据
开源代码与共享数据是现代科研的重要趋势,也是 ICML 2025 提倡的优秀实践之一。遵循匿名性要求提交资源,并在论文被接受后,及时与最终稿一起公开这些资源,能帮助提升研究的可信度与影响力。。hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家点开下面名片,添加好友交流。原创 2024-12-22 09:00:00 · 1109 阅读 · 0 评论 -
【ICML2025】6 致谢与影响声明
致谢与影响声明在 ICML 论文中承担着重要的学术交流和社会责任角色。遵守双盲审稿规则,合理撰写这些部分,可以帮助提升论文的规范性和影响力。。预祝您的研究取得成功!hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家点开下面名片,添加好友交流。原创 2024-12-21 09:00:00 · 1732 阅读 · 0 评论 -
【ICML2025】5 latex提交指南之可访问性
提升论文的可访问性不仅是对读者的尊重,更是知识传播的重要一环。ICML 2025 鼓励所有作者关注这方面的优化,在提交过程中主动设计、测试和完善论文的可访问性。hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家点开下面名片,添加好友交流。原创 2024-12-20 15:30:00 · 1829 阅读 · 0 评论 -
【ICML2025】4 latex论文格式规范全面解读
位置:位于作者地址下方 0.4 英寸处,左对齐。标题:用 11 点加粗字体,居中。正文:用 10 点字体,左右缩进各 0.25 英寸。篇幅:摘要需简洁,限制在一段内,约 4-6 句。留白:摘要正文下方需留出 0.4 英寸空白。ICML 2025 的论文格式要求严谨细致,研究者需严格遵守相关规范,以确保论文提交符合标准。。希望本文对您的投稿有所帮助,预祝投稿成功!hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家点开下面名片,添加好友交流。原创 2024-12-20 09:00:00 · 2030 阅读 · 0 评论 -
【科研】10BibTool:BibTeX文件管理与优化工具介绍
BibTool 旨在扩展 BibTeX 的功能,通过对.bib文件进行复杂的管理操作,实现如筛选引用、去重、排序、键生成、语义检查等功能,使文献管理更为便捷。BibTool 支持使用资源文件对其行为进行配置,便于自动化处理和高级操作。原创 2024-11-29 15:29:22 · 991 阅读 · 6 评论 -
【ICML2025】3指南阅读
请确保在提交时遵循所有格式和政策要求,以确保顺利通过评审并参与会议。更多信息请访问ICML 2025 官方网站。hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家点开下面名片,添加好友交流。原创 2024-11-29 15:27:56 · 2892 阅读 · 1 评论 -
【科研】9如何高效阅读和理解学术论文
阅读论文是一项需要耐心和技巧的能力。通过系统的11步方法,你可以快速抓住论文的核心内容,并评估其价值。无论是科研工作者还是技术爱好者,这套方法都可以帮助你更高效地学习和成长。希望这篇博客对你有所启发,祝你在学术阅读的旅程中越走越顺畅!hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-11-28 12:07:10 · 2012 阅读 · 0 评论 -
【ICML2025】2论文格式要求
摘要应位于左栏,从最终地址下方 0.4 英寸开始。摘要的标题“Abstract”应为 11 号加粗字体,并居中。摘要正文应为 10 号字体,行间距为 11 点,且左右两边的缩进为 0.25 英寸。摘要应简洁明了,控制在一段内,约 4-6 个句子。ICML 2025 论文的提交和格式要求非常严格,遵循这些规范对于确保顺利提交和通过审稿至关重要。务必检查您的论文格式、引用、图表和算法等部分,确保其符合上述要求,以便提高您的论文成功率。hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。原创 2024-11-28 11:56:30 · 2569 阅读 · 0 评论 -
【ICML2025】1提交指南
ICML 2025 的论文提交要求严格且详细。遵循这些格式要求将确保您的论文能够顺利提交并进入评审阶段。在提交之前,请仔细检查文档的格式、字体、图表和引用,确保它们符合 ICML 提交指南的要求。祝您的论文提交顺利,获得成功!hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-11-27 17:28:39 · 7027 阅读 · 0 评论 -
【代码优化】model.cuda() ,让模型快速起飞
是 PyTorch 中连接模型与 GPU 的关键接口。它使得模型可以利用 GPU 的强大计算能力,从而大幅提升训练和推理速度。为了充分发挥 GPU 的性能,请确保输入数据和模型都位于 GPU 上,同时合理使用多 GPU 和显存优化技术。如果在使用中遇到任何问题,欢迎留言讨论!hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-11-27 10:59:07 · 1217 阅读 · 0 评论 -
【科研】8投稿攻略:超越SOTA,优秀的Motivation是关键
Motivation 是论文中用来说明“为什么要研究这个问题”的部分。问题的重要性:为什么这个问题值得解决?现有方法的局限性:为什么现有工作无法有效解决?本文的创新点:你的方法如何弥补现有不足?简而言之,Motivation 的目标是引导读者认同你的研究方向,并对你的方法产生兴趣。Motivation 是论文的第一印象,也是评审决定是否深入阅读的重要依据。通过真实场景引入问题、指出现有工作的不足、明确创新点的贡献,并结合逻辑性和数据支持,您可以打造一篇真正打动评审的高质量论文。原创 2024-11-22 09:16:23 · 1954 阅读 · 0 评论 -
【科研】7学术论文的撰写核心:逻辑严谨与方法阐述的平衡
感谢师兄和学长的帮助,论文前后的三版本能感觉到论文的进步。特此记录过程中的感悟,方便下次论文写作时找到这种感觉。在学术论文写作中,逻辑性是文章的灵魂。论文的每个章节、段落、甚至句子,都应追求一一对应的连贯性,就像写小说一样:**前文埋下的“伏笔”必须在后文呼应**。如果前后脱节,不仅会让读者迷惑,还可能大幅降低论文的说服力。引言和方法部分是决定论文质量的核心。如何在方法阐述中实现`“简而易懂”`与`“深而扎实”`的平衡,是提升论文中稿率的关键。以下,我们将从逻辑性和方法撰写技巧两方面展开描述。原创 2024-11-22 09:07:05 · 2787 阅读 · 0 评论 -
【科研】6从零到一:全面了解学术论文写作技巧
学术论文是科研工作的重要产出,也是研究者向学术界传递创新思想和实验成果的主要方式。然而,写好一篇论文并非易事,特别是对于新手来说,可能面临逻辑混乱、语言生涩、方法描述不清等挑战。本文结合 [优快云博文](https://blog.youkuaiyun.com/qq_46675545/article/details/128879845) 和 [GitHub 项目](https://github.com/MLNLP-World/Paper-Writing-Tips) 的内容,分享一套从准备到成稿的全面写作指南,助您轻松迈原创 2024-11-21 11:31:36 · 3201 阅读 · 0 评论 -
【科研】5高效撰写学术论文:从思路到落地的实用技巧
在学术界,撰写一篇高质量的论文是研究工作的核心环节之一。然而,从灵感到成稿的过程中,许多研究者常常面临各种挑战:逻辑不清晰、表达不流畅、思路散乱等。感谢互联网的大佬们,找到了一篇很好的教学仓库,mark一下。这篇博客将结合 GitHub 上的 [Paper Writing Tips 项目]原创 2024-11-21 11:13:36 · 1534 阅读 · 0 评论 -
【Github】如何使用Git将本地项目上传到Github
通过以上步骤,你就可以轻松地将本地项目上传到Github。这不仅能帮助你备份代码,还能与他人协作开发。希望这篇教程对你有所帮助!如果有问题,欢迎留言讨论!😊hello,我是。原创 2024-11-20 12:24:34 · 2262 阅读 · 4 评论 -
【README】如何写出一份优秀的 README 文件:完整指南
在 README 的开头明确项目名称,并简要介绍项目的功能和目的,让用户快速了解项目。# 项目名称项目简介:通过 [方法/技术] 实现 [核心功能],适用于 [使用场景]。一份优秀的 README 文件不仅可以快速传达项目价值,还能大幅提升用户的使用体验和项目的曝光率。通过合理的结构设计和 SEO 优化,帮助更多用户发现和使用你的项目。快行动起来,为你的项目打造一份高质量的 README 文件吧!hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-11-20 12:12:11 · 2439 阅读 · 0 评论 -
【LaTex】14在.bib文件中,去掉latex论文中没有用到的引用(已排除错误指令)
在 Overleaf 中,虽然没有直接的功能清理.bib文件,但通过bibtool工具、手动筛选或利用本地文献管理工具,可以轻松清理未引用的条目。推荐使用bibtool自动化筛选,这样可以更高效地管理.bib文件,确保文献引用的准确性,优化文档编译的性能。对于日常编辑,Overleaf 提供了方便的在线平台,但复杂的.bib文件管理建议在本地工具中完成,然后上传至 Overleaf 项目中进行最终编译。hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-11-19 11:25:08 · 2016 阅读 · 2 评论 -
【Word】一键批量引用论文上标——将正文字体改为上标格式
最近在写开题报告,手动插入参考文献,后续将这些引用调整为上标格式好麻烦。一个个修改不仅繁琐,还容易出错。找到了一个简单高效的方法:利用 **Word 的“替换”功能**,一键实现引用批量上标!下面是具体步骤和技巧。原创 2024-11-19 11:23:41 · 2768 阅读 · 0 评论 -
【CVPR 2025】4 提交要求
所有作者都应仔细阅读以下政策,这些政策将指导提交和评审流程。如果未能遵守这些政策,可能会导致投稿被拒绝,或者在双重投稿和抄袭的情况下可能会受到额外的制裁。此外,强烈建议作者查阅道德指南、推荐的最佳实践和常见问题解答。原创 2024-10-24 10:56:40 · 3091 阅读 · 2 评论 -
【CVPR2025】3 投稿指南和论文模版
作为计算机视觉领域最具影响力的会议之一,CVPR(Conference on Computer Vision and Pattern Recognition)每年吸引着全球顶尖的研究者和开发者投稿。CVPR 2025 的论文模板有着严格的格式要求,以确保论文的规范性与一致性。本文将为大家详细介绍 CVPR 2025 论文模板的具体要求,从格式设置到提交过程中的注意事项,让您轻松掌握这一模板的要点。本文为此系列的第三篇,将展示各个投稿链接,详细可以该系列的其他文章。如有错漏,欢迎评论区指出。原创 2024-10-24 10:52:40 · 6532 阅读 · 6 评论 -
【深度学习代码调试5】标准化数据集:TensorFlow Datasets (TFDS)自动化数据加载与预处理
是一个为机器学习模型提供标准化数据集的库。它不仅支持 TensorFlow,也可以与其他框架(例如 PyTorch)一起使用。TFDS 提供了一个一致的 API 来访问广泛的标准数据集,同时支持自动下载、预处理和缓存。TFDS 的核心目标是减少数据集准备的繁琐操作,帮助用户专注于模型开发,而不是数据处理。无论是图像、文本、时间序列还是其他类型的数据,TFDS 都可以帮助快速加载和处理。extract_dir='/tmp/tfds_extract', # 数据解压路径。原创 2024-10-24 10:29:52 · 1520 阅读 · 0 评论 -
【CVPR 2025】2 论文模板引言部分详解:如何准备和提交稿件
作为计算机视觉领域最具影响力的会议之一,CVPR(Conference on Computer Vision and Pattern Recognition)每年吸引着全球顶尖的研究者和开发者投稿。CVPR 2025 的论文模板有着严格的格式要求,以确保论文的规范性与一致性。本文将为大家详细介绍 CVPR 2025 论文模板的具体要求,从格式设置到提交过程中的注意事项,让您轻松掌握这一模板的要点。本文为此系列的第二篇,将展示论文模板中的引言部分,详细可以该系列的其他文章。如有错漏,欢迎评论区指出。原创 2024-10-24 10:17:01 · 1794 阅读 · 0 评论 -
【CVPR 2025】1 论文模板中文版详细指南:从格式到提交要求
摘要标题“Abstract”应为 12 磅的 Times 粗体,并相对于列居中。摘要内容为 10 磅,单倍行距,完全对齐,位于左栏的顶部。摘要和正文之间需要留出两行空白。摘要部分的简洁和清晰是让审稿人快速了解您研究内容的关键,因此严格遵守模板要求至关重要。CVPR 2025 论文模板的格式要求非常严格,确保所有投稿的论文都有统一的外观和结构。遵循这些要求不仅能提升论文的专业度,还能减少因格式问题带来的不必要麻烦。无论是页面设置、字体选择,还是数学公式的编号与引用,所有细节都至关重要。原创 2024-10-24 10:15:47 · 6961 阅读 · 7 评论 -
【深度学习代码调试1】环境配置篇(上) -- 安装PyTorch(安利方法:移除所有国内源,使用默认源)
如果之前添加了非官方源(如清华大学镜像源),可能会导致安装冲突或失败。这将从Conda配置中移除所有自定义的频道设置,使Conda恢复为默认配置。安装深度学习框架时,常常会遇到版本不兼容、依赖库冲突等问题。通过合理选择安装源、升级相关库,通常可以解决大部分问题。希望本文的记录能帮助大家顺利完成环境配置,并避免常见的坑。hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-10-16 22:00:19 · 1767 阅读 · 0 评论 -
【深度学习代码调试2】环境配置篇(中) -- 列出conda环境中所有env的pytorch版本
通过上述步骤,您可以手动或自动检查所有 Conda 环境中的 PyTorch 版本,特别是能够重点标注的环境。这对于管理多个虚拟环境并确保某些关键版本的依赖性非常有帮助。版权声明:本文为原创,遵循协议。转载请注明出处。hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-10-16 22:00:45 · 1667 阅读 · 0 评论 -
【知识图谱】探索攻略:基础、构建、高级应用与相关论文方向
知识图谱(Knowledge Graph,简称KG)是一个旨在以结构化的形式表示知识的工具。它通过节点和边的方式将信息表示出来,节点代表实体(如人、地点、事件等),边则表示实体之间的关系。知识图谱的目的是将零散的信息组织起来,使其变得更加易于理解和利用。原创 2024-05-23 13:58:38 · 3149 阅读 · 69 评论 -
快速入门深度学习9.1(用时20min)——GRU
8节 和 9节 中,循环神经网络(recurrent neural network,`RNN`),这是⼀种利用数据中的`时间或序列结构`的模型,通常用于自然语言处理和时间序列预测。10节 中,`注意力机制`的技术,最近它们已经开始在自然语言处理中取代循环神经网络。这一部分将 帮助读者快速了解大多数现代深度学习应用背后的基本工具。原创 2024-04-14 22:23:49 · 1139 阅读 · 4 评论 -
【笔记】探索生成范式:大型语言模型在信息提取中的作用
信息抽取(Information Extraction, IE)旨在从自然语言文本中提取结构化知识,如实体、关系、事件等。随着生成式大型语言模型(Large Language Models, LLM)在文本理解和生成领域展现出卓越能力,其在跨领域和跨任务泛化中的潜力受到广泛关注。近期,众多研究致力于利用LLM的能力,为IE任务提出基于生成范式的解决方案。因此,研究计划对LLM在IE任务中的应用进行全面和系统性的回顾与探索,综述了该领域的最新进展。原创 2024-04-13 18:35:29 · 5431 阅读 · 26 评论 -
【威胁情报综述阅读3】Cyber Threat Intelligence Mining for Proactive Cybersecurity Defense
在 2020 年代 COVID 驱动的社会、经济和技术变革造成大规模破坏之后,网络安全对手已经改进了他们的交易技巧,使其变得更加复杂。一系列备受瞩目的攻击接踵而至,例如SolarWinds供应链攻击[1],它震撼了许多组织,标志着网络安全的转折点。作为收集、处理和分析有关威胁行为者动机、目标和攻击行为的信息的过程,网络威胁情报 (CTI) 帮助组织、政府和个人互联网用户做出更快、更明智、数据支持的安全决策并改变他们的行为,以对抗威胁行为者从被动到主动。CTI 有几种定义。原创 2024-04-02 15:43:46 · 6874 阅读 · 9 评论 -
四年旅程,一路成长——小雨的创作纪念日
🌈 你好呀,我是小雨,一个充满好奇心的ENFP,正在不断提升能力以满足前者。🌌 2024每日百字篆刻时光,感谢你的陪伴和支持! 🌟 争取每周二开展粉丝福利送书活动,欢迎关注 ~🚀 定期自动回三,欢迎加好友互动 ~ 私信说一下噢可在专栏中快速找到:【网络安全】AIGC最新论文、现代密码、量子通信【快速实战】Python、图像分类、文本摘要原创 2024-04-01 13:14:06 · 10908 阅读 · 120 评论 -
【LaTeX】7实现章节跳转
LaTeX 的hyperref包提供了一个强大的工具集,用于在科研文档中创建和管理超链接。通过简单的步骤,即使是科研新手也能轻松实现文档内的章节跳转,从而提升读者的阅读体验。随着你对 LaTeX 的进一步学习,你将发现更多高级功能,以支持你的科研写作需求。原创 2024-03-27 20:48:13 · 4400 阅读 · 15 评论 -
【ACL 2023-NER注入到PLM】数据集+实验解读:基于上下文学习的命名实体识别 Learning In-context Learning for Named Entity Recognitio
论文:Learning In-context Learning for Named Entity Recognition标题:基于上下文学习的命名实体识别作者:Jiawei Chen, Yaojie Lu, Hongyu Lin, Jie Lou, Wei Jia, Dai Dai, Hua Wu, Boxi Cao, Xianpei Han and Le Sun地址:[\[2305.11038\] Learning In-context Learning for Named Entity Recog原创 2024-03-21 20:04:17 · 7209 阅读 · 36 评论 -
【ACL 2023-NER注入到PLM】基于上下文学习的命名实体识别 Learning In-context Learning for Named Entity Recognition
在这个实例中,我们看到上面两个文本被作为了元函数进行训练,分别得出的函数是文本的分类为{疾病,病毒}和{电影}。下文中我们认为目标是在文本中找到有{疾病,病毒}属性的文本,最终经过PLM得出SARS-CoV-2是一种病毒. COVID-19 是一种疾病。首先我们看到,蓝色的方框中为微调过的函数,这时我们认为微调过的函数取得了最好的结果,也就是预测准确度非常高。原创 2024-03-20 12:00:45 · 7427 阅读 · 31 评论 -
【ACL 2023获奖论文】再现奖:Do CoNLL-2003 Named Entity Taggers Still Work Well in 2023?
该研究提供了对NER模型泛化能力深入的理解,特别是在长时间跨度下的性能变化。通过创建CoNLL++测试集和对多个模型的评估,揭示了时间漂移对模型性能的影响及其与过拟合无关。此外,研究还强调了模型架构、参数规模、预训练数据的时效性和微调数据量在模型泛化中的重要性。这些发现不仅为未来NER模型的开发提供了宝贵的见解,也对如何评估模型在面对新兴数据时的适应性提供了新的视角。原创 2024-03-19 15:27:58 · 10104 阅读 · 4 评论 -
一文速通半监督学习(Semi-supervised Learning):桥接有标签与无标签数据
论文看到哪学到哪 ^ - ^在机器学习的世界里,我们通常遇到这样一个现实问题:标注数据(有标签的数据)往往昂贵且难以获得,而未标注数据(无标签的数据)却大量存在,易于收集。假设你正在尝试教会计算机区分猫和狗的照片,但只有少数照片是打上了“猫”或“狗”的标签,大部分照片都没有标签。这时候,半监督学习就闪亮登场了,它是一种使用大量未标注数据和少量标注数据进行学习的方法,旨在提高学习效率和准确性。原创 2024-03-18 21:16:36 · 6325 阅读 · 26 评论