
计算机科研
文章平均质量分 72
北岛寒沫
一生温暖纯良,不舍爱与自由
展开
-
图神经网络(GNN)入门详细介绍(2025.3.4)
用尽可能通俗易懂的方式对图神经网络(GNN)进行介绍,非常适合初学者了解GNN。原创 2025-03-04 10:59:47 · 1100 阅读 · 0 评论 -
深度学习领域的里程碑文章 Transformer 阅读详细笔记(2025.2.27 - 2025.3.3)
对 Transformer 论文的详细阅读笔记,包含文章地位、研究背景、模型架构等内容原创 2025-03-03 20:44:37 · 623 阅读 · 0 评论 -
深度学习重要论文阅读笔记 ResNet (2025.2.26)
对ResNet论文阅读的详细笔记原创 2025-02-26 15:26:08 · 930 阅读 · 0 评论 -
pip和conda常用命令 pip和conda对比 Anaconda和miniconda对比
简单介绍了Python的两款包管理工具pip和conda的常用命令和对比,以及Anaconda和Miniconda的对比原创 2024-12-25 10:32:28 · 521 阅读 · 0 评论 -
Python fastapi模块入门介绍(基本介绍 unicorn模块 异步函数 FastAPI类 SwaggerUI)
简单介绍了python中的第三方模块fastapi的使用方法,包括fastapi基本介绍、uvicorn介绍、python异步函数介绍、fastapi使用方式介绍和Swagger UI原创 2024-12-21 22:04:01 · 656 阅读 · 0 评论 -
大模型的temperature参数和top_p参数有什么用?
详细介绍了大模型中常用的temperature参数和top_p参数的作用,以及如何进行设置原创 2024-11-23 13:53:21 · 1316 阅读 · 0 评论 -
SSH公钥有什么用?Windows 11操作系统上如何获取SSH公钥
简单介绍了SSH密钥是什么(包括公钥和私钥)、有什么用,以及在Windows 11操作系统上如何获取SSH公钥原创 2024-11-19 20:38:34 · 848 阅读 · 0 评论 -
Git 修改用户名(user.name)和用户邮件地址(user.email)的方法和作用
介绍了Git如何修改用户名(user.name)和用户邮件地址(user.email),以及修改这两个属性的作用。原创 2024-11-18 21:58:45 · 2677 阅读 · 0 评论 -
SPSS 聚类结果 ANOVA表分析
文章目录基本作用分析方法基本作用ANOVA表也被称为方差分析表,是一种统计方法,用于比较两个或多个样本的平均值是否相等。在聚类分析中,可以使用ANOVA表来判断不同类别之间的平均值是否存在显著差异,从而判定不同的聚类之间是否存在显著的差异,以及同一聚类的内部的数据点是否足够接近。分析方法F值:用于判断自变量对因变量的影响程度,一般F值越大,自变量对因变量的影响越强。显著性水平(P值):一般而言某一个属性对应的P值越小,我们越能自信地认为不同簇的该属性值之间存在显著差异。当P值小于0.05时原创 2024-11-02 08:19:57 · 725 阅读 · 0 评论 -
SQL的基本语句(2024年9月最新版 入门级)
个人学习(复习)MySQL过程中的学习笔记。原创 2024-09-10 19:42:24 · 1262 阅读 · 0 评论 -
算法刷题笔记 Kruskal算法求最小生成树(详细算法介绍,详细注释C++代码实现)
一个经典的图论求最小生成树算法,给出了详细的算法介绍和C++代码实现。原创 2024-08-03 22:57:47 · 481 阅读 · 0 评论 -
2024年7月人工智能前沿
2024年7月每日的人工智能前沿新闻汇总,非常详细。原创 2024-07-26 22:13:16 · 1306 阅读 · 0 评论 -
(2024年5月17日截止)智源大模型评测结果
最新的大模型评测结果,方便选择使用哪一种大模型产品原创 2024-05-17 19:21:30 · 394 阅读 · 0 评论 -
目标检测(任务概述、机器学习时代的方法、深度学习时代的目标检测模型)
目标检测任务的概念:尝试从一张输入图像中找出感兴趣的物体所在的区域。感兴趣物体所在的区域:一般通过RoI(Region of Interest)进行表示,往往是一个包含有感兴趣的物体的水平的矩形,有时候也会是倾斜的矩形或一个表示物体轮廓线的任意几何形状。目标检测和OCR的关系:目标检测是一种常见的图像处理任务,是OCR任务的基础。目标检测技术的发展:在21世纪初,研究者们提出了很多基于机器学习的目标检测算法;十多年后,深度学习将目标检测引领向了一个新时代。目标检测方法的分类。原创 2024-04-27 22:01:23 · 1852 阅读 · 5 评论 -
前端开发学习笔记 3 (Chrome浏览器调试工具、Emmet语法、CSS复合选择器、CSS元素选择模式、CSS背景)
元素显示模式概述:元素以什么样的方式进行显示,是独占一行或一行显示多个;HTML元素标签分类:HTML标签可以分为块标签和行内标签。原创 2024-04-05 19:44:13 · 1494 阅读 · 0 评论 -
Git的简单入门使用
【代码】Git的简单入门使用。原创 2024-04-03 14:46:35 · 444 阅读 · 0 评论 -
机器翻译评价指标 BLEU分数
在机器翻译任务中,将同一个句子翻译成另外一种语言时,往往会有多个都是正确的翻译结果。因此,在构建机器翻译的评价指标时需要注意如何在有多个正确答案的情况下评价翻译结果的好坏。一个常用的传统评价指标就是BLEU分数。当机器翻译的结果与任意一个参考结果相似的话,那么就会有一个较高的BLEU分数。BLEU分数的英文全称是 Bilingual Evaluation Understudy(双语评估替补),是在2002年的一篇论文中提出的。原创 2024-03-23 16:25:50 · 1323 阅读 · 0 评论 -
字符串之间的相似度的评价指标汇总
余弦相似度是通过测量两个向量的夹角的余弦值来评估它们之间的相似性。余弦相似度的值范围在-1到1之间,值越接近1表示两个向量(即字符串)越相似。对于字符串来说,可以将它们看作字符集合或者词集合,然后计算两个集合的交集大小与并集大小的比值。Jaccard相似度的值范围在0到1之间,值越大表示两个字符串越相似。汉明距离用于衡量等长字符串之间的差异,它计算的是两个等长字符串在相同位置上不同字符的个数。与LCS类似,最长公共子串也是寻找两个字符串中都出现的字符序列,但要求这个序列在原始字符串中是连续的。原创 2024-03-21 21:26:46 · 599 阅读 · 0 评论 -
GPT系列 论文阅读笔记
关于GPT-1到3的三篇文章阅读的笔记原创 2024-03-21 21:01:50 · 729 阅读 · 0 评论 -
BERT 论文阅读笔记
BERT是在NLP领域中第一个预训练好的大型神经网络,可以通过模型微调的方式应用于后续很多下游任务中,从而避免了下游NLP应用需要单独构建一个新的神经网络进行复杂的预训练。这样既简化了下游NLP任务的模型训练,又提高了性能。原创 2024-03-21 14:42:13 · 567 阅读 · 0 评论 -
Prompt Engineering入门教学(看这一篇就够!)
大语言模型(LLM)可以划分为基础大语言模型和指令调整大语言模型两类,下面给出了这两类模型的相关概念:解释:模型幻觉是指大语言模型在生成文本时可能会产生一些与事实不符、错误或根本不存在的信息。这可能是由于模型在训练过程中学习了某些错误的模式,或者是因为模型在处理某些复杂的任务时过于依赖模式识别而忽视了事实的准确性。Prompt优化策略:解释:尽管大语言模型在文本生成和理解方面取得了很大的进展,但它们在处理复杂的数学问题,尤其是需要进行多步骤推理或符号运算的问题时,表现往往欠佳。这可能是因为这些模型主要是基于原创 2023-12-09 23:57:34 · 1915 阅读 · 0 评论 -
大语言模型Prompt设计学习记录:Magic words(魔法词)的作用
Magic words示例:“用5句话总结这篇文章”。作用:这可以帮助模型提炼出长篇内容的关键点,对于快速获取信息或复习非常有用。示例输出:“文章主要讨论了…,…,…,和…。总的来说,它的重点是…”Magic words示例:“解释一下量子力学”。作用:模型会为复杂的主题或概念提供简洁的解释,这对于快速了解新领域很有帮助。示例输出:“量子力学是研究微观粒子如电子和光子的行为的物理分支。原创 2023-12-04 14:14:27 · 1049 阅读 · 0 评论 -
大语言模型评测论文HELM阅读笔记
文章将NLP大模型的应用场景和评估方法进行了分类,选择了7个评价指标,并进行了16个核心场景、30个大语言模型的评测。:包括问答任务和数据集、信息检索任务和数据集、摘要生成任务和数据集、情感分析任务和数据集、毒性检测任务和数据集以及其他类型的文本分类任务和数据集。:参与比较的模型包括Anthropic LM(窗口很大),T5,GPT-3 davinci,清华大学的GLM和俄罗斯的YaLM等。:一般来说,模型越大效果越好;这篇文章是斯坦福大学的团队完成的一篇大语言模型的评测文章,文章的简称为HELM。原创 2023-12-01 11:34:48 · 1973 阅读 · 0 评论 -
build文件 beta版本
今天在安装Caffe2的过程中,遇到了下面的一句话:原创 2023-11-24 21:32:15 · 566 阅读 · 0 评论 -
Docker的简单介绍
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux或Windows操作系统的机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口。原创 2023-11-24 21:12:23 · 1145 阅读 · 0 评论 -
PubLayNet:电子文档元素识别的有史以来最大数据集
重要性:识别一个无结构的电子文档中的元素布局并将其转换为计算机可以理解的格式,对于下游的任务非常重要。当前的不足:现有的可以公开获得的用于深度神经网络训练的文档布局数据集都太小,使得所有处理这一类任务的模型都必须使用基于传统图像数据集训练的深度神经网络经过迁移学习获得。本文贡献:提出了一个用于文档布局分析的大型数据集,共包含有超过100万篇PDF文章,超过36万张文档页图片。这些文章中的内容与XML的表示进行了匹配。实验结果。原创 2023-11-23 19:55:25 · 2686 阅读 · 0 评论 -
Python学习过程笔记:主模块(main) 异常处理 命令行参数解析 日志记录 socket模块 类的私有方法 字节字符串
条件判断,我们可以将一些代码片段放在这个条件块内,这些代码只有在该脚本作为主程序执行时才会被执行,而在作为模块被导入时不会执行。模块是一个用于记录日志的强大工具,它提供了灵活的日志记录功能,可以帮助你在应用程序中捕获、记录和管理各种类型的日志信息。是 Python 标准库中的一个模块,用于解析命令行参数和生成用户友好的命令行界面。参数用于指定命名空间对象,如果不提供,则会创建一个新的命名空间对象。参数是一个字符串列表,用于指定要解析的命令行参数。解析命令行参数,并返回一个命名空间对象,其中包含参数的值。原创 2023-08-14 11:16:48 · 1439 阅读 · 0 评论 -
三步法 从零开始学习读论文(参考 跟李沐学AI)
无论是什么研究方向的论文,都基本上由下面六个部分组成:原创 2023-03-20 22:14:49 · 352 阅读 · 0 评论