
科研经验
文章平均质量分 74
Jurio.21
自爱,沉稳,而后爱人。
展开
-
【论文笔记】Transformer^2: 自适应大型语言模型
自适应大型语言模型(LLMs)旨在解决传统微调方法的挑战,这些方法通常计算密集且难以处理多样化的任务。本文介绍了Transformer²(Transformer-Squared),一种新颖的自适应框架,通过在推理时选择性地调整权重矩阵的单个奇异分量来实时适应未见过的任务。Transformer²在参数数量较少且效率更高的情况下,持续优于LoRA等常用方法。此外,Transformer²在不同LLM架构和模态(包括视觉语言任务)中表现出色,代表了自适应LLMs的重大进步。原创 2025-02-17 17:53:43 · 626 阅读 · 0 评论 -
【论文笔记】Are Self-Attentions Effective for Time Series Forecasting? (NeurIPS 2024)
时间序列预测在多领域极为关键,Transformer 虽推进了该领域发展,但有效性尚存争议,有研究表明简单线性模型有时表现更优。本文聚焦于自注意力机制在时间序列预测中的作用,提出仅用交叉注意力的 CATS 架构。它摒弃自注意力,利用交叉注意力并设置未来视野依赖参数为查询及增强参数共享,提升了长期预测精度,还减少了参数和内存使用。多数据集实验显示,CATS 模型均方误差最低且参数更少。原创 2025-02-10 17:59:58 · 1368 阅读 · 0 评论 -
免费开源!DeepSeek深度使用手册:从入门到精通的AI增效之道
DeepSeek 是一款专为提升用户学习与工作效率而设计的智能助手,凭借先进的人工智能技术,它能够快速、精准地处理复杂任务,成为用户日常工作和学习的得力伙伴。DeepSeek 不仅是一个工具,更是一种生产力的革新,致力于让每一位用户在学习和工作中事半功倍,轻松应对挑战。,目录虽只有三个板块,内容却足足有104页,手把手教你成为灵活使用大语言模型的AI专家!「分析我上传的课程表,结合下周考试安排,生成复习计划表(每天不超过4小时)」在信息爆炸的时代,DeepSeek作为国内领先的AI助手,专为。原创 2025-02-10 15:30:00 · 1114 阅读 · 0 评论 -
dandi download下载数据时报错:Error: ‘gbk‘ codec can‘t encode character ‘\u2212‘ in position 5273...
当使用命令行工具如`dandi download`下载数据时遇到`“'gbk' codec can't encode character '\u2212' in position 5273: illegal multibyte sequence”`这样的错误时,这通常意味着系统的默认编码是GBK,而尝试下载进行处理的文本中包含了GBK编码无法表示的字符。此时,需要在命令行里将编码更改为`UTF-8`原创 2024-12-09 15:30:41 · 401 阅读 · 1 评论 -
使用 PyTorch 库来检查 CUDA 是否可用以及 GPU 数量等信息
使用 PyTorch 库来:检查 CUDA 是否可用,GPU 数量,以及 GPU 的详细信息原创 2024-11-24 09:00:00 · 1366 阅读 · 0 评论 -
nohup 挂载程序在后台运行
**`nohup` 命令在 Linux 系统中用于运行某个命令或程序,使其在用户注销或关闭终端后继续运行**。这个命令的名称来自 "no hang up" 的缩写,意味着 "不挂断"。当你使用 `nohup` 命令时,标准输出和标准错误通常会被重定向到 `nohup.out` 文件中,除非你指定了其他的输出文件。原创 2024-11-24 09:00:00 · 379 阅读 · 0 评论 -
import torch 报错 ModuleNotFoundError: No module named ‘typing_extensions’
解决 import torch 报错 ModuleNotFoundError: No module named 'typing_extensions’原创 2024-11-23 09:00:00 · 494 阅读 · 0 评论 -
快速安装GPU版PyTorch(清华源)
使用清华源快速安装GPU版PyTorch原创 2024-11-22 09:00:00 · 2329 阅读 · 2 评论 -
【Python】几种常用的方法来安装和管理python库依赖
在 Python 开发中,有几种常用的方法来安装和管理库依赖,包括 `requirements.txt`、`environment.yml` 和 `setup.py`。每种方法都有其特定的用途和场景:原创 2024-11-22 09:00:00 · 980 阅读 · 0 评论 -
Conda 管理项目环境
Conda 是一个开源的包管理系统和环境管理系统,它主要用于安装和管理软件包和创建、管理不同版本的环境。以下是一些基本的命令和步骤,用于使用 Conda 管理项目环境:原创 2024-11-21 22:32:09 · 607 阅读 · 0 评论 -
通过huggingface-cli下载Hugging Face上的公开数据集或模型至本地
通过huggingface-cli下载Hugging Face上的公开数据集或模型至本地原创 2024-11-20 20:04:47 · 734 阅读 · 0 评论 -
【Python绘图】两种绘制混淆矩阵的方式 (ConfusionMatrixDisplay(), imshow()) 以及两种好看的colorbar
在机器学习领域,混淆矩阵是一个评估分类模型性能的重要工具。它不仅展示了模型预测的准确性,还揭示了模型在不同类别上的表现。本文介绍两种在Python中绘制混淆矩阵的方法:ConfusionMatrixDisplay() 和 imshow(),以及两种好看的colorbar:coolwarm_r,GnBu, 以增强可视化效果。原创 2024-11-18 20:13:01 · 2302 阅读 · 0 评论 -
huggingface-cli : 无法将“huggingface-cli”项识别为 cmdlet、函数、脚本文件或可运行程序的名称
huggingface-cli 是 Hugging Face 官方提供的命令行工具,它可以帮助用户方便地与 Hugging Face Hub 交互。通过这个工具,用户可以执行多种操作,包括模型和数据集的上传和下载等。原创 2024-11-16 14:31:41 · 1140 阅读 · 2 评论 -
解决安装GPU版PyTorch报错:cuda 11.7.* , which does not exist (perhaps a missing channel)
为了安装特定版本的 CUDA,需要确保已经添加了提供该版本的通道。解决安装GPU版PyTorch报错:cuda 11.7.* , which does not exist (perhaps a missing channel)原创 2024-09-18 14:21:37 · 1210 阅读 · 0 评论 -
解决Linux服务器 shell 上下左右键出现乱码^[[D ^[[C ^[[A ^[[B
解决Linux服务器 shell 上下左右键出现乱码^[[D ^[[C ^[[A ^[[B 的问题原创 2024-09-16 13:01:24 · 465 阅读 · 0 评论 -
Linux服务器配合Xshell+Tensorboard实现深度学习训练过程可视化
在深度学习领域,监控模型的训练过程是非常重要的。TensorBoard 是 TensorFlow 提供的一个可视化工具,可以帮助我们直观地理解模型的训练和验证过程。本文将介绍如何在 Linux 服务器上使用 Xshell 远程连接服务器,并配合 TensorBoard 实现深度学习训练过程的可视化。原创 2024-09-15 15:03:37 · 678 阅读 · 0 评论 -
pip install速度太慢的多种解决方案
在使用 Python 进行开发时,我们经常需要使用 pip 来安装第三方库。然而,由于 pip 默认使用 PyPI 的国外服务器,国内用户在下载时常常会遇到速度慢的问题。以下是一些解决方案,可以帮助你加速 pip install 的过程。原创 2024-09-06 17:27:07 · 20845 阅读 · 1 评论 -
解决VPN代理下git clone报错:fatal: unable to access ‘xxx‘: OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno 0
解决VPN代理下git clone报错:fatal: unable to access 'xxx': OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno 0原创 2024-09-05 16:32:52 · 1797 阅读 · 1 评论 -
Latent Factor Analysis via Dynamical Systems:LFADS (Nature methods 2018)
Latent Factor Analysis via Dynamical Systems:LFADS (Nature methods 2018)论文阅读笔记原创 2024-07-26 18:02:24 · 1158 阅读 · 0 评论 -
LaTex:章节不编号且加入自动生成目录
默认情况下只有`\section{title}`生成的章节会被自动加入目录中,单纯`\section*{title}`语句生成的章节不会被加入目录。需要在后面加一个强制添加目录的语句`\addcontentsline{toc}{section}{title}`,且必须出现在章节标题命令之后原创 2024-07-23 09:00:00 · 1223 阅读 · 0 评论 -
STNDT: Modeling Neural Population Activity (NeurIPS 2022)
SpatioTemporal Neural Data Transformer (STNDT) 基于NDT的架构,显式地建模群体中单个神经元跨时间和空间的响应,以揭示其潜在的放电率。原创 2024-07-21 15:34:09 · 882 阅读 · 0 评论 -
KAN: Kolmogorov-Arnold Networks (arXiv 2024)
【KAN原论文阅读笔记】受Kolmogorov-Arnold表示定理的启发,作者提出Kolmogorov-Arnold Networks(KAN)作为多层感知器(MLPs)的有前途的替代方案。MLP 在节点(“神经元”)上具有固定的激活函数,但 KAN 在边缘(“权重”)上具有可学习的激活函数。KAN 没有线性权重:每个权重参数都被参数化为一个样条线的单变量函数。作者发现,这个看似简单的变化使得 KAN 在准确性和可解释性方面优于 MLP。原创 2024-07-10 20:21:06 · 2571 阅读 · 2 评论 -
解决AS安装报错:Google APIs Intel x86_64 Atom System Image and 6 more SDK components were not installed
Android Studio安装运行报错:Google APIs Intel x86_64 Atom System Image and 6 more SDK components were not installed的解决方案原创 2024-06-06 14:45:23 · 4958 阅读 · 1 评论 -
解决Gradle报错:Plugin [id: ‘com.android.application‘, version: ‘x.x.x‘, apply: false] was not found
【亲测可行!】解决Gradle报错:Plugin [id: ‘com.android.application‘, version: ‘x.x.x‘, apply: false] was not found原创 2024-06-06 14:45:49 · 27050 阅读 · 41 评论 -
Android Studio 的中文汉化教程
Android Studio 中文汉化教程:最新的Android Studio是23年3月版,所以这里下载的IntelliJ IDEA Ultimate的23年版中文语言包,版本号:`233.199`,兼容性范围:2023.3 — 2023.3.6原创 2024-06-05 17:35:25 · 53227 阅读 · 21 评论 -
安装Android Studio报错unable to access android sdk add-on list的解决方案
安装Android Studio报错unable to access android sdk add-on list的解决方案原创 2024-06-04 15:09:16 · 5641 阅读 · 6 评论 -
tensorboard可视化多个events
在使用tensorboard可视化网络参数时,当因多次训练产生多个events文件后,在tensorboard上显示会非常混乱。文章解决如何在一个tensorboard界面显示多个events文件。原创 2024-05-22 08:00:00 · 1079 阅读 · 0 评论 -
Linux服务器安装Anaconda并运行Python程序
本文介绍Linux服务器安装Anaconda并运行Python程序的全部详细步骤,亲测可行!同时记录了本人在配置环境过程中遇到的一些问题。原创 2024-04-29 17:16:49 · 4242 阅读 · 0 评论 -
解决Pytorch的cuDNN error: CUDNN_STATUS_NOT_INITIALIZED
解决Pytorch的cuDNN error: CUDNN_STATUS_NOT_INITIALIZED,总结四种可能原因及解决方法和链接原创 2024-04-28 19:07:48 · 4924 阅读 · 0 评论 -
ImportError: cannot import name ‘ParamSpec‘ from ‘typing_extensions‘
解决加载torch报错:ImportError: cannot import name 'ParamSpec' from 'typing_extensions'原创 2024-01-29 15:52:11 · 1334 阅读 · 0 评论 -
场景识别与词袋模型
本报告的主题是图像识别,旨在实现输入多个具有label的不同场景的图片,通过Tiny images representation或者特征词袋表示结合最近邻分类器预测给定测试集图片的类别结果以及分类准确率。原创 2024-01-05 15:56:41 · 1180 阅读 · 0 评论 -
UI演示双视图立体匹配与重建
详细介绍自定义设计的UI演示双视图立体匹配与重建的过程和结果。包括SAD、SSD、NCC等匹配方法的介绍,以及通过实例对比不同方法的性能。最后附上了可以获取所有代码的GitHub链接。原创 2023-12-29 14:27:03 · 1476 阅读 · 0 评论 -
基于PyQt5自定义UI的详细教程
基于PyQt5自定义UI的详细教程!!!按步骤详解自定义,附全代码!原创 2023-12-29 11:07:41 · 2291 阅读 · 0 评论 -
PyCharm安装GitHub Copilot(最好用的AI编程插件之一,高校认证免费使用)
GitHub Copilot简介以及PyCharm安装Copilot的详细图文教程原创 2023-12-25 16:30:59 · 37985 阅读 · 19 评论 -
Qt designer设计UI实例:双视图立体匹配与重建的可视化UI
Qt designer设计UI实例:双视图立体匹配与重建的可视化UI。有基本的交互界面供用户选择立体匹配算法以及输入的图片,每种立体匹配方法所用的时间以及图片大小信息出来,可视化重建的结果,如点云,深度图,视差图等,可以使用Meshlab 软件或者Open3D 进行可视化。原创 2023-12-25 15:55:08 · 2105 阅读 · 1 评论 -
Qt designer界面和所有组件功能的详细介绍(全!!!)
最完整的Qt designer界面和所有组件功能的详细介绍原创 2023-12-24 22:10:34 · 12645 阅读 · 2 评论 -
PyQt5和Qt designer的详细安装教程
详细介绍了PyQt5和Qt designer的安装教程,其中包括二者的简介、工作流程,然后按步骤讲解Anaconda下创建虚拟环境以及安装PyQt5和Qt designer的流程,最后提供检验是否安装成功的方法。原创 2023-12-24 19:55:34 · 5484 阅读 · 4 评论 -
LaTex 数学公式:单个编号连等式
LaTex 数学公式:单个编号连等式详解原创 2023-12-07 14:44:35 · 1010 阅读 · 0 评论 -
LaTex 空行
LaTex 如何添加空行原创 2023-11-20 18:54:11 · 1902 阅读 · 0 评论 -
LaTex 使用颜色突出文中链接或引用
LaTex 使用颜色突出文中链接或引用原创 2023-11-20 18:48:30 · 690 阅读 · 0 评论