- 博客(43)
- 资源 (3)
- 收藏
- 关注

原创 视觉显著性预测模型与GitHub代码仓库综合列表
每个GitHub链接包含相应模型的实现。这些仓库通常包括额外资源,如预训练模型、数据集和使用说明。: 克隆GitHub仓库以实验模型。这种实践方法可以加深您对视觉显著性预测技术的理解。: 提供的论文标题未包含直接链接。如需访问完整论文,建议在。或相关学术期刊上搜索论文标题。
2025-01-02 00:57:50
1426
原创 自然语言处理(NLP)核心技术深度解析
基于Transformer Encoder堆叠(如BERT-base:12层,768隐层维度)。:BERT(掩码填充)、NAT(Non-Autoregressive Transformers)。:将词汇映射到低维连续向量空间,捕捉语义和语法关系。:使用[S]和[/S]标记片段边界,强化位置感知。:传统RNN编码器-解码器存在长程信息丢失。:解码时动态加权编码器隐状态,聚焦关键信息。:根据上下文生成词向量,解决多义词问题。:并行多个注意力头,捕获不同子空间特征。:各头独立计算后拼接,通过线性层融合。
2025-03-16 11:22:11
1012
原创 Transformer 架构深度剖析
Transformer 由编码器(Encoder)和解码器(Decoder)堆叠而成,每个层包含:关键特性:完全基于注意力机制,摒弃了循环和卷积结构,实现并行化处理序列数据。自注意力通过 Query-Key-Value(QKV) 三元组计算元素间依赖关系:Attention(Q,K,V)=softmax(QKTdk)VAttention(Q, K, V) = softmax\left(\frac{QK^T}{\sqrt{d_k}}\right)VAttention(Q,K,V)=softmax(dk
2025-03-16 11:15:34
786
原创 大模型核心知识点体系详解
自注意力机制(Self-Attention)、位置编码、多头注意力。将参数拆分到多个设备(如Megatron-LM的Tensor并行)。:改进Adam的权重衰减分离,避免参数更新与权重衰减耦合。利用数据自身构造监督信号(如BERT的掩码语言建模)。:仅保留符号函数(sign)更新参数,降低内存占用。模型复杂度与训练数据量的平衡(奥卡姆剃刀原理)。通过概率分布描述数据生成过程(如贝叶斯网络)。基于标注数据的模型训练(如分类、回归)。无标注数据下的模式发现(如聚类、降维)。
2025-03-16 11:07:29
502
原创 大模型架构全景解析:从Transformer到未来计算范式
通过以上架构创新,大模型在生成质量、推理效率和跨任务泛化能力上持续突破,未来将形成“基础架构统一化(如 RetNet)+ 应用架构场景化”的生态格局。
2025-03-15 09:23:43
756
原创 Conda 环境迁移指南
现象 :Linux打包环境无法在Windows使用。步骤1:确定Conda安装路径。步骤1:生成环境配置文件。步骤2:补充pip依赖。
2025-03-14 15:38:48
437
原创 神经网络微调技术解析
微调(Fine-tuning)是迁移学习的核心技术,通过在预训练模型基础上调整参数,使其适应特定任务或领域。以下从传统方法、参数高效微调(PEFT)、新兴技术三个维度展开,覆盖主流技术及其应用场景。
2025-03-14 14:42:10
828
1
原创 大模型高效优化技术全景解析:微调、量化、剪枝、梯度裁剪与蒸馏
量化与剪枝:硬件友好的压缩方案,推动边缘端部署。蒸馏与微调:知识传递的核心手段,保障小模型性能。梯度裁剪:大模型训练的必备稳定器。
2025-03-14 14:36:01
1422
原创 主流开源大模型能力对比矩阵
fill:#333;color:#333;color:#333;fill:none;中文优先代码开发移动部署多语言支持使用场景需求特征+安全模块+业务知识库。
2025-03-14 09:16:32
494
原创 IPC 机制详解(Inter-Process Communication)
【代码】IPC 机制详解(Inter-Process Communication)
2025-03-14 09:11:27
852
原创 线程和进程的区别
进程是「独立公司」:成本高、隔离好,适合强独立性任务(如不同软件)。线程是「公司员工」:成本低、协作快,适合高频交互任务(如游戏、下载)。
2025-03-14 09:05:09
240
原创 2024大模型技术全景解构:从开源生态到商业落地的深度博弈
技术多元化:从纯文本向多模态(视频/语音)扩展部署轻量化:移动端模型(Phi-3)与量化技术普及生态竞争:巨头通过开源抢占开发者生态(如Meta、阿里)合规挑战:数据版权、模型备案成为关键限制因素开发者建议通用场景优先选择Qwen/LLaMA系列移动端部署考虑Phi-3商用需重点关注Apache/MIT协议模型。
2025-02-23 08:45:04
938
原创 Python与Anaconda在CUDA环境中的角色解析
cudatoolkit | 11.8.0 | 无直接依赖 | 驱动 ≥ 520.00 || 包名 | 版本 | 依赖Python版本 | 兼容CUDA版本 |
2025-02-20 20:15:46
328
原创 避免CUDA兼容性问题:全面了解nvcc与显卡驱动的协同工作机制
显卡驱动是 GPU 运行的基础,决定了可用的 CUDA 版本上限。nvcc 是 CUDA 开发的工具链组件,依赖驱动提供的运行时环境。版本对齐是避免兼容性问题的关键。安装对应版本的 CUDA Toolkit(或通过 conda 安装 cudatoolkit)
2025-02-20 15:45:44
1144
原创 深度学习工厂的蓝图:拆解CUDA驱动、PyTorch与OpenCV的依赖关系
按照正确的安装顺序配置这些工具,可以确保整个工厂(深度学习环境)高效运转,充分利用 GPU 的并行计算能力,完成复杂的深度学习和计算机视觉任务。
2025-02-20 15:29:58
1167
原创 Windows 电脑搭建FTP服务器详细教程 - 局域网文件共享方案
在局域网环境中搭建FTP服务器,可以实现快速、稳定的文件共享。本教程将详细演示Windows系统自带的IIS服务搭建FTP服务器的完整流程。
2025-02-20 14:51:01
604
原创 本地部署 DeepSeek 和 RAGFlow,结合 Embedding 模型,构建个人知识库
通过本地部署 DeepSeek 和 RAGFlow,结合 Embedding 模型构建个人知识库。
2025-02-19 13:56:36
1192
原创 【手把手教程】PyCharm本地部署阿里Qwen2.5-VL:零基础玩转顶级AI视觉模型
阿里云开源的凭借其强大的图像理解、文本识别和复杂布局解析能力,已成为AI视觉领域的明星模型。本文教你用PyCharm实现本地部署,,小白也能轻松搞定!
2025-02-19 13:24:48
786
2
原创 全网最全!腾讯云DeepSeek大模型API接入实战(附CherryStudio可视化调试指南)
《三步玩转国产大模型!腾讯云DeepSeek API接入+可视化开发全攻略》
2025-02-19 10:19:53
1003
原创 Docker 配置
使用 docker pull 命令拉取你选择的 TensorFlow 镜像。例如:拉取 TensorFlow 1.15.0 GPU 版本。如果你想使用 TensorFlow 1.x 并且支持 GPU,可以选择标签 1.15.0-gpu。如果你想使用 TensorFlow 2.x 并且支持 GPU,可以选择标签 2.10.0-gpu。根据你的需求,选择合适的镜像版本和变体。
2025-01-07 16:14:18
456
原创 jupyter打包文件夹并生成下载链接
该代码示例展示了如何将一个文件夹打包为.tar.gz格式,并生成一个下载链接,供用户在 Jupyter Notebook 中下载文件。
2025-01-02 16:02:58
178
原创 Docker 快速入门:常用命令与操作指南
IMAGE: 镜像名COMMAND: 可选的命令OPTIONS: 可选的运行选项,如 -d(后台运行)、-p(映射端口)等。docker ps。
2025-01-02 15:36:54
135
原创 清华镜像安装 Jupyter 并一键启动外网访问
首先,在安装 Jupyter 之前,建议将 pip 配置为使用清华大学的镜像源,这样可以加速 Python 包的下载速度。这将在用户的家目录下生成一个 .jupyter 文件夹,其中包含 jupyter_notebook_config.py 配置文件。然后在本地浏览器中访问 http://localhost:8888,即可安全地访问远程的 Jupyter Notebook。默认情况下,Jupyter Notebook 只能在本地访问,我们需要将其配置为可以从外网访问。
2025-01-01 23:44:36
1972
原创 Docker 安装与常用命令
nvtop是一个用于监控 NVIDIA GPU 性能的命令行工具,类似于 Linux 中的top命令。GPU 使用率显存使用情况温度电源消耗每个进程的 GPU 负载。
2025-01-01 23:30:58
356
原创 Contextual Encoder-Decoder Network for Visual Saliency Prediction 代码复现
您遇到的错误主要是由于 Python 3.5 版本过旧,导致某些现代库(如certifi和requests)使用了在 Python 3.6 及以上版本中引入的功能(例如。
2025-01-01 23:07:39
705
原创 数据包传输的详细过程
1、ip地址和tcp端口在传输数据中的作用ip address:告诉了数据包将要被传输到哪儿去。tcp port:告诉数据报 将传输到哪个应用程序。二、怎么抓包(1)设置“捕获过滤”:在 Capture Filter 中填写IP.Addr==192.168.14.115(2)开始抓包;(3)在 DOS 下执行 PING 命令;ping www.baidu.com(4)停止抓包。(5)设置“显示过滤”: IP.Addr==192.168.14.115使用tracert 192.168.
2021-05-02 15:19:59
2148
原创 计算机网络是怎么实现数据的稳定性传输的?
一、四层网络结构1、任何的应用都希望自己发送的消息能够准确无误的进行交付,为了保证数据的准确性,任何丢失的或者损害的数据都将会重新传送,知道数据正确为止。2、互联网由终端主机、路由器和链接组成,数据通过链接逐跳传送数据包来实现,数据由数据包和标头组成。数据包:包含从哪儿来到哪儿去。网络层将数据包交付给链路层,链路层将数据包传送给路由器,路由器中的链路层将数据包交给网络层,网络层将检查数据包的目标地址,然后由链路层再次进行传送。二、tcp和udptcp和udp都是数据传输协议,为了保证数据的
2021-05-02 09:17:35
1373
原创 解决mybatis中的属性名和数据库中的字段名不一致的问题
方案一:为列名指定别名 , 别名和java实体类的属性名一致 .<select id="selectUserById" resultType="User"> select id , name , pwd as password from user where id = #{id}</select>方案二:使用结果集映射->ResultMap 【推荐】<resultMap id="UserMap" type="User"> <!-- id为主
2020-05-31 18:57:32
749
原创 ssm整第一阶段
一、建立数据库表CREATE DATABASE ssmbuild;USE ssmbuild;CREATE TABLE `books` (`bookID` INT(10) NOT NULL AUTO_INCREMENT COMMENT '书id',`bookName` VARCHAR(100) NOT NULL COMMENT '书名',`bookCounts` INT(11) NOT NULL COMMENT '数量',`detail` VARCHAR(200) NOT NULL COMME
2020-05-26 23:16:18
342
原创 json对象与JavaBean对象的转换
fastjson.jar是阿里开发的一款专门用于Java开发的包,可以方便的实现json对象与JavaBean对象的转换,实现JavaBean对象与json字符串的转换,实现json对象与json字符串的转换astjson 的 pom依赖!<dependency> <groupId>com.alibaba</groupId> <artifactId>fastjson</artifactId> <version>1.
2020-05-26 19:49:44
503
原创 解决json出现的乱码问题
我们可以在springmvc的配置文件(resource中的spring-servlet.xml)上添加一段消息StringHttpMessageConverter转换配置!<mvc:annotation-driven> <mvc:message-converters register-defaults="true"> <bean class="org.springframework.http.converter.StringHttpMessageConv
2020-05-26 19:48:29
2305
note_03_svn命令.txt
2020-03-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人