自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(89)
  • 收藏
  • 关注

原创 深度学习-自监督学习总结

深度学习-自监督学习总结

2025-02-28 12:21:44 1012

原创 机器学习-无监督学习总结

机器学习-无监督学习总结

2025-02-28 12:16:50 811

原创 DeepSeek服务繁忙的一种方案-硅基流动免费增送2000 万 Tokens

DeepSeek服务繁忙的一种方案-硅基流动免费增送2000 万 Tokens

2025-02-25 20:24:12 189

原创 DeepSeek R1 训练策略4个阶段解析

DeepSeek R1 训练策略4个阶段解析

2025-02-25 20:09:41 1873

原创 AIGC领域介绍

AIGC领域介绍

2025-02-24 14:08:03 927

原创 AIGC-Stable Diffusion模型介绍

AIGC-Stable Diffusion模型介绍

2025-02-23 19:41:28 704

原创 AIGC-LLAMA模型介绍

AIGC-LLAMA模型介绍

2025-02-23 19:37:30 640

原创 Windows11 系统记事本默认加载之前文本内容的问题解决方法

Windows11 系统记事本默认加载之前文本内容的问题解决方法

2025-02-19 09:41:14 509

原创 NLP基础-人工评估(Human Evaluation)

NLP基础-人工评估(Human Evaluation)

2025-02-17 14:11:58 1045

原创 Xshell 或 XFTP 无响应打不开的解决方法

Xshell 或 XFTP 无响应打不开的解决方法

2025-02-17 14:02:25 2380 2

原创 开源代码寻找平台总结

开源代码平台总结

2024-12-26 14:53:02 473

原创 常见LLM大模型总结

常见LLM大模型总结

2024-12-26 14:45:32 488

原创 NLP基础知识 - 向量化

NLP基础知识 - 向量化

2024-12-26 14:33:57 814

原创 NLP领域重要期刊汇总

NLP领域重要期刊汇总

2024-12-15 17:51:52 1660

原创 Temporal Convolutional Network (TCN) 实现与讲解

Temporal Convolutional Network (TCN) 实现与讲解

2024-12-15 17:47:28 667

原创 NLP领域重要会议及CCF等级

NLP领域重要会议及CCF等级

2024-12-15 17:40:42 3132 1

原创 数据类型转换在自然语言处理中的应用

NLP数据类型转换

2024-12-08 14:33:35 604

原创 NLP-实体识别

NLP-实体识别

2024-12-08 14:19:56 1448

原创 自然语言处理与人工智能

自然语言处理与人工智能

2024-12-08 14:16:35 1226

原创 NLP-语料库的相关知识整理

语料库的相关知识整理

2024-12-02 13:40:20 931

原创 NLP 相关知识的构成

NLP相关知识的构成

2024-12-02 11:13:11 1275

原创 NLP 的发展历程

NLP的发展历程

2024-12-01 15:15:11 1396

原创 NLP 的研究任务

NLP的研究任务

2024-12-01 15:09:54 1133

原创 自然语言处理基础概念

自然语言处理基础概念

2024-12-01 15:05:52 943

原创 图论基础知识

图论基础知识

2024-11-25 11:15:29 953

原创 机器学习-----变色龙算法(Chameleon Algorithm)

机器学习-----变色龙算法(Chameleon Algorithm)

2024-11-25 11:09:49 599

原创 全卷积网络(Fully Convolutional Networks, FCN)

全卷积网络

2024-11-24 19:46:01 803

原创 行人重识别(Person Re-Identification, Re-ID)

行人重识别(Person Re-Identification, Re-ID)

2024-11-24 19:42:32 2147 1

原创 Leetcode刷题6--- Z 字形变换

Leetcode刷题6--Z字形变换

2024-11-24 19:33:53 594

原创 Leetcode刷题5--- 最长回文子串 Python

Leetcode刷题5--- 最长回文子串 Python

2024-11-24 19:22:55 597

原创 SLAM 模型与算法概述

SLAM 模型与算法概述

2024-11-24 19:04:31 2317

原创 图像分类经典模型与代码

计算机视觉经典模型和代码

2024-11-23 16:04:44 1241

原创 计算机视觉领域的基础知识

计算机视觉的基础知识

2024-11-23 15:56:38 975

原创 PIL库图像压缩教程

PIL库图像压缩教程

2024-09-03 18:37:12 824

原创 深度学习-VGG16原理和代码详解

深度学习-VGG16原理和代码详解

2024-09-01 10:01:58 1120

原创 大模型评估基准(Benchmark)概述

大模型评估基准概述

2024-08-31 19:09:31 1792

原创 MySQL数据库和数据表操作教程

MySQL数据库教程

2024-08-30 18:21:01 668

原创 C++实现的购物小程序

C++实现的购物小程序

2024-08-29 20:11:56 814

原创 C++实现的电路逻辑模拟

C++实现的电路逻辑模拟

2024-08-29 20:02:13 957

原创 C++实现的活动安排问题

C++实现的活动安排问题

2024-08-28 20:06:18 655

深度学习领域的DeepSeek R1模型:四阶段训练策略详解及其应用优化

内容概要:本文详细介绍了DeepSeek R1的人工智能训练策略,旨在优化模型在推理、生成以及对齐方面的性能。全文共分四大部分阐述不同训练阶段的特点与目的。首先是冷启动监督微调(SFT),使用高质量数据如长链思考(CoT)资料初始化模型的基础推理和语言处理技能,并防止因直接进行强化学习所引发的问题。其次,在已有推理能力基础上实施针对推理优化的强化学习(RL),强调多步逻辑推理的改进,降低幻觉几率并确保响应的一致性。再次是运用拒绝采样的方式筛选优质答案用于二次SFT训练,从而扩展模型处理多样文本的能力同时维持良好的通用性能。最后执行全面情景覆盖的再一轮RL,全面提升包括但不限于写作和交谈等在内的各项业务技能,调整模型的行为更加贴合人性化的期望。 适合人群:深度学习研究者、NLP工程师及其他对先进AI模型训练技术感兴趣的从业人员或学术界人士。 使用场景及目标:本文提供的训练方法可用于改善现有机器学习系统尤其是那些需要处理复杂自然语言任务的应用程序的表现,比如自动客服系统或者智能助理的设计开发者们可借鉴这些先进的训练手段。 其他说明:本文着重于各训练步骤之间的内在联系及其具体实现效果,并非单纯介绍理论概念而是结合了实际操作经验来进行剖析,对于想要深入理解如何通过精准有效的训练计划打造出高性能语言模型的技术人员来说非常有价值。

2025-02-25

基于MATLAB的图像处理教程

基于MATLAB的图像处理教程

2025-02-23

C++图书管理系统-经典框架实现

C++图书管理系统-经典框架实现

2025-02-17

大模型相关教程、调用、使用技巧

大模型相关教程、调用、使用技巧

2024-07-22

AI绘画Stable Diffusion、Midjourney、DALL2等AI绘画基础知识

AI绘画Stable Diffusion、Midjourney、DALL2等AI绘画基础知识

2024-07-22

狗狗图像分类数据集10分类

这个数据集包含了10种不同狗品种的图像集合,经过精心收集和组织,以便于进行各种计算机视觉任务,如图像分类和物体检测。数据集包括以下品种: 金毛猎犬 德国牧羊犬 拉布拉多猎犬 牛头梗 比格犬 标准贵宾犬 罗威纳犬 约克夏梗 拳师犬 达克斯猎犬

2024-07-22

Matlab实现SVM算法教程

Matlab实现SVM算法教程

2024-07-22

Delphi基础语法教程

Delphi基础语法教程

2024-07-22

Kotlin语言基础教程

Kotlin语言基础教程

2024-07-22

Ruby语言基础语法教程

Ruby语言基础语法教程

2024-07-22

Go语言任务管理系统项目

环境依赖构建 Go:安装 Go 1.x 版本。 数据库:安装 PostgreSQL。 数据库连接:配置数据库连接信息,connStr 变量中填写相应的数据库信息。 Go 依赖:安装必要的 Go 包

2024-07-22

PHP任务管理系统项目代码

环境依赖构建 Web 服务器:安装 Apache 或 Nginx。 PHP:安装 PHP 7.x 或更高版本。 数据库:安装 MySQL 或 MariaDB。 数据库连接:配置数据库连接信息

2024-07-22

美赛教程和经验总结,写作经验

美赛教程和经验总结,写作经验

2024-07-22

爬取目标网站的新闻标题和链接并将爬取的数据保存为CSV文件

技术栈: 编程语言:Python 请求库:requests 解析库:BeautifulSoup(HTML解析),lxml(更高效的解析) 存储:pandas(数据框架),sqlite3(数据库),csv(CSV文件)

2024-07-22

Python实现的管理系统源码

1.功能要求 用户管理: 添加用户:用户通过表单提交姓名和邮箱来添加新用户。 删除用户:用户可以删除已有用户。 查看用户列表:显示所有用户的姓名和邮箱。 2.使用技术 编程语言:Python Web框架:Flask 数据库:SQLite 前端技术:HTML、CSS 3.数据库设计 用户表(User): id:用户唯一标识符,整数型,主键。 name:用户姓名,字符串型,不为空。 email:用户邮箱,字符串型,唯一且不为空。 4.用户界面搭建 首页 (home.html): 表单用于添加新用户(姓名、邮箱)。 用户列表显示已添加的用户及其邮箱,提供删除链接。 样式 (style.css): 主要用于页面的基本样式和布局。

2024-07-22

电赛比赛经验总结和梳理

电赛比赛经验总结梳理

2024-07-22

大学生创新创业训练计划经验分享

大学生创新创业训练计划经验分享

2024-07-22

蓝桥杯比赛介绍和心得体会

蓝桥杯比赛介绍和心得体会

2024-07-22

ACM比赛经验总结梳理

ACM比赛经验总结梳理

2024-07-22

BiLSTM-tensorflow实现.py

1. 数据准备 首先创建了一个简单的文本数据集,并对标签进行了编码。然后,使用 Keras 的 Tokenizer 将文本数据转换为整数序列,并填充序列使其具有相同的长度。最后,将数据集分割为训练集和测试集。 2. 构建 BiLSTM 模型 使用 Keras 构建了一个 BiLSTM 模型。模型的输入层是一个 Embedding 层,用于将整数序列转换为稠密向量。接下来是一个双向 LSTM 层,输出的特征向量经过一个全连接层,然后通过 softmax 激活函数输出最终的分类结果。 3. 模型训练 使用训练数据对模型进行了训练,设置了训练的轮数(epochs)和批次大小(batch_size)。同时,在训练过程中使用了一部分训练数据进行验证,以监控模型的性能。 4. 模型评估 使用测试数据评估模型的性能,打印出测试集上的准确率。

2024-07-06

c语言链表的基本操作整理

一个简单的单向链表的基本操作代码,包括链表节点的定义、链表的初始化、插入节点、删除节点、遍历链表和销毁链表的功能。 1.定义链表节点结构:Node 结构体包含一个整数数据和一个指向下一个节点的指针。 2.初始化链表:initialize 函数创建一个头节点,并初始化其指针为 NULL。 3.插入节点:insert 函数在链表末尾插入一个新节点。 4.删除节点:delete 函数从链表中删除包含指定值的节点。 5.遍历链表:traverse 函数遍历链表并打印每个节点的值。 6.销毁链表:destroy 函数释放链表的所有节点,释放内存。

2024-07-04

yolov5实现物体识别代码

提供了一个完整的流程,从加载模型、读取图像到显示和保存检测结果,帮助你快速实现基于YOLOv5的物体检测任务。

2024-07-04

pycharm安装教程详细介绍

pycharm安装教程

2024-07-03

Pytoch深度学习项目-Mnist例子

## 项目简介 MNIST 数据集是手写数字识别的标准数据集,包含 60000 张训练图片和 10000 张测试图片,每张图片为 28x28 的灰度图像,代表 0-9 的数字标签。该项目演示如何使用 PyTorch 构建一个简单的卷积神经网络(CNN)进行手写数字识别。 ## 步骤 1. **导入必要的库** 2. **数据加载和预处理** 3. **构建卷积神经网络** 4. **定义损失函数和优化器** 5. **训练模型** 6. **测试模型**

2024-07-03

HTML+CSS+JS项目

## Git 简介 Git 是一个分布式版本控制系统,广泛用于软件开发中代码的管理和协作。它允许多个开发人员在同一项目中同时工作,通过分支和合并机制,实现高效的代码管理和版本控制。 ## Html 和 Css 简介 HTML(超文本标记语言)是构建网页内容的标准标记语言,用于定义网页的结构和内容。CSS(层叠样式表)用于控制网页的样式和布局,通过分离内容和样式,实现更灵活和可维护的网页设计。 ## JavaScript 简介 JavaScript 是一种广泛用于网页开发的脚本语言。它可以在浏览器中运行,实现动态交互效果,控制网页内容的行为和响应用户操作。JavaScript 也是现代前端开发的核心语言之一。

2024-07-03

常见算法知识点总结归纳

简要介绍了几类常见算法,包括排序算法(如冒泡排序、选择排序、插入排序、快速排序、归并排序)、搜索算法(线性搜索、二分搜索)、图算法(深度优先搜索、广度优先搜索、Dijkstra算法、Floyd-Warshall算法)、动态规划算法、贪心算法、分治算法、回溯算法和分支限界算法。每类算法分别介绍了其基本思想和典型应用。

2024-07-03

C++实现的俄罗斯方块游戏

一个简单的俄罗斯方块游戏的C++实现,涉及基本的游戏逻辑和控制。这个示例包括了初始化、显示、移动、旋转和消除方块等基本功能。 主要文件 main.cpp:包含主函数和游戏循环。 tetris.h:包含游戏逻辑的头文件。 tetris.cpp:包含游戏逻辑的实现文件。 运行说明 确保安装SFML库,以便进行窗口绘制和用户输入处理。

2024-07-01

C语言常用基础代码整理

c语言基础,包含头文件、指针、数组、结构体和类型等内容。

2024-07-01

Python实现的线性SVM分类器

1.训练函数train: 将输入数据X和标签Y转换为PyTorch的张量。 初始化优化器(这里使用随机梯度下降SGD)。 进行批处理训练,计算损失,并更新模型参数。损失函数包括一个线性项和一个正则化项(L2惩罚),正则化项用于控制模型的复杂度。 2.可视化函数visualize: 计算模型的权重和偏置,并使用这些参数在二维平面上画出决策边界。 用不同的颜色和级别显示不同的决策区域,同时将数据点绘制在图上。 3.命令行参数处理: 定义了几个命令行参数,包括正则化系数--c、学习率--lr、批大小--batchsize、训练轮数--epoch以及计算设备--device(CPU或CUDA)。

2024-06-29

数学建模美赛特等奖论文

数学建模美赛特等奖论文

2024-06-28

python爬虫入门通用框架

一.请求网址 二.解析定位 三.保存数据

2024-06-28

输入法iFlyIME-Setup,讯飞输入法电脑版

讯飞输入法电脑版是一款功能强大、高效的电脑输入法工具,软件集语音、手写、拼音输入于一体,具有强大的语音识别能力,创新的触摸板手写,极简的输入界面,可大大提升输入速度。 多种输入方式:iFlyIME 支持拼音、手写、语音、多种输入方式,用户可以根据自己的习惯和需求进行选择。 智能预测:该输入法具有强大的智能预测功能,能够根据用户的输入习惯和上下文提供准确的词汇预测,提高输入效率。 个性化设置:用户可以根据自己的偏好进行个性化设置,包括主题、字体、快捷键等,以满足不同用户的审美和使用习惯。 云同步:iFlyIME 支持云同步功能,可以将用户的个性化设置和输入记录同步到云端,方便在不同设备上使用。 无广告:该版本的 iFlyIME 是官方纯净版,没有广告干扰用户的输入体验。 多语言支持:除了中文,iFlyIME 也支持多种其他语言的输入,适用于国际化的用户。 手写输入:支持手写输入,用户可以用手写汉字或英文进行输入,适用于触摸屏设备。

2024-06-27

毕业答辩PPT模板.pptx

这个简约风格的毕业答辩PPT模板设计清新优雅,采用浅蓝色背景。封面页使用简洁现代的字体展示标题“毕业答辩”,右上角放置学校的小标志。后续的幻灯片布局一致,具有清晰的标题和充足的留白。每张幻灯片都包含浅色线条,细腻地分隔不同部分,使用图标表示不同的主题(如简介、方法论、结果、结论)。整个配色方案主要为黑色、白色和浅灰色,确保可读性和专业外观。该模板的设计简洁大方,适合展示专业的学术内容。

2024-06-24

基于神经网络的图像识别小项目(Python实现)

本项目旨在开发一个基于神经网络的图像识别系统,使用Python编程语言和深度学习框架TensorFlow,实现对CIFAR-10数据集中图像的自动识别。CIFAR-10数据集包含10个类别的60000张32x32彩色图像,是计算机视觉领域中常用的基准测试数据集之一。 神经网络架构 神经网络模型将包括以下几个关键层: 1.卷积层:使用多个卷积层来提取图像中的特征。每个卷积层后通常会接一个非线性激活函数,如ReLU。 2.池化层:在卷积层之后使用池化层(如最大池化层)来降低特征图的空间尺寸,减少计算量和过拟合风险。 3.全连接层:在卷积层和池化层提取并压缩特征后,通过全连接层来进行最终的分类决策。 4.输出层:使用softmax激活函数的输出层,提供10个类别的预测概率。

2024-06-10

庆祝端午节Python GUI界面

使用 Python 的 tkinter 库来创建一个图形用户界面(GUI),让用户通过可视化的方式庆祝端午节。程序具有以下功能和特点: 1.界面组件: 标签(Label):用来显示欢迎信息以及庆祝端午节的动态信息。 按钮(Button):用户可以点击这个按钮来随机生成和显示一个庆祝端午节的活动和食品。 2.随机选择机制: 程序定义了两个列表,分别包含与端午节相关的传统活动(如赛龙舟、吃粽子等)和不同类型的粽子(如豆沙粽、咸肉粽等)。点击按钮时,程序会从这些列表中随机选择元素。 3.交互逻辑: 当用户点击“庆祝端午节”按钮时,celebrate_dragon_boat_festival 函数被触发。该函数随机选择一个活动和一个粽子,然后更新标签内容,展示一条定制的庆祝信息。 4.界面布局: 程序使用pack()方法来安排按钮和标签在窗口中的位置。标签占据窗口的中央区域,按钮则固定在窗口底部。

2024-06-09

计算机网络实验项目 HTTP-Proxy-Server

(1)设计并实现一个基本 HTTP 代理服务器。要求在指定端口(例如 8080)接收来自客户的 HTTP 请求并且根据其中的 URL 地址访问该地址 所指向的 HTTP 服务器(原服务器),接收 HTTP 服务器的响应报文,并 将响应报文转发给对应的客户进行浏览。 (2) 设计并实现一个支持 Cache 功能的 HTTP 代理服务器。要求能缓 存原服务器响应的对象,并能够通过修改请求报文(添加 if-modified-since 头行),向原服务器确认缓存对象是否是最新版本。

2023-12-23

MerryChristmas圣诞树HTML代码

圣诞树html网页代码

2023-12-23

网上书店系统(java+jsp源程序)

基于JSP(JavaServer Pages)的网上书店系统是一个使用Java技术构建的在线书店平台。以下是该系统的简单说明: 1.前端页面(JSP): 使用JSP创建网页界面,包括主页、图书列表、购物车、用户登录、订单结算等页面。 通过JSP标签嵌入Java代码,以便在页面上动态生成内容。 数据库(通常使用关系型数据库如MySQL): 存储图书信息、用户信息、订单信息等。 数据库表包括但不限于图书表、用户表、订单表等。 2.用户注册和登录: 用户可以通过注册页面创建新账户,输入个人信息。 注册信息将存储在用户数据库中。 注册后的用户可以使用用户名和密码登录系统。 3.图书管理: 后台管理系统允许管理员添加、删除或更新图书信息。 图书信息包括书名、作者、价格等。

2023-12-23

基于Pytorch实现的Bert模型

基于PyTorch实现的BERT模型。BERT(Bidirectional Encoder Representations from Transformers)是一种预训练的自然语言处理模型,它在大规模文本数据上进行预训练,然后可以通过微调适应各种NLP任务,如文本分类、语言生成、问答等。 这段代码包含以下主要组件: PositionalEncoding: 位置编码,用于为输入的序列数据添加位置信息,以便模型能够理解单词之间的相对位置。 MultiHeadAttention: 多头自注意力机制,用于在输入序列中捕捉不同单词之间的关系。 PositionwiseFeedForward: 前馈神经网络,用于增强模型的表达能力。 TokenEmbedding: 词嵌入层,将输入的单词索引转换为向量表示。 SegmentEmbedding: 分割嵌入层,表示句子的分割信息。 PositionEmbedding: 位置嵌入层,添加序列中单词的位置信息。 TransformerLayer: Transformer层,由多头自注意力和前馈神经网络组成。

2023-08-27

java实现简易文件管理系统

java实现简易文件管理系统

2023-08-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除