自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 【深度学习】DeepSeek模型介绍与部署

我们提出了 DeepSeek-V3,一个强大的混合专家 (MoE) 语言模型,拥有 671B 总参数,其中每个 token 激活 37B 参数。为了实现高效推理和成本效益的训练,DeepSeek-V3 采用了多头潜在注意力 (MLA) 和 DeepSeekMoE 架构,这些架构在 DeepSeek-V2 中得到了充分验证。此外,DeepSeek-V3 首次提出了无辅助损失的负载平衡策略,并设置了多 token 预测训练目标,以增强性能。

2025-02-01 12:25:27 8662

原创 【Deepseek】服务器部署Deepseek全流程

在服务器上部署 DeepSeek 模型需要细致的准备和配置,但通过上述步骤,您可以成功地在 Linux 服务器上运行并远程访问该模型。根据您的硬件条件和需求,选择合适的模型规模,并进行相应的优化,以获得最佳性能。希望本指南对您的部署过程有所帮助。。

2025-03-25 13:56:44 900

原创 【NLP】 API在大语言模型中的应用

API是大语言模型落地应用的关键桥梁,开发者通过标准化接口即可快速获得:文本生成(如客服对话)、数据分析(如文档摘要)、自动化(如代码生成)等能力。实际开发中需重点关注提示工程优化异步性能调优和合规性控制。随着模型技术的演进,未来LLM API将向更低延迟、更低成本和更高专业性的方向发展。

2025-03-19 19:33:13 1452 3

原创 【Linux】使用VirtualBox部署Linux虚拟机

安装完成后,系统会提示重启。为了获得更好的性能(如支持共享文件夹、自动调整分辨率等),你需要安装。如果需要虚拟机与主机共享网络(比如访问互联网),可以在。重启虚拟机,进入你安装好的 Linux 系统。按钮开始创建新的虚拟机。

2025-02-01 12:02:18 1140

原创 [USACO05DEC] Scales S (DFS+剪枝)

每次称牛时,他都把某头奶牛安置在天平的某一边,然后往天平另一边加砝码,直到天平平衡,于是此时砝码的总质量就是牛的质量(约翰不能把砝码放到奶牛的那边,因为奶牛不喜欢称体重,每当约翰把砝码放到她的蹄子底下,她就会尝试把砝码踢到约翰脸上)。约翰有一架用来称牛的体重的天平。现在约翰告诉你每个砝码的质量,以及天平能承受的最大质量,你的任务是选出一些砝码,使它们的质量和在不压坏天平的前提下是所有组合中最大的。个砝码开始,每个砝码的质量至少等于前面两个砝码(也就是质量比它小的砝码中质量最大的两个)的质量的和。

2025-01-31 17:11:18 412

原创 【Python】 使用pygame库实现新年烟花

使用pygame库实现新年烟花

2025-01-28 13:37:43 641

原创 【深度学习】 UNet详解

我们将训练一个 UNet 模型,使用交叉熵损失函数和 Adam 优化器。训练时,输入的图像和标签将通过 DataLoader 加载。# 超参数# 数据加载# 初始化模型与优化器model = UNet(in_channels=3, out_channels=2).to(DEVICE) # 假设是二分类# 训练过程# 前向传播# 计算损失# 反向传播# 更新参数。

2025-01-26 12:25:46 5617 2

原创 独木桥(贪心)

你希望找些刺激,于是命令你的士兵们到前方的一座独木桥上欣赏风景,而你留在桥下欣赏士兵们。由于先前的愤怒,你已不能控制你的士兵。另外,总部也在安排阻拦敌人的进攻,因此你还需要知道你的部队最多需要多少时间才能全部撤离独木桥。每个士兵都有一个初始面对的方向,他们会以匀速朝着这个方向行走,中途不会自己改变方向。但是,如果两个士兵面对面相遇,他们无法彼此通过对方,于是就分别转身,继续行走。突然,你收到从指挥部发来的信息,敌军的轰炸机正朝着你所在的独木桥飞来!的数据,满足初始时,没有两个士兵同在一个坐标,

2025-01-25 12:35:16 923

原创 [NOIP2012 提高组] 借教室

借教室的原则是先到先得,也就是说我们要按照订单的先后顺序依次为每份订单分配教室。如果在分配的过程中遇到一份订单无法完全满足,则需要停止教室的分配,通知当前申请人修改订单。大到院系举办活动,小到学习小组自习讨论,都需要向学校申请借教室。教室的大小功能不同,借教室人的身份不同,借教室的手续也不一样。个教室,而它们具体是哪些教室,每天是否是相同的教室则不用考虑。天剩余的教室数为$2$,因此无法满足。第$1$份订单满足后,$4$天剩余的教室数分别为。,表示租借的数量,租借开始、结束分别在第几天。

2025-01-19 11:48:53 1048

原创 [Atcoder Beginner 057 D] Maximum Average Sets

个以下的物品,计算出所选物品平均值的最大值,并求出能使选择物品的平均值最大的选择方法有几种。第一行一个实数,代表所选物品平均价值的最大值。如果选手答案与标准答案的绝对误差或相对误差在。第二行一个整数,代表所选物品平均价值达到最大选择方法的数量。另外,由于除此之外的物品的选择方法中没有价值平均值为。个物品,价值的平均值是最大的,所以第一行输出。物品价值平均值最大的物品的选择方法可能有多个。的东西,所以第二行输出。你需要从这些物品中选择。以下,则视为正确答案。

2025-01-18 13:15:08 1181

原创 [NOIP2001 提高组] 数的划分

份,且每份不能为空,任意两个方案不相同(不考虑顺序)。NOIP 2001 提高组第二题。,下面三种分法被认为是相同的。个整数,即不同的分法。问有多少种不同的分法。

2025-01-17 10:15:00 773

原创 [NOIP2015 提高组] 跳石头

为了提高比赛难度,组委会计划移走一些岩石,使得选手们在比赛过程中的最短跳跃距离尽可能长。这项比赛将在一条笔直的河道中进行,河道中分布着一些巨大岩石。块岩石(不含起点和终点的岩石)。在比赛过程中,选手们将从起点出发,每一步跳向相邻的岩石,直至到达终点。块岩石与起点的距离。这些岩石按与起点距离从小到大的顺序给出,且不会有两个岩石出现在同一个位置。,分别表示起点到终点的距离,起点和终点之间的岩石数,以及组委会至多移走的岩石数。块岩石(不能移走起点和终点的岩石)。的两个岩石移走后,最短的跳跃距离为

2025-01-15 12:00:00 784 1

原创 # 逆序对

猫猫 TOM 和小老鼠 JERRY 最近又较量上了,但是毕竟都是成年人,他们已经不喜欢再玩那种你追我赶的游戏,现在他们喜欢玩统计。最近,TOM 老猫查阅到一个人类称之为“逆序对”的东西,这东西是这样定义的:对于给定的一段正整数序列,逆序对就是序列中。知道这概念后,他们就比赛谁先算出给定的一段正整数序列中逆序对的数目。注意序列中可能有重复数字。个数,表示给定的序列。序列中每个数字不超过。过 50 万吧 by chen_zhe。输出序列中逆序对的数目。请使用较快的输入输出。

2025-01-14 12:45:00 487

原创 [NOIP2015 提高组] 神奇的幻方

NOIP2015 提高组 Day1T1

2025-01-13 06:45:00 1926

原创 【深度学习】 PyTorch一文详解

PyTorch详解

2025-01-12 21:13:25 1880

原创 [NOIP2016 提高组] 玩具谜题

小南发现,这个谜题中玩具小人的朝向非常关键,因为朝内和朝外的玩具小人的左右方向是相反的:面朝圈内的玩具小人,它的左边是顺时针方向,右边是逆时针方向;而面向圈外的玩具小人,它的左边是逆时针方向,右边是顺时针方向。如果下次有更多的玩具小人藏他的眼镜,或是谜题的长度更长,他可能就无法找到眼镜了。小南发现玩具小人们围成了一个圈,它们有的面朝圈内,有的面朝圈外。行,每行包含一个整数和一个字符串,以逆时针为顺序给出每个玩具小人的朝向和职业。保证不会出现其他的数。小南有一套可爱的玩具小人,它们各有不同的职业。

2025-01-12 09:30:00 947 2

原创 [NOIP2009 普及组] 多项式输出

号连接此项与前一项,分别表示此项系数为正或者系数为负。紧跟一个正整数,表示此项系数的绝对值(如果一个高于。多项式中,多项式的开头、结尾不含多余的空格。次项的系数,每两个整数之间用空格隔开。,从左到右按照次数递减顺序给出多项式。次项系数为正,则多项式开头不出。,则接下来紧跟的指数部分的形式为“NOIP 2009 普及组 第一题。,则接下来紧跟的指数部分形式为。行,按题目所述格式输出多项式。次项系数为负,则多项式以。次的项,其系数的绝对值为。,表示一元多项式的次数。,则仅需输出系数即可。

2025-01-11 11:55:38 1000

原创 [NOIP2011 提高组] 铺地毯

模拟

2025-01-10 14:25:45 1237

原创 【数据结构】 学习笔记(含代码)

数据结构(Data Structure)是指在计算机中存储和组织数据的方式。它不仅仅关乎数据的存储,还关乎如何有效地进行数据操作、访问、修改和删除等。不同的数据结构适用于不同的应用场景和需求。常见的数据结构包括线性结构(如数组、链表、栈、队列)、非线性结构(如树、图)、哈希表、堆等。数据结构的选择直接影响程序的效率和性能,良好的数据结构设计能够使得算法的实现更加高效、简洁,并能提高计算机系统的资源利用率。

2025-01-06 17:21:06 1218

原创 【离散数学】学习笔记

离散数学学习笔记

2025-01-02 17:35:36 799

原创 【面向对象程序设计与C++】学习笔记

面向对象(Object Oriented)是一种软件开发方法,一种编程范式。面向对象的概念和应用已超越了程序设计与软件开发,扩展到如应用结构、应用平台等领域。面向对象是一种对现实世界理解和抽象的方法,是计算机编程技术发展到一定阶段后的产物。简而言之,面向过程就是根据业务从上到下写代码,而面向对象就是将数据和函数绑定到一起,加速开发程序,减少重复的代码的重写过程。对象可以是人们要研究的任何事物,包括具体的(如程序、计算机)和抽象的(如思想、规则、计划等)每一类对象都有属性(如大小、形状、重量等)和行为。

2024-12-20 21:19:58 744 1

《离散数学(第二版)》知识点总结

《离散数学(第二版)》知识点总结

2025-01-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除