- 博客(89)
- 问答 (2)
- 收藏
- 关注
原创 快来测试一下你的 GPU 性能吧!
近期老板发个任务,想要测试一下半精度下的GPU稀疏算力,探索了多个软件和脚本,包括DeepBench、GPU-Burn、Pytorch基准测试等,发现均不太好用;
2025-04-04 11:12:18
1026
原创 使用VLLM部署一系列大语言模型方案
轻量级本地化工具,专为个人开发者和小规模实验设计,主打快速部署和低资源占用核心优势wp:list一键安装,支持跨平台(Windows/macOS/Linux),无需编程基础即可使用;内置1700+预训练模型,自动下载int4量化版本,显存占用极低(如Qwen2.5-14B仅需11GB显存);支持CPU/GPU混合运行,空闲时自动释放显存,适合低配置设备(如16GB内存笔记本);提供类ChatGPT的交互式命令行界面,适合快速测试和原型开发;
2025-04-04 11:11:33
757
原创 一文学会云服务器配置Milvus向量数据库
配置用户组(可选),默认情况下,只有root用户和docker组的用户才能运行Docker命令,我们可以将当前用户添加到docker组,以避免每次使用Docker时都需要使用sudo。注:docker的旧版本不一定被称为docker,docker.io 或 docker-engine也有可能,如果不能正常卸载,出现如下情况,显示无权限时,需要添加管理员权限才可进行卸载。添加Docker官方GPG密钥,执行以下命令来添加Docker官方的GPG密钥。连接成功将会输出:成功连接到 Milvus 服务器。
2025-04-04 11:10:28
894
原创 Gradio学习笔记记录
安装指令:pip install gradio 方法介绍 Interface=》用于构建一些简单的页面,可以直接用这个指令搞定 形式=》接收三个参数分别为处理函数、输入、输出三部分,呈现一般左/上为输入,右或下为输出 fn:将用户界面 (UI) 包裹起来的函数 inputs:用于输入的 Gradio 组件,组件数应与函数中的参数数匹配 outputs:用于输出的 Gradio 组件。组件数应与函数的返回值数匹配 案例 效果
2024-11-24 22:54:42
910
原创 算是一些Transformer学习当中的重点内容
Transformer是一种神经网络结构,由Vaswani等人在2017年的论文Attentions All YouNeed”中提出,用于处理机器翻译、语言建模和文本生成等自然语言处理任务。Transformer同样是encoder-decoder的结构,只不过这里的“encoder”和“decoder”是由无数个同样结构的encoder层和decoder层堆叠组成。
2024-06-23 22:42:10
722
原创 关于Pytorch转换为MindSpore的一点建议
整体来说,只要数据集构建没有问题,网络结构没有问题(需要计算测试)那么框架转换就很简单了,因为训练的流程都大致相同,虽然mindspore里面没有梯度清零什么的但是也有独特的自动微分梯度求导,这个多看几个案例,其实也是一套流程。
2024-06-23 22:35:29
1450
原创 预训练是什么?
练而改变),尝试使用 A 的前 50 /100 层去完成任务 B一个任务 A,一个任务 B,两者极其相似,任务 A 已经训练处一个模型 A,使用模型 A 的浅层参数去训练任务 B,得到模型 B。
2024-06-23 22:17:48
863
原创 关于如何得到Mindspore lite所需要的.ms模型
此过程并不复杂,需要注意的是,要在昇腾910的npu环境下训练得到的ckpt模型文件才可以转换,其它如cpu、gpu下得到的模型均不可以,所以可以用启智AI平台来,按照昇思官方给的示例就可以转成。input_np为训练/推理过程输入网络的数据(其中一个),可以先打印出来确定其内容和类型,我这个案例里面用的是(10,1),即一个二维数字,10列1行,这也是为什么数据是这个样子的原因;路径需要替换为自己的mindspore lite地址,后面按照转换示例走一下就可以转换得到,主要容易出错的是环境变量的设置。
2024-06-21 02:05:22
841
原创 NLP快速入门
分词是什么?Tokenizer了解、texts_to_sequences方法了解、 文本为何能序列化?未见过的单词如何处理?序列填充 pad_sequences;打造识别文本情感的模型、循环神经网络、长短期记忆网络(LSTM)、打造一个会写诗的AI
2024-02-14 17:18:04
1758
原创 zzulioj1115: 数组最小值
数组a有n个元素,请输出n个元素的最小值及其下标。若最小值有多个,请输出下标最小的一个。注意,有效下标从0开始。输入分两行,第一行是一个正整数n(n
2023-01-27 14:10:34
909
原创 zzulioj1081: n个数求和 (多实例测试)
对于每组输入,在一行输出n个数的和(保证和不会超出int类型的范围)!时间限制: 1 Sec 内存限制: 128 MB。输入第一行是一个整数T,表示有T组测试实例;初做多实例测试,注意累加和变量赋初值的位置。提交: 33539 解决: 21570。1081: n个数求和 (多实例测试)第一行一个数n表示接下来会有n个整数;第二行空格隔开的n个数。
2023-01-27 13:57:38
282
原创 zzulioj1097: 计算平均成绩(函数专题)
输入的成绩均为五级制成绩,五级制成绩转换为百分之成绩的规则如下:'A'转换为百分之成绩为95分,'B'对应85分,C对应75分,'D'对应65分,'E'对应40分。要求程序定义一个getScore()函数和一个main()函数,getScore()函数返回一个等级对应的分数,其余功能在main()函数中实现。对于C/C++代码的提交,本题要求必须通过定义getScore函数和main函数实现,否则,提交编译错误,要提交完整的程序。输入为一行只包含'A'~'E'的字母,每个字母表示一门课的成绩,
2023-01-27 13:56:37
272
原创 zzulioj 1000-1004题 c++实现
1000: 从今天开始入坑C语言。1003: 两个整数的四则运算。1004: 三位数的数位分离。1002: 简单多项式求值。1001: 整数a+b。
2023-01-25 12:25:09
310
原创 虚拟化技术考试重点总结
在操作系统层面增添虚拟服务器功能,没有独立的Hypervisor层。 相反主机操作系统本身就负责在多个虚拟服务器之间分配硬件资源,并且让这些服务器彼此独立,一个明显的区别是,如果使用操作系统层虚拟化,所有虚拟服务器必须运行同一操作系统。 虽操作系统层虚拟化的灵活性比较差,但本机速度性能比较高。此外,由于架构在所有虚拟服务器上使用单一、标准的操作系统,管理起来比异构环境要容易。
2023-01-12 15:47:24
2077
2
原创 python 解决依赖包版本问题
将这个文件夹放到新的环境里,注意要与Python同级,根据requirement.txt配置新环境。执行成功后,会自动生成requirement.txt文件,位置与Python文件同级。requirement.txt这个文件是用于记录所有依赖包及其精确的版本号。主要是解决更换不同电脑,配置的环境,因依赖包版本原因出现的问题。
2023-01-06 16:41:09
1179
原创 python-turtle画图
Turtle是一个渲染器基于底层图形编程结构(API)构建,主要用于场景的构建以及3D物体的绘制(3D游戏、虚拟场景等)
2023-01-04 17:56:25
3297
原创 爬虫学习-数据解析三种方式:正则、bs4、xpath,以及一些实例操作
【代码】爬虫学习-数据解析三种方式:正则、bs4、xpath,以及一些实例操作。
2022-12-21 14:17:01
991
TA创建的收藏夹 TA关注的收藏夹
TA关注的人