自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 pyqt+ 大模型 API:AI + diary

pyqt小应用(中英文日记管理)+ 大模型 API 附加AI功能一个PyQt的小应用,日记本、日记的创建、删除、保存/修改等,支持在AI大模型API的基础上加入更多高级功能(日记心情预测、语法检查、语言翻译、高级处理)

2025-03-05 18:29:37 1015

原创 基于LLM与检索增强生成(RAG)的文本生成

RAG(Retrieval-Augmented Generation,检索增强生成)是一种将信息检索与文本生成相结合的 AI 技术。它通过检索模块从外部知识库中检索与问题相关的文档或信息,然后利用生成模块处理这些信息,生成更专业的文本。RAG广泛应用于问答系统、对话系统、个性化推荐等领域。

2025-02-06 16:22:37 754

原创 聚类基础实验——KMeans(++)聚类

K-Means聚类的核心思想是将含有n个对象或元组的数据集X={x1, x2, …, xn}划分为K个簇,每个簇至少包含一个对象且每个对象属于且仅属于一个簇;划分时,同一个簇中的对象的距离尽可能地近,不同簇之间的对象的距离尽可能地大。 K-Means是对K-Meand的改进,主要区别在于对初始聚类中心的选取方法不同。K-Means聚类算法在实际应用中有着广泛的用途,包括但不限于:客户分群, 图像分割, 文本聚类。

2025-01-07 09:40:57 1784

原创 Transformer学习与基础实验4——英汉翻译(2. 模型构建、训练、推理)

Transformer学习与基础实验系列文章的第4篇,基于自定义实现的Transformer模型的英汉翻译任务训练、推理等过程记录和代码理解,以及所有源码、模型结构图绘制文件的原件提供

2025-01-04 10:20:00 976

原创 Transformer学习与基础实验3——transformer应用举例演示——英汉翻译(1. 数据准备与处理)

中英文语料库分词、预处理多进程处理大型中文语料库的jieba分词算法以提高效率构造语料库词典创建训练数据集Dataset和Dataloader

2025-01-04 10:17:33 1255

原创 Transformer学习与基础实验2——Transformer结构

上一篇:Transformer学习与基础实验1——注意力机制。

2025-01-04 10:14:36 705

原创 Transformer学习与基础实验1——注意力机制

Transformer学习与基础实验系列文章的第1篇,加性注意力机制、点积注意力机制、自注意力和多头注意力机制的学习,从公式、结构图、代码结合理解

2025-01-04 10:10:17 1178

原创 LLM生成、推理解码策略——以LLaMa3文本生成任务为例

​- num_return_sequences (int, 可选,默认为1) - 每个批次中每个元素独立计算返回的序列数量。​- output_attentions (bool, 可选,默认为False) - 是否返回所有注意力层的注意力张量。欲了解更多详情,请参阅返回张量下的注意力。​- output_hidden_states (bool, 可选,默认为False) - 是否返回所有层的隐藏状态。欲了解更多详情,请参阅返回张量下的隐藏状态。​。

2024-12-31 16:33:17 1424

原创 MindNLP中文文档基础部分(含示例运行结果)+ AI 社区推荐(免费下载预训练模型和开源数据集)

MindNLP是一个基于MindSpore深度学习框架开发的开源自然语言处理(NLP)库。它为解决各种NLP任务提供了一个强大的平台,包含了许多常用的NLP方法和模型。MindNLP 官网:​​Github仓库地址: ​​官网上的Tutorials中的示例和代码的版本比较旧,存在部分因错误而不可运行的代码;这里提供中文文档的基础部分,包含各示例代码及其运行结果,部分内容在原官方英文教程基础上加入了一些额外的说明。​。

2024-12-30 20:47:05 909

原创 DB-GPT系统安装部署与运行(CPU环境 + 模型代理模式)

DB-GPT可以通过代理模式部署在硬件较低的服务器上,也可以在GPU下进行私有化本地模型的部署。本人的硬件配置较低,只有CPU,考虑使用第三方大模型API服务,这里以使用。⚠️ 当使用MySQL时,在v0.4.7版本之后,DB-GPT不在做MySQL数据库Schema的自动创建与升级, 主要是为安全生产考虑。注意:如果使用sqlite3(即不执行上述的可选步骤:配置元数据库),需要下载;,使用前需要注册/登录智谱AI官网并实名注册,获取API 密钥((文件比较大,近2.5G,可能需要等待一段时间)

2024-12-10 17:41:35 4073 14

备战蓝桥杯省赛的Python部分题目(研究生组,大学A组)的ipynb文件(jupyter notebook 代码,内含题目截图和解题思路笔记)

备战蓝桥杯省赛的Python部分题目(研究生组,大学A组)的ipynb文件(jupyter notebook 代码,内含题目截图和解题思路笔记)

2025-04-13

备战蓝桥杯省赛的Python部分题目的PPT,涵盖了部分中等或中上题目的数据结构的讲解,以及一些解题思路和代码实现

资源内容: 分糖果问题:详细介绍了如何处理字符串的字典序排序以及如何根据特定条件选择目标字符串,包括清晰的逻辑流程和示例说明。 0填充问题:讲解了如何统计特定子串在序列中出现的次数,并给出了相应的算法逻辑和代码实现。 互质数的个数:介绍了欧拉函数的定义、计算方法及其在求解互质数问题中的应用,配有详细的算法步骤和示例。 阶乘的和:提供了计算阶乘和的思路和代码实现,帮助你快速掌握相关知识点。 公因数匹配:讲解了如何通过素数筛选和字典记录来解决公因数匹配问题,包括详细的算法逻辑和代码示例。 完全m叉树问题:讲解了如何求解完全m叉树中特定节点的子节点编号以及子树的节点数,提供了清晰的思路和代码实现。 快速幂算法:介绍了快速幂算法的原理和实现方法,帮助你在处理大数幂运算时提高效率。 马拉车算法:详细讲解了马拉车算法求解最长回文子串的过程,包括算法逻辑、代码实现以及辅助理解的示例。 增量数组与前缀和:介绍了增量数组和前缀和思想在处理区间操作问题中的应用,提供了高效的算法解决方案。 博弈论问题:讲解了如何通过博弈论分析解决特定的砍柴游戏问题,包括必胜态分析和质数判断的算法实现。 字典树及其结点操作:介绍了字典树的基本概念、构建方法以及结点操作的实现,帮助你更好地理解和应用字典树。 中国剩余定理:提供了中国剩余定理的详细讲解和代码实现,帮助你解决同余方程组问题。 全排列及其价值计算:讲解了全排列的计算方法以及如何求解全排列的价值之和,提供了多种思路和算法实现。 适用人群: 参加蓝桥杯省赛的Python编程爱好者 想要提升算法和数据结构知识的程序员 对Python编程和算法竞赛感兴趣的初学者 使用建议: 在阅读每个问题的讲解之前,先自己尝试解决该问题,然后再参考资料中的解题思路和代码

2025-04-13

【Git版本控制】Linux环境下Git及Git LFS安装配置与基础命令使用指南:涵盖安装、配置、认证及常用操作

内容概要:本文详细介绍了Git的基本安装、配置、认证方法及常用命令。首先讲述了在Linux(以Ubuntu为例)上安装Git和Git LFS的方法,包括更新包管理器、安装Git和Git LFS以及验证安装。接着介绍了Git的三种配置级别(系统配置、用户配置、仓库配置),并列举了一些常用的配置选项。认证方面,分别介绍了HTTPS认证(包括直接输入用户名密码、凭据存储和个人访问令牌)和SSH认证(生成SSH密钥对、添加SSH密钥到SSH代理、添加SSH公钥到Git服务器)。最后,阐述了Git版本控制下的三种工程区域(工作区、暂存区、仓库)及其文件状态转换,并介绍了常用的Git命令如git init、git clone、git add、git rm、git mv、git status、git commit、git push等。 适合人群:适用于初学者或有一定基础但希望深入了解Git使用的开发者。 使用场景及目标:①掌握Git在Linux环境下的安装与配置;②理解并能配置不同级别的Git设置;③学会使用HTTPS和SSH两种认证方式;④熟悉Git版本控制系统中的工程区域及文件状态转换;⑤熟练掌握Git的基本命令,如初始化项目、克隆仓库、添加/删除/移动文件、查看状态、提交更改、推送至远程仓库等。 阅读建议:读者在学习过程中应结合实际项目操作,逐步练习文中提到的各种命令和配置,特别是安装和认证部分,确保每一步都能正确执行,并理解其背后的工作原理。对于命令的使用,建议多查阅官方文档或相关资料,加深理解。

2025-04-13

Python基础数据结构操作基础

这个文档提供了Python中基本数据结构的操作和使用方法,包括字符串、列表、集合、字典和队列。详细介绍了各数据结构的特点、常用操作和方法,如字符串的查找、替换、大小写转换,列表的添加、删除、排序,集合的并集、交集、差集操作,字典的键值对管理,以及队列的FIFO、LIFO和优先级队列操作。

2025-01-04

PyTorch 深度学习小技巧 70个

PyTorch深度学习框架的实用指南,涵盖了从基础操作到高级技巧的70个技巧。内容包括张量操作、自动求导、神经网络构建、损失函数、模型训练与评估、迁移学习、模型保存与加载、数据可视化、序列模型、学习率调度器、分布式训练、梯度裁剪、模型微调、处理不平衡数据集、自定义激活函数、模型集成、处理缺失数据、以及模型导出到ONNX和TorchScript等。适合PyTorch初学者和有经验的深度学习实践者。

2025-01-04

逻辑回归, k-近邻算法,朴素贝叶斯分类器, 支持向量机,决策树,组合分类器,聚类基础,机器学习基础实验,含原理精华、基础实验 关注微信公众号:分享之心,后台回复“机器学习基础实验”获取代码和文档链接

1. 逻辑回归乳腺癌预测:使用Numpy和MindSpore框架实现逻辑回归模型,包括数据加载、参数初始化、前向传播、参数优化以及模型训练和预测,旨在预测乳腺癌数据集。 2. KNN鸢尾花分类:讲解k-近邻(KNN)算法,通过鸢尾花数据集展示分类任务的实现。文档包括KNN的核心理念、距离度量和快速检索方法,并展示了如何利用scikit-learn库进行代码实现。 3. 朴素贝叶斯垃圾信息识别:朴素贝叶斯分类器的理论和实践应用,包括Numpy实现和scikit-learn库调用。文档覆盖了算法理论、数据处理、模型构建、训练和评估,特别适合垃圾信息识别任务。 4. 支持向量机(SVM):SVM的算法思想和基础理论,如最大间隔超平面和支持向量等,并提供了使用scikit-learn进行基础分类实验的指导和结果分析。 5. 组合分类器实验:袋装(Bagging)、随机森林和提升(Boosting)三种组合分类器的基本思想和算法流程,提供了基础分类实验的结果,帮助理解不同集成学习方法的效果。 6. 聚类基础实验:KMeans和KMedoids聚类算法,包括原理、优缺点、应用场景和聚类评估方法

2025-01-04

基于自定义实现的Transformer模型的英汉翻译任务训练得到的模型参数权重字典

对应的模型的超参数: d_model = 512 d_ff = 2048 n_layers = 6 n_heads = 8 dropout_p=0.1 src_vocab_size = 4456 trg_vocab_size = 8013

2025-01-03

cmn.txt的英文句子经过分词、转为小写处理得到的结果存放的文件

cmn.txt的英文句子经过分词、转为小写处理得到的结果存放的文件

2025-01-02

cmn.txt的中文句子经过jieba分词得到的结果存放的文件

cmn.txt的中文句子经过jieba分词得到的结果存放的文件

2025-01-02

LLM生成、推理解码策略-以LLaMa3文本生成任务为例

LLM生成、推理解码策略-以LLaMa3文本生成任务为例

2024-12-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除