自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 pyqt+ 大模型 API:AI + diary

pyqt小应用(中英文日记管理)+ 大模型 API 附加AI功能一个PyQt的小应用,日记本、日记的创建、删除、保存/修改等,支持在AI大模型API的基础上加入更多高级功能(日记心情预测、语法检查、语言翻译、高级处理)

2025-03-05 18:29:37 969

原创 基于LLM与检索增强生成(RAG)的文本生成

RAG(Retrieval-Augmented Generation,检索增强生成)是一种将信息检索与文本生成相结合的 AI 技术。它通过检索模块从外部知识库中检索与问题相关的文档或信息,然后利用生成模块处理这些信息,生成更专业的文本。RAG广泛应用于问答系统、对话系统、个性化推荐等领域。

2025-02-06 16:22:37 701

原创 聚类基础实验——KMeans(++)聚类

K-Means聚类的核心思想是将含有n个对象或元组的数据集X={x1, x2, …, xn}划分为K个簇,每个簇至少包含一个对象且每个对象属于且仅属于一个簇;划分时,同一个簇中的对象的距离尽可能地近,不同簇之间的对象的距离尽可能地大。 K-Means是对K-Meand的改进,主要区别在于对初始聚类中心的选取方法不同。K-Means聚类算法在实际应用中有着广泛的用途,包括但不限于:客户分群, 图像分割, 文本聚类。

2025-01-07 09:40:57 1676

原创 Transformer学习与基础实验4——英汉翻译(2. 模型构建、训练、推理)

Transformer学习与基础实验系列文章的第4篇,基于自定义实现的Transformer模型的英汉翻译任务训练、推理等过程记录和代码理解,以及所有源码、模型结构图绘制文件的原件提供

2025-01-04 10:20:00 861

原创 Transformer学习与基础实验3——transformer应用举例演示——英汉翻译(1. 数据准备与处理)

中英文语料库分词、预处理多进程处理大型中文语料库的jieba分词算法以提高效率构造语料库词典创建训练数据集Dataset和Dataloader

2025-01-04 10:17:33 1159

原创 Transformer学习与基础实验2——Transformer结构

上一篇:Transformer学习与基础实验1——注意力机制。

2025-01-04 10:14:36 670

原创 Transformer学习与基础实验1——注意力机制

Transformer学习与基础实验系列文章的第1篇,加性注意力机制、点积注意力机制、自注意力和多头注意力机制的学习,从公式、结构图、代码结合理解

2025-01-04 10:10:17 1139

原创 LLM生成、推理解码策略——以LLaMa3文本生成任务为例

​- num_return_sequences (int, 可选,默认为1) - 每个批次中每个元素独立计算返回的序列数量。​- output_attentions (bool, 可选,默认为False) - 是否返回所有注意力层的注意力张量。欲了解更多详情,请参阅返回张量下的注意力。​- output_hidden_states (bool, 可选,默认为False) - 是否返回所有层的隐藏状态。欲了解更多详情,请参阅返回张量下的隐藏状态。​。

2024-12-31 16:33:17 1328

原创 MindNLP中文文档基础部分(含示例运行结果)+ AI 社区推荐(免费下载预训练模型和开源数据集)

MindNLP是一个基于MindSpore深度学习框架开发的开源自然语言处理(NLP)库。它为解决各种NLP任务提供了一个强大的平台,包含了许多常用的NLP方法和模型。MindNLP 官网:​​Github仓库地址: ​​官网上的Tutorials中的示例和代码的版本比较旧,存在部分因错误而不可运行的代码;这里提供中文文档的基础部分,包含各示例代码及其运行结果,部分内容在原官方英文教程基础上加入了一些额外的说明。​。

2024-12-30 20:47:05 864

原创 DB-GPT系统安装部署与运行(CPU环境 + 模型代理模式)

DB-GPT可以通过代理模式部署在硬件较低的服务器上,也可以在GPU下进行私有化本地模型的部署。本人的硬件配置较低,只有CPU,考虑使用第三方大模型API服务,这里以使用。⚠️ 当使用MySQL时,在v0.4.7版本之后,DB-GPT不在做MySQL数据库Schema的自动创建与升级, 主要是为安全生产考虑。注意:如果使用sqlite3(即不执行上述的可选步骤:配置元数据库),需要下载;,使用前需要注册/登录智谱AI官网并实名注册,获取API 密钥((文件比较大,近2.5G,可能需要等待一段时间)

2024-12-10 17:41:35 3778 14

Python基础数据结构操作基础

这个文档提供了Python中基本数据结构的操作和使用方法,包括字符串、列表、集合、字典和队列。详细介绍了各数据结构的特点、常用操作和方法,如字符串的查找、替换、大小写转换,列表的添加、删除、排序,集合的并集、交集、差集操作,字典的键值对管理,以及队列的FIFO、LIFO和优先级队列操作。

2025-01-04

PyTorch 深度学习小技巧 70个

PyTorch深度学习框架的实用指南,涵盖了从基础操作到高级技巧的70个技巧。内容包括张量操作、自动求导、神经网络构建、损失函数、模型训练与评估、迁移学习、模型保存与加载、数据可视化、序列模型、学习率调度器、分布式训练、梯度裁剪、模型微调、处理不平衡数据集、自定义激活函数、模型集成、处理缺失数据、以及模型导出到ONNX和TorchScript等。适合PyTorch初学者和有经验的深度学习实践者。

2025-01-04

逻辑回归, k-近邻算法,朴素贝叶斯分类器, 支持向量机,决策树,组合分类器,聚类基础,机器学习基础实验,含原理精华、基础实验 关注微信公众号:分享之心,后台回复“机器学习基础实验”获取代码和文档链接

1. 逻辑回归乳腺癌预测:使用Numpy和MindSpore框架实现逻辑回归模型,包括数据加载、参数初始化、前向传播、参数优化以及模型训练和预测,旨在预测乳腺癌数据集。 2. KNN鸢尾花分类:讲解k-近邻(KNN)算法,通过鸢尾花数据集展示分类任务的实现。文档包括KNN的核心理念、距离度量和快速检索方法,并展示了如何利用scikit-learn库进行代码实现。 3. 朴素贝叶斯垃圾信息识别:朴素贝叶斯分类器的理论和实践应用,包括Numpy实现和scikit-learn库调用。文档覆盖了算法理论、数据处理、模型构建、训练和评估,特别适合垃圾信息识别任务。 4. 支持向量机(SVM):SVM的算法思想和基础理论,如最大间隔超平面和支持向量等,并提供了使用scikit-learn进行基础分类实验的指导和结果分析。 5. 组合分类器实验:袋装(Bagging)、随机森林和提升(Boosting)三种组合分类器的基本思想和算法流程,提供了基础分类实验的结果,帮助理解不同集成学习方法的效果。 6. 聚类基础实验:KMeans和KMedoids聚类算法,包括原理、优缺点、应用场景和聚类评估方法

2025-01-04

基于自定义实现的Transformer模型的英汉翻译任务训练得到的模型参数权重字典

对应的模型的超参数: d_model = 512 d_ff = 2048 n_layers = 6 n_heads = 8 dropout_p=0.1 src_vocab_size = 4456 trg_vocab_size = 8013

2025-01-03

cmn.txt的英文句子经过分词、转为小写处理得到的结果存放的文件

cmn.txt的英文句子经过分词、转为小写处理得到的结果存放的文件

2025-01-02

cmn.txt的中文句子经过jieba分词得到的结果存放的文件

cmn.txt的中文句子经过jieba分词得到的结果存放的文件

2025-01-02

LLM生成、推理解码策略-以LLaMa3文本生成任务为例

LLM生成、推理解码策略-以LLaMa3文本生成任务为例

2024-12-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除