
AI技术
文章平均质量分 92
青山瀚海
青砖成山,绿水成海
展开
-
基于LLM的垂直领域问答方案
主要介绍在垂直领域问答的传统的方案、基于LLM的方案、RAG(Retrieval-Augmented Generation)、基于知识体系;以及他们之前的综合对比原创 2025-01-31 07:00:00 · 577 阅读 · 0 评论 -
Ollama离线部署模型
文章主要内容是没有显卡的CPU环境下,Linux系统中进行私有化大语言模型、embedding模型的部署以及迁移原创 2025-01-10 01:30:00 · 5901 阅读 · 0 评论 -
ElasticSearch基础学习使用
简要分享ES的docker安装,浏览器客户端插件,以及分词插件使用、关键词检索的简单案例分享原创 2024-12-31 08:00:00 · 701 阅读 · 0 评论 -
服务器部署LLM、Embedding
介绍在服务器下将大语言模型、embedding模型通过transformers或者vllm的方式部署为API服务的搭建步骤和脚本原创 2024-12-30 20:43:41 · 3451 阅读 · 0 评论 -
推荐系统简介(下)
衔接推荐系统简介上,本章内容主要介绍召回内容的排序方案,以及谷歌、You Tube、阿里公布的策略方案,分享推荐上线的A/B test方案的优缺点。原创 2024-12-18 07:00:00 · 1269 阅读 · 0 评论 -
推荐系统简介(上)
主要介绍推荐系统的整体组成结构,重点介绍了基于内容、协同过滤、统计信息、冷启动等召回策略和问题;以及召回的核心点,特征处理工程。原创 2024-12-15 11:41:23 · 721 阅读 · 0 评论 -
LLM在Transformer上的改动
介绍关于当前大模型的在Transformer结构上的优化和改进:multi-head共享、attention前后网络、归一化层位置、归一化层函数、激活函数等调整方案,并给出LLama2方案介绍;以及大语言模型长文本输出中,涉及到位置编码的方案原创 2024-11-14 03:00:00 · 873 阅读 · 0 评论 -
RAG介绍
介绍当前大语言模型下应用广泛的RAG技术优势、缺点、一些场景的解决方案,RAG的评价指标原创 2024-11-13 02:00:00 · 1431 阅读 · 0 评论 -
BPE算法
介绍BPE算法大语言模型中Tokenizer之间的使用方案和逻辑,和好处原创 2024-11-10 21:20:27 · 789 阅读 · 0 评论 -
知识图谱构建
介绍在知识图谱中,非常重要的:知识抽取、知识融合、知识推理、知识表示的内容;以及基于知识图谱的NL2SQL应用原创 2024-11-09 02:00:00 · 5126 阅读 · 0 评论 -
对话系统介绍
主要介绍对话系统中:任务型对话、问答型对话、闲聊型对话的介绍,重点介绍任务型对话系统的流程和实现;介绍LLM多轮对话的训练等信息原创 2024-10-24 22:53:56 · 1148 阅读 · 0 评论 -
大语言模型使用和测评
主要介绍大语言模型中ICL的使用案例和特殊的情况;大语言模型评价数据集;当前两种业内对大模型可解释性的实验和结论;以及从大模型层面对输出结果真实性可靠性的实验介绍原创 2024-10-22 20:54:25 · 1278 阅读 · 0 评论 -
agent介绍
主要介绍agent的原理和前一段时间较火热的一些应用项目原创 2024-10-14 21:00:00 · 1023 阅读 · 0 评论 -
大语言模型训练
主要介绍当前大语言模型训练过程中的数据并行、模型并行等方法;模型权重上的混合精度训练、deepspeed训练框架内容,以及LoRA、P-tuning等PEFT方法,推理加速KV cache的原理原创 2024-10-13 16:00:51 · 1109 阅读 · 0 评论 -
多模态简单了解
主要内容即图片在transformer中的编码逻辑,以及图文训练时、diffusion的方式:CLIP图文交互、对比学习训练、flamingo图文交互、LLava图文交互;原创 2024-10-09 20:59:05 · 441 阅读 · 0 评论 -
预训练发展
文章主要介绍预训练的历史中,出现的一些重要模型结构、训练方法和思想;包含模型:ELMo、GPT、Bert、GPT2、UNILM、Transformer-XL & XLNet、Roberta、SpanBert、ALBERT、T5、GPT3。原创 2024-09-15 14:07:43 · 844 阅读 · 0 评论 -
NLP中文本生成任务
简单介绍文本生成式任务的应用领域,主要讲解实现的方案,包括自回归模型实现、Encoder-Decoder结构;其中注意力机制原理和种类,训练方式;以及评价指标和常见问题的解决方案。原创 2024-09-11 23:46:44 · 1265 阅读 · 1 评论 -
序列标注任务
序列标注任务中的场景任务,中文分词和实体提取;重点分享中文分词的数据标注方法、NER实体提取的相关算法和实现方案。原创 2024-09-09 12:05:21 · 1163 阅读 · 0 评论 -
文本匹配任务(上)
主要对文本匹配任务的定义、到应用的介绍;从智能问答中可知难点核心是文本匹配相似度算法;接着对算法进行详细介绍:编辑距离、Jaccard、BM25算法、word2vec原创 2024-08-20 23:39:58 · 919 阅读 · 0 评论 -
文本分类任务算法演变(二)
主要讲解在深度学习技术在文本分类任务中的算法应用,包含fastText、LSTM、TextCNN、Gated CNN、TextRCNN、Bert;以及实验中常见数据稀疏、标签不均衡问题处理。多标签分类任务的实现。原创 2024-08-17 18:25:31 · 1060 阅读 · 0 评论 -
文本分类任务算法演变(一)
主要对分类任务中的NLP应用场景;和算法的演变,其中主要介绍了:贝叶斯算法、支持向量机的优缺点和计算公式原创 2024-08-14 21:27:11 · 983 阅读 · 0 评论 -
语言模型-预训练模型(三)
主要内容为预训练模型的介绍、BERT结构的介绍,embedding、encoder、self-attention等核心结构的分析原创 2024-08-07 21:13:51 · 1367 阅读 · 0 评论 -
语言模型-神经网络模型(二)
主要讲解神经网络语言模型以及语言模型的一些应用的方向原创 2024-08-06 20:43:29 · 870 阅读 · 0 评论 -
语言模型简介和Ngram模型(1)
主要讲解语言模型的发展四个阶段、应用和PPL评价指标;以及第一阶段的Ngram模型的计算和构建原创 2024-08-04 15:51:50 · 1115 阅读 · 0 评论 -
词的向量化和文本向量化
主要为文本的向量化内容,包含两种编码:词向量和one-hot;词向量训练方式介绍基于语言模型、基于窗口、基于共现矩阵Glove;窗口训练讲解CBOW模型;SkipGram模型;以及负采样、Huffman树;包含聚类应用原创 2024-07-29 23:23:39 · 1500 阅读 · 0 评论 -
新词发现与重要词计算
新词发现与重要词TFIDF的计算、应用场景介绍原创 2024-07-22 20:04:15 · 701 阅读 · 0 评论 -
分词任务介绍-(十)
分词任务的简介,以及分词实现技术:正向最大匹配、反向最大匹配、jieba分词、机器学习实现分词的介绍原创 2024-07-18 21:42:45 · 834 阅读 · 0 评论 -
网络结构-组件-AI(九)
深度学习常使用的组件包括CNN、RNN、Normalization、Dropout层介绍原创 2024-07-17 21:59:33 · 779 阅读 · 0 评论 -
文本分类--NLP-AI(八)
自然语言处理中的文本分类任务,引入介绍池化层(pooling)和向量化表示embedding层原创 2024-07-14 08:42:35 · 920 阅读 · 0 评论 -
深度学习组件优化器简介--AI(七)
深度学习基础组件之优化器的简介原创 2024-07-10 09:00:00 · 424 阅读 · 0 评论 -
深度学习-基础网络组件介绍(六)
深度学习基础网络组件--全连接层、激活层、损失函数的常用介绍原创 2024-07-09 09:00:00 · 1073 阅读 · 0 评论 -
深度学习-梯度下降算法-NLP(五)
深度学习中梯度下降算法是如何发挥作用的,在整个流程中起到的作用原创 2024-07-08 20:49:59 · 1042 阅读 · 3 评论 -
深度学习-数学基础(四)
总结深度学习会涉及到的基础数学知识内容原创 2024-07-04 23:46:24 · 1178 阅读 · 0 评论 -
深度学习简介-AI(三)
深度学习的基础逻辑和概念的总结介绍原创 2024-07-03 20:34:06 · 811 阅读 · 1 评论 -
机器学习简介--NLP(二)
机器学习逻辑的基本介绍和理解原创 2024-07-02 19:15:59 · 1019 阅读 · 0 评论 -
人工智能基础解释(一)
NLP学习技术梳理--人工智能概述原创 2024-06-29 17:58:37 · 775 阅读 · 0 评论