
大模型工程
文章平均质量分 96
大模型工程方面的一些记录。
铁柱同学
博主从事后端开发已然八年,然入行越久越深感知识无限,学海无涯,非一时之功。故编写博客,用于自省记录,也遵循前辈们的教导,希望可以帮到更多的人。愿各位都能勇攀高峰,顺利成为大佬!奥利给!
展开
-
Langchain-Chatchat的markdownHeaderTextSplitter使用
开源项目开箱即用是好事,但是直接拿来做产品还是欠佳的,怪不得大家最终都会走到自定义分词器的步骤,业务的需求千变万化,代码都掌握在自己手里才能以不变应万变啊。原创 2024-05-21 08:49:47 · 1891 阅读 · 0 评论 -
Langchain-Chatchat之pdf转markdown格式
在使用Langchain-Chatchat做RAG的时候,发现导入的pdf文件中的表格关系无法保存,导致LLM的回答不符合预期。例如我想问的内容在表格中,但LLM的回答并不是对表格的总结。那么想要解决这个问题,就需要找到一种合适的文本格式来保留表格间的关系,然后修改Langchain-Chatchat的文本加载源码,使pdf文本转换成目标的文本格式,也就是本篇的markdown格式。原创 2024-05-21 08:47:36 · 2486 阅读 · 7 评论 -
自定义神经网络四之编写自定义神经网络
本博客是在大佬代码的基础上,实现了自定义神经网络的训练和推理。外网上的优秀文章和视频太多了,可惜限于网络和语言,能被我们看到的太少了。 这个大佬40多分钟就手撸了简单的神经网络类,并且实现了训练和推理,博主只能说,牛逼。本系列文章到这里就结束了。本来只是想分享一下大佬的视频和代码,但直接输出难免会没有上下文,因此只能把以前的一些笔记梳理下,期望读者能先有一些基础概念,然后再手撸代码实现一个自己的神经网络。原创 2024-02-25 18:12:29 · 1361 阅读 · 0 评论 -
自定义神经网络三之梯度和损失函数激活函数
本篇博客分别解释了梯度,损失函数,激活函数等相关概念。前期概念准备部分基本结束,接下来我们就尝试自定义一个神经网络,实现训练,推理和生成模型等,也算是对基础概念部分的一个实践。原创 2024-02-25 18:11:15 · 773 阅读 · 0 评论 -
自定义神经网络二之模型训练推理
通过上一篇文章,我们大概了解了神经网络以及常见的神经网络结构和应用场景。但是在日常与算法同学打交道中,基本都是算法同学提供模型,工程化同学进行推理获取结果。那么模型是什么,怎么产生的模型,模型训练和推理又是干嘛的呢?下面我们一一道来。原创 2024-02-25 18:09:49 · 1379 阅读 · 0 评论 -
自定义神经网络一之Tensor和神经网络
神经网络是AI界的一个基础概念,当下火热的神经网络例如RNN循环神经网络或者CNN卷积神经网络,都是从基础的神经网络发展而来的。本系列博客的主要目标是自定义一个神经网络,并把训练结果保存到模型文件。想要完成这个目标,了解基础的概念必不可少。原创 2024-02-25 18:08:20 · 1133 阅读 · 0 评论