- 博客(4)
- 收藏
- 关注
原创 LLM大模型之基于SentencePiece扩充LLaMa中文词表实践
目前大模型的词表和分词器都是基于SentencePiece工具实现的,比如LLaMa,BLOOM,ChatGLM,Baichuan等,简单来说SentencePiece就是工程化的实现了之前写的各种的分词算法
2023-09-09 17:49:45
2590
3
原创 LLM大语言模型之Generate/Inference生成/推理参数与解码策略原理与代码实现
LLM大语言模型Generate/Inference生成或者说推理时,有很多的参数和解码策略,比如OpenAI在提供GPT系列的模型时,就提供了很多的参数[1],那这些参数的原理以及代码上怎么实现的呢?本文将尽力进行一一的解释
2023-09-09 17:45:14
1534
1
原创 LLM大语言模型之Tokenization分词方法(WordPiece,Byte-Pair Encoding (BPE),Byte-level BPE(BBPE)原理及其代码实现)
本文主要内容为目前大模型时代分词是怎么做的☺️,WordPiece,Byte-Pair Encoding (BPE),Byte-level BPE(BBPE)分词方法的原理以及其代码实现
2023-09-09 17:38:01
929
2
原创 Anaconda+Tensorflow2.0+Pycharm安装教程(Win10)
人工智能三件套Anaconda+Tensorflow2.0+Pycharm+Win10的安装过程,尽量详细Anaconda是一个开源的包、环境管理器,可以用于在同一个电脑上安装不同版本的软件包,并能够在不同的环境之间切换Tensorflow是一个开源的机器学习平台/环境,用于各类机器学习算法的编程实现,其中2.0版本中更好的支持Keras。Pycharm是一个非常好用的Python IDE...
2019-10-24 16:40:51
7364
7
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人