- 博客(4)
- 收藏
- 关注
原创 DeepSeek-V2:强大、高效且经济的专家混合语言模型
前言:近期deepseek相关的公众文章比较多,对这家公司的研究很多媒体介绍比较笼统,外行看着很热闹,但是内行却很迷茫。为此,对deepseek公开的论文进行介绍,便于大众稍微更多一点了解细节。DeepSeek-V2:强大、高效且经济的专家混合语言模型摘要我们提出了DeepSeek-V2,一种强大的专家混合(MoE)语言模型,其特点是经济的训练和高效的推理。它总共包括236B个参数,其中每个词符激活21B个参数,并支持128KToken的上下文长度。
2025-01-18 01:18:44
1430
原创 TensorRT软件包onnx转TensorRT运行的例程,高版本不兼容,源代码如下
#include #include <assert.h>#include #include <cuda_runtime_api.h>#include #include #include #include #include <sys/stat.h>#include <time.h>#include “NvInfer.h”#include “NvOnnxParser.h”#include “common.h”using namespace
2021-08-29 19:50:59
890
转载 MySQL在windows系统中修改datadir路径后无法启动问题,报错1067
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Ma...
2019-04-17 15:14:28
2148
空空如也
down_conv1 请问是什么操作
2024-04-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人