自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

转载 探秘Transformer系列之(35)--- 大模型量化基础

将现有的量化技术直接应用于大模型存在困难,会出现较大量化误差和精度下降。这主要是因为大模型的特点是规模和复杂性。与较小的模型相比,大模型的权重和激活通常表现出更多的outlier(离群值),并且具有更宽的分布范围。LLM.int()的作者就发现:与较小的模型不同,LLM 表现出独特的权重和激活分布,其特点是存在大量的outlier。因为outlier 的存在,如果我们使用 INT8 量化,大多正常数值将被清零。

2025-06-26 09:36:41 52

转载 java消息中心的所含技术

Java消息中心实现技术教程一、整体流程下面是实现Java消息中心所含技术的整体流程:journey title Java消息中心实现技术流程 section 学习准备 开发者准备学习资料 section 学习步骤 开发者了解消息中心概念 开发者...

2024-07-13 03:35:34 145

转载 androidstuidio轮播图怎么做

IDE相关视频讲解:C语言程序设计入门之环境安装Android开发中,轮播图是一个常见的UI组件,它可以展示多张图片或广告,让用户可以通过自动轮播或手动滑动来查看不同的内容。在Android Studio中,我们可以通过ViewPager和Fragment来实现一个简单的轮播图。下面我们就来介绍如何在Android S...

2024-07-08 03:15:25 405

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除