我们说的大模型参数量都是6B,130B等等, 一般模型运行需要多少显存呢.
我其实在想,为啥要发明一个B出来, 我们用G来描述不香吗.
推理过程:
计算的公式是 G = B ( 1.024 ) 3 × s i z e o f ( 参数类型 ) G = \frac{B}{(1.024)^3}\times sizeof(参数类型) G=(1.024)
我们说的大模型参数量都是6B,130B等等, 一般模型运行需要多少显存呢.
我其实在想,为啥要发明一个B出来, 我们用G来描述不香吗.
推理过程:
计算的公式是 G = B ( 1.024 ) 3 × s i z e o f ( 参数类型 ) G = \frac{B}{(1.024)^3}\times sizeof(参数类型) G=(1.024)