
浅谈DeepSeek模型Token
绿算技术
智慧加载 安全存取
绿色低碳 异构统管
展开
-
Token ≠ 单词 ≠ 字符
示例: 输入:"unhappiness" 输出:["un", "happiness"] 或 ["un", "happ", "iness"] 空格分隔 规则:以空格为分隔符,将文本分割为单词或子词单元。示例: 输入:"This is a very long text..." 输出:截断为 ["This", "is", "a", "very", "long", "text", "..."] 特殊字符和符号 规则:特殊字符(如 @、#、$ 等)通常单独作为一个 token。原创 2025-02-24 15:13:47 · 150 阅读 · 0 评论 -
浅谈DeepSeek模型的Token
Token的概念可以类比为我们在阅读一篇文章时,将文章分解成句子,句子再进一步分解成单词一样,DeepSeek模型也是将输入的文本分解成Token。通过将这些Token进行组合和分析,DeepSeek模型能够理解文本的含义,并据此进行相应的操作。在使用DeepSeek模型时,我们经常会接触到一个专业术语,那就是“Token”。当DeepSeek模型处理自然语言任务时,通常会将输入的文本分解成一系列的Token,以便计算机能够更好地理解和处理这些数据。未完待续......原创 2025-02-24 15:11:46 · 388 阅读 · 0 评论