Bert Model 训练遇到的问题描述

最新推荐文章于 2024-11-05 20:14:42 发布

不放糖的苦咖啡

最新推荐文章于 2024-11-05 20:14:42 发布

阅读量1.9k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： CNN 个人工作小结文章标签： bert 人工智能深度学习

本文链接：https://blog.youkuaiyun.com/it_lxg123/article/details/121142057

本文介绍了在训练Bert模型过程中tokenizer.encode()和tokenizer.tokenize()的区别，前者返回字典ID，后者返回token。此外，讨论了TensorFlow 2.0中模型保存的两种形式：.pb格式包含了模型参数、结构和计算过程，适合直接部署；.ckpt格式仅保存模型参数，恢复时需重新定义网络结构。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. tokenizer.encode() 方法与 tokenizer.tokenize() 之间的区别：
(1) tokenizer.encode() 返回其在字典中的id

(2) tokenizer.tokenize() 返回 token

def bert_():
    model_name = 'bert-base-chinese'
    MODEL_PATH = 'F:/models/bert-base-chinese/'

    # a.通过词典导入分词器
    tokenizer = BertTokenizer.from_pretrained(model_name)
    # b. 导入配置文件
    model_config = BertConfig.from_pretrained(model_name)
    # 修改配置
    model_config.output_hidden_states = True
    model_config.output_attentions = True
    # 通过配置和路径导入模型
    bert_model = BertModel.from_pretrained(MODEL_PATH, config=model_config)
    # tokenizer.encode()
    sen_code_encode = tokenizer.encode("自然语")
    print("sen_code_encode",sen_code)
    # tokenizer.tokenize
    sen_code_tokenizer = tokenizer.tokenize("自然语")
    print("sen_code_tokenizer", sen_code0)

if __name__ == '__main__':
    bert_()