用Bert模型计算句子的vector

最新推荐文章于 2024-07-09 22:13:55 发布

raintungli

最新推荐文章于 2024-07-09 22:13:55 发布

阅读量3.2k

点赞数

CC 4.0 BY-SA版权

分类专栏： Tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/raintungli/article/details/96739200

Tensorflow 专栏收录该内容

6 篇文章

订阅专栏

本文介绍如何使用2018年Google开源的Bert模型来计算句子的向量表示。具体步骤包括获取模型的encoder层、拼接不同层级的特征、计算句子的有效长度并最终得出句子的向量。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. Bert模型

Bert模型是2018年google开源出来的NLP的模型，具体实现请参考：https://github.com/google-research/bert

2. Bert模型计算句子的vector

2.1 通过模型获取句子的encoder层

 model = modeling.BertModel(
        config=bert_config,
        is_training=False,
        input_ids=input_ids,
        input_mask=input_mask,
        token_type_ids=input_type_ids,
        use_one_hot_embeddings=use_one_hot_embeddings)
model.get_all_encoder_layers()

2.2 拼接层级

all_layers = [model.get_all_encoder_layers()[layer_index] for (i, layer_index) in enumerate(layer_indexes)]
encoder_layer = tf.concat(all_layers, -1)

这时候生成的是以句子最大长度的x ,768*n层纬度的矢量，比如最大句子长度128，层数是-1,-2,-4,-9(4层)

Tensor("concat:0", shape=(?, 128, 3072), dtype=float32)

2.3 计算句子的vector

因为bert模型返回的是句子长度128维的矢量，但我们每个句子都有自己的长度，所以我们需要找到真实长度所对应的矢量，在传递给模型的参数的时候有一个mask，代表128维的句子长度里的有效字的位置用1来标示

点乘mask 找到有效的纬度的矢量

r = X * tf.expand_dims(mask, axis=-1)

简单的平均算法求句子的vector，将有效纬度的矢量相加，在每一层上求均值

tf.reduce_sum(t, axis=1) / (
                    tf.reduce_sum(mask, axis=1, keepdims=True) + 1e-10)

最后输出的是以层为纬度(3072)的句子的vector

Tensor("concat:0", shape=(?, 3072), dtype=float32)

这样就能简单的计算获取到了一个句子的vector

博客等级

码龄18年

博客专家认证

121
原创

218
点赞

465
收藏

576
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 从如何在Java删除乱码文件中开始说起

下一篇：: Soot 静态分析框架（一）整体框架

最新评论

JVM源码系列：java如何实现多态性，基于itable, vtable源码分析
MYGAG: 错误一大堆
JVM源码研读：章节序列
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
Soot 静态分析框架（一）整体框架
嘉嘉嘉le: 请问有没有文章中的sootclass思维导图的完整版？
Soot 静态分析框架（二）Soot的核心
wtz519: 在Soot中，i0<0 和 i1=0 这两个语句都可以被分解成Unit和Value。要区分哪些部分是UnitBox，哪些部分是ValueBox，你需要理解Soot中的基本概念： Unit（单元）：Unit是Soot中表示字节码指令的基本单元，通常对应于一个字节码指令。它们用于构建控制流图（Control Flow Graph，CFG）和表示代码的执行流程。 Value（值）：Value是Soot中表示字节码中的值的抽象概念，可以代表局部变量、字段、常量等各种类型的值。它们用于表示和操作代码中的数据。 UnitBox（单元盒）：UnitBox用于包装Unit对象，提供了对Unit的间接引用，以便在分析中传递和操作Unit。 ValueBox（值盒）：ValueBox用于包装Value对象，提供了对Value的间接引用，以便在分析中传递和操作Value。现在，让我们分析你的示例 if i0<0 i1=0 来区分哪些部分是UnitBox，哪些部分是ValueBox： i0<0 是一个条件语句，表示一个比较操作。在Soot中，这将被表示为一个Unit，因此 i0<0 是一个Unit。 i1=0 是一个赋值语句，用于将0赋值给变量i1。在Soot中，这个赋值语句也将被表示为一个Unit，因此 i1=0 也是一个Unit。 i0 和 i1 是局部变量的引用，它们表示值。在Soot中，这些引用将被表示为Value，因此 i0 和 i1 都是Value。 < 和 = 操作符是用于比较和赋值的操作，它们不是Unit或Value，而是Java字节码中的操作符。综上所述，i0<0 和 i1=0 都是Unit，而 i0 和 i1 都是Value。在Soot中，你可以使用UnitBox来包装Unit对象，使用ValueBox来包装Value对象，以便在分析中传递和操作它们。
Soot 静态分析框架（二）Soot的核心
wtz519: 在Soot分析框架中，Unit和Value是两个核心概念，用于表示和操作Java字节码中的代码和数据。 Unit（单元）： Unit是Soot中用于表示字节码指令的基本单元。每个Unit通常对应于一个字节码指令，例如方法调用、赋值操作、条件分支等。 Unit用于构建控制流图（Control Flow Graph，CFG）和数据流图（Data Flow Graph），以便进行各种静态分析。它们帮助Soot分析工具理解和操作Java字节码中的执行流程。 Value（值）： Value是Soot中用于表示字节码中的值的抽象概念。 Value可以代表局部变量、字段、常量等各种类型的值。它是Soot的数据流分析中的关键组成部分，用于表示和操作字节码中的数据。 Value对象可以被包含在各种字节码指令中，例如赋值语句的左值和右值都可以是Value。总之，Unit用于表示字节码指令，而Value用于表示字节码中的各种值。这两个概念是Soot分析工具的基础，它们使得分析工具能够理解和操作Java字节码，进行各种静态分析和优化。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。