NLU - 快速使用BioBERT进行Embedding任务

本文介绍了如何在JohnSnowLabs的NLU平台上安装及配置,包括对JDK版本的要求,然后展示了如何使用BioBERT模型进行文本嵌入,通过SparkNLP构建了一个简单的pipeline并进行了预测示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

安装NLU

  • nlu.johnsnowlabs.com 是 John Snow Labs 公司提供的一个自然语言理解(Natural Language Understanding, NLU)平台。用户可以进行模型训练、部署、以API形式直接调用进行预测、模型管理等操作。
  • 完整安装johnsnowlabs指导
  • 也可以仅安装nlu pypi,我这样不行
  • 这里安装超级复杂、混乱。注意jdk版本严格要求,是经典jdk8!而且有的版本还不行,我记不到是openjdk还是哪一个了,大家可以尝试,只要报错了java相关的问题,就换一下版本。我最终使用的是zulu jdk8
  • 我们需要使用的BioBERT embedding模型

调用BioBERT进行embedding

  1. 启动sparknlp

    import sparknlp
    spark = sparknlp.
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值