情感分析是企业洞察客户需求和改进产品服务的重要工具。近年来,随着自然语言处理 (NLP) 技术的飞速发展,情感分析变得更加精准高效。Google 推出的 Gemini 模型,作为大型语言模型 (LLM) 的代表,拥有强大的文本处理能力,可帮助企业轻松实现情感分析。
Gemini 模型在 BigQuery 中的应用
BigQuery 作为 Google 云数据仓库,拥有强大的数据分析能力。将 Gemini 模型与 BigQuery 结合,可以实现更加高效的情感分析。具体来说,BigQuery 提供了 ML.GENERATE_TEXT 函数,该函数允许您直接在 SQL 查询中利用 Gemini 模型来分析 BigQuery 表中的文本。这意味着您无需将数据从 BigQuery 迁移到其他平台或编写复杂的代码,就可以进行深入的文本分析。
ML.GENERATE_TEXT 函数还可用于使用基于gemini-pro-vision 多模态模型的远程模型来生成描述视觉内容的文本。该功能主要具有以下优势:
-
易于使用: 基于 SQL 的查询方式,即使非专业人员也能轻松上手。
-
可扩展性: BigQuery 可以处理海量数据,Gemini 模型可以高效分析大规模文本数据。
-
强大的分析能力: Gemini 模型可以进行细粒度的文本分析,提取情感、主题、关键词等信息。
-
灵活的应用场景: 情感分析、主题提取、文本摘要、文本生成等多种场景。
接下来,我们以假设的一个打车公司为例,了解如何使用 ML.GENERATE_TEXT 函数:
设置说明:
-
开始之前,请选择您的 GCP 项目,链接结算帐户,并启用必要的API;
-
创建云资源连接并获取连接的服务账户;
-
授予服务帐户访问权限。
-
加载数据。要从公共存储帐户加载,请使用以下命令:
-
请将“[PROJECT_ID.DATASET_ID]”替换为您的 project_id,并输入数据集的名称
-
该命令将在您的数据集中创建一个名为“ customer_review ”的表
-
CREATE SCHEMA IF NOT EXISTS `[PROJECT_ID.DATASET_ID]` OPTIONS (location='us');
LOAD DATA OVERWRITE `[PROJECT_ID.DATASET_ID].customer_review`
FROM FILES ( format = 'PARQUET',
uris = ['gs://data-analytics-golden-demo/rideshare-lakehouse-raw-bucket/rideshare_llm_export/v1/raw_zone/customer_review/000000000000.parquet']);
情感分析
然后,让我们来看一个执行情感分析的例子。
1.创建模型
在 BigQuery 中创建一个利用 Vertex AI 基础模型的远程模型。
句法:
CREATE O