结构化知识抽取案例

天一生水water

已于 2024-09-25 10:19:25 修改

阅读量512

点赞数 4

文章标签：数据库 neo4j 知识图谱

于 2024-09-25 10:13:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Metal1/article/details/142515967

版权

假设我们有一个包含中文电影信息的数据库表 movies，其中包含以下字段：

movie_id (电影ID)
title (电影标题)
year (上映年份)
genre (类型)
director (导演)
rating (评分)

表中的部分数据如下：

知识抽取步骤

数据获取：从数据库中查询所需的数据。例如，我们可以查询所有评分大于8.5的电影。
数据清洗：对获取的数据进行清洗，去除重复项、空值等。
知识建模：将提取的数据转换为结构化的知识形式，如知识图谱中的节点和边。
知识存储：将提取的知识存储到知识图谱或其他知识库中，以便后续使用。

1. 数据获取使用SQL查询从数据库中提取评分大于8.5的电影：

SELECT * FROM movies WHERE rating > 8.5;

2. 数据清洗检查并处理数据中的空值、重复项等。假设数据已经比较干净

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。