KG-构建：知识图谱基础代码构建（医疗向）

u013250861

已于 2024-02-14 22:26:48 修改

阅读量950

点赞数

分类专栏：知识图谱（Knowledge Graph）文章标签：知识图谱人工智能

于 2022-12-22 16:20:48 首次发布

本文链接：https://blog.youkuaiyun.com/u013250861/article/details/128136710

版权

知识图谱（Knowledge Graph）专栏收录该内容

84 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了如何构建医疗知识图谱，包括数据获取和处理。项目基于GitHub上的刘老师开源的医疗问答机器人，数据来源于寻医问药网的疾病百科。通过爬虫获取8807条疾病数据，使用`build_data.py`进行数据规整，利用`pymongo`库存储数据。重点讲解了`MedicalGraph`类中`collect_medical()`方法，涉及疾病信息的字典构建和存储到数据库的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

项目来源是GitHub上面刘老师做的一个基于知识医疗图谱的问答机器人，本文主要关注点放在建立知识图谱这一侧。这个项目并且将数据集也开源了放在dict和data文件夹下，让我觉得真的很难得，得给老师一个star！

https://github.com/liuhuanyong/QASystemOnMedicalKG

data_spider.py

首先是数据获取阶段，解读刘老师的爬虫项目。

import urllib.request
import urllib.parse
from lxml import etree
import pymongo
import re
 
 
class CrimeSpider:
    def __init__(self):
        self.conn = pymongo.MongoClient()
        self.db = self.conn['medical']
        self.col = self.db['data']
 
    '''根据url，请求html'''
    def get

了解本专栏