如何利用jieba分词加知识图谱的方式来做问答系统

最新推荐文章于 2024-03-09 12:21:37 发布

原创

最新推荐文章于 2024-03-09 12:21:37 发布 · 1.4k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#自然语言处理

本文探讨了jieba分词库的原理及应用，包括使用前缀树和朴素贝叶斯思想进行分词，以及TF-IDF算法进行名词实体识别。同时，对比了条件随机场(CRF)在实体识别上的优势。

解决思路：

1. 首先利用结巴分词对用户的输入做名词实体挖掘处理，目的是为了挖掘出客户想要寻找的那个对象。

在试验的过程中你可能会发现jieba并不能很好的分辨出你想要的对象，这时你需要定义自己的名词实体。

如上图所示，第一列是你想新增的实体名词，第是词频，第3列是词性，n表示名词

jieba.load_userdict("add_dict.txt")

print(jieba.analyse.extract_tags(sentence1, topK=1, withWeight=True, allowPOS=('n')))

import jieba
jieba.load_userdict("add_dict.txt")
sentence1 = 'e生宝的购买流程是什么样的。'
print(jieba.analyse.extract_tags(sentence1, topK=1, withWeight=True, allowPOS=('n')))

通过上面的方式就可以识别出你关注的实体名词了。

但是上面的方式有个问题，如果句子出现其他名词，它的评分要高于你想要的名词，这种情况可能会出现误选。

还有种方式是，利用jieba的分词功能，将句子做分词处理，得到词数组。提前准备要自己的名词实体库，存放在字典A中。

遍历词数组中的词，若存在字典A中就是目标词。

2. 将剩余句子中的词和实体的属性做相识度匹配，匹配到的属性就是返回给用户的答案了。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

带着托托写代码

关注关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

[Python知识图谱] 三.Jieba工具中文分词、添加自定义词典及词性标注详解

杨秀璋的专栏

07-28

2万+

本系列文章主要结合Python语言实现知识图谱构建相关工程，具有一定创新性和实用性，非常希望各位博友交流讨论，相互促进成长。前面两篇文章详细讲解了哈工大Pyltp工具，包括中文分词、词性标注、实体识别、依存句法分析和语义角色标注等。但是其中文分词效果不是很理想，如“贵州财经大学”总是切分成“贵州”、“财经”和“大学”，这是因为词典中这些词的权重较高。这篇文章主要介绍最经典的自然语言处理工具之一——Jieba，包括中文分词、添加自定义词典及词性标注等内容。

知识图谱在智能问答系统中的应用

最新发布

AI天才研究院

10-29

1185

知识图谱在智能问答系统中的应用关键词：知识图谱、智能问答系统、图数据库、数据采集、关系抽取、推理算法、问答系统架构摘要：本文详细探讨了知识图谱在智能问答系统中的应用，从基础知识图谱的概念、表示方法，到构建流程，再到应用场景，进行了全面而深入的剖析。文章介绍了如何利用知识图谱实现智能问答系统，并讨论了相关算法和优化策

参与评论您还未登录，请先登录后发表或查看评论

[源码和文档分享]基于BeautifulSoup和jieba的用户投书文本知识图谱构建研究与实现...

12-01

182

自从google公司推出旗下的产品KnowledgeGraph以来，知识图谱这个概念越来越受到学术与工业界的关注。如何以质量参差不齐的网页数据作为原始数据源，构建知识图谱已经成为了一个热门的研究课题。互联网技术的迅速发展导致了网民数量的快速增长。愈来愈多的人热衷于在网络论坛上发表想法。在这个背景下，投诉类型论坛吸引了政府和个人的广泛关注。他们都希望能从投诉类型...

python jieba分词_利用Python+Gephi构建金庸人物关系知识图谱

weixin_39809168的博客

12-04

1420

Python+Gephi丨金庸上周末闲来无事，一时兴起，想着金庸老爷子的武侠世界那么宏大，作为金庸迷，为何不做个人物关系知识图谱看看效果如何？数学模型构建利用Gephi构建知识图谱，无外乎两点：节点信息和边界信息。节点数据还是很好处理的，将金庸武侠世界的所有有名有姓的人物取为节点数据即可，关键在于边界数据的提取。参考众多大神的经验，大部分是以小说章节或者段落为基本分析单元，将出现在同一分...

猿解疑（基于ssm+vue框架、AI大模型、jieba分词实现智能问答系统）

m0_58682482的博客

06-01

422

内接AI大模型实现智能问答功能，使用jieba分词实现根据问题内容智能分类，内有小彩蛋（使用random类实现给新用户随机分配头像和昵称）。有对应余额功能，根据用户公开问题的浏览量获得收入，提问AI消费以及充值功能。

3.jieba分词+es实现KBQA问答系统

wang37444的专栏

05-14

3195

1.jieba分词 jieba分词号称是最好的中文分词器，目前Python版本在运维，Java版本很久没有更新了。 jieba能实现什么功能呢？我们通过下面的TEST可以看下：我们实现一个例子：如：系统提问“UA融易贷利率是多少” @Test public void testReadJiebaDict(){ /**JiebaSegmenter:分词器，WordDictionary:词典*...

知识图谱 — jieba、pyhanlp、smoothnlp工具实现中文分词（词性表）

zkkkkkkkkkkkkk的博客

12-30

3081

基于知识图谱的问答系统（protege，jena，jieba分词的结合）

热门推荐

强风吹拂

12-21

1万+

一个简单的问答系统，只不过这其中的构建过程是基于知识图谱。主要的使用的工具（AKA，重点）有protégé（用于知识图谱的建模）、jena数据库（其为一个基于三元组的图数据库，用于完成知识图谱的存储）、Python中的应用程序框架Streamlit与jieba分词库。（需要额外按照的环境：jena数据库，了解明白SPARQL语句，对分词有初步掌握）...

精选资源

基于Python实现的医疗知识图谱的知识问答系统源码期末大作业.zip

04-24

在这个项目中，开发者构建了一个能够处理和回答与健康医疗相关问题的系统，利用知识图谱的强大功能来提供准确的信息。以下是这个系统可能涉及的关键知识点： 1. **Python编程语言**：作为项目的基础，Python因其...

jieba详细使用说明

studyvcmfc的专栏

08-30

497

https://blog.youkuaiyun.com/qq_35273499/article/details/79082500

Python——＞jieba库的使用

qq_55016379的博客

04-13

3708

jieba库的使用 jieba是Python中的一个非常重要的一个第三方中文分词函数库因为jieba库是第三方函数库，需要通过下载才能引用，不会第三方库下载的可以参考我的之前的第三方库引用对的笔记 jieba库的概述 jieba（“结巴”）是Python中一个重要的第三方中文分词函数库分词原理：jieba分词原理是利用一个中文词库，将待分词的内容与分词词库进行比对，通过图结构和动态规划方法找到最大概率的词组。除了分词，jieba还提供增加自定义中文单词的功能 jieba库支持的三种分词模式精确模式：

python问答系统实践

qq_33909788的博客

11-03

6139

本人最近在研究NLP，做了一个简易版的问答系统。一个完整的问答系统主要包含：实体识别、分词、语法分析、知识图谱的构建、知识推理及意图识别等命名实体识别句法分析实体关系抽取 知识图谱的构建知识推理今天开个头，以后有时间慢慢写。。。 ...

知识图谱学习(一)：知识提取

juranyaoyingwen的博客

05-02

5769

一. 正则表达式 1.1 Python re 1.1.1 regex语法推荐网站http://pythex.org/,不但有语法,还可以在线测试 1.1.2 match匹配模式 re.match(pattern,string,flags)尝试从字符串的开始匹配一个模式,flags是匹配模式，可以使用按位或’|’表示同时生效，也可以在正则表达式字符串中指定。 1)....

一文秒懂机器人如何通过知识图谱回答用户问题

m0_57974417的博客

01-28

1189

机器人的大脑是结构化的聊天机器人学习大量的文本、照片等非结构化文件，通过一些AI技术（如NLP自然语言处理、多模态识别、目标识别等）按其语义结构化成知识图谱，这个知识图谱就是聊天机器人的大脑了。知识图谱由“实体”和“关系”组成，对应图中的点和边，具有逻辑推理功能和特征表达功能。常见“实体”类型有时间、地点、人物、事件等，常见“关系”有“出生于”、“父母”、“孩子”、“夫妻”、“出生于”等等。机器人消化人类语言 🤖️先从用户的问句中锁定目标实体为“汤姆·汉克斯”这个人、关系为“合作过”，再根

问答系统：构建知识图谱与检索模型

AI天才研究院

03-09

203

1.背景介绍在信息爆炸的时代，我们每天都会接触到大量的信息，而如何从这些信息中快速准确地找到我们需要的信息，成为了一个重要的问题。问答系统就是解决这个问题的一种有效的工具。问答系统是一种能够理解用户问题，并给出精确答案的智能系统。它不同于传统的搜索引擎，搜索引擎只能提供相关的网页链接，而问答系统则能直接给出答案。 问答系统的核心技术包括

结巴（jieba）分词 java 实现

qq_20667511的博客

06-22

1万+

结巴分词java版的使用包括自定义词典关于java版词性分词的问题

问答系统概述（待续）

三人行必有我师的博客

09-06

2446

问答系统主要术语：问题类型、答案类型、问句焦点、问句主题、候选段落、候选答案。分别介绍如下：问题类型：对问题的分类，用以产生相应的策略和答案形式。问题分为：事实类问题，列表类问题，定义类问题，列表类问题难度较大，因为涉及到不同的实体识别，这些实体往往分散在不同的文本段落。定义类问题难度最大，识别出用户提出的概念，然后再组织语言给出答案。另外还有根据语言学分为是非类问题、关系型问题、最型问题...

语音问答系统调研

Suan2014的博客

09-14

2556

因工作需要，准备开始做语音问答系统，之前对语音和自然语言处理（NLP）没接触过，所以开头还是很难的，历时两周做了一个大概的了解，适合像我这样的新手入门，里边借鉴了n多大神的内容，并给出了讲得比较好的网页、课程等等，如侵权请联系删除。。。一对话系统框架二调研内容语音识别-- Speech Recogniton, SR 闲聊型问答系统--Chitchat-bot 知识库...

基于Python与Neo4j的电影知识图谱问答系统实现

Python与Neo4j结合构建电影知识图谱智能问答系统是一项集数据采集、图数据库建模、自然语言处理与智能查询于一体的综合性项目，充分体现了知识图谱在实际应用场景中的强大能力。该项目以“电影”为核心领域，通过...