- 博客(8)
- 收藏
- 关注
原创 面向非结构化文本的信息抽取与NLPIR大数据语义智能分析平台
从海量文本信息中获取关键信息是一项重要需求,信息抽取任务通常可由关系集合是否给定分为封闭信息抽取和开放信息抽取两大类。其中,封闭信息抽取又根据实体对是否给定分为关系抽取(分类)和实体关系联合抽取两类。NLPIR平台提供一键式操作,集成各种文本挖掘功能,在专业性要求不高的情况下推荐使用。
2024-10-23 11:02:56
977
原创 大模型知识幻觉问题及缓解方案
垂直行业知识问答是目前我们所能感知的稍微能贴近LLM落地真实需求的场景,但其所面临的幻觉性问题一直是个无法根治的问题。引入领域知识和提升检索相关性或能缓解大模型幻觉问题。
2024-10-23 10:41:33
465
原创 【逐步实操】Tesseract OCR 最新版本安装教程(Windows)+ 图片PDF转WORD实操
在文本挖掘领域,少不了对PDF文件进行处理的,其中有不少PDF里面可能是单纯的图片,这个时候就需要采用OCR技术进行图像文字识别。今天发布一版将图片PDF转为WORD文字的教程,首先需要安装并且配置好Tesseract OCR工具。下面展开详细教程。
2024-05-30 21:39:36
13949
6
原创 【ChatGLM2-6B微调】6GB显存实现ChatGLM2-6B大模型微调!
6GB显存配置实现ChatGLM2-6B大模型微调!使用官方项目包中的P-Tuning V2做微调实践。
2023-08-15 15:37:55
5404
3
原创 【deepKE做NER教程】调bug!lstmcrf和bert均跑通
目前关于deepke的实战教程大多数是以re关系抽取作为演示的,ner的代码和教程通过readme也能跑也能做,不过还是会有一些bug,这里将我实验过程中的步骤,以及遇到的bug、且如何调整,给大家分享一下。
2023-07-17 15:20:52
1814
9
原创 【论文浅析】大模型与知识图谱融合
随着多模态LLMs和KGs的发展,这个框架可以扩展到处理多模态的数据,如视频、音频和图像。在应用层,LLM和KG可以被整合到一起,以解决各种现实世界的应用,如搜索引擎、推荐系统和AI助手。②、共指消解(同一文本、跨文本)共指消解指的是查找文本中引用(即提及)同一实体或事件的所有表达式。①、LLM作为文本编码器:应用LLMs对实体和关系的文本描述进行编码,以丰富KG的表示。有三种:KG增强的LLMs、LLM增强的KG、协同的LLM+KG。①、实体识别(命名实体识别、实体类型、实体链接)
2023-07-13 22:09:35
2784
1
原创 【本地逐步部署教程】清华ChatGLM-6B本地部署,适合小白和具备一定基础的大模型尝试者
详细讲解Anaconda的安装、虚拟环境的创建和镜像源配置、ChatGLM-6B模型代码和模型参数的下载、CUDA驱动包括CuDNN的安装、ChatGLM-6B运行
2023-07-11 20:33:21
1551
原创 清华ChatGLM2-6B一键式部署,无需自行安装依赖环境!!
小白式部署,事先已经做好并上传了ChatGLM2-6B模型框架和模型参数的整合文件,且为int4量化版本,支持6GB显存电脑使用;同时,支持ChatGLM2-6B推理运行的环境也全部打包上传了,解压缩到自己的conda的envs文件夹下即可用!此外上传了CUDA、CuDNN安装包,甚至包括Anaconda2的安装包(个人感觉版本越老越好用,主要是网上教程多)
2023-07-11 20:17:48
2656
11
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人