- 博客(34)
- 收藏
- 关注
原创 LightRAG核心原理和数据流
lightRAG其实就是微软Graph的简化版本,将社区、社区宅摘要这些环节做了去除,这种去除是好的,不会太重,对于知识更新也更快;应用场景都很类似,一个是local search,一个是global search,一个是hybrid searchlightRAG对应的是lowlevelsearch(主要关注检索特定的实体以及它们相关的属性或关系。
2025-04-05 15:13:59
564
原创 conda env pip install error:No space left on device
解决pip install error no space left on device
2024-07-03 17:33:12
871
原创 利用AI技术预测未被充分监测的流域中的极端洪水事件笔记
利用人工智能(AI)技术预测未被充分监测的流域(ungauged watersheds)中的极端洪水事件
2024-03-26 19:19:27
1498
1
转载 实测有效-高速下载hugginface model & datasets
利用 HuggingFace 官方的下载工具和从上对模型和数据集进行高速下载
2024-01-09 10:01:16
2737
1
原创 ChatGLM-LLaMA-chinese-insturct 学习记录(含LoRA的源码理解)
ChatGLM-LLaMA-chinese-insturct 学习记录(含LoRA的源码理解)
2023-05-08 11:57:46
1743
1
原创 基于本地知识构建简易的chatPDF
介绍:一种利用 ChatGLM-6B + langchain 实现的基于本地知识的 ChatGLM 应用Github:这里的整体逻辑还是相对比较简单的,每个环节都还可以继续优化,作者在群里说了,项目代码已经在持续优化中了。
2023-04-26 19:39:15
2843
1
原创 简读 General Language Model Pretraining with Autoregressive Blank Infilling
GLM模型
2023-04-05 19:23:26
631
1
原创 DAY5 Recommended system cold startup problem
3 使用其它站点的行为数据, 例如腾讯视频&QQ音乐 今日头条&抖音。根据用户的标签可以做人群聚类 用以有用户的行为做推荐。如果应用缺少用户行动数据-》基于内容的推荐。随着用户行为积累的越来越多-》协同过滤。设备信息:定位、⼿机型号、app列表。尽可能收集用户信息,构建用户画像。⽤户注册信息:性别、年龄、地域。社交信息、推⼴素材、安装来源。4 新老用户推荐策略的差异。基于内容和协同过滤共同工作。举例 性别与电视剧的关系。2 引导用户填写兴趣。更多的使用流行度对剑。
2022-12-25 21:07:47
1007
原创 DAY4 Recommendation system evaluation
Exploitation & Exploration 探索与利用问题。
2022-12-25 19:58:11
162
1
原创 Bert-flow模型的理论基础【转】和理解
Bert-flow模型的理论基础和理解1- 理论基础2- flow模型的理解3- Bert-flow模型4- 自己的实验和心得我只是大佬的搬运工!文本的主要内容是记录下自己学习Bert-flow的流程,从论文的出来,到各大大佬对其的解读,自己的理解还是不到位的,其主要原因是数学没有跟上,于是记录下自己的看过的博客。1- 理论基础这部分主要是对数据基础的理解,可以参照以下博客:flow的理论基础2- flow模型的理解主要参考苏神的讲解,稍微百度了下,属苏神讲解的详细细水长flow之NICE:流
2021-01-13 15:27:08
1600
1
原创 多标签、类别不均衡分类问题
最近老是遇到多标签分类问题????,加之自己对loss的理解还是不够到位整理以下链接以作学习参考使用:多标签分类:定义、思想和算法主要是将多标签分类的定义,思考和一些解决办法。????multilabel_categorical_crossentropy????损失函数主要是介绍了两个损失函数的区别:????categorical_crossentropy????????binary_crossentropy????二分类、多分类与多标签问题的区别及对应损失函数的选择这篇主要分析了so
2020-09-23 16:59:04
6767
3
原创 指代消解模型浅析
本文主要根据以下几个方面进行阐述:01 指代消解主流模型02 模型分析03 数据集介绍04 模型调研结果及调试过程记录01 指代消解的主流模型指代消解任务再OntoNotes数据集上的刷榜记录16年Clark等人发表 《Improving Coreference Resolution by Learning Entity-Level Distributed Representations》论文下载:https://arxiv.org/abs/1606.01323该文章使用4个深度学习模块
2020-09-04 15:23:17
2971
5
原创 指代消解开源工具
01 简介指代消解是自然语言处理的一大任务之一,它是信息抽取不可或缺的组成部分。在信息抽取中,由于用户关心的事件和实体间语义关系往往散布于文本的不同位置,其中涉及到的实体通常可以有多种不同的表达方式,例如某个语义关系中的实体可能是以代词形式出现的,为了更准确且没有遗漏地从文本中抽取相关信息,必须要对文章中的指代现象进行消解。指代消解不但在信息抽取中起着重要的作用,而且在机器翻译、文本摘要和问答系统等应用中也极为关键。02 数据集KBP2015/2016 文本指代分析英文数据集ACE2005(跨文本指
2020-09-04 15:04:34
2769
1
原创 Onnx高效推理框架
Onnx推理框架:参考:Inference PyTorch Bert Model with ONNX Runtime on GPUpytorch官网说明Supported Operator Onnx支持的算子https://pytorch.org/docs/stable/onnx.html?highlight=onnx%20runtimeSupported Model Onnx支持的模型:AlexNetDCGANDenseNetInception (warning: this m
2020-09-04 15:00:33
3743
2
原创 基于知识图谱的问答系统(下)
基于知识图谱的问答系统(下)本项目是基于知识图谱的问答系统,BERT+BILSTM+CRF做命名实体识别和句子相似度比较,最后实现线上的部署。项目的分以下步骤进行描述:1-项目介绍- 1.1-数据集介绍- 1.2-技术方案流程- 1.3-评价标准2-命名实体识别模型训练代码理解- 2.1-数据集准备- 2.2-数据预处理- 2.3-定义主模型- 2.4-开始训练3-BE...
2020-03-12 06:03:36
9927
21
原创 基于知识图谱的问答系统(上)
基于知识图谱的问答系统(上)本项目是基于知识图谱的问答系统,BERT+BILSTM+CRF做命名实体识别和句子相似度比较,最后实现线上的部署。项目的分以下步骤进行描述:1-问答QA系统简单介绍- 1.1-问答系统目标- 1.2-问答系统分类- 1.3-问答系统框架2-知识库问答KB-QA介绍1-问答QA系统简单介绍-1.1-问答系统目标总目标:给定一个自然语言的问题,能够得...
2020-03-06 17:29:13
7838
1
原创 机器阅读理解总结
机器阅读理解总结引言本文主要是总结下自己最近学习到的机器阅读理解的相关知识。文章的主要结构分以下步骤:常见的机器阅读理解的任务阅读理解任务的分析以及解决机器阅读理解的模型分析这些模型之间的差异阅读理解任务主要是让机器根据给定的文本回答与文本相关的问题,15年以前由于小规模的数据集和基于规则的方法问题不能兴起,后面兴起了是因为:1、深度学习框架的阅读理解提出。2、大规模数据集的公布...
2020-03-05 23:26:24
1942
1
原创 New Pointer-Generator Networks for Summarization
指针生成网络之文本摘要文章目录文本摘要任务介绍模型数据数据集来源数据分析数据预处理实验结果评估结果分析改进措施,及实验效果文本摘要任务介绍文本摘要主要分为两种模式:一种是生成式,一种是抽取式。其中...
2020-03-02 21:15:09
3299
6
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人