- 博客(105)
- 资源 (19)
- 收藏
- 关注

原创 在 chest X-ray 数据集上做肺分割
在 chest X-ray 数据集上做肺分割介绍在此任务中,您将开发一个系统,可以在胸部X光片中自动检测肺部的边界框。对于这项任务,我们将使用一个名为[Yolo]的网络(https://arxiv.org/pdf/1506.02640.pdf) 。有关YOLO(以及最新的YOLOv2 / YOLO9000)方法的详细信息,请参阅以下文章:** YOLO:统一的实时物体检测** [http...
2018-12-25 21:53:51
12257
6

原创 医疗影像的图像处理基础
介绍计算机辅助诊断和图像处理基础介绍In this first assignment, we are going to implement and apply some basic image processing techniques, and we will get familiar with some kind of medical imaging data.In particular...
2018-12-20 10:03:03
12870
4
原创 Whisper in ONNX
在我的 CPU 上,使用 ONNX 转换可以获得适度的加速。对于编码器,只有批次维度是动态的,因为 whisper 使用固定的 30 秒音频窗口。对于解码器,批次和序列维度,即生成的标记数量,都是动态的。我使用了一个小的 Rust 程序从我的麦克风捕获了 30 秒的样本,并将其转换为梅尔频率倒谱。在接下来的内容中,我将专注于最简单的解码方法,即不带时间戳预测的贪婪解码,并忽略键值缓存。我们用一个固定的序列初始化预测的标记,以指示模型任务。在这里我将使用前者,因为后者在我的实验中失败了。
2025-03-19 09:45:53
343
原创 DeepSeek R1 进行信息提取
许多人谈论思维的重要性,认为这是强化学习在LLMs领域带来的主要促进因素之一,许多论文也表明,思维链可以提高模型的性能,因此认为思维可以改善性能是非常合理的。RL 的另一个有趣特性是我们可以优化不同的目标并手动控制它们的影响,例如,如果我们发现我们的模型在关系提取上很困难,我们可以为正确提取的关系生成的示例分配更高的奖励,与其他特征相比。在开始强化学习之前,考虑到我们使用的是小模型,需要额外的监督训练,以将模型返回的数据调整为正确的格式。我们计划进行更多实验,使用更大模型和更高质量的数据,请保持关注。
2025-02-10 19:34:26
1116
原创 从 DeepSeek R1 中提取数学推理数据,使用 CAMEL
通过使用我们的合成数据生成管道,CAEML-AI 制作了三个全面的数据集,现已提供以增强您的数学推理和问题解决能力。本笔记提供了一个关于配置和使用 CAMEL 数据蒸馏管道的全面指南,以生成高质量的数学推理数据集,突出详细的思维过程(长链思维数据)。:一种系统的方法,用于从像 DeepSeek R1 这样的模型中提取和提炼高质量推理数据集,包含详细的思维过程。一个包含 4000 个高级数学问题及其解决方案的数据集,提炼了改进历史,展示了解决方案是如何逐步完善的。接下来,让我们设置推理模型并评估模型。
2025-02-05 19:04:21
790
原创 NVIDIA JetPack 6.2 为 NVIDIA Jetson Orin Nano 和 Jetson Orin NX 模块带来了超级模式
如果在此模式下模块的总功率超过了热设计功率(TDP)预算,则模块将被限制到较低的频率,从而在保持在热预算内的同时提供较低的性能。本文讨论了超级模式的细节,包括新的功率模式、针对 Jetson Orin Nano 和 Orin NX 模块的流行生成 AI 模型的基准测试、文档更新以及支持超级模式的 NPN 合作伙伴的见解。表 2 比较了 Jetson Orin Nano 4GB 和 8GB 以及 Jetson Orin NX 8GB 和 16GB 在其原始模式和超模式下的详细规格。
2025-01-24 19:04:46
1323
原创 EfficientQAT: 大型语言模型的高效量化感知训练
然后,您可以加载 Block-AP 的量化模型以进行进一步的 E2E-QP。具体而言,E2E-QP 可以通过更改训练数据集适应不同的场景。我们在下面提供了关于 Llama-2-7B 的 w2g64 量化的训练脚本示例。EfficientQAT 包括两个连续的训练阶段:所有参数的块级训练 (以下是使用 GPTQ 或 BitBLAS 量化格式进行推理的示例。按相同比例增加,以保持相同的批量大小。修改为脚本中量化模型的文件夹。在我们的实验中对 2 位数为。在我们的实验中对于 2 位是。详细的训练脚本可以在。
2024-11-29 16:30:43
866
原创 使用 Llama 3.1 和 Qdrant 构建多语言医疗保健聊天机器人的步骤
'sources': [Document(metadata={'Disease': '疟疾', '_id': '1497e650–06e7–458c-a542–9f8815e7303f', '_collection_name': 'healthcare_collection'}, page_content='疾病:疟疾描述:由疟原虫科原生动物寄生虫引起的传染病,可通过按蚊叮咬或受污染的针头或输血传播,是最致命的类型。我们需要翻译器的原因是,嵌入是从英语文本生成的,用户可以使用任何选择的语言。
2024-09-26 15:06:22
1459
1
原创 使用 Llama-index 实现的 Agentic RAG-Router Query Engine
你是否也厌倦了我在博文中经常提到的老式 RAG(Retrieval Augmented Generation | 检索增强生成) 系统?反正我是对此感到厌倦了。但我们可以做一些有趣的事情,让它更上一层楼。接下来就跟我一起将 agents 概念引入传统的 RAG 工作流,重新构建自己的 Agentic RAG 系统吧。去年大模型领域最流行的关键词就是 RAG 了,而今年,一代新人换旧人,agents 已经取代 RAG 成为大模型领域的新宠。
2024-09-26 14:38:32
1621
原创 GraphRAG 本地 Ollama - 知识图谱
为了结合这些对比方法的优势,我们提出了一种图形 RAG 方法,用于回答关于私人文本语料库的问题,该方法随着用户问题的普遍性和要索引的源文本数量而扩展。对于在 100 万令牌范围内的数据集上的一类全局意义问题,我们展示了图形 RAG 相对于天真的 RAG 基线在生成答案的全面性和多样性方面带来了显著改进。llm 模型期望像 llama3、mistral、phi3 等语言模型,嵌入模型部分期望像 mxbai-embed-large、nomic-embed-text 等嵌入模型,这些模型由 Ollama 提供。
2024-09-04 11:30:32
1285
1
翻译 医疗图形 RAG: 通过图检索增强生成实现安全医疗大型语言模型
摘要我们介绍了一种新颖的基于图的检索增强生成(RAG)框架,专门为医学领域设计,称为,旨在增强大型语言模型(LLM)的能力,并生成基于证据的结果,从而在处理私人医疗数据时提高安全性和可靠性。我们的全面流程始于一种混合静态语义方法的文档分块,显着改善了传统方法的上下文捕捉。提取的实体用于创建一个三层次的分层图结构,将实体与来自医学论文和字典的基础医学知识联系起来。然后这些实体相互连接以形成元图,基于语义相似性合并这些元图以开发一个全面的全局图。该结构支持精确的信息检索和响应生成。
2024-08-14 16:12:37
497
原创 钙成像数据建模为行为事件
这再次符合直觉,因为我们知道,当动物获得奖励时,大量细胞会同时激活,因此高度相关的活动可以指示“奖励”事件(从而是“正确”事件),甚至可能比任何单个细胞的活动更具指示性。因此,我的数据设计使用单个神经元的活动作为其特征(x 值),行为事件作为其因变量或预测变量(y 值)。老鼠通过植入在头部的微型显微镜(迷你显微镜)完成任务,该显微镜发出 LED 光,照射到植入的镜头上,以照亮在细胞使用钙时会发光的基因改造神经元。这再次是可以预期的,因为在活动平均的较长时间尺度上(超过 2 秒),时间动态是不可忽视的。
2024-07-25 15:01:48
864
原创 将文本嵌入和知识(图)嵌入结合在RAG系统中
在我的以前的文章中,我写了关于如何将知识图谱与 RAGs 结合使用,以及如何使用图技术进行自适应标记化以构建更具上下文意识的LLMs。在将知识图谱元素表示为嵌入向量之后,我们使用评分函数来评估三元组的可信度,例如“Tim”、“是”、“艺术家”。通过准确地将文本中的实体提及与结构化知识表示中的相应实体进行关联,实体解析使机器能够更有效地理解和推理自然语言,从而促进各种下游任务和应用。这段代码通过将文本嵌入和知识嵌入结合到单一嵌入空间中,然后根据查询和段落的组合嵌入之间的余弦相似度,从知识库中检索相关段落。
2024-06-26 16:15:31
1290
原创 华为昇腾910B3 NPU训练最佳实践
NPU推理与微调最佳实践在 Notebook 打开NPU推理与微调最佳实践在 Notebook 打开。
2024-06-26 15:53:16
5431
2
原创 Docker 容器内运行的 Neo4j 实例 安装apoc插件
有关插件的一般说明,请参见配置 → 插件。在带宽受限的情况下,或者 Neo4j 经常停止和启动的情况下,可能希望只下载插件一次并重复使用,而不是每次都下载插件。Neo4j Docker 映像包括一个启动脚本,可以在运行时自动下载和配置特定的 Neo4j 插件。此功能旨在简化在开发环境中使用 Neo4j 插件的过程,但不建议在生产环境中使用。要在生产中使用 Neo4j Docker 容器中的插件,请参阅安装用户定义的过程。安装插件,包括用户定义的程序,将包含插件 JAR 的文件夹或卷挂载到。
2024-06-18 09:08:08
1380
原创 使用父文档检索器(PDR)构建 RAG 的最佳实践,并使用 PDR 进行元数据过滤。
矢量存储将在单独应用过滤器后执行相似性搜索,将它们组合起来,然后过滤出唯一的文档,这些唯一的文档可用于查询,即矢量搜索将发生 n 次,其中 n 是 metadata_filter 字典中键值对的数量,然后过滤出唯一的文档。3. 存储父级和子级块:存储嵌入✨:初始化父文档检索器并将文档添加到检索器是在运行时发生的事情,不仅需要长时间运行,而且每次查询相同的内容都需要花费成本来创建相同的嵌入,您可以使用下面的代码行来存储已创建的嵌入。现在来到有趣的话题。生成的响应将根据要求应用正确的元数据过滤器,符合预期。
2024-06-12 13:30:30
941
原创 Cohere reranker 一致的排序器
这本notebook展示了如何在检索器中使用 Cohere 的重排端点。这是在 ContextualCompressionRetriever 的想法基础上构建的。让我们首先初始化一个简单的向量存储检索器,并存储 2023 年国情咨文(分块)。我们可以设置检索器以检索大量(20)的文档。API 参考: ContextualCompressionRetriever | CohereRerank | Cohere。,使用 Cohere 重新排名端点来重新排列返回的结果。包装我们的基础检索器。
2024-06-12 11:20:28
1068
原创 知识图谱在检索增强生成(RAG)中的应用:详细步骤
以下是如何生成知识图谱、将数据加载到图形数据库中,并将其用作检索增强生成之上的一个层,以提供更可管理和更强大的知识的分步说明。我们可以在知识图谱中应用RAG,而不是直接查询,我们可以根据问题在知识图谱中进行搜索,并使用搜索结果作为上下文来生成答案。这里的查询字符串是一个问题:AES加密的安全级别是什么,它根据你的问题提取了关键词,并从你的图形数据库中查询它们。知识图谱 rag 最强大的用例在于它可以与现有的搜索结合使用,将额外的知识注入 GenAI 结果中,从而提高性能。
2024-05-20 22:45:38
1900
原创 如何创建一个在本地和离线运行的LangChain应用程序
默认情况下不需要任何参数,但可以指定一个指向您所需的Takeoff运行的URL的baseURL,并且可以提供生成参数。总的来说,本地和离线运行LLMs能够提供更大的自主性、效率、隐私和对计算资源的控制,这使得它成为许多应用和使用场景中的一个吸引人的选择。对于LLM/SLM实施,组织将需要确定业务需求和扩展需求,并将其与所使用的语言模型的容量和能力相匹配的适当解决方案相结合。默认情况下不需要任何参数,但可以指定一个指向您所需的Takeoff运行的URL的baseURL,并提供生成参数。
2024-02-29 14:19:13
1286
原创 基于JSON的Ollama和LangChain agent
有趣的是,在实施自定义函数之后,我发现了一个现有的LangChain函数,它将自定义的Pydantic工具输入定义转换为Mixtral可以识别的JSON对象。正如提到的,大多数模型没有经过训练来产生行动输入或文本,如果不需要行动,我们必须使用当前可用的内容。它们共同使LLM能够提供更准确的推荐,随着时间的推移了解用户的偏好,并获得更广泛的最新信息,从而实现更具互动性和适应性的用户体验。正如提到的那样,除了在查询时能够检索到额外的信息外,它们还给LLM提供了一种影响他们环境的选择,例如在日历中预订会议。
2024-02-29 14:14:01
3032
原创 视频生成模型:构建虚拟世界的模拟器 [译]
我们致力于在视频数据上开展生成模型的大规模训练。具体来说,我们针对不同时长、分辨率和宽高比的视频及图像,联合训练了基于文本条件的扩散模型。我们采用了一种 Transformer 架构,这种架构能够处理视频和图像潜在编码的时空片段。我们的最大型号模型,Sora,能生成高质量的一分钟视频。我们的研究显示,扩展视频生成模型的规模是向着创建能够模拟物理世界的通用工具迈出的有前途的一步。本技术报告主要介绍了两方面内容:(1) 我们如何将各种类型的视觉数据转化为统一的表示形式,从而实现生成模型的大规模训练;
2024-02-20 15:12:30
1839
原创 “利用电子医院记录,针对急性护理环境中的老年人,开发并验证了一项医院脆弱风险评分:一项观察性研究“
一组中被确定为脆弱的六个群集之一,基于预定义的ICD-10代码清单(附录)中至少有一个脆弱标记的人数比例较高(4907人中的4073人[83·0%]),而在队列的其余部分中为17,232人中的29·1%(5008人)。至少有一种脆弱综合征的人数从434952人中的99604人(22.9%)增加到204514人中的193266人(94.5%),其中认知功能障碍的梯度最为显著,从434952人中的20443人(4.7%)增加到204514人中的135388人(66.2%)。每个集群中人群的特征总结在表2中。
2024-02-19 15:56:33
1294
原创 建立流行病预警指数体系并优化传染病模型:对公共卫生突发事件监测数据的分析
R ,从传染病模型中移除的人群,指的是被隔离或对该疾病具有免疫力的人群[59]。经过数据筛选、分类和其他预处理工作,结合各国数据趋势,从2020年1月16日至5月15日中国累计确诊病例、累计疑似病例、新增确诊病例、累计死亡病例和累计治愈病例,以及从2020年2月1日至4月30日日本、韩国和英国(英国)的累计确诊病例和累计疑似病例,最终保留了从2020年3月1日至5月29日美国(美国)的新确诊病例、累计死亡病例和累计治愈病例,使用每个国家90天的新冠疫情相关数据集作为训练样本集,以确诊病例的时间数据集。
2024-02-19 14:29:39
3432
原创 使用 RAG 创建 LLM 应用程序
通常,如果您有较少的数据,最好使用较低的“k”,大约为2。Hugging Face的模型中心提供了许多嵌入模型的选项,您可以浏览排行榜,选择最适合您需求的模型。有不同类型的链条适用于不同的使用情况,如果你希望你的 LLM 能够在一段时间内记住聊天的上下文,就像ChatGPT一样,你需要一个可以在多个对话片段之间共享的记忆实例,对于这种情况,有可用的对话链条。在我的测试中,我使用了包含有关《权力的游戏》中琼恩·雪的信息的网址,以及变形金刚论文和 YOLO V7 论文的 PDF 文件来评估机器人的表现。
2024-02-17 17:05:35
1519
原创 Sora 的工作原理(及其意义)
作者:OpenAI 的新型文本到视频模型为电影制作开启了新篇章DALL-E 提供的插图。让我们先明确一点,我们急急忙忙慌乱。我们不会预测乌托邦或预言灾难。我们要保持冷静并...你真的看到 SORA 了吗???OpenAI 的新文本到视频模型可以生成一段 60 秒的高度逼真的视频,内容是两只可爱的。它能生成一个的视频,在这里,一只老虎在镶满翡翠的围栏里懒洋洋地躺着,一只卷尾猴戴着国王的皇冠待在金笼子后面。它还能生成一个的视频,在乡村厨房里,她穿着粉色的花朵围裙,制作着意大利土豆饺子。
2024-02-17 14:37:47
1225
原创 Sora 和之前 Runway 那些在架构上有啥区别呢?
Runway、Stable Diffusion 是基于扩散模型(Diffusion Model),扩散模型(Diffusion Model)的训练过程是通过多个步骤逐渐向图片增加噪点,直到图片变成完全无结构的噪点图片,然后在生成图片的时候,基于一张完全噪点的图片,逐步减少噪点,直到还原出一张清晰的图片。但是,由于 Sora 是基于“Patch”而非视频的全帧进行训练的,它可以处理任何大小的视频或图片,无需进行裁剪。想象一下从每一个存在的视频中剪出的 Patch——无尽的胶片塔——被堆叠起来并输入到模型中。
2024-02-17 14:01:15
968
原创 忘记 RAG:拥抱Agent设计,让 ChatGPT 更智能更贴近实际
然而,要真正创建一个能够执行更复杂的研究任务,如多步骤和自适应执行的智能代理,我们需要实现一些额外的能力。这个过程不仅让人想起人类的行为,而且比RAG模式更高效,RAG模式中知识检索是一个单独的过程,无论是否需要,都会向聊天机器人提供信息。附加的指示表示,如果需要,机器人应该重试并更改问题。这篇文章介绍了一种新的方法,灵感来自人类研究方法,涉及多种搜索技术,观察中间结果,不断完善和重试,然后才提供回应。当代理需要查找它所不具备的知识时,它会制定一个搜索查询,并向搜索引擎发出信号,以检索所需的答案。
2024-02-05 19:02:41
2085
原创 使用LlamaIndex,Qdrant,Ollama和FastAPI构建本地RAG api
互联网上有大量关于如何构建RAG管道的教程,问题在于,大多数都依赖于在线服务和云工具,特别是在生成部分,许多教程都主张使用OpenAI LLM API,不幸的是,这些API并不总是免费的,而且在处理敏感数据时可能不被认为是可信的。现在我们已经成功地将我们的数据(研究论文)加载到我们的向量存储(Qdrant)中,我们可以开始查询它以获取相关数据,以供我们的LLM使用。Llamaindex支持各种数据加载器,在我们的情况下,我们的数据将是一个文件夹中的一堆PDF,这意味着我们可以使用。对我们的数据进行分块。
2024-02-04 10:22:39
2913
原创 12个RAG痛点和建议解决方案
Neutrino 目前支持。此外,您可以微调自定义的重新排序器,以获得更好的检索性能,详细的实现已在《通过与LlamaIndex微调Cohere Reranker来改善检索性能》中记录。准确解释用户查询以检索相关的结构化数据可能会很困难,特别是对于复杂或含糊不清的查询、不灵活的文本到SQL转换以及当前LLMs在有效处理这些任务方面的限制。在使用 LLMs 时,您可能会想知道,如果您的模型遇到问题,比如与OpenAI的模型发生速率限制错误,您需要一个备用模型作为主要模型发生故障的替代方案。
2024-02-04 10:02:23
2134
翻译 模块化的RAG和RAG流程:第一部分
以上,我们可以看到RAG的快速发展已经超越了链式高级RAG范式,展示了模块化的特点。为了解决当前的组织和抽象不足,我们提出了一种模块化的RAG方法,无缝地集成了天真RAG和高级RAG的开发范式。模块化RAG呈现出一种高度可扩展的范式,将RAG系统划分为模块类型、模块和运算符的三层结构。每个模块类型代表RAG系统中的核心流程,包含多个功能模块。每个功能模块又包含多个具体的运算符。整个RAG系统成为多个模块和相应操作符的排列组合,形成我们所称的RAG流程。
2024-01-29 17:33:29
1553
1
翻译 模块化的RAG和RAG流程:第二部分
定义了模块和运算符之后,它们可以帮助我们从流程角度查看各种RAG方法。每个RAG可以使用一组运算符进行排列。模块化RAG框架那么,在模块化RAG范式下,我们应该如何设计我们的RAG系统?在第二部分中,我们将深入探讨典型的RAG流程模式、具体的RAG流程实施以及最佳行业案例。典型的RAG流程模式和实施首先,让我们探索RAG流程的突出模式,以及每个模板下的具体流程,展示不同的模块和运算符是如何协调的。在RAG Flow的背景下,我们将为微调阶段划分三个不同的流程,并为推理阶段划分四个流程。
2024-01-29 17:18:49
1089
原创 BERT模型的初步认识
1 BERT模型的初步认识不知道BERT(Pre-training of Deep Bidirectional Transformers,原文链接:BERT)没有关系,让我们来看一些数据。自从2018年BERT模型发布以来,BERT模型仅用 2019 年一年的时间,便以势如破竹的姿态成为了 NLP 领域首屈一指的红人,BERT 相关的论文也如涌潮般发表出来。2019 年,可谓是 NLP 发展历程中具有里程碑意义的一年,而其背后的最大功臣当属 BERT !在NLP领域,如果把2019年称为“BERT年”也
2021-04-12 08:58:37
1080
翻译 Word2Vec 教程 : The Skip-Gram 模型
Word2Vec教程:Skip-Gram模型原文链接: .本教程介绍了Word2Vec的Skip-Gram神经网络体系结构。本教程的目的是跳过有关Word2Vec的常规介绍性知识和抽象性介绍,并深入了解更多细节。特别是在这里,我将深入研究Skip-Gram神经网络模型。模型介绍实际上,Skip-Gram神经网络模型的基本形式非常简单。我认为所有这些小的调整和增强开始使解释变得混乱。让我们...
2019-11-13 13:06:39
324
翻译 文本分类- Hierarchical attention network
本文实现了层次注意力模型来进行文档分类。 得益于Keras简单上手,这使得这个项目变得不是那么困难。 自定义Layer非常强大且灵活,可以将您的自定义逻辑嵌入到现有框架中。 功能性API使得分层InputLayer非常容易实现。Text classification using Hierarchical LSTM在全面实现层次注意力模型之前,我想要建立一个分层的LSTM网络作为base
2019-02-28 13:31:26
860
转载 Link Conda environment with Jupyter Notebook
For Anaconda I suggest you a much easier and proper solution; just give a look at the nb_conda_kernels package.It allows you to “manage your conda environment-based kernels inside the Jupyter Notebo...
2018-06-28 11:35:30
292
原创 使用catboost解决ML中高维度不平衡数据集挑战的解决方案
什么是不平衡的数据集本文中所涉及的数据分类之间不均匀,有的几千条,有的几十条,这种数据集被认为是不平衡的数据集。 这些类型的数据集通常存在于预测维护系统,销售倾向,欺诈识别,智能诊断等应用领域中。例如,在电子病历中的呼吸科疾病诊断中,以2200条测试数据来看具体分布,数据分布很不均匀,最多的是1214例,最少的37例。各个疾病的分布如下。J20 急性支气管炎 ...
2018-05-09 17:23:28
5739
2
原创 Scipy hstack results in “TypeError: no supported conversion for types: (dtype('float64'), dtype('O')
X = sp.sparse.hstack((X, OtherColumn.values)) #error here sc = preprocessing.StandardScaler().fit(X) X = sc.transform(X) X_test = sc.transform(X_test)Full error message:-----------------------...
2018-04-16 17:24:50
7711
原创 mac sublime3 3156 LICENSE
Sublime Text 3.x (after Build 3156)—– BEGIN LICENSE —–Bug7sec Team (www.bug7sec.org)50 User LicenseEA7E-106883286C49532 8F829C68 2ED18D56 162664F28B934F0C EB60A7FE 81D7D5EF BB8F1673
2017-12-08 09:38:50
3485
原创 sublime3 3154 LICENSE
—– BEGIN LICENSE —–TwitterInc200 User LicenseEA7E-8900071D77F72E 390CDD93 4DCBA022 FAF6079061AA12C0 A37081C5 D0316412 4584D13694D7F7D4 95BC8C1C 527DA828 560BB037D1EDDD8C AE7B379F 50C9D69
2017-11-30 09:01:07
1160
opencv编译必须的文件
2019-01-18
python3 64位CRF编译结果
2018-08-01
mac 版sublime
2017-11-30
R on Spark
2014-02-23
hadoop面试题
2013-08-17
用HTML5新特性开发移动App
2013-03-20
Word 转换器(Word Converter)
2013-03-20
星号密码查看器
2013-03-20
extremeTable
2007-09-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人