- 博客(47)
- 资源 (6)
- 收藏
- 关注
原创 多智能体强化学习IPPO、MADDPG 深度强化学习
多智能体的情形相比于单智能体更加复杂,因为每个智能体在和环境交互的同时也在和其他智能体进行直接或者间接的交互。多智能体强化学习可以分为以下类别。
2025-02-19 17:20:29
353
原创 deepseek部署和型微调
Deepseek 模型微调它对这个数据集应用一个名为 process_func 的处理函数,最终返回一个经过处理的 tokenized 数据集,返回处理后的数据集 tokenized_id,通常是一个包含 token ID 或其他处理结果的新数据集。R1 和 V1 的区别集中在 优化方向(速度、领域、资源)或 迭代阶段(V1 为初版,R1 为改进版)模型微调通过 peft 库来实现模型的 LoRA 微调。自注意力机制中的 查询(Query)、键(Key)、值(Value) 的投影矩阵,用于生成注意力权重。
2025-02-10 16:48:04
1234
原创 12 款开源OCR发 PDF 识别框架
2024 年 12 款开源文档解析框架的选型对比评测:PDF解析、OCR识别功能解读、应用场景分析及优缺点比较这是该系列的第二篇文章,聚焦于智能文档处理(特别是 PDF 解析)。无论是在模型预训练的数据收集阶段,还是基于 RAG 的知识库构建阶段,大量高质量数据通常以 PDF 或扫描图像的形式出现。由于这些文件的排版多样、格式不一以及扫描质量参差不齐,利用这些数据极具挑战。主要难点在于:一是有效提取内容信息和版面信息(如正文、标题、图注、图片、表格、公式等);二是处理版面元素之间的关系。
2025-01-26 17:14:00
3834
原创 Crawl4AI 人工智能自动采集数据
Crawl是一个强大的工具,它赋予AI智能体更高的效率和准确性执行网络爬取和数据提取任务。其开源特性、AI驱动的能力和多功能性,使其成为构建智能且数据驱动智能体的宝贵资产。
2025-01-26 10:28:40
2748
原创 CosyVoice TTS 语音生成
同最近大火的ChatTTS对比,可以发现CosyVoice的合成音频在内容一致性上更高,CosyVoice对生成语音的情感、韵律进行细粒度的控制,生音频在情感表现力上得到明显提升,并且没有很少存在幻觉额外多字的现象。CosyVoice是一款基于语音量化编码的语音生成大模型,一个可以深度融合文本理解和语音生成的一项新型语音合成技术,它对语音进行离散化编码,并依托大模型技术,实现自然流畅的语音生成体验。网站提供:Ai工具箱,Ai开源项目,CosyVoice,Voice,modelscope,魔搭社区,模型。
2025-01-26 10:13:51
1125
原创 DeepFace人脸识别
理想情况下,人脸分类器能够以人类的准确度识别人脸,并且无论图像质量、姿势、表情或照明如何,它都能够返回高精度。此外,理想的人脸识别框架只需很少的修改或无需修改即可应用于各种应用。尽管 DeepFace 是目前最先进、最高效的人脸识别框架之一,但它并不完美,在某些情况下可能无法提供准确的结果。但是 DeepFace 框架是人脸识别行业的一个重要里程碑,它通过利用强大的度量学习技术缩小了性能差距,并且随着时间的推移,它将继续变得更加高效。
2025-01-26 10:09:41
1779
原创 GraphRAG 和 LightRAG
LightRAG 是一种优化版的检索增强生成(RAG)框架,旨在通过减少资源消耗和简化系统设计,实现轻量化与高效性。核心理念:轻量化设计:减少模型参数和计算复杂度,使其能在资源受限的环境中运行。实时性优化:提高系统响应速度,满足高实时性需求。模块化集成:提供灵活的检索与生成模块,便于在不同环境中部署。目标:在保证生成质量的同时,降低硬件要求和运行成本。为移动设备、边缘计算环境等提供优化解决方案。
2025-01-24 14:37:06
1039
原创 自学大模型主要包括哪些方面:
深入学习不同类型的神经网络结构,如全连接神经网络(每一层的神经元都与前一层的所有神经元相连)、卷积神经网络(特别适用于图像处理,利用卷积操作提取图像的局部特征,如在图像识别任务中,卷积层能够自动学习图像中的边缘、纹理等特征)、循环神经网络(擅长处理序列数据,如自然语言处理中的文本序列,能够记住序列中的历史信息,在每个时间步上根据当前输入和上一时刻的隐藏状态进行状态更新和输出预测)等。梯度下降法及其变体:是训练神经网络最常用的优化算法,基本思想是沿着梯度的反方向更新模型参数,使损失函数值逐渐减小。
2024-12-28 15:38:28
724
原创 OpenCV图像分割
阈值分割阈值分割是最基础的图像分割方法之一,通过设定一个阈值将像素分为两组:前景和背景。该方法假设图像中的目标和背景的灰度值差异较大,存在一个合适的阈值,使得灰度值高于该阈值的像素被划分为目标,灰度值低于该阈值的像素被划分为背景。自适应阈值分割自适应阈值分割能够根据图像的不同区域自动调整阈值,适用于光照不均的场景。该方法将图像划分为多个小区域(子块),每个子块分别计算阈值进行分割。Otsu’s二值化Otsu’s二值化是一种自动寻找最佳阈值的方法,特别适合于单峰分布的图像。
2024-12-22 21:46:28
1055
原创 yolov5 yolov6 yolov7 yolov8 yolov9目标检测、目标分类 目标切割 性能对比
在YOLOv1提出之前,R-CNN系列算法在目标检测领域中独占鳌头。R-CNN系列检测精度高,但是由于其网络结构是双阶段(two-stage)的特点,使得它的检测速度不能满足实时性,饱受诟病。为了打破这一僵局,涉及一种速度更快的目标检测器是大势所趋。2016年,Joseph Redmon、Santosh Divvala、Ross Girshick等人提出了一种单阶段(one-stage)的目标检测网络。它的检测速度非常快,每秒可以处理45帧图片,能够轻松地实时运行。
2024-12-22 21:41:24
4606
原创 deepseek免费大模型搜索工具发布
自然语言处理(NLP):DeepSeek在自然语言处理领域有着深入的研究,开发了先进的语言模型和对话系统,能够理解和生成自然语言,广泛应用于智能客服、文本分析、机器翻译等场景。公司注重技术创新和实际应用的结合,致力于成为全球领先的人工智能公司之一。机器学习与深度学习:DeepSeek利用机器学习和深度学习技术,构建了强大的数据分析和预测模型,帮助企业优化决策、提升运营效率。行业应用:DeepSeek的技术广泛应用于金融、医疗、教育、零售等多个行业,提供智能化的解决方案,帮助企业实现数字化转型。
2024-12-13 12:45:41
9214
5
原创 多模态大模型InternVL 2.5重磅发布
我们很高兴推出InternVL 2.5,这是一个基于 InternVL 2.0 构建的先进多模式大型语言模型 (MLLM) 系列,它保留了其核心模型架构,同时在训练和测试策略以及数据质量方面进行了显著的改进。图片/pngInternVL 2.5 系列在下表中,我们提供了 InternVL 2.5 系列的概述。模型架构如下图所示,InternVL 2.5 保留了与前代产品 InternVL 1.5 和 2.0 相同的模型架构,遵循“ViT-MLP-LLM”范式。在这个新版本中,我们使用随机初始化的 ML
2024-12-13 12:36:38
1657
原创 GraphRAG 知识图谱介绍
如附图二所示,给定一个查询(Query),RAG从一个垂直领域知识库(图中向量化后的“Vector Database”)中检索(Retrieve)与查询内容相关的文档或段落(Context,简称“上下文”),并将查询信息(Query)与检索到的上下文信息(Context)进行组合转化成LLM的“提示词”((Prompt),由LLM生成(Generate)答案(Response)。其中,最主要的挑战来自知识图谱的构建(需要随着专业领域知识的动态变化而动态构建)及其所引致的计算资源的消耗与运维成本的开销。
2024-12-08 00:20:26
868
原创 机器学习 LightGBM -GBDT 多分类 点击率预测 检索排序
GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合等优点。GBDT不仅在工业界应用广泛,通常被用于多分类、点击率预测、搜索排序等任务;在各种数据挖掘竞赛中也是致命武器,据统计Kaggle上的比赛有一半以上的冠军方案都是基于GBDT。
2024-12-08 00:14:09
1209
原创 Transformer神经网络算法
通过分割原始的输入向量到多个头(head),每个头都能独立地学习不同的注意力权重,从而增强模型对输入序列中不同部分的关注能力。每个解码器层由三个子层连接结构组成:第一个子层是一个带掩码的多头自注意力子层,第二个子层是一个多头注意力子层(编码器到解码器),第三个子层是一个前馈全连接子层。GPT:GPT也是一种基于Transformer的预训练语言模型,它的最大创新之处在于使用了单向Transformer编码器,这使得模型可以更好地捕捉输入序列的上下文信息。这些线性变换的参数是模型需要学习的。
2024-12-07 19:41:54
890
原创 深度全解析开放开源大模型之BLOOM
BLOOM是 BigScience Large Open-science Open-access Mul-tilingual Language Model首字母的缩写。BigScience 不是财团(consortium),也不是正式成立的实体。这是一个由HuggingFace、GENCI和IDRIS发起的开放式协作组织,以及一个同名的研究研讨会(workshop)。其主页为 https://bigscience.huggingface.co/
2024-12-07 18:10:12
1091
原创 Megatron 和 deepspeed 大模型训练框架
现在都是fp16或者bf16训练和推理,那么如果是1个100亿参数量的模型(也就是储存了100亿个参数),它其实是一个10B大小的模型。训练时,如果用Adam优化器,有个2+2+12的公式,训练时显存下限是16n GB,需要把模型参数、梯度和优化器状态(4+4+4),保持在显存中。1个字节占8bits,那么fp16就是占2个字节(Byte),那么10B模型的模型大小是20GB,是*2的关系。megatron是NV家的,张量并行(TP)是最专业的,尽管通信速度限制TP应用在有NVLINK的节点内。
2024-12-07 18:02:55
1368
原创 24个顶级 Python 库
Python 通常被称为 “自带电池的编程语言”。这仅仅意味着它附带了许多预打包的库,开发人员可以使用它们来使工作变得更加轻松。正如所料,有大量库可用于这种解释性、高级、通用编程语言。毫无疑问,Python 如此受欢迎的最大原因之一是有超过十万个库可供选择。编程语言拥有的库和软件包越多,它的用例就越多样化。在成千上万个可用的 Python 库中,很难判断哪些是好的,哪些是容易被遗忘的。我们在本文中列出了一些最佳 Python 库,供大家学习和参考。什么是 Python 库?
2024-12-07 16:34:39
1362
原创 python 核心类库
这些库提供了高度优化的、可扩展的、快速的梯度增强实现,这使得它们在数据科学家和 Kaggle 竞争对手中非常流行,因为在这些算法的帮助下赢得了许多比赛。今年,我们扩展了这个清单,增加了新的Python库,并重新审视了去年已经讨论过的 Python 库,重点关注了这一年来的更新。它是一个用于可视化和调试机器学习模型并逐步跟踪算法工作的软件包,为 scikit-learn、XGBoost、LightGBM、lightning 和 sklearn-crfsuite 库提供支持,并为每个库执行不同的任务。
2024-12-07 15:16:48
1232
原创 DeepMind AI智能体Gato,多模态多任务,受大语言模型启发
今日,受大规模语言建模的启发,Deepmind 应用类似的方法构建了一个单一的「通才」智能体 Gato,它具有多模态、多任务、多具身(embodiment)特点。论文地址:https://storage.googleapis.com/deepmind-media/A%20Generalist%20Agent/Generalist%20Agent.pdfGato 可以玩雅达利游戏、给图片输出字幕、和别人聊天、用机械臂堆叠积木等等。
2024-12-06 12:02:50
775
原创 谷歌DeepMind推出RT-2 大模型机器人方面应用
大模型应用案例:Meta、CMU团队耗时2年打造的RoboAgent,能烘培、收纳餐具、使用微波炉,也能将一套茶艺演绎得行云流水。不久前,谷歌DeepMind推出RT-2——一个视觉-语言-动作(Vision-Language-Action)模型,将多模态大模型的能力塞进机械臂。它可以从网络和机器人数据中学习到大量知识,并将这些知识转化为机器人控制的通用指令。这使得机器人也能像 ChatGPT一样理解自然语言,并根据自然语言做出一系列动作,能数学推理、能辨认人物、也能泛化到各种新环境、新任务。
2024-12-06 11:45:10
1819
原创 强化学习在医学领域应用探索
由于人工智能尤其是深度学习的最新进展,许多数据驱动的决策支持系统已被实施,以促进医生提供个性化护理。我们在本文中关注深度强化学习 (DRL) 模型。DRL 模型在计算机视觉和游戏任务(例如围棋和雅达利游戏)中展示了人类水平甚至卓越的性能。然而,在临床决策优化中采用深度强化学习技术仍然很少见。我们在此展示了第一项调查,该调查总结了使用深度神经网络 (DNN) 进行临床决策支持的强化学习算法。我们还讨论了一些案例研究,其中应用了不同的 DRL 算法来解决各种临床挑战。
2024-12-04 23:02:51
1213
原创 强化学习在医学领域- 案例应用 DNN 策略梯度
在策略梯度 RL 中,DNN 用于在步骤 3 中构建策略,其中 DNN 的输入是状态,输出是动作。图1是策略梯度RL的MDP图。在临床环境中,与其他 RL 算法相比,策略梯度 RL 并不“流行”。例如,要了解脓毒症患者药物剂量的最佳临床决策,进行反复试验是不道德的,也将是耗时的。然而,策略梯度 RL 在其他领域仍然很流行,例如机器人控制和计算机棋盘游戏,这些领域的环境是一个可以承受试错的模拟器。基于价值的强化学习在临床应用中很常见,我们将在第 3 节关于 DRL 的临床应用中看到更多例子。
2024-12-04 22:48:17
284
原创 构建高可用系统设计OpenStack、Docker、Mesos和Kubernetes(简称K8s)
如果构建高可用、高并发、高效运维的大型系统大型系统架构设计包括业务层设计、服务层设计、基础架层设计、存储层设计、网络层协同设计来完成。
2024-12-01 17:21:03
1591
原创 Kubernetes KubeVirt 让容器和虚拟机一起工作
KubeVirt是一个Kubernetes插件,它为Kubernetes提供了在与容器相同的基础结构上提供、管理和控制虚拟机的能力。KubeVirt是由云原生计算基金会(CNCF)赞助的开源项目,目前正处于孵化阶段。KubeVirt使Kubernetes能够使用与容器化工作负载相同的工具来调度、部署和管理虚拟机,从而消除了使用不同监视和管理工具的单独环境的必要性。为虚拟机和Kubernetes一起工作提供了可能。
2024-11-29 17:36:48
857
原创 华为IPD研发框架
在这个阶段,客户在使用的过程中会发现产品的一些问题并反馈给企业,企业会利用客户反馈的问题不断的改进和升级产品,有些改进会在这个产品进行,有些则会在新的产品中改进和升级。开发阶段就是大家平时说的具体的研发阶段,这个阶段是各个领域的研发人员进行详细的研发,对于很多行业来讲,开发阶段是最花时间和人力的阶段,有些项目在开发阶段的时间和资源占到了整个项目的60%以上。所谓的需求管理,就是把市场调研(外部)获得的信息,结合企业内部对行业的理解和分析,综合起来形成对于产品开发的需求进行全流程的管理。
2024-11-27 19:05:36
777
原创 GraphRAG 与 RAG 的比较分析
检索增强生成(Retrieval-Augmented Generation,简称 RAG)是一种旨在提升大型语言模型(Large Language Models,LLMs)性能的技术方法。其核心思想是通过整合外部可靠知识库的信息来增强模型的输出质量。RAG 的工作原理可以概括如下:当 LLM 接收到查询时,它不仅依赖于自身的预训练知识,还会主动从指定的知识源检索相关信息。这种方法确保了生成的输出能够参考大量上下文丰富的数据,并得到最新、最相关可用信息的支持。
2024-11-27 18:23:05
807
原创 广告推荐算法 Lookalike
look-alike 并不是某种特定的算法,而是一类建模方法的统称。Look alike简单说,就是依据访客,尤其以转化客户的典型行为特征,去推及在全网中寻找那些类似行为特征,但并未看过广告,或者从未出过转化的用户进行广告投放。这种方法相对来说计算量较大,且可能因为特征十分微小分散,也可能因采集样本量级不够大或不明干扰因素等,最后得出的特征会较为发散,未必能找出收敛的特征要素。所以很多时候我们也会通过人群标签作为中介来做look alike。
2024-11-27 16:42:07
1257
1
原创 人工智能(Artificial Intelligence, AI)
人工智能技术可以帮助车辆感知周围环境、预测其他车辆和行人的行为,并做出相应的决策和操作。机器学习:机器学习是人工智能的核心技术之一,通过训练模型学习数据规律,使得计算机可以自动提取、分析和识别数据中的模式和特征。综上所述,人工智能在现代科技中的应用非常广泛,并且未来将继续发展和拓展。随着技术的进一步进步和创新,人工智能将在各个领域发挥更加重要的作用,改变人们的生活和工作方式。通过分析用户的行为和偏好,人工智能可以提供个性化的推荐、广告和服务,满足用户的特定需求。人工智能在现代科技中的应用非常广泛。
2024-11-27 15:42:15
333
原创 Transformer工作原理
本文将从Transformer的本质、Transformer_的原理_、_Transformer的应用__三个方面,带您一文搞懂Transformer ,VIT架构(总体架构 & 三种注意力层)。
2024-11-27 10:26:30
1656
原创 大模型入门
通用大模型、大模型入门基础 ,综合社会学科、生活、文学、自然科学、数学、学术等进行预训练、解决社会综合问题。💰 比如算数学第一天花了 10元第二天挣了 15元第三天花了 2元问:现在有多少钱,模型回答:3元。当然复杂的也可以,思考用法.............
2024-11-26 22:49:26
318
2
原创 Harbor部署安装
Harbor是一个开源的企业级容器镜像仓库,最初由VMware公司的中国团队开发。它旨在提供安全、高性能和易于管理的容器镜像存储、签名和扫描服务。Harbor扩展了开源Docker Distribution的功能,增加了用户通常需要的安全性、身份和管理功能,使得注册表更加接近构建和运行环境,提高了图像传输效率。Harbor支持在注册表之间复制镜像,并提供高级安全功能,如用户管理、访问控制和活动审核。Harbor的优势在于它专为企业级环境设计,提供了合规性、性能和互操作性,特别适合在Kubernetes和D
2024-11-26 22:08:40
424
原创 大模型应用案例分析
本课程聚焦大语言模型(LLM)在中国的实际应用场景,通过理论学习与实践案例相结合的方式,帮助学员掌握大模型应用开发的关键技能。
2024-11-24 22:51:07
438
原创 摩尔线程GPU、平行训练能力
摩尔线程的核心技术是自主研发的MUSA架构,这是一种基于异构计算的GPU架构,具有高性能、高效率、高兼容性和高可扩展性的特点,能够支持各种复杂的计算任务,如图形渲染、视频编解码、机器学习、深度学习、物理仿真等。摩尔线程的产品是基于MUSA架构的全功能GPU芯片,已经成功量产了多款产品,覆盖从低端到高端的全系列产品线,广泛应用于数字办公、AI大模型、物理仿真、数字文娱、科学计算和元宇宙应用等场景。这与市场上其他主要聚焦于GPGPU的产品形成对比,摩尔线程的全功能GPU定位使其在市场上具有独特的竞争优势。
2024-11-24 22:37:57
429
原创 原生多模态世界模型Emu3发布
智源研究院院长王仲远表示:“Emu3证明了下一个token预测能在多模态任务中有高性能的表现,这为构建多模态AGI提供了广阔的技术前景。据悉,Emu3只基于下一个token预测,无需扩散模型或组合式方法,便能把图像、文本和视频编码为一个离散空间,在多模态混合序列上从头开始联合训练一个Transformer,展现了其在大规模训练和推理上的潜力。相关技术从业者表示:“对于研究人员来说,Emu3意味着出现了一个新的机会,可以通过统一的架构探索多模态,无需将复杂的扩散模型与大语言模型相结合。
2024-11-24 22:32:42
222
原创 深度强化学习 DQN算法
DQN算法,英文名为Deep Q Network,被称为深度Q网络,其将深度神经网络结合了Q_eamming。传统的 Q-leamning只使用表格的方式记录状态、动作对应的Q值,这样的方法在处理大规模问题上会占用极大的内存,可能存在的状态数量过于庞太无法列出表格,即维度爆炸,因此科学家们将神经网络与Q-learning进行结合,用神经网络就不再需要表格来记录Q值。
2024-11-19 17:48:01
1087
原创 强化学习PPO算法
PPO 算法之所以被提出,根本原因在于 Policy Gradient 在处理连续动作空间时 Learning rate 取值抉择困难。Learning rate 取值过小,就会导致深度强化学习收敛性较差,陷入完不成训练的局面,取值过大则导致新旧策略迭代时数据不一致,造成学习波动较大或局部震荡。除此之外,Policy Gradient 因为在线学习的性质,进行迭代策略时原先的采样数据无法被重复利用,每次迭代都需要重新采样;同样地置信域策略梯度算法(Trust Region Policy Optimiza
2024-11-19 17:31:12
1567
原创 LLM大模型思维链构建专业翻译软件
需要使用到大模型、对文字进行翻译、专业的修改和校对,这个需要使用到思维链路,提出修改建议,然后反复修正,校对,输出翻译。使用SequentialChain顺序思维链
2024-11-14 12:02:24
654
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人