
CV/MLM
文章平均质量分 72
计算机视觉技术、多模态大语言模型技术相关的算法及其代码实战案例
一个处女座的程序猿
2025年初博主2本新书(机器学习耗时5年/大模型耗时3年)正在预售!人工智能硕学历,拥有十多项发专利(6项)和软著(9项),包括国际期刊SCI内多篇论文,多个国家级证书(2个国三级、3个国四级),曾获国内外“人工智能算法”竞赛(包括国家级省市级等,一等奖5项、二等奖4项、三等奖2项)证书十多项,以上均第一作者身份,并拥有省市校级个人荣誉证书十多项。目前也是国内知名博主,连续3年获优快云十大博客之星,荣获达摩院评测官、阿里社区/优快云/华为社区等十多个开发者社区专家博主荣誉,曾受邀阿里/华为/谷歌等社区采访-评审-论坛几十次。截止2022年,AI领域粉丝超100万,文章阅读量超5000万
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
CV:《SuperEdit: Rectifying and Facilitating Supervision for Instruction-Based Image Editing》翻译与解读
CV:《SuperEdit: Rectifying and Facilitating Supervision for Instruction-Based Image Editing》翻译与解读目录《SuperEdit: Rectifying and Facilitating Supervision for Instruction-Based Image Editing》翻译与解读Abstract1、IntroductionDiscussi原创 2025-05-11 23:09:55 · 873 阅读 · 0 评论 -
MLLM之Bench:LEGO-Puzzles的简介、安装和使用方法、案例应用之详细攻略
MLLM之Bench:LEGO-Puzzles的简介、安装和使用方法、案例应用之详细攻略目录LEGO-Puzzles的简介LEGO-Puzzles的安装和使用方法LEGO-Puzzles的案例应用LEGO-Puzzles的简介2025年4月,LEGO-Puzzles是一个用于评估多模态大型语言模型 (MLLM) 多步空间推理能力的基准测试。LEGO-Puzzles 基准测试旨在系统地评估多模态大型语言模型 (MLLM) 的多步空间推理能力。它以乐高积木搭建为灵感原创 2025-04-27 23:58:08 · 1114 阅读 · 0 评论 -
MLMs之OpenAI o系列:OpenAI o3/o4-mini的简介、安装和使用方法、案例应用之详细攻略
MLMs之OpenAI o系列:OpenAI o3/o4-mini的简介、安装和使用方法、案例应用之详细攻略目录OpenAI o3 和 o4-mini 简介OpenAI o3 和 o4-mini 安装和使用方法OpenAI o3 和 o4-mini 案例应用OpenAI o3 和 o4-mini 简介2025年4月16日,OpenAI o3 和 o4-mini 是 OpenAI 最新发布的 o 系列模型,旨在提升 ChatGPT 的推理能力和工具使用能力。它们是目前原创 2025-04-19 13:52:30 · 1353 阅读 · 0 评论 -
MLMs之Benchmark:《InterFeedback: Unveiling Interactive Intelligence of Large Multimodal Models via Hum
MLMs之Benchmark:《InterFeedback: Unveiling Interactive Intelligence of Large Multimodal Models via Human Feedback》翻译与解读目录《InterFeedback: Unveiling Interactive Intelligence of Large Multimodal Models via Human Feedback》翻译与解读A原创 2025-04-13 23:08:36 · 1241 阅读 · 0 评论 -
MLMs之MoE之Chart:《ChartMoE: Mixture of Diversely Aligned Expert Connector for Chart Understanding》翻译与解
MLMs之MoE之Chart:《ChartMoE: Mixture of Diversely Aligned Expert Connector for Chart Understanding》翻译与解读目录《ChartMoE: Mixture of Diversely Aligned Expert Connector for Chart Understanding》翻译与解读Abstract1、IntroductionConclu原创 2025-04-06 22:53:28 · 1468 阅读 · 0 评论 -
MLMs之Gemini :Gemini 2.5的简介、安装和使用方法、案例应用之详细攻略
MLMs之Gemini :Gemini 2.5的简介、安装和使用方法、案例应用之详细攻略目录相关文章Gemini 2.5的简介Gemini 2.5 安装和使用方法Gemini 2.5 案例应用相关文章MLMs之Gemini:《Gemini 2.5: Our most intelligent AI model》翻译与解读MLMs之Gemini:《Gemini 2.5: Our most intelligent AI model》翻译与解读-优快云博客Gemini原创 2025-03-27 02:48:56 · 1451 阅读 · 0 评论 -
MLMs之Gemini:《Gemini 2.5: Our most intelligent AI model》翻译与解读
MLMs之Gemini:《Gemini 2.5: Our most intelligent AI model》翻译与解读目录《Gemini 2.5: Our most intelligent AI model》翻译与解读Abstract1、Introducing Gemini 2.5 ProBuilding on the best of Gemini基于 Gemini 的最佳特性《Gemini 2.5: Our most intelligent原创 2025-03-27 02:42:21 · 1511 阅读 · 0 评论 -
VLMs之Dataset :《HaloQuest: A Visual Hallucination Dataset for Advancing Multimodal Reasoning》翻译与解读
VLMs之Dataset :《HaloQuest: A Visual Hallucination Dataset for Advancing Multimodal Reasoning》翻译与解读目录《HaloQuest: A Visual Hallucination Dataset for Advancing Multimodal Reasoning》翻译与解读Abstract1、Introduction6 Conclus原创 2025-03-25 23:39:37 · 1297 阅读 · 0 评论 -
MLMs之R1-Omni:《R1-Omni: Explainable Omni-Multimodal Emotion Recognition with Reinforcement Learning》翻
MLMs之R1-Omni:《R1-Omni: Explainable Omni-Multimodal Emotion Recognition with Reinforcement Learning》翻目录《R1-Omni: Explainable Omni-Multimodal Emotion Recognition with Reinforcement Learning》翻译与解读Abstract1、Introduction5 Limitations原创 2025-03-14 00:39:58 · 1644 阅读 · 0 评论 -
VLA之Agent:《Magma: A Foundation Model for Multimodal AI Agents》翻译与解读
VLA之Agent:《Magma: A Foundation Model for Multimodal AI Agents》翻译与解读目录《Magma: A Foundation Model for Multimodal AI Agents》翻译与解读Abstract1、IntroductionConclusion《Magma: A Foundation Model for Multimodal AI Agents》翻译与解读地址原创 2025-03-13 01:53:26 · 1548 阅读 · 0 评论 -
MLM之MiniCPM-o:MiniCPM-o的简介(涉及MiniCPM-o 2.6和MiniCPM-V 2.6)、安装和使用方法、案例应用之详细攻略
MLM之MiniCPM-o:MiniCPM-o的简介(涉及MiniCPM-o 2.6和MiniCPM-V 2.6)、安装和使用方法、案例应用之详细攻略目录MiniCPM-o的简介MiniCPM-o的安装和使用方法MiniCPM-o的案例应用MiniCPM-o的简介MiniCPM-o是基于MiniCPM-V升级的多模态大型语言模型(MLLM)系列。该系列模型能够以端到端的方式接收图像、视频、文本和音频作为输入,并提供高质量的文本和语音输出。自2024年2月原创 2025-02-02 10:45:24 · 2777 阅读 · 0 评论 -
MLMs之Janus:《Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling》翻
MLMs之Janus:《Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling》翻译与解读目录《Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling》翻译与解读Abstract1、Introduction原创 2025-01-28 09:02:51 · 1847 阅读 · 0 评论 -
MLMs之Janus:Janus/Janus-Pro的简介、安装和使用方法、案例应用
MLMs之Janus:Janus/Janus-Pro的简介、安装和使用方法、案例应用目录相关文章Janus的简介Janus的安装和使用方法Janus的案例应用相关文章MLMs之Janus:《Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling》翻译与解读MLMs之Janus:《Janus-Pro: Unifie原创 2025-01-28 08:32:14 · 15198 阅读 · 0 评论 -
VLM之Bench:VBench的简介、核心组成部分、评估结果与可视化之详细攻略
VLM之Bench:VBench的简介、核心组成部分、评估结果与可视化之详细攻略目录VBench的简介VBench的评估结果与可视化VBench的简介VBench 项目旨在构建一个更全面、客观、细致的视频生成模型评估基准,为推动该领域发展提供有力支撑。它通过多维度评估、人工标注和开源等方式,解决了现有评估方法的不足,并为研究者提供了宝贵的参考数据和工具。VBench旨在创建一个全面、系统的视频生成模型基准测试套件,解决现有评估方法与人类感知不符以及缺乏指导未来发展的洞察力的原创 2025-01-12 23:52:22 · 2389 阅读 · 0 评论 -
VLM之Wanx:Wanx 2.1(通义万相系列)的简介、安装和使用方法、案例应用之详细攻略
VLM之Wanx:Wanx 2.1(通义万相系列)的简介、安装和使用方法、案例应用之详细攻略目录Wanx 2.1的简介Wanx 2.1的安装和使用方法Wanx 2.1的案例应用Wanx 2.1的简介通义万相是阿里云通义旗下的一款AI创意作画平台,提供AI艺术创作服务,支持文生图、图生图、涂鸦作画、虚拟模特、个人写真等多种图片创作模式。2025年1月8日,Wanx团队发布最新版本Wanx 2.1,该版本在2023年7月发布的基础上进行了重大升级,显著提升了原创 2025-01-12 23:52:53 · 4233 阅读 · 0 评论 -
CV之Drawings:AnimatedDrawings(一款将儿童手绘人物图动画化的工具)简介、安装和使用方法、案例应用之详细攻略
如果 BVH 的骨架与本项目中使用的示例不同,则需要创建一个新的运动配置文件和重新定位配置文件。项目提供了许多示例配置文件,演示了如何创建不同效果的动画,例如添加多个角色、背景图片,以及使用不同骨骼结构的 BVH 文件。但现在,幸运的是,有简单易用的选项可以从单个 RGB 视频中获取 3D 运动数据。等待时,系统会分析位于 的图像drawings/garlic.png,检测、分割和装配角色,并使用来自人类演员的 BVH 运动数据对其进行动画处理。如果您有兴趣,请查看以下两个示例中指定的配置文件。原创 2024-12-24 23:36:36 · 3548 阅读 · 0 评论 -
VLMs之Gemma 2:PaliGemma 2的简介、安装和使用方法、案例应用之详细攻略
VLMs之Gemma 2:PaliGemma 2的简介、安装和使用方法、案例应用之详细攻略目录相关文章《PaliGemma 2: A Family of Versatile VLMs for Transfer》翻译与解读PaliGemma 2的简介PaliGemma 2的安装和使用方法PaliGemma 2的案例应用相关文章《PaliGemma 2: A Family of Versatile VLMs for Tr原创 2024-12-26 23:59:06 · 2497 阅读 · 0 评论 -
LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读
LLMs之:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读目录《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读Abstract1 Introduction6 Discussion《Deliberative Alignment: Reasoning原创 2024-12-26 01:36:30 · 2299 阅读 · 0 评论 -
LLMs之o系列模型:2024年12月份OpenAI的12天发布的解读—《12 Days of OpenAI》
本文章中的表格详细记录了这一系列激动人心的发布,从ChatGPT Pro和o1 Pro模式的推出,到强化微调研究项目的开放,再到Sora视频生成模型的亮相,以及Canvas功能的上线,第一天的内容主要介绍了OpenAI o1和ChatGPT Pro的推出,强调了OpenAI对AI模型安全性的关注,并通过新的系统卡展示了在安全性方面的多项进展。主要向开发者介绍了OpenAI的新工具和服务,特别是OpenAI o1的发布及其对开发者的帮助,提升了开发者使用OpenAI技术的便利性和创新性。原创 2024-12-26 01:11:29 · 1558 阅读 · 0 评论 -
AI之GPU:GPUStack的简介、安装和使用方法、案例应用之详细攻略
AI之GPU:GPUStack的简介、安装和使用方法、案例应用之详细攻略目录GPUStack简介GPUStack 安装和使用方法GPUStack的案例应用GPUStack简介2024年8月,GPUStack是一个开源的GPU集群管理器,用于运行AI模型。它具有广泛的硬件兼容性,支持多种品牌的GPU,包括在Apple MacBook、Windows PC和Linux服务器上运行。 它支持各种AI模型,从大型语言模型(LLM)和扩散模型到音频、嵌入和原创 2024-12-07 23:43:20 · 15368 阅读 · 0 评论 -
LLMs之Tool:screenpipe(OCR+RAG)的简介、安装和使用方法、案例应用
LLMs之Tool:screenpipe(OCR+RAG)的简介、安装和使用方法、案例应用目录Screenpipe 简介Screenpipe 安装和使用方法Screenpipe 案例应用Screenpipe 简介2024年7月,Screenpipe 是一个由 rewind.ai 和 cursor.com 联合开发的 AI 助理,它能够进行 24/7 的屏幕和语音录制,旨在为超级智能时代做好数据准备。其目标是让用户拥有所有上下文信息的 AI 助手。项目标语为“rec原创 2024-11-20 02:47:41 · 3589 阅读 · 0 评论 -
MLMs之TableGPT2:《TableGPT2: A Large Multimodal Model with Tabular Data Integration》翻译与解读
MLMs之TableGPT2:《TableGPT2: A Large Multimodal Model with Tabular Data Integration》翻译与解读目录《TableGPT2: A Large Multimodal Model with Tabular Data Integration》翻译与解读Abstract1、IntroductionOutlook展望《TableGPT2: A Large Mu原创 2024-11-12 01:29:13 · 2090 阅读 · 0 评论 -
MLMs之OmniGen:OmniGen(统一图像生成模型)的简介、安装和使用方法、案例应用之详细攻略
MLMs之OmniGen:OmniGen(统一图像生成模型)的简介、安装和使用方法、案例应用之详细攻略目录相关文章OmniGen的简介OmniGen的安装和使用方法OmniGen的案例应用相关文章《OmniGen: Unified Image Generation》翻译与解读地址论文地址:https://arxiv.org/abs/2409.11340时间2024年9月17日作者原创 2024-11-08 00:52:12 · 3388 阅读 · 0 评论 -
OCR之Surya:Surya(表格识别/版面分析/阅读顺序检测/)的简介、安装和使用方法、案例应用之详细攻略
OCR之Surya:Surya的简介、安装和使用方法、案例应用之详细攻略目录Surya的简介Surya的安装和使用方法Surya的案例应用Surya的简介Surya是一个文档OCR工具包,支持90多种语言,其功能涵盖光学字符识别(OCR)、版面分析、阅读顺序检测和表格识别。Surya旨在提供一个高性能、多语言的文档处理工具,能够准确地从各种文档中提取文本信息,并理解文档的结构和布局。它不仅能进行OCR,还能分析文档的版面,识别表格、图片、标题等元素,并确原创 2024-10-30 23:27:06 · 3928 阅读 · 2 评论 -
MLM之Emu3:Emu3(仅需下一个Token预测)的简介、安装和使用方法、案例应用之详细攻略
MLM之Emu3:Emu3(仅需下一个Token预测)的简介、安装和使用方法、案例应用之详细攻略目录Emu3的简介Emu3的装和使用方法Emu3的案例应用Emu3的简介Emu3是由BAAI(北京人工智能研究院)的Emu团队在2024年9月27日发布的一系列最先进的多模态模型。该模型的核心创新在于它仅仅使用下一个Token预测进行训练,无需依赖扩散模型或组合式架构。通过将图像、文本和视频标记到离散空间,Emu3在一个单一的原创 2024-10-23 23:59:57 · 1714 阅读 · 0 评论 -
Agent之AutoGLM:AutoGLM(面向GUI的自主基础代理)的简介、安装和使用方法、案例应用之详细攻略
Agent之AutoGLM:AutoGLM(面向GUI的自主基础代理)的简介、安装和使用方法、案例应用之详细攻略目录AutoGLM的简介AutoGLM的安装和使用方法:AutoGLM的案例应用AutoGLM的简介2024年10与25日,智谱AI发布AutoGLM!AutoGLM是ChatGLM家族的最新系列模型,旨在通过图形用户界面(GUI),例如手机和网页,实现自主任务完成代理。它是一个能够自主控制数字设备的基础代理系统,专注于网页浏览器和Android系统作为代表性原创 2024-10-27 23:54:38 · 6132 阅读 · 0 评论 -
TTS之MaskGCT:MaskGCT(基于掩码生成编解码器的零样本文本转语音模型)的简介、安装和使用方法、案例应用之详细攻略
TTS之MaskGCT:MaskGCT(基于掩码生成编解码器的零样本文本转语音模型)的简介、安装和使用方法、案例应用之详细攻略目录MaskGCT的简介MaskGCT的安装和使用方法:MaskGCT的案例应用MaskGCT的简介2024年10月19日,正式发布MaskGCT (Masked Generative Codec Transformer) 是一款完全非自回归的文本转语音 (TTS) 模型。其最显著的特点是无需文本和语音监督之间的显式对齐原创 2024-10-23 23:57:54 · 1999 阅读 · 0 评论 -
MLM之Llama-3:Llama 3.2的简介、安装和使用方法、案例应用之详细攻略
MLM之Llama-3:Llama 3.2的简介、安装和使用方法、案例应用之详细攻略目录Llama 3.2 简介Llama 3.2 的安装和使用方法Llama 3.2 的案例应用Llama 3.2 简介2024年9月26日,Meta发布Llama 3.2,这是一款开源的大规模语言模型(LLM)集合,支持多种版本,覆盖从 1B、3B、11B 到 90B 参数规模。Llama 3.2 具有多模态能力,其中 1B 和 3B 版本仅支持文本处理,而 11B 和 9原创 2024-10-10 23:09:18 · 2207 阅读 · 0 评论 -
LLMs之SLMs之Phi:Phi-3.5系列模型(Phi-3.5-mini/Phi-3.5-vision/Phi-3.5-MoE)的简介、安装和使用方法、案例应用之详细攻略
LLMs之Phi:Phi-3.5系列模型(Phi-3.5-mini/Phi-3.5-vision/Phi-3.5-MoE)的简介、安装和使用方法、案例应用之详细攻略目录Phi-3.5系列模型(Phi-3.5-mini/Phi-3.5-vision/Phi-3.5-MoE)的简介Phi-3.5-MoE:专家混合Phi-3.5-minPhi-3.5-vision:具有多帧输入Phi-3 系列模型的安全Phi-3.5系列模型(Phi-3.5-mini/Phi-3原创 2024-08-28 02:11:54 · 1144 阅读 · 0 评论 -
LLMs之GLM-4:GLM-4-Long的简介、安装和使用方法、案例应用之详细攻略
LLMs之GLM-4:GLM-4-Long的简介、安装和使用方法、案例应用之详细攻略目录GLM-4-Long的简介GLM-4-Long的安装和使用方法GLM-4-Long的案例应用GLM-4-Long的简介GLM-4-Long 是由智谱 AI 推出的一个拥有百万级上下文长度的大语言模型,基于 GLM-4-9B 模型,是 GLM 技术团队在长文本领域持续迭代的最新成果。它能够处理超过 1M 上下文长度的文本,相当于 2原创 2024-08-22 23:50:52 · 2119 阅读 · 0 评论 -
LLMs之PE:AI for Grant Writing的简介、使用方法、案例应用之详细攻略
LLMs之PE:AI for Grant Writing的简介、使用方法、案例应用之详细攻略目录AI for Grant Writing的简介AI for Grant Writing的使用方法—提示资源AI for Grant Writing的简介AI for Grant Writing”是一个资源列表,旨在利用大型语言模型(LLMs)来撰写更具竞争力的资助申请。该项目提供了多种工具和提示,以帮助用户提升申请质量,包括:>> 有用的服务:拼写和语法检查、文本生原创 2024-09-21 23:45:05 · 2883 阅读 · 0 评论 -
CV之OCR:GOT-OCR2.0的简介、安装和使用方法、案例应用之详细攻略
CV之OCR:GOT-OCR2.0的简介、安装和使用方法、案例应用之详细攻略目录GOT-OCR2.0的简介GOT-OCR2.0的安装和使用方法GOT-OCR2.0的案例应用GOT-OCR2.0的简介GOT-OCR2.0 是一款通用光学字符识别(OCR)理论的官方代码实现,旨在通过一个统一的端到端模型推进 OCR-2.0 的发展。GOT-OCR2.0 提供了一种新的 OCR 解决方案,整合了最新的技术和理论,以提升文本识别的准确性和效率。该项目是基于 Huggi原创 2024-09-21 23:43:04 · 15050 阅读 · 1 评论 -
CV之PDF-Extract-Kit:PDF-Extract-Kit(布局检测→公式检测+公式识别→表格识别→光学字符识别)的简介、安装和使用方法、案例应用之详细攻略
CV之PDF-Extract-Kit:PDF-Extract-Kit(布局检测→公式检测+公式识别→表格识别→光学字符识别)的简介、安装和使用方法、案例应用之详细攻略目录PDF-Extract-Kit的简介PDF-Extract-Kit的安装和使用方法PDF-Extract-Kit的案例应用PDF-Extract-Kit的简介PDF文档中包含大量知识信息,然而提取高质量的PDF内容并非易事。为此,我们将PDF内容提取工作进行拆解:布局检原创 2024-09-21 20:24:32 · 2569 阅读 · 0 评论 -
MLM:多模态大型语言模型的简介、微调方法、发展历史及其代表性模型、案例应用之详细攻略
MLM:多模态大型语言模型的简介、微调方法、发展历史及其代表性模型、案例应用之详细攻略目录相关文章多模态大型语言模型的简介多模态大型语言模型的微调多模态大型语言模型的代表性模型多模态模型的应用场景多模态大型语言模型的案例应用实战应用相关文章AI之MLM:《MM-LLMs: Recent Advances in MultiModal Large Language Models多模态大语言模型的最新进原创 2024-09-04 02:10:03 · 2371 阅读 · 0 评论 -
MLM之Qwen:Qwen2-VL的简介、安装和使用方法、案例应用之详细攻略
MLM之Qwen:Qwen2-VL的简介、安装和使用方法、案例应用之详细攻略目录Qwen2-VL的简介Qwen2-VL的安装和使用方法Qwen2-VL的案例应用Qwen2-VL的简介2024年8越30日,阿里云重磅发布Qwen2-VL!Qwen2-VL是Qwen模型系列中最新版本的视觉语言模型。Qwen2-VL是由阿里云qwen2团队开发的多模态大型语言模型系列。GitHub地址:https://原创 2024-09-01 21:04:54 · 11329 阅读 · 0 评论 -
MLM之CogVideo:CogVideo(国产版Sora)的简介、安装和使用方法、案例应用之详细攻略
MLM之CogVideo:CogVideo的简介、安装和使用方法、案例应用之详细攻略目录CogVideo的简介CogVideo的安装和使用方法CogVideo的案例应用CogVideo的简介2022年5月19日,智谱AI开源了 CogVideo。在2024年8月7日正式开源。地址:https://github.com/THUDM/CogVideo1、项目更新🔥News:2024/8/7: CogVideoX 已经合并入diffuser原创 2024-08-07 23:28:22 · 2278 阅读 · 0 评论 -
CV之Face:Deep-Live-Cam的简介、安装和使用方法、案例应用之详细攻略
CV之Face:Deep-Live-Cam的简介、安装和使用方法、案例应用之详细攻略目录Deep-Live-Cam的简介Deep-Live-Cam的安装和使用方法Deep-Live-Cam的案例应用Deep-Live-Cam的简介Deep-Live-Cam仅需一张图片即可实现实时换脸和一键深度人造视频。此软件旨在为快速增长的 AI 生成媒体行业做出有益的贡献。它将帮助艺术家完成诸如动画制作自定义角色或将角色用作服装模特等任务。该软件的开发者意识原创 2024-08-07 00:04:26 · 4565 阅读 · 1 评论 -
MLM之GPT:GPT-4o mini(最具成本效益的GPT-4o)的简介、安装和使用方法、案例应用之详细攻略
MLM之GPT:GPT-4o mini(最具成本效益的GPT-4o)的简介、安装和使用方法、案例应用之详细攻略目录GPT-4o mini的简介GPT-4o mini的安装和使用方法GPT-4o mini的案例应用GPT-4o mini的简介2024年7月18日,GPT-4o mini是OpenAI推出的最具成本效益的小型模型,推进成本效益型智能,推出OpenAI最具成本效益的小型机型。OpenAI 致力于让智能尽可能广泛地普及。今天,OpenAI宣布推出原创 2024-07-24 23:36:16 · 2285 阅读 · 0 评论 -
MLM之CLIP:CLIP(对比语言-图像预训练模型)的简介、安装和使用方法、案例应用之详细攻略
MLM之CLIP:CLIP的简介、安装和使用方法、案例应用之详细攻略目录相关文章CLIP的简介CLIP的安装和使用方法CLIP的案例应用相关文章《Learning Transferable Visual Models From Natural Language Supervision》翻译与解读地址论文地址:https://arxiv.org/abs/2103.00020时间2021 年 2 月 26 日作者OpenAI总结CLIP的原创 2021-11-16 01:32:47 · 5458 阅读 · 0 评论 -
成功解决This graphics driver could not find compatible graphics hardware. You maycontinue installation,
成功解决This graphics driver could not find compatible graphics hardware. You maycontinue installation, but you may not be able to run CUDA applications with thisdriver. This may occur with graphics hardware that is newer than this toolkit. lInthat case, it原创 2024-07-25 01:15:29 · 2247 阅读 · 0 评论