
AI
dev.null
这个作者很懒,什么都没留下…
展开
-
DeepSeek + Kimi 自动生成 PPT
点击生成ppt就制作好了。原创 2025-03-18 10:10:52 · 1334 阅读 · 0 评论 -
Gemini分析屏幕截图时,如何处理图像模态(如界面元素、文字内容)与文本模态(用户指令)的语义对齐?
在通过Gemini大语言模型进行屏幕截图分析时,实现图像模态(界面元素/文字内容)与文本模态(用户指令)的语义对齐,需要结合多模态融合技术和领域知识。以下是具体的技术实现路径和挑战应对方案:图像特征提取使用Gemini的视觉编码器(如ViT)提取截图中的 结构化视觉特征:文本指令解析采用Gemini的文本编码器提取用户指令的 意图向量:空间-语义联合嵌入构建 异构图注意力网络 实现模态交互:动态权重分配机制根据任务类型自动调整模态贡献度:矛盾检测与置信度评估典型冲突场景应对方案轻量化视觉原创 2025-03-18 07:49:46 · 586 阅读 · 0 评论 -
MCP(Model Context Protocol,模型上下文协议)
是由Anthropic提出的开放协议,旨在为大型语言模型(LLM)与外部数据源、工具和服务之间的交互提供标准化框架。它通过统一的通信接口,解决AI生态中的数据孤岛问题,并推动智能体(Agent)技术的实用化发展。原创 2025-03-18 07:49:13 · 863 阅读 · 0 评论 -
KV 缓存简介
的策略,成为大模型高效推理的核心技术。随着模型规模扩大,优化KV缓存的内存效率(如Grouped Query Attention)仍是研究重点。是Transformer架构(如GPT、LLaMA等大模型)在。,避免重复计算,从而显著减少计算量。(如文本生成)中,用于。原创 2025-03-17 23:25:14 · 666 阅读 · 0 评论 -
PEFT简介
解决了大模型微调中的资源瓶颈问题,已成为NLP、多模态模型落地的关键技术。随着大模型规模的增长,PEFT的研究(如QLoRA、DoRA等)仍在持续演进。(参数高效微调)是机器学习领域的一种技术,专为。的轻量级微调而设计。,使大模型适应下游任务,同时。,显著降低了上述问题的影响。原创 2025-03-17 23:21:50 · 373 阅读 · 0 评论 -
中国在 AI 上超越美国,需要另辟蹊径
与此同时,中国在AI领域的进步虽然迅速,但仍面临着来自美国的技术封锁,尤其是在高性能计算芯片(如GPU)的限制方面。例如不需要那么多算力、更加“巧妙、智慧”的方法,虽然大模型取得了成功,但是不得不承认它不够简洁、优雅,更像是通过暴力计算弥补了智慧上的不足。虽然大模型(如GPT、BERT等)取得了显著的成功,但也暴露出了它们的一些局限性:依赖海量数据、巨大的算力支撑,以及复杂、笨重的架构。要想在与美国的全球竞争中实现超越,中国要在LLM上超越美国难度极大,需要另辟蹊径,寻找更加先进的AI实现方式。原创 2025-03-17 22:52:24 · 253 阅读 · 0 评论 -
DeepSeek 是否被过度吹捧了?
DeepSeek 的确取得了不错的成果,不过可能没有媒体宣传和人们想象中那么重大。它的轰动性主要在于以低廉的成本达到了前沿模型相近的效果,但是并没有显著超越其它前沿模型,而它的低廉成本也是存在争议的,可能是因为进行了蒸馏训练等原因导致成本被低估了。然而,由于一些技术以外的因素,围绕其的宣传可能存在夸大成分。因此,业界应保持理性,客观评估其技术实力和市场影响。二、国内民众由于众所周知的原因无法访问国外前沿模型,导致民众误认为 DeepSeek 遥遥领先于国外的模型,也就是说大多数民众存在信息滞后的情况。原创 2025-03-17 22:50:45 · 236 阅读 · 0 评论 -
文生图网站推荐(2025.3)
以下是2024-2025年期间值得推荐的文生图网站,综合了免费性、中文友好度、操作便捷性及功能特色,涵盖不同用户需求:通义万相(阿里云)Dreamina(字节跳动)简单AI(搜狐)哩布哩布AI(LiblibAI)无界AIWHEEVega AIDALL-E-2(OpenAI)Stable Diffusion(DreamStudio)注意事项:原创 2025-03-17 22:22:46 · 439 阅读 · 0 评论 -
大语言模型“狂飙”,如何与具身智能领域紧密结合?
DeepSeek R1 公布后,不少研发团队受其启发,纷纷借鉴 R1 的技术路线,以更易负担的成本研发大模型,就好像“拼多多”在电商领域用低价策略打开市场一样,DeepSeek 同样凭借开源和成本优势,迅速拉近了普通人与尖端 AI 的距离。RT—1 的设计思路秉承了大模型“力大砖飞”的理念,也就是说,模型容量大,可以吸收大量的各类数据,也可高效地泛化。我们有理由相信,不久的将来,具身智能体将具备执行通用任务的能力和强大的学习能力,它们将能够更深入地理解我们的世界,并以前所未有的方式参与其中。转载 2025-03-16 23:14:23 · 25 阅读 · 0 评论 -
大语言模型的潜力是否被高估
关于大语言模型(LLM)的潜力是否被高估,目前学术界和产业界存在显著分歧。一、技术能力的争议:潜力与局限并存。原创 2025-03-13 22:30:54 · 369 阅读 · 0 评论 -
Gemini 2.0 Flash
此外,Google 还推出了 Gemini 2.0 Flash Thinking 实验版模型,经过专门训练,能够在回答问题时展示其思考过程,增强了推理能力。Gemini 2.0 Flash 是 Google 最新推出的 AI 语言模型,旨在提升速度和效率,满足各种任务需求,包括写作、规划、学习和图片生成等。Gemini 2.0 Flash 的发布,标志着 Google 在 AI 领域迈出了重要一步,为用户提供了更快速、高效和多功能的人工智能体验。原创 2025-03-10 20:42:01 · 341 阅读 · 0 评论 -
失控的普罗米修斯之火:AI时代人类文明的终极命题
2023年,当ChatGPT用两个月时间完成TikTok九个月的用户积累时,这个数字不仅昭示着技术迭代的加速度,更隐喻着人类正在经历文明史上最危险的认知错位——我们创造的技术存在正在以指数级速度进化,而人类对其本质的理解仍停留在线性思维时代。这种认知鸿沟的持续扩大,正在将人类文明推向前所未有的风险边缘。原创 2025-03-07 00:03:51 · 380 阅读 · 0 评论 -
AI进化太快,建立完善的AI理论迫在眉睫
如果 AI 还是像上个世纪一样弱小那还不足为虑,但是如今的 AI 已经接近甚至超越人类了,人类还是只知其一不知其二,那将非常危险。可能在所有人都没有意识到的方面,AI 突然失控。虽然AI是人类创造的,但是我们其实没有完全理解其原理。深度学习本质上还是一个黑盒,虽然我们有知道一些方法调整和改善黑盒的输出,但是还远没有透彻地理解其原理。DeepSeek的热度还没降,Manus 又火了。随着AI越来越强大且进化速度越来越快,建立完善的AI理论迫在眉睫。AI 越强大,就越需要完全理解其原理,否则越危险。原创 2025-03-07 00:00:35 · 253 阅读 · 0 评论 -
小模型和小数据可以实现AGI吗
小模型和小数据很难实现真正的,但在特定任务或受限环境下,可以通过高效的算法和优化方法实现“近似 AGI” 的能力。原创 2025-03-05 23:19:03 · 414 阅读 · 0 评论 -
如何本地部署llm
总结一下,本地部署LLM的关键步骤包括准备硬件环境、安装依赖、加载预训练模型、优化性能、创建API服务并进行部署。如果有任何问题或具体的实现细节,随时告诉我!LLM通常需要大量的计算资源。特别是像GPT、BERT之类的模型,它们需要较强的GPU或TPU支持。如果模型非常大,或者你计划部署多个模型实例,可能需要考虑负载均衡和资源管理工具,如Kubernetes等。大多数LLM都有预训练模型可供使用。接口,你就可以发送文本并得到模型的推理结果。原创 2025-02-23 18:51:50 · 518 阅读 · 0 评论 -
机器翻译同样的文本,是从英语翻译成日语更准确还是中文翻译成日语更准确
可以尝试直接中日翻译,但仍可能需要人工修正以确保自然流畅。,这样机器翻译的结果会更流畅、准确。原创 2025-02-13 21:33:16 · 459 阅读 · 0 评论 -
哪些办法可以判断程序员技术面试时是否使用了AI辅助
特别是一些简单的问题,却要“思考”好久。有时候选人为了掩盖停顿,会先复述问题,或者先模棱两可地回答一下,然后突然“灵光一现”,回答正确答案(AI这时生成好了)。针对这种情况,可以使用一些方法来判断,例如,发送一些AI相对较难识别的代码块图片,让候选人说出运行结果和解释,候选人如果和之前的对答如流有明显的反差,则可能是用了AI。因此,面试官应综合考虑候选人的整体表现,包括非语言线索,如肢体语言和面部表情,以做出更全面的判断。:如果候选人的回答过于流畅、结构清晰,且缺乏个性化细节,可能是AI生成的内容。原创 2025-02-11 23:20:33 · 171 阅读 · 0 评论 -
AI 编程助手 Cline
Cline 是一款集成于 Visual Studio Code(VS Code)的 AI 编程助手,旨在提升开发者的编程效率和代码质量。:直接在编辑器中创建、编辑文件,并在过程中监控 linter 和编译器错误,主动修复问题,如缺少导入和语法错误。总之,Cline 通过集成多种 AI 功能,旨在为开发者提供一个高效、智能的编程环境,提升开发效率和代码质量。:Cline 能根据开发者的输入,自动生成代码片段或完整的函数,减少手动编写的工作量。Cline 作为 VS Code 的扩展插件,安装过程简单。原创 2025-02-11 22:19:17 · 355 阅读 · 0 评论 -
运用 LangChain 编排任务处理流水线,实现多轮对话场景
接下来,我们通过LangChain的链式结构来定义一个任务处理流水线。可以在流水线中加入多个步骤,按顺序处理。例如,我们定义一个简单的流水线,首先进行用户输入的处理,然后通过调用语言模型生成回复。原创 2025-02-11 22:18:23 · 381 阅读 · 0 评论 -
deepseek和chatgpt对比
总的来说,ChatGPT 更注重生成和互动,而 DeepSeek 则偏重于信息检索和深度分析。两者有不同的应用重点,具体选择取决于你的需求。DeepSeek 和 ChatGPT 都是自然语言处理领域的工具,但它们的设计目标和功能有所不同。原创 2025-02-11 21:01:54 · 1295 阅读 · 0 评论 -
目前,机器翻译英译日的效果远低于英译中
来源: https://scholar-press.com/uploads/papers/W8VFe2jz0Iz7wVY3lNvzeXeOyjAQU8gZMbXCewzD.pdf。原创 2025-02-06 20:27:36 · 161 阅读 · 0 评论 -
体验 DeepSeek 多模态大模型 Janus-Pro-7B
继上篇文章下载了 Janus-Pro-7B 后,准备本地运行时发现由于电脑配置配置太低(显存小于24G),无法运行,因此只能用线上运行的网站体验一下了。https://huggingface.co/deepseek-ai 或 https://hf-mirror.com/deepseek-ai(国内)。总的来说,Janus-Pro-7B 还是比较强大的,能够在评测中超过 DALL3 也是实至名归。勉强也算准确,只是图片中没有 Git,描述中却出现了 Git,有点无中生有了。当然也可能是提示词和参数应该改善。原创 2025-02-05 23:44:29 · 1271 阅读 · 0 评论 -
除了网页,还有哪些方式可以访问deepseek r1
例如,微软已将 DeepSeek 的 AI 模型集成到 Azure 云平台,用户可以在 Azure 上使用 DeepSeek R1。:DeepSeek 已推出适用于 iOS 和 Android 的移动应用,用户可以通过这些应用在手机上直接使用 DeepSeek R1。:开发者可以通过 DeepSeek 提供的 API,将 R1 模型的功能集成到自己的应用程序或平台中,实现自动化的数据检索和处理。请注意,使用 DeepSeek R1 时,可能需要注册账户,并遵守相关的使用条款和隐私政策。原创 2025-02-05 22:58:47 · 501 阅读 · 0 评论 -
如何安装 CUDA Toolkits
的步骤如下,具体步骤根据你的操作系统(Windows/Linux/Mac)有所不同。完成这些步骤后,你就可以开始使用 CUDA 进行开发了!如果遇到任何问题,随时可以提出。原创 2025-01-30 21:32:28 · 2062 阅读 · 0 评论 -
电脑要使用cuda需要进行什么配置
完成以上配置后,你的电脑应该可以使用CUDA进行并行计算了!如果在使用过程中遇到问题,可以提供具体报错信息进一步排查。CUDA Toolkit是CUDA开发环境,包含运行库、编译器和工具。确保你的电脑拥有支持CUDA的NVIDIA显卡。如果输出CUDA的版本信息,说明安装成功。中查看显卡型号是否支持CUDA。原创 2025-01-30 21:31:34 · 1878 阅读 · 0 评论 -
如何获取 DeepSeek 多模态大模型 Janus-Pro-7B
DeepSeek 团队近期开源了新一代多模态模型 Janus-Pro-7B,该模型在图像生成和多模态理解方面表现卓越,超越了OpenAI的DALL-E 3,并在基准测试中取得了优异成绩。Janus-Pro-7B 的代码和模型参数已经分别在 github 和 huggingface 上开源,我们拉取到本地后就能运行使用了。由于模型比较大,约为15G,下载比较耗时,请耐心等待。下载成功后就可以进行下一步使用了,将在下一期分享。原创 2025-01-29 00:21:03 · 6930 阅读 · 0 评论 -
如何构建一个 GraphRAG 系统
构建一个。原创 2025-01-24 23:43:57 · 1075 阅读 · 0 评论 -
GraphRAG 简介
与传统的 RAG 系统主要检索语义相似的文本片段不同,GraphRAG 从非结构化文本中构建结构化的知识图谱,使模型能够更好地处理复杂信息,特别适用于需要多跳推理或从多种来源综合信息的任务。提供了对中文的支持,允许使用兼容 OpenAI 协议的中文大模型 API,或使用开源中文模型搭建的 API 服务器。通过这种结构化的方法,GraphRAG 克服了传统 RAG 系统的局限性,在回答复杂查询时提供更全面和准确的响应。值得注意的是,GraphRAG 已经有适配中文的版本。例如,GitHub 上的项目。原创 2025-01-24 23:42:26 · 504 阅读 · 0 评论 -
芯片部署大模型应该用什么语言
芯片部署大模型的编程语言选择主要取决于以下几个因素:硬件架构、框架支持、性能优化和团队技能。原创 2025-01-23 09:21:23 · 458 阅读 · 0 评论 -
使用openai assistant实现rag如何知道检索出的文件内容
通过在向量数据库中存储文件的元数据,并结合 OpenAI 的生成模型,可以很容易地知道检索出了哪些文件及其内容。您可以使用这些信息来调试和改进您的 RAG 系统,同时提升回答的可追溯性。原创 2025-01-13 21:05:56 · 457 阅读 · 0 评论 -
对智能的一种新理解
若要给“智能”赋予一个更具包容性的概念,可以把它视作个体(或系统)在面对多变环境时,能够持续学习、合理决策、有效沟通,并在必要时进行创造性突破,以实现目标或更高层次发展的综合能力。这当中不仅包括逻辑推理、知识获取,也包含情绪与人际互动,更包含对未知的探索、对新事物的好奇心与创造力。面对飞速变化的世界,一个真正“智能”的个体或系统,需要具备灵活应变的能力,而非仅仅积累大量的固化知识。或许,在未来我们还会有更多新发现,进一步推动对智能的理解。但可以肯定的是,从多元性、社会性、创造性和可计算性。原创 2025-01-12 22:06:00 · 699 阅读 · 0 评论 -
AIOps 平台
AIOps(Artificial Intelligence for IT Operations)平台是一种结合人工智能(AI)技术和IT运营管理的解决方案,旨在通过自动化、智能化的手段优化企业IT系统的运行与管理。AIOps 可处理混合云、多云和微服务架构等复杂系统环境中的数据和事件。整合监控、日志分析和告警功能,减少工具和人力成本。基于历史趋势预测未来的资源需求,优化资源使用效率。管理分布于不同云环境的系统,实现全局的监控与优化。监控业务系统的运行状态,自动检测性能瓶颈。原创 2025-01-09 22:27:32 · 421 阅读 · 0 评论 -
FastGPT 介绍
FastGPT 是一种专注于高效对话和任务处理的人工智能语言模型。原创 2025-01-07 23:11:33 · 1244 阅读 · 0 评论 -
Supervised Fine-Tuning(监督式微调)
Supervised Fine-Tuning(监督式微调) 是机器学习和深度学习领域中的一个重要概念,尤其是在自然语言处理(NLP)和计算机视觉等领域中被广泛使用。以下是对这个概念的详细介绍:Supervised Fine-Tuning 是指在有监督学习框架下,通过给模型提供标注过的数据(labelled data),对一个已经预训练的模型(pre-trained model)进行进一步的调整和优化。这种方法通常用于将一个通用模型(general model)适配到特定任务或领域中,例如从自然语言生成模型原创 2025-01-05 17:52:39 · 1023 阅读 · 0 评论 -
ChatGPT 是通用人工智能吗
ChatGPT 是一个非常强大的工具,但它距离真正的 AGI 还有很远的距离。目前,全球的 AGI 研究仍处于早期阶段,尚未有系统真正实现“通用智能”。,具体来说是一种基于大规模语言模型(如 GPT-4)的生成式人工智能,专注于处理自然语言任务。ChatGPT 目前并不是。原创 2025-01-01 22:07:49 · 668 阅读 · 0 评论 -
如何根据数据分布特性,选择合适的聚类算法,以优化K-Means算法对非球形分布数据的聚类效果?
在数据聚类分析中,选择合适的聚类算法对于获得有效的聚类结果至关重要。K-Means算法因其简单高效在许多场景中被广泛应用,但其假设簇为球形且大小相近,这在面对非球形或不同密度的数据分布时往往表现不佳。为了优化K-Means在非球形分布数据上的聚类效果,可以根据数据的分布特性选择更适合的聚类算法。原创 2024-12-31 20:35:25 · 1622 阅读 · 0 评论 -
如何看待deepseek-v3的发布
在多个基准测试中,DeepSeek-V3的表现超越了此前的所有开源模型,甚至超过了OpenAI的GPT-4o(8月发布),接近Anthropic的Claude 3.5 Sonnet(10月发布)。此外,DeepSeek-V3的成功也显示出,即使在硬件资源有限的情况下,通过数据与算法层面的优化创新,仍然可以实现高效的模型训练和推理。总的来说,DeepSeek-V3的发布展示了中国在人工智能领域的快速进步,特别是在模型性能提升和训练成本降低方面的创新,为未来人工智能技术的发展提供了新的思路。原创 2024-12-30 20:23:48 · 1255 阅读 · 0 评论 -
适合发布人工智能主题文章的英文网站和平台
专注于数据科学、人工智能和机器学习的专业平台,你可以投稿文章并获得行业内的曝光。专注于人工智能、机器学习和数据科学的高质量平台,适合分享深入的技术文章。虽然是全球社区,主要内容与数据科学、AI相关,适合技术性较强的文章。回答人工智能相关问题时,可以附上自己的文章链接,帮助文章传播。一个流行的博客平台,拥有专注于人工智能和技术的社区,如。如果你有具体的文章类型,我可以推荐更适合的发布平台。适合技术和创新类主题文章,可以覆盖广泛的技术受众。偏向科技新闻和评论,适合前沿技术、创新相关的文章。原创 2024-12-30 20:23:01 · 568 阅读 · 0 评论 -
上海机场联络线完全可以设计成不出站换乘地铁
由于机场联络线和普通地铁在运行速度和路线上有着明显差异,当乘客从任意两个站点出入时,可以通过乘客花费的时间自动识别出乘客是否乘坐了机场联络线,甚至可以识别出哪一段路乘坐了机场联络线,哪一段路乘坐了普通地铁。虽然由于乘客的等车时间、换乘时间的差异,可能会导致一定的误差,但是智能算法能够将这些误差都考虑在内,不会出现误判的情况。机场联络线和普通地铁的票价差异并不必然导致乘客必须出站重新计费。通过这样的自动计算票价的机制,乘客可以实现真正的无缝换乘,无需担心额外的操作步骤和时间浪费,从而提高整体出行效率。原创 2024-12-28 18:49:12 · 435 阅读 · 0 评论 -
聚类的主要算法和介绍
聚类是一种无监督学习算法,用于将数据集划分为多个组(或簇),使得同一簇内的数据点更相似,不同簇之间的点差异更大。选择算法时应根据数据分布特性、规模和具体任务需求进行权衡。原创 2024-12-27 22:29:57 · 1084 阅读 · 1 评论