深度学习
文章平均质量分 88
重点介绍最新的深度模型,以及深度学习在工业界,尤其是电商领域的应用。
sp_fyf_2024
老和山扫地僧,专注电商算法与系统优化。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【深度模型】OpenVoice: 多才多艺的即时语音克隆
OpenVoice是一种多才多艺的即时语音克隆方法,它只需要来自参考说话者的短音频剪辑就能复制他们的声音,并在多种语言中生成语音。这项技术在语音风格控制和零样本跨语言语音克隆方面取得了显著进展。与传统方法相比,OpenVoice在计算效率上也有显著提升,成本远低于市面上的API,同时提供了更好的性能。为了推动该领域的研究,研究者们已经将源代码和训练好的模型公开,并在演示网站上提供了定性结果。原创 2024-12-15 12:35:00 · 1466 阅读 · 0 评论 -
【深度学习】经典的深度学习模型-02 ImageNet夺冠之作: 神经网络AlexNet
Note: 草稿状态,持续更新中,如果有感兴趣,欢迎关注。。。原创 2024-10-12 11:18:46 · 402 阅读 · 0 评论 -
【深度学习】经典的深度学习模型-01 开山之作:CNN卷积神经网络LeNet-5
Note: 草稿状态,持续更新中,如果有感兴趣,欢迎关注。。。原创 2024-10-12 11:13:36 · 833 阅读 · 0 评论 -
[大语言模型-算法优化] 微调技术-LoRA算法原理及优化应用详解
随着GPT等大语言模型的陆续出现,人们逐步发现和接受了这样一个现实规律:增加数据量和模型参数往往是提升深度网络模型性能最简单粗暴的方法。目前主流的大模型参数量,通常都是千亿级别起步,并且还在不断持续地扩大。大型语言模型(LLM)的微调是为了使模型更好地适应特定的任务或领域。微调通常在模型的预训练阶段之后进行,预训练阶段模型在大量无标签数据上学习通用的语言特征,而微调阶段则使用特定任务的数据对模型进行进一步训练,以提高其在该任务上的表现。全参数微调。原创 2024-10-04 11:19:03 · 2181 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-04
本文提出了一种新的幻觉检测方法,该方法结合了多项填空考试方法,以解决因故事线变化导致的检测准确性下降的问题。首先,该方法通过从原始文本中遮蔽多个对象来创建一个多项填空考试。然后,提示大型语言模型(LLM)重复回答这个考试。这种方法确保了考试答案的故事线与原始文本一致。最后,通过评分考试答案来量化每个原始句子的幻觉程度,同时考虑原始文本本身可能出现的幻觉雪崩效应。实验结果表明,该方法不仅单独优于现有方法,而且在与现有方法集成时也达到了更清晰的最新性能。原创 2024-10-04 10:26:08 · 2005 阅读 · 0 评论 -
【电商搜索】现代工业级电商搜索技术-Facebook语义搜索技术QueSearch
本文要介绍的这篇论文是Facebook发表在KDD 2021的ADS Track的论文。通常情况下,论文所描述的问题和解决方案,与公司实际业务中遇到的现实问题有密切关联。这篇论文介绍了“Que2Search”,这是Facebook部署的一个查询和产品理解系统(如下图1),用于搜索功能。该系统通过多任务和多模态学习方法来训练查询和产品表示,实现了超过 5% 的绝对离线相关性改进和超过 4% 的在线参与度提升。原创 2024-09-28 21:20:32 · 1584 阅读 · 0 评论 -
[大语言模型-工程实践] 手把手教你-基于BERT模型提取商品标题关键词及优化改进
关键词提取是信息检索和文本挖掘中的一项重要技术,它涉及从文本中识别和提取出最能代表文档内容的词语或短语。如下图所示,对于亚马逊上面的商品标题,在构建底层索引时,通常需要对标题做分词,提取里面核心词,用于构建倒排索引或者用于关键词匹配计算等。关键词提取技术可以通过多种方法实现,包括无监督学习和有监督学习的方法。首先,你需要定义一个LoRA模块,这个模块将被插入到BERT模型的特定层中。大语言模型,工程实践,BERT, 人工智能算法,前沿技术。原创 2024-09-28 09:03:16 · 2791 阅读 · 0 评论 -
[大语言模型-论文精读] 大语言模型是单样本URL分类器和解释器
恶意URL分类是网络安全的关键部分。尽管现有的工作包括了许多基于机器学习和深度学习的URL分类模型,但大多数模型由于缺乏代表性的训练数据集而存在泛化和领域适应问题。此外,这些模型未能以自然人类语言提供给定URL分类的解释。在这项工作中,我们研究并展示了使用大型语言模型(LLMs)来解决这个问题。具体来说,我们提出了一个基于LLM的一次性学习框架,使用链式思考(CoT)推理来预测给定URL是否是良性或网络钓鱼。原创 2024-09-27 20:59:52 · 1829 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-09-27
多模态大型语言模型(MLLMs)通过整合文本和视觉信息,在多种任务中展现了有前景的能力,以实现复杂场景下的视觉理解。尽管已有多个基准旨在评估MLLMs在从视觉问题回答到复杂问题解决等任务的表现,但大多数主要集中在数学或一般视觉理解任务上。这揭示了当前基准的一个关键缺口,即常常忽略了物理和化学等其他关键科学学科的包含。为了解决这一差距,我们精心构建了一个全面的基准,名为VisScience,用于评估数学、物理和化学三个学科的多模态科学推理。计算机前沿技术,人工智能算法,大语言模型,LLM, 最新研究进展原创 2024-09-27 08:05:10 · 1680 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-09-26
本文探讨了大型语言模型(LLMs)是否具备规划能力,并特别评估了OpenAI最新模型o1(草莓模型)在PlanBench基准上的表现。计算机前沿技术,人工智能算法,大语言模型,llm,在相关领域的最新研究论文10篇速读。原创 2024-09-26 09:18:34 · 1570 阅读 · 0 评论 -
[大语言模型-工程实践] 手把手教你-基于Ollama搭建本地个人智能AI助理
Ollama 是一个用于在本地环境中运行和定制大型语言模型的工具。它提供了一个简单而高效的接口,用于创建、运行和管理这些模型,同时还提供了一个丰富的预构建模型库,可以轻松集成到各种应用程序中。原创 2024-09-25 08:13:55 · 1254 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-09-25
本文介绍了一种名为 PromSec 的算法,它针对大型语言模型(LLMs)在生成源代码时存在的安全漏洞问题,提出了一种提示优化方法。计算机前沿技术,人工智能算法,大语言模型,LLM, 最新研究,NLP,自然语言处理。原创 2024-09-25 08:10:41 · 1641 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-09-24
以往的研究采用了隐马尔可夫模型和循环神经网络来预测名字中的人口统计信息,但存在显著的局限性,包括缺乏大规模、良好策划、无偏见、公开可用的数据集,以及缺乏跨数据集稳健的方法。本文展示了大型语言模型的零样本能力,其表现与专门训练的模型一样好,甚至更好。计算机前沿技术,人工智能算法,AI, 大语言模型,最新研究进展原创 2024-09-24 07:59:12 · 1263 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-生成对抗网络-算法原理及应用实践
生成对抗网络(Generative Adversarial Networks,简称GANs)是由Ian Goodfellow等人在2014年提出的一种深度学习模型,主要用于数据生成任务。在本文,我们介绍该算法原理,如何优化,以及如何结合实际应用使用GAN网络编程。计算机前沿技术,,人工智能,生成对抗网络。原创 2024-09-24 00:01:02 · 2182 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-12
大型语言模型(LLMs)相关研究的最新进展,本文对10篇相关论文进行简介。计算机前沿技术,人工智能算法,大语言模型,LLM,提示词,最新论文阅读原创 2024-09-13 12:32:16 · 2029 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-23
计算机前沿技术,人工智能技术,大语言模型, LLM,软件安全,Prompt, 最新进展, 论文阅读原创 2024-09-23 07:27:45 · 1577 阅读 · 1 评论 -
[大语言模型] LINFUSION:1个GPU,1分钟,16K图像
本文介绍了一种新型的扩散模型LINFUSION,它能够在保持高分辨率图像生成性能的同时显著降低时间和内存复杂度。原创 2024-09-22 14:23:14 · 1215 阅读 · 0 评论 -
[大语言模型-论文精读] 以《黑神话:悟空》为研究案例探讨VLMs能否玩动作角色扮演游戏?
随着视觉语言模型(VLMs)的出现,代理现在具备了增强的视觉理解能力,使它们能够仅使用视觉输入与游戏互动。尽管取得了这些进展,当前方法在动作导向任务中仍面临挑战,尤其是在动作角色扮演游戏(ARPGs)中,强化学习方法虽然普遍,但泛化能力差,需要大量的训练。为了解决这些限制,我们选择ARPG《黑神话:悟空》作为研究平台,探索现有VLMs在需要视觉输入和复杂动作输出的场景中的性能边界。原创 2024-09-22 12:24:45 · 2925 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-22
大型语言模型(LLMs)最近作为解决具有动作和观测不确定性的机器人任务的有前途的工具出现。基于LLM的决策方法(也称为LLM代理)与适当的批评者配对,已显示出在解决复杂、长期任务方面的潜力,且交互次数相对较少。计算机前沿技术,人工智能算法,大语言模型,LLM,提示词,最新论文阅读,黑神话,悟空原创 2024-09-22 11:40:01 · 1872 阅读 · 1 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-21
计算机人工智能前沿,大语言LLM GPT,最新研究论文10篇速读。计算机前沿技术,人工智能算法,大语言模型,LLM,提示词,最新论文阅读原创 2024-09-21 17:18:36 · 1857 阅读 · 0 评论 -
浅谈计算机视觉的学习路径1
浅谈计算机视觉的学习路径原创 2024-09-21 10:01:30 · 1691 阅读 · 0 评论 -
手把手教你-MAC虚拟环境搭建TensorFlow开发环境
MAC笔记本创建Tensorflow虚拟环境原创 2024-09-20 22:28:20 · 618 阅读 · 0 评论 -
手把手教你-MAC笔记本安装Pytorch环境
MAC笔记本安装Pytorch环境,深度学习代码开发原创 2024-09-20 22:21:16 · 1920 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-20
计算机人工智能前沿进展,大语言模型LLM, 2024-09-20 论文速读, 计算机前沿技术,人工智能算法,大语言模型,LLM,提示词,最新论文阅读原创 2024-09-20 22:03:08 · 2316 阅读 · 1 评论 -
人工智能-大语言模型-微调技术-LoRA及背后原理简介
大语言模型的微调技术LoRA及成功背后原理分析文章。原创 2024-09-20 07:50:39 · 2624 阅读 · 0 评论 -
Qwen 2.5:阿里巴巴集团的新一代大型语言模型
在人工智能领域,大型语言模型(LLMs)的发展日新月异,它们在自然语言处理(NLP)和多模态任务中扮演着越来越重要的角色。阿里巴巴集团的Qwen团队最近推出了Qwen 2.5,这是其大语言模型系列的最新升级。本文将综述Qwen 2.5的主要特点、技术进步以及它在多模态交互和语言理解方面的应用潜力。Qwen 2.5的发布标志着阿里巴巴集团在这一领域的最新进展,它不仅在语言理解方面取得了显著提升,还在文本生成、视觉理解、音频理解等多个方面展现了卓越的能力。Qwen 2.5:阿里巴巴集团的新一代大型语言模型。原创 2024-09-19 23:02:54 · 2370 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-19
计算机人工智能前沿进展,大语言模型方向,最新研究论文,LLM。计算机前沿技术,人工智能算法,大语言模型,LLM,提示词,最新论文阅读原创 2024-09-19 07:36:25 · 2247 阅读 · 1 评论 -
浅谈机器学习与深度学习的区别
机器学习是一个更加广泛的学科,深度学习则是其一个分支,两者常识上的差异对比,不严谨,仅供参考。原创 2024-09-18 23:28:35 · 2597 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-18
计算机人工智能前沿,大语言模型方向5篇论文速读。计算机前沿技术,人工智能算法,大语言模型,LLM,提示词,最新论文阅读原创 2024-09-18 23:17:20 · 1609 阅读 · 0 评论 -
深度学习-生成式检索-论文速读-2024-09-14
生成式检索是多媒体信息检索领域的新方向,本文对最近几年的几篇论文进行速读,便于对该方向感兴趣的朋友学习。原创 2024-09-17 13:34:35 · 3033 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-17
计算机人工智能前沿进展-大语言模型方向-2024-09-17,计算机前沿技术,人工智能算法,大语言模型,LLM,提示词,最新论文阅读原创 2024-09-17 12:21:04 · 2266 阅读 · 1 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-16
计算机人工智能前沿进展-大语言模型方向-2024-09-16 论文速读,计算机前沿技术,人工智能算法,大语言模型,LLM,提示词,最新论文阅读原创 2024-09-16 14:55:55 · 1799 阅读 · 0 评论 -
机器学习-点击率预估-论文速读-20240916
点击率预估方向的2篇经典老文+ 最新出现的2篇文章。原创 2024-09-16 12:18:48 · 1715 阅读 · 0 评论 -
imagen: 具有深度语言理解的逼真的文本到图像扩散模型
谷歌的Imagen项目简介原创 2024-09-15 23:28:39 · 1321 阅读 · 0 评论 -
Imagen论文简要解析
文章介绍了一种名为Imagen的文本到图像扩散模型,该模型在理解文本和生成高保真度图像方面达到了前所未有的水平。Imagen基于大型变换器语言模型的强大文本理解能力,并依赖于扩散模型在图像生成方面的高保真度。研究发现,即使是在仅针对文本语料库预训练的通用大型语言模型(例如T5),在图像合成编码文本方面也出奇地有效。在Imagen中增加语言模型的大小,可以显著提高样本保真度和图像-文本对齐度,这比增加图像扩散模型的大小要有效得多。原创 2024-09-15 23:07:15 · 905 阅读 · 0 评论 -
浅谈计算机视觉新手的学习路径
计算机视觉学习新人的成长路线原创 2024-09-15 22:40:51 · 1108 阅读 · 0 评论 -
计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-15
计算机人工智能前沿进展-大语言模型方向-2024-09-15 有价值的9篇论文速读。计算机前沿技术,人工智能算法,大语言模型,LLM,提示词,最新论文阅读原创 2024-09-15 22:35:24 · 2036 阅读 · 0 评论
分享