
Gen-AI
文章平均质量分 92
新缸中之脑
这个作者很懒,什么都没留下…
展开
-
基于自组织映射的检索增强生成
大量数据用于训练大型语言模型 (LLM),该模型包含数百万和数十亿个模型参数,目的是生成文本,例如文本补全、文本摘要、语言翻译和回答问题。虽然 LLM 从训练数据源中开发知识库,但总有一个训练截止日期,在此日期之后 LLM 将不会知道任何新生成的数据。例如,训练 OpenAI 的 GPT-3.5-turbo-instruct LLM 的截止日期是 2021 年 9 月,因此,GPT-3.5-turbo-instruct LLM 可能无法准确回答有关 2022、2023 或 2024 年事件的问题。原创 2024-07-22 12:43:09 · 1045 阅读 · 0 评论 -
AI驱动的生成式设计,塑造CAD的未来
如今,生成式设计(Generative Design)技术正在使用强大的计算能力从头到尾彻底改变设计过程。借助新的计算机软件,生成式设计现在正在优化 CAD 输出。设计正在数字化转型,我们不会回头。推荐:用快速搭建3D场景。工程公司已转向生成式设计,以颠覆工程流程。生成式设计技术开启了富有想象力的设计潜力。它为传统 CAD 技术智能梦想的高度优化产品铺平了道路。通过利用云处理能力,生成式设计生产出具有效率和更高性能的产品。我们现在正在进入第四次工业革命。原创 2023-03-13 20:57:04 · 2258 阅读 · 0 评论 -
【Blender】Stability AI插件 - AI生成图像和动画
Stability AI 的官方插件允许 Blender 艺术家使用现有的项目和文本描述来创建新的图像、纹理和动画。推荐:用快速搭建3D场景。原创 2023-03-10 08:55:27 · 4982 阅读 · 0 评论 -
11种主流生成式AI应用【2023】
生成式 AI 允许在几分钟内生成新颖逼真的视觉、文本和动画内容。据 Gartner 称,到 2025 年,生成式 AI 生成的数据将占所有生成数据的 10%。作为 2022 年最重要的战略技术趋势之一,人工智能 (AI) 的这一分支具有广泛的应用,适用于不同行业,包括监控、医疗保健、营销、广告、教育、游戏、通信、播客等。推荐:将加入你的3D开发工具链。原创 2023-02-22 07:17:23 · 5515 阅读 · 0 评论 -
文本生成图像应用指南【Stable Diffusion】
Stable Diffusion 是一种文本到图像的潜在扩散模型,由来自 CompVis、Stability AI 和 LAION 的研究人员和工程师创建。它使用来自 LAION-5B 数据库子集的 512x512 图像进行训练。稳定扩散,生成人脸,也可以在自己的机器上运行,如下图所示:推荐:将加入你的3D开发工具链。如果你足够聪明和有创意,你可以创建一系列图像,然后形成视频。原创 2023-02-20 08:49:18 · 4106 阅读 · 0 评论 -
基于Transformer的NLP处理管线
这个任务的输入是一个文本语料库,模型将根据参数中提到的预期长度输出它的摘要。在这里,我们将最小长度保持为 5,将最大长度保持为 30。还可以从针对摘要任务进行微调的模型的其他选项中进行选择 - bart-large-cnn、t5-small、t5-large、t5-3b、t5-11b。可以在此处查看可用模型的完整列表。原创 2023-02-19 11:58:27 · 678 阅读 · 0 评论 -
基于深度神经网络的3D模型合成【Transformer vs. CNN】
从单一视角合成 3D 数据是一种基本的人类视觉功能,这对计算机视觉算法来说极具挑战性,这是一个共识。但在 3D 传感器(如 LiDAR、RGB-D 相机(RealSense、Kinect)和 3D 扫描仪)的可用性和可负担性提高之后,3D 采集技术的最新进展取得了巨大飞跃。与广泛可用的 2D 数据不同,3D 数据具有丰富的比例和几何信息,从而为机器更好地理解环境提供了机会。然而,与 2D 数据相比,3D 数据的可用性相对较低,而且采集成本较高。原创 2023-02-18 10:24:12 · 2606 阅读 · 0 评论 -
ChatGPT提示语编写指南
Linux 终端、哲学家、品茶师或圣经翻译——ChatGPT 可以扮演所有这些角色,甚至更多。AI所需要的只是朝着正确方向的推动。方便的是,开发人员 Fatih Kadir Akın 在他的网站上编制了一系列此类情况描述,包括一些清晰描述的提示。良好的提示通常具有相同的结构:首先,ChatGPT 收到一个提示,告诉它 AI 应该扮演什么角色。然后提示会说明用户提供了哪些信息,然后是 AI 应该如何处理这些信息,包括粗略的方向建议。最后,开发人员将第一条具体指令放在引号中。示例:我希望你当导游。原创 2023-02-15 21:51:36 · 4907 阅读 · 2 评论 -
PyTorch自定义损失函数实现
MNIST 数据集是广泛用于图像分类任务的数据集,它包含 70,000 张手写数字图像,每张图像的分辨率为 28x28 像素。任务是将这些图像分类为 10 个数字之一 (0–9)。此任务旨在根据 MNIST 数据集中提供的训练示例训练一个模型,该模型可以准确地对手写数字的新图像进行分类。此任务的典型方法是使用多类逻辑回归模型,它是一个 softmax 分类器。softmax 函数将模型的输出映射到 10 个类别的概率分布。交叉熵损失通常用作此类模型的损失函数。原创 2023-02-11 10:39:30 · 2067 阅读 · 0 评论 -
OpenAI最重要的模型【CLIP】
CLIP 代表 Contrastive Language-Image Pretraining:CLIP 是一个开源、多模态、零样本模型。给定图像和文本描述,该模型可以预测与该图像最相关的文本描述,而无需针对特定任务进行优化。开源:该模型由 OpenAI 创建并开源。稍后我们将看到有关如何使用它的编程教程。多模态:多模态架构利用多个领域来学习特定任务。CLIP 结合了自然语言处理和计算机视觉。零样本:零样本学习是一种在未见过的标签上进行泛化的方法,无需专门训练来对它们进行分类。原创 2023-02-11 10:32:40 · 9151 阅读 · 0 评论 -
变分自编码器背后的直觉【VAE】
我们将从解释基本自动编码器 (AutoEncoder) 的一般工作原理开始。在构建任何 ML 模型时,你的输入都会被编码器转换为数字表示形式,供网络使用。这样做是为了简化数据并保存其最重要的特征。好吧,AE 只是两个网络放在一起——一个编码器和一个解码器。这对的目标是尽可能准确地重建输入。编码器保存输入的表示,之后解码器从该表示构建输出。起初,这似乎有点适得其反。为什么要经历所有以纯净、未更改的形式重建已有数据的麻烦?关键是,通过训练过程,AE 学会构建紧凑而准确的数据表示。原创 2023-02-11 10:20:19 · 1009 阅读 · 0 评论 -
Transformer位置编码图解
位置编码描述了序列中实体的位置或位置,以便为每个位置分配一个唯一的表示。不使用单个数字(例如索引值)来表示项在转换器模型中的位置的原因有很多。对于长序列,索引的幅度可能会变大。如果将索引值规范化为介于 0 和 1 之间,则可能会为可变长度序列带来问题,因为它们的规范化方式不同。Transformers 使用智能位置编码方案,其中每个位置/索引都映射到一个向量。因此,位置编码层的输出是一个矩阵,其中矩阵的每一行代表序列中的一个编码对象与其位置信息相加。下图显示了仅对位置信息进行编码的矩阵示例。原创 2023-02-09 11:11:07 · 3789 阅读 · 3 评论 -
3D模型深度生成网络【ShapeAssembly】
手动创作 3D 形状既困难又耗时;3D 形状的生成模型提供了引人注目的替代方案。程序表示(procedural representations)就是这样一种可能性:它们提供高质量和可编辑的结果,但难以创作,并且通常产生多样性有限的输出。另一个极端是深度生成模型(deep generative models):给定足够的数据,它们可以学习生成任何类别的形状,但它们的输出有伪影并且表示不可编辑。在本文中,我们朝着实现新颖的3D形状合成的两全其美迈出了一步。原创 2023-02-09 10:22:03 · 759 阅读 · 0 评论 -
带纹理3D网格的深度生成模型【Gen-AI】
具体来说,我们的方法为各个形状部分生成纹理贴图,每个部分都是一个可变形的盒子,从而产生失真最小的自然 UV 贴图。该网络分别将部分几何体(通过 PartVAE)和部分纹理(通过 TextureVAE)嵌入到它们各自的潜在空间中,以便于学习以几何为条件的纹理概率分布。我们引入了一个用于纹理生成的条件自回归模型,它可以以零件几何形状和已经为其他零件生成的纹理为条件,以实现纹理兼容性。为了产生高频纹理细节,我们的 TextureVAE 通过基于字典的矢量量化在高维潜在空间中运行。原创 2023-02-08 16:11:21 · 3795 阅读 · 0 评论 -
3D模型的生成式AI
生成式 AI 席卷了 2022 年,我们最近决定 Physna 不应错过这个热点。因此,尽管生成 AI 并不是我们的商业模式—Physna 是一家 3D 搜索和分析公司,专注于 AR/VR 和制造中的工程和设计应用—我们还是决定为 3D 模型和场景生成 AI 构建一个非常基本的原型,由三名工程师进行为期两周的冲刺。为什么?原创 2022-12-26 12:39:11 · 4139 阅读 · 0 评论 -
ChatGPT与BimAnt的1小时对话实录【数字孪生】
数字孪生的核心价值在于,它可以在软件仿真的基础上,帮助我们更好地理解和掌握真实世界的系统和过程,并做出更加明智的决策。这家企业可以使用人工智能技术来创建出一个生产流程的数字孪生,通过模拟生产过程中的各种情况,找出生产瓶颈并分析出更优的生产方案。BRep 可以精确地表示几何体的形状,并且可以支持复杂的几何体,如拐角处的曲线和扭曲的几何体。值得注意的是,如果要将BRep模型导出为IFC格式,可能需要额外的转换步骤,因为IFC格式要求模型中包含许多额外的信息,而BRep模型可能只包含几何信息。原创 2022-12-24 22:01:36 · 5220 阅读 · 0 评论