yt9364-优快云博客

原创 RTX5090震撼发布，国行16499元起，黄仁勋「美国队长」pose亮翻全场

基于 Transformer 的 DLSS 光线重建和超分辨率模型使用 2 倍以上的参数和 4 倍以上的算力，以在游戏场景中提供更高的稳定性、更好的重影、更高的细节和增强的抗锯齿效果。目前，整个物理 AI 行业的先驱都在使用 Cosmos，比如 AI 和人形机器人公司 1X 使用 Cosmos Tokenizer 推出了 1X 世界模型挑战赛数据集，另一家以自动驾驶汽车为起点为世界提供生成式 AI 的先驱 Waabi 在自动驾驶软件开发和仿真的数据管理环境中评估 Cosmos。

2025-01-08 16:55:35 869

原创简化芯片设计传统，AI训练的新型算法正改变芯片研发范式

为了了解 Parsac 在更真实的设计中的表现，团队在基准测试问题中添加了自己的约束，包括关于块放置和分组的规定。令人高兴的是，Parsac 在不到 15 分钟的时间内成功解决了拥有商业规模的高级布局规划问题，使其成为同类产品中已知最快的布局规划器。相比之下，估计有 10 的 24 次方个宇宙中的星星的总量。事实上，来自英特尔 AI 实验室的团队最近尝试开发一种基于 AI 的解决方案来处理一项称为布局规划的棘手设计任务，但在此之中他们找到了一个基于非 AI 方法的更成功的工具。

2025-01-08 16:54:33 1349

原创高质量3D生成最有希望的一集？GaussianCube在三维生成中全面超越NeRF

更为关键的是，鉴于先前研究中的发现，扩散模型在处理高维数据分布时表现不佳，本文提出的 GaussianCube 在保持高质量重建的同时，显著减少了所需的参数量，极大地缓解了扩散模型在分布建模上的压力，为 3D 生成建模领域带来了显著的建模能力和效率提升。更为关键的是，本文提出的新型拟合算法极大地增强了表示的紧凑性，在 3D 表示拟合质量相似的情况下所需的参数量仅是传统结构化表示所需参数量的十分之一或百分之一。本文的方法可以极大程度上保留输入肖像的身份特征信息，并且提供细致的发型、服装建模。

2025-01-06 11:42:12 1447

原创吴恩达团队新作：多模态多样本上下文学习，无需微调快速适应新任务

研究结果表明，多样本上下文学习能够显著提高多模态基础模型的表现，尤其是 Gemini 1.5 Pro 模型在多个数据集上表现出持续的性能提升，使其能够更有效地适应新任务和新领域，而无需传统的微调。然而，受限于基础模型的上下文长度，尤其是对于需要大量视觉 token 来表示图片的多模态基础模型，已有的相关研究只局限于在上下文中提供少量样本。通过对多个领域和任务的数据集进行测试，团队验证了多样本上下文学习在提高模型性能方面的显著效果，并探讨了批量查询对性能和成本及延迟的影响。

2025-01-06 11:40:37 1044

原创阿里云与零一万物达成战略合作，成立“产业大模型联合实验室” ，加速落地应用

据悉，双方深度战略合作的产业大模型联合实验室包含技术、业务、人才等板块，阿里和零一万物将结合两个团队全球顶尖的大模型研发实力，形成从下一代基座模型技术探索到产业落地大模型服务的组合拳，全面通过阿里云百炼大模型平台的模型服务层面向市场，针对 ToB 行业打造更强更全面的大模型解决方案，加速大模型穿透千行百业。近期，阿里云和大模型头部企业零一万物达成模型平台业务的战略合作，双方将成立“产业大模型联合实验室”，联手加速大模型从技术到应用的落地，进一步扩大产业大模型的生态整合。

2025-01-05 11:54:20 353

原创昆仑万维周亚辉：人形机器人时代，中国新首富就在这三个人当中

那个时候，举例来说，一个负责任的发达大国里，假如有 1 亿人口，18-65 岁人口占到 60%，这是劳动力人口，劳动力人口里面将会有一半以上的人不再工作而在家待业状态，这些人将由政府发放生活费，假如人均 GDP 是 1 万美金，算到每个劳动力人口的人均 GDP 是大致 1.8 万美金，这些待业人口政府将会发放相当于年薪 6000 美金的生活费，工作人群的年薪大致会在 3 万美金左右，税后在 2 万美金左右，比现在的年薪要高，因为是工作质量高的更高端人群留下来工作了。当然企业的战略也是动态调整变化的。

2025-01-05 11:53:07 1733

原创 AAAI 2025 | 多模态大语言模型空间智能新探索：仅需单张图片或一句话，就可以精准生成3D建模代码啦！

我们把关键的 3D、2D 建模参数定义为大语言模型可以理解的建模语言，便于大模型理解和生成。近期，来自上海交通大学的 i-WiN 研究团队提出了专门用于 CAD 建模的多模态大语言模型 CAD-GPT，结合专门设计的 3D 建模空间定位机制，将 3D 参数映射到 1D 语言信息维度，提高了 MLLM 的空间推理能力，实现了基于单张图片或一句话描述的精准 CAD 建模构造序列生成。如图所示，添加定位机制后，CAD-GPT 可以精准的推理空间角度、位置变化，以及生成准确的 2D 草图。

2025-01-05 11:51:54 953

原创 NVIDIA 与 Deepcell 合作，加速生成式 AI 在单细胞研究中的应用

Deepcell 与 NVIDIA 合作，拥有独特的优势，可以利用其技术优势，提供能够最佳地利用最先进的架构和算法以及多模态和多组学数据集的 AI 模型，从而增强新颖的生物学见解的生成。Deepcell 的平台利用其 AI 模型，即人类基础模型，根据形态差异来识别和分类细胞，有助于推动基础和转化研究，并提供诊断测试和治疗靶向方面的未来应用。此次联合合作旨在增进对细胞形态的理解，并最终加速 AI 驱动的细胞分析在细胞生物学和转化研究中的广泛应用，包括癌症、干细胞和细胞治疗。

2025-01-02 20:29:42 1200

原创悉尼大学和香港D24H的研究人员，开发用于亚细胞空间转录组数据分割的自监督学习方法

随着基准测试研究获得认可，由于软件版本控制和不同操作系统的挑战，它们可能会非常耗时，并且不同的方法可能需要不同程度的易用性和调整代码进行比较的时间。BIDCell 通过其集成损失函数进行创新，注入细胞形态和表达的生物学知识，使模型能够从给定的空间转录组和 DAPI 图像中进行自学习，并与以前的方法相比产生卓越的视觉和定量性能。悉尼大学和 D24H 的研究人员提出了一种基于生物信息深度学习的细胞分割（BIDCell）框架，该框架通过框架和学习策略的关键创新解决了SST图像中细胞体分割的挑战。

2025-01-02 20:28:34 953

原创从撸猫、打工到马拉松，2024最强国产机器人图鉴来了！

55 个全主动自由度，让四肢活动范围能进一步提升，单腿 6 个自由度，单臂 7 个自由度，腰、颈各有 3 个和 2 个自由度，步态自然，更有单手 12 个主动自由度全驱动的灵巧手，灵活多变。其小跑速度大于 2m/s，拥有广阔的关节运动空间，23 至 43 个关节，最大关节扭矩达到 120N.m，可进行高难度的动态动作，如动态站起、坐下折叠、舞棍等。相较于第一代，GR-2 身高体重都有了升级，身高达到 175cm，体重 63kg，全身共有 53 个自由度，单臂运动负载达 3kg，能够完成更复杂的操作。

2025-01-02 20:27:29 1130

原创 Ilya布局末日倒计时？奥特曼与谷歌大佬揭秘2025年ASI降临时间表！

如今，我们仍会迎来AGI，但4年前大家普遍认为它会成为一个历史性的转折点，但如今AGI的诞生可能更像是一次普通的产品发布，而在短期内，市场上会涌现出许多迭代和类似的选择。Bryk称自己一直幻想的科幻世界真的要来了，并列出了十年内AI可能实现的突破性进展，其中就包括炫酷的物理学发现，机器人建造火星/月球基地，几近完美的导师/建议AI等等。这是一种全新的「测试时计算」。比如AlphaGo的进步，就并非来自复杂的手工设计功能，而是来自简单方法的规模化，在推理中应用大规模搜索，以及集成深度强化学习。

2025-01-01 15:35:45 1328

原创让AI理解费马大定理的证明，两个月过去了，进展如何？

根据我目前对数学的观察（作为形式主义者），当 Antoine 发现这个问题时，整个晶体上同调理论就从文献中消失了，并带来巨大的附带损害（例如数学家 Scholze 的大量工作就消失了，整本的书籍和论文都化为乌有）。几个小时后，他回复了我，并指出，在 Berthelot-Ogus 的关于晶体上同调的著作的附录中，存在对「模的一般除幂代数具有除幂」这个断言的另一个不同的证明，而且 Conrad 认为这个方法没有问题。然而，大多数数学家都不是形式主义者，对于这些人，我需要以不同的方式说明我的工作的合理性。

2025-01-01 15:30:10 1033

原创突发！刚刚，OpenAI裂变成了两块：一块营利，一块非营利

部分原因在于我们的进步，该领域的活力与竞争⁠，从类似于 ChatGPT 的商业产品到开源大模型，到各领域积极的创新⁠、对于安全⁠的追求等等。与美国其他州公益公司要求的类似报告不同，特拉华州公共利益公司（PBC）编制的两年一次报告不必按照第三方标准或认证机构的措施完成或使用其措施，尽管公司可以根据其认为合适的情况采用此类标准或获得第三方认证机构的认证。公益公司不必公开此报告。最终，很明显，最先进的 AI 将不断使用越来越多的计算，而扩大大型语言模型的规模是一条有希望的 AGI 之路，它植根于对人类的理解。

2025-01-01 15:29:21 867

原创李飞飞、谢赛宁等探索MLLM「视觉空间智能」，网友：2025有盼头了

其中，视频数据是通过捕捉连续的、时间性的输入来完成的，不仅与我们观察世界的方式相似，而且比静态图像更能丰富空间理解和推理。在 VSI-Bench 上评估开源和闭源模型显示，尽管模型与人类之间存在较大的性能差距，尽管 MLLM 面临视频理解、文本理解和空间推理的挑战，但其仍展现出了新兴的视觉空间智能。李飞飞也对这项研究进行了宣传，她表示这项名为「Thinking in Space」的研究，是对 LLM（大部分都失败了）在空间推理方面表现的评估，而空间推理对人类智能至关重要。SI-Bench 的任务演示。

2024-12-24 15:46:28 1441

原创豆包说要「普惠」，于是大模型处理图片按「厘」计价了

据智源研究院 12 月 19 日发布的国内外100余个开源和商业闭源的大模型综合及专项评测结果，「大语言模型评测能力榜单」中，豆包通用模型 pro 在重点考察中文能力的主观评测中排名第一，「多模态模型评测榜单」中，豆包·视觉理解模型在视觉语言模型中排名第二，仅次于 GPT-4o，是得分最高的国产大模型。背后的技术源自豆包・文生图模型原生的文字渲染能力，豆包大模型团队通过打通 LLM 和 DiT 架构和构建高质量文字渲染数据，大幅提升了模型在文字生成方面的准确率，尤其是结构复杂、字符数量较多的汉字场景。

2024-12-24 15:45:16 1153

原创自动化运维教程

自动化运维通过减少人工操作、提高工作效率和保证系统稳定性，已经成为现代 IT 基础设施管理的重要组成部分。通过应用配置管理、容器化、CI/CD、监控和日志管理等技术，可以大大提高运维效率、节省成本并减少错误。随着技术的发展，自动化运维将进一步与人工智能、机器学习等技术结合，变得更加智能化和自动化。访问更多内容来源。

2024-12-23 18:37:57 1146

原创 Linux 系统性能调优技巧

Linux 系统性能调优是一个持续优化的过程。通过监控系统性能、调整配置参数和硬件优化，可以显著提升系统的整体性能访问更多内容来源。

2024-12-23 18:36:50 1007

原创服务器虚拟化教程

虚拟化技术的基本思想是将物理硬件抽象成虚拟资源，以便在同一台物理服务器上运行多个虚拟机。每个虚拟机都具有独立的操作系统和应用环境，从而使得物理服务器能够实现资源的更高效利用。服务器虚拟化技术极大地提高了资源的利用效率和灵活性，并为企业节省了大量硬件和管理成本。通过虚拟化，企业能够更好地管理计算资源，实现高可用性、灾难恢复、快速部署等目标。随着技术的不断发展，虚拟化技术也在不断演进，容器化、微服务等新的虚拟化方式为现代IT架构带来了更多可能性。访问更多内容来源。

2024-12-23 18:35:23 1105

原创人工智能学习框架教程

人工智能是一个多学科的领域，学习AI不仅需要掌握基础的数学和编程技能，还需要了解各种机器学习和深度学习框架。随着技术的不断进步，AI领域也在不断发展，新的算法和工具不断涌现。掌握上述学习框架并应用于实际项目，将有助于你在AI领域取得成功。访问更多内容来源。

2024-12-23 17:31:35 931

原创计算机视觉算法教程

计算机视觉是一个多领域的研究方向，涉及图像处理、特征提取、目标检测、图像分割等技术。在实际应用中，计算机视觉算法常常与深度学习方法结合使用，尤其是在大型数据集和复杂任务中。以上介绍了几种常见的计算机视觉算法和应用，包括边缘检测、特征匹配、目标检测、图像分割和使用 CNN 进行图像分类等。这些算法在实际应用中有广泛的使用场景，如自动驾驶、安防监控、医疗影像分析等。掌握这些基本的计算机视觉技术，将为进一步深入人工智能领域打下坚实的基础。访问更多内容来源。

2024-12-23 17:30:07 744

原创机器学习实战教程

数据收集：从各种来源收集数据。数据预处理：清洗数据，处理缺失值、异常值等。特征工程：选择、转换、组合特征，使其适合模型学习。模型训练：选择合适的机器学习算法并训练模型。模型评估：通过评估指标（如准确率、召回率、F1分数等）评估模型性能。模型优化：通过超参数调整、交叉验证等方式优化模型。模型应用：将训练好的模型应用到实际场景中。机器学习的实战过程中，最重要的是理解不同算法的应用场景、优缺点，并根据具体问题选择合适的算法。本文通过实际案例介绍了监督学习中的线性回归和逻辑回归，以及无监督学习中的。

2024-12-23 17:28:47 713

原创深度学习模型教程

深度学习模型是现代人工智能技术的核心，具有强大的自动特征学习和高效的预测能力。MLP：适用于结构化数据的基本神经网络模型。CNN：用于处理图像数据的卷积神经网络。RNN：处理序列数据的循环神经网络。LSTM：改进的 RNN，能够处理长序列的长期依赖问题。GAN：生成对抗网络，用于生成和增强数据。这些模型在许多领域都有广泛应用，包括计算机视觉、自然语言处理、语音识别等。在实际应用中，我们可以根据任务的需求选择合适的模型，并通过大量的数据和计算资源进行训练。

2024-12-23 17:27:24 926

原创 Elasticsearch 实战应用教程

分布式搜索和存储：能够水平扩展，支持大规模数据存储与查询。全文搜索：通过强大的分析引擎，支持自然语言处理、模糊查询等功能。实时性：对数据的插入、修改、删除都能实时反映到搜索结果中。聚合分析：可以对海量数据进行多维度聚合分析，提供强大的数据统计和挖掘功能。在本教程中，我们介绍了 Elasticsearch 的基础知识、数据索引、查询和聚合分析，并通过日志分析的案例展示了如何将 Elasticsearch 应用于实际应用场景。

2024-12-23 17:25:56 695

原创大数据治理教程

大数据治理是一个复杂但非常关键的过程，它帮助企业有效管理和利用数据，确保数据的质量、安全性、合规性和可用性。一个成熟的大数据治理体系能够提升数据的价值，支持业务决策，帮助企业在数据驱动的时代保持竞争力。通过实施数据质量管理、数据安全管理、数据合规管理和元数据管理等策略，企业可以确保其数据资产的健康发展，促进数据治理和业务需求的同步提升。访问更多内容来源。

2024-12-23 17:23:01 1009

原创 JavaScript 网页设计案例：动态用户信息展示

通过这个案例，你可以了解如何使用 JavaScript、HTML 和 CSS 创建一个简单的动态网页应用。该应用通过表单输入和动态显示用户信息来展示 JavaScript 的交互能力。通过不断改进和扩展，可以将其发展为一个功能更加复杂的网页应用。访问更多内容来源。

2024-12-23 17:20:41 724

原创 React 前端框架教程

使用创建一个 React 项目。创建并使用 React 组件。使用useState钩子管理组件状态。处理用户事件和动态更新 UI。使用 CSS 文件为组件添加样式。动态渲染列表和条件渲染内容。React 提供了强大的工具和功能，使得开发互动性强的用户界面变得更加简单和高效。你可以在此基础上扩展和构建更复杂的应用。希望这个教程对你有帮助，如果有更多问题，欢迎继续提问！访问更多内容来源。

2024-12-23 17:17:58 1210

原创简单的 Vue.js 组件开发教程，带有演示代码，适合初学者

创建一个 Vue 组件（MyButton在父组件中使用它并传递事件。为组件添加基本样式和逻辑。Vue 组件是构建 Vue 应用的基础，组件化开发可以帮助你更高效地管理复杂的 UI 和逻辑。如果你希望了解更多关于 Vue.js 的内容，欢迎继续提问！访问更多内容来源。

2024-12-23 17:16:05 855

原创 2025英伟达奖学金出炉，7位华人博士生入选，上交、中科大、浙大校友在列

他在上海科技大学获得了硕士和学士学位。今年同样宣布向计算创新相关领域的 10 位博士生提供每人 6 万美元的奖金，他们的工作涉及到了自主系统、计算机架构、计算机图形学、深度学习、编程系统、机器人和安全。入选理由：为多模态和具身人工智能智能体开发以视觉为中心的推理模型，重点关注动态场景中的以对象为中心的感知系统、用于开放世界场景理解和生成的视觉基础模型，以及用于具身推理和机器人规划的大型多模态模型。目前，她的研究主要集中于开发智能算法、模型和工具，以提高用户在设计、动画和模拟方面的创造力和生产力。

2024-12-23 13:24:18 1160

原创一张电影海报100万？AI来设计不花钱

Prompt：日式电影风格，海报主体是一个短发亚洲女生的侧脸特写，她穿着黑色毛衣，微微仰头看向天空，身后是一片白茫茫的雪地，海报下方是红色字体 “Love Letter”，居中排列。Prompt：电影写实风格，海报的主体是一个在雨中张开双臂的男人，他的身体微微向后仰，迎接雨水，海报下方用白色粗体写着 “肖申克的救赎”。一个美丽的女生站在雪地里，手里拿着一束红色的气球，复古氛围，重阴影，高对比度，闪光灯，暗角，过度曝光，高光溢出，高颗粒度，梦核，胶片。（简化版 Prompt：科幻影视风格的画面。

2024-12-23 13:22:31 1232

原创从线性注意力视角揭秘视觉Mamba，清华、阿里合作提出全新MILA模型

基于以上分析和验证，本文将 Mamba 和线性注意力的优秀设计结合起来，将 Mamba 的两项核心设计的精髓引入线性注意力，构建了 Mamba-Inspired Linear Attention (MILA) 模型。本文给出了一个十分有趣的发现：强大的 Mamba 模型与通常被认为性能不佳的线性注意力有着内在的相似性：本文用统一的公式表述了 Mamba 中的核心模块状态空间模型（SSM）和线性注意力，揭示了二者之间的密切联系，并探究了是哪些特殊的属性和设计导致了 Mamba 的成功。

2024-12-10 20:04:51 1118

原创 NeurIPS 2024 | 智能体不够聪明怎么办？清华&蚂蚁团队：让它像学徒一样持续学习

相比之下，AMOR 则如同经验丰富的专家，每一步推理都清晰可控，不仅能准确找到答案，还能接受精确的过程指导，持续提升自己的能力。这就像是在 AI 的「大脑」中划分了专门的「思维区域」。AMOR 框架给出了一个优雅的答案：将复杂的 AI 推理过程拆解成可控的「专家模块」，通过有限状态机（FSM）编排它们的协作规则，就像精密的齿轮系统一样，每个部件都完美啮合。：这个阶段就像师傅在旁边观察学徒的工作，并给出具体指导，可以直接说「对」或「错」，也可以具体指出正确答案，并且 AMOR 的每个推理步骤都能得到反馈。

2024-12-10 20:03:23 1143

原创如何搭建影视站,自动采集最新片源并创建会员收费机制【手把手教程】-1

只要有片源接口那么就可以用定时任务实时更新。然后后台配置一下定时任务每日更新最新片源。环境是php 7+ MySQL5+我搭建了demo大家也可以测试下。之前一直想看美剧下了很多app。直接运行install.php。然后定时任务里采集当天就可以了。羊毛战纪第二季就是叫末日地堡了。这个就不说了回车就可以饿了。今天补充一下后台的配置细节。然后配置一下会员和收费机制。之前写的教程内容附在文末。试了很多类似的开源程序。测试下最新的片是否齐全。后来想还是自己搭一个。2、git直接拉代码。按提示一路回车就可以。

2024-12-09 12:48:27 687

原创 OpenAI的强化微调：RL+Science 创造新神还是灭霸？

这个结果很漂亮，用的技术正是已经广泛应用于 alignment, math, coding 领域的方法，其前身就是 Reinforcement learning from human feedback (RLHF). RLHF 用来对齐大模型与人类偏好性数据，训练数据的形式为（问题，回答 1，回答 2，偏好），让用户选择更喜欢的回答，学习人类的偏好，训练奖励模型（reward model）。科学的数据也往往是 noisy 的，不是简单的多选题，没有清晰的决策树。然而，看到这个项目的时候，让人冷汗不已。

2024-12-08 21:38:17 624

原创如何搭建影视站,自动采集最新片源并创建会员收费机制【手把手教程】

只要有片源接口那么就可以用定时任务实时更新。然后后台配置一下定时任务每日更新最新片源。环境是php 7+ MySQL5+之前一直想看美剧下了很多app。我搭建了demo大家也可以测试下。直接运行install.php。然后定时任务里采集当天就可以了。羊毛战纪第二季就是叫末日地堡了。这个就不说了回车就可以饿了。然后配置一下会员和收费机制。不过不建议收费因为版权问题。在后台点采集-自定义接口。试了很多类似的开源程序。测试下最新的片是否齐全。后来想还是自己搭一个。2、git直接拉代码。按提示一路回车就可以。

2024-12-08 21:36:10 1672 1

2404_89475753的博客