
高性能计算
文章平均质量分 80
小信瑞
研发设计VDI
展开
-
IBM LSF:分布式集群管理的核心引擎
实施效果显著,LSF的资源调度功能使BLAST任务的平均完成时间缩短了60%,CPU利用率从30%提升至80%,通过自动化调度功能,客户减少了90%的手动操作时间,任务错误率显著降低,统一的输出文件管理和实时监控功能使数据检索和分析效率提高了50%,为研究提供了更强支持。IBM LSF是IBM旗下的一款分布式集群管理系统软件,自诞生以来,经过二十多年的发展,从最初的LSF 1.0版本不断演进至最新的LSF 10.1版本,在功能和性能上都实现了质的飞跃。随着技术的不断发展,高性能计算的应用领域正在不断拓展。原创 2025-04-15 10:26:10 · 818 阅读 · 0 评论 -
美国芯片巨头MaxLinear(麦凌威)凭借快速、高效的研发实力,不断突破半导体技术的边界
因此,IBM Spectrum LSF帮助我们更快地将更高质量的产品推向市场,保持了我们首次芯片成功的良好记录。MaxLinear公司联合创始人兼CAD高级总监Jean-Sebastien Gagne表示:“我们开发的组件技术复杂,用于研发的HPC资源成本高昂,因此我们不能过度配置资源并让资源闲置。通过更好地控制HPC容量和EDA许可证的分配,MaxLinear提高了资源利用率,确保了高优先级任务的快速完成。然而,如何充分利用成本高昂的高性能计算(HPC)和应用程序许可证资源,成为了公司面临的一大挑战。原创 2025-03-21 10:34:06 · 580 阅读 · 0 评论 -
Mentor Graphics(明导)助力客户加速并高效推出下一代半导体产品
当然,复杂而专业的Veloce®仿真平台是一种极具价值的资源,Mentor的客户必须充分利用它,以获得最佳的投资回报。”为了实现对策略的更精细控制和更高的利用率,Mentor希望在Spectrum LSF与Veloce Enterprise Server(ES)应用程序之间提供更丰富、更直接的通信。”他补充说:“Veloce和Spectrum LSF之间更紧密的集成使得编写正确的策略变得更加容易,能够在竞争作业之间实现最佳平衡,并真正精细地控制谁可以访问测试资源,而不一定需要人工干预。原创 2025-03-13 09:25:18 · 720 阅读 · 0 评论 -
IBM LSF 分布式集群管理系统介绍及客户使用案例
具有一套全面的智能调度功能,确保将适当的资源自动分配给适当的作业,实现应用程序性能和效率的最大化。凭借强大的管理功能和无与伦比的可扩展性,IBM Spectrum LSF 使您能够利用异构资源,确保资源分配始终与业务优先级保持一致,同时降低成本并加快获得结果的速度。适应于 Workgroups 的 IBM Spectrum LSF Suite 和适用于高性能计算的 IBM Spectrum LSF Suite 为运行科学和工程计算环境的组织提供完整的 HPC 管理解决方案。原创 2025-03-03 10:52:04 · 877 阅读 · 0 评论 -
如何处理电子设计自动化 (EDA) 工作负载?
芯片设计师和制造商发现自己承受着巨大的压力,他们需要推出新一代芯片,这些芯片具有更高的密度、可靠性和效率,并遵守严格的时间表,这是取得成功的关键因素。这使得设计师成为图左侧最没有弹性的组件,限制了商机。结合 IBM 在半导体技术、数据和人工智能 (AI) 方面的深厚专业知识,我们广泛的 EDA 和 HPC 产品组合包括系统、存储、AI、网格和可扩展的作业管理。电子设计自动化 (EDA) 是一个由软件、硬件和服务组成的细分市场,其目标是协助半导体器件(或芯片)的定义、规划、设计、实施、验证和后续制造。原创 2024-12-09 13:30:41 · 978 阅读 · 0 评论 -
IBM Spectrum LSF Suites 提高高性能计算的价值
此外,凭借对 NVIDIA DCGM 的支持,IBM Spectrum LSF Suites 提供了许多先进功能,包括 NVIDIA GPU 行为监测、运行情况和诊断以及 GPU 工作负载的记账和流程统计。HPC 环境中的硬件质量非常重要,而 HPC 基础架构的真正价值来自于组织可以从中获得什么,包括减少产品开发和研究所需要的时间,或改善使用它的人员的资源访问和运营效力。随着来自大数据源和物联网的信息增长,各种规模和类型的组织加入了采用 HPC 的传统用户的行列,例如科学研究者、大学和政府。原创 2024-12-03 10:37:35 · 954 阅读 · 0 评论 -
半导体行业如何利用高性能计算推动创新
半导体是各个行业背后的秘密动力源,从医疗保健到制造再到金融服务。仅在过去几年中,我们就看到了半导体的重要性,以及为什么公司需要快速开发这项技术以最大限度地提高生产力。随着半导体制造商努力满足客户的期望,电子设计自动化 (EDA) 工具是解锁解决方案的关键。然而,要真正推动大规模创新,EDA 领导者需要强大的计算能力。随着以高级别的弹性和性能管理计算密集型工作负载的需求不断增长,现在是转向云进行高性能计算 (HPC) 的时候了。原创 2024-12-02 10:25:14 · 824 阅读 · 0 评论 -
IBM Spectrum LSF 用户基础
LSF 在现有异构 IT 资源之间分配工作,以创建共享,可扩展且容错的基础架构,从而提供更快,更可靠的工作负载性能并降低成本。已提交的作业在队列中等待,直到调度这些作业并将其分派给主机以执行。LSF 提供了一个资源管理框架,用于满足您的作业需求,查找运行该作业的最佳资源,并监视其进度。多个 LSF 进程在集群中的每个主机上运行。了解在 LSF 主机上运行的各种守护进程, LSF 集群通信路径以及 LSF 如何容忍集群中的主机故障。LSF 作业将经历多个状态,从作业提交开始,通过分派,执行和返回作业结果。原创 2024-09-20 13:25:59 · 730 阅读 · 0 评论 -
在 IBM Cloud 上使用 Spectrum LSF(工作负载管理平台和作业调度程序) 管理数据
当数据在 Object Storage中可用时,可以将 Object Storage 存储区安装到管理节点上,或者将数据从 Object Storage 存储区复制到 NFS 实例,以使数据对 Spectrum LSF 集群的管理节点和工作程序节点可见。对于具有唯一需求的作业,可以将数据需求指定为作业提交的一部分 (bsub -f),并在作业运行时将文件传输到计算节点,并在完成后将结果传输回计算节点。在供应任何节点之前,会将输入文件传输到云存储器,在取消供应节点之后,会将结果传输回云存储器。原创 2024-09-18 10:40:21 · 936 阅读 · 0 评论 -
IBM Spectrum LSF (“Load Sharing Facility“ ,简称负载共享设施) 软件
异构、高扩展性和可用架构可为传统的高性能计算和高吞吐量工作负载提供支持,也适用于大数据、认知、GPU 机器学习和容器化工作负载。借助更多访问 HPC 资源的方式提高用户生产力,包括用于作业监视和通知的移动设备客户端,以及用于 Windows 环境的集成式桌面客户端。自动检测和配置 NVIDIA GPU 以简化 GPU 服务器的管理,并充分利用 NVIDIA GPU 的行为监视、运行状况和诊断以及会计和进程统计信息。对混合 HPC 云的支持使工作负载能够转发到多个云,并且数据可以自动暂存到云或从云中暂存。原创 2024-09-12 12:59:29 · 351 阅读 · 0 评论 -
IBM Spectrum LSF Explorer 轻量级且功能强大的报告解决方案
IBM Spectrum LSF Explorer 解决方案旨在快速轻松地部署在基于 x86 和基于 IBM POWER® 的 Linux 服务器上。对于单个群集,可以在单个 Linux 服务器上安装所有组件,以最大程度地减少解决方案占用空间并帮助降低成本。对于更大的环境,您可以横向扩展 Elasticsearch多个主机以提高性能。该解决方案几乎无需维护。原创 2024-07-22 14:55:49 · 308 阅读 · 0 评论 -
IBM Spectrum LSF Process Manager, 设计、记录和运行复杂的计算工作流,提高流程可靠性
IBM Spectrum LSF Process Manager 结合了复杂的异常处理、IBM Spectrum LSF 固有的可靠性以及自动化和透明的故障转移功能,有助于确保工作流无需手动干预即可完成。使用直观的图形界面,您可以轻松记录工作流程的步骤和依赖关系,然后自动执行容易出现人为错误的冗长重复性任务。技术用户喜欢基于 XML 的文件格式和丰富的命令集,因为这些命令集允许他们触发随时间而变化的工作流,并使用可编写脚本的界面作为图形环境的替代方案来管理这些流。● 快速创建复杂的分布式工作流。原创 2024-07-18 10:55:27 · 554 阅读 · 0 评论 -
IBM Spectrum LSF License Scheduler ,强大的许可证管理工具
虽然其他许可证管理解决方案可以计算和报告许可证的使用情况, IBM Spectrum LSF 许可证调度程序根据用户、组、项目或集群共享策略,按功能独特地分配许可证。IBM Spectrum LSF 许可证调度程序提供了调度的另一个维度,确保许可证始终可用于满足关键需求,同时支持共享,因此宝贵的许可证不会闲置。在群集模式下,许可证最初分配给群集,然后在项目之间分配,每个群集根据本地策略分配其分配的许可证功能的份额。基于许可证的作业抢占:为管理员提供通过基于策略的作业抢占强制实施许可证分配的选项。原创 2024-07-03 07:31:56 · 789 阅读 · 0 评论 -
IBM Spectrum LSF RTM,针对 IBM Spectrum LSF 环境的高级报告、跟踪和监控工具
对于运行使用 FlexNet Publisher 和 Reprise License Manager 授权的商业应用程序的站点,IBM Spectrum LSF RTM 提供了按特性和供应商的许可证使用情况的洞察,以及包括许可证状态、版本、特性计数和到期日期等信息。IBM Spectrum LSF RTM 支持基于用户、组或项目的作业级资源监控,为管理员提供关于基于主机的资源(如 cpu、内存和交换空间)如何被消耗的精确信息,以便他们可以进行调优,增加集群使用、提高作业吞吐量和减少等待时间。原创 2024-06-28 10:50:03 · 1048 阅读 · 0 评论 -
IBM Spectrum LSF Application Center 提供单一界面来管理应用程序、用户、资源和数据
对于使用 IBM Spectrum LSF Process Manager 的用户,IBM Spectrum LSF Application Center 提供了一个基于 Web 的流编辑器,该编辑器提供了一个整合的集成环境,用于直观地创建、编辑和监控工作流。这提高了用户满意度和生产力。此外,直观的、自文档化的脚本指导有助于简化其他作业提交模板的创建,从而减少安装时间,同时减少工作负载提交期间的用户错误。基于角色、组或个人 ID 的访问控制确定用户可以执行的操作、可以使用的模板以及可以监视的内容。原创 2024-06-26 11:37:50 · 1037 阅读 · 0 评论 -
IBM Spectrum LSF Data Manager,独立于群集工作负载进行数据传输管理,以提高吞吐量并优化计算资源的使用
IBM Spectrum LSF Data Manager 可自动传输在 IBM Spectrum LSF 集群和云上运行的应用程序工作负载所使用的数据,通过将常用数据存储在可在用户和工作负载之间共享的智能托管缓存中,使这些数据更接近计算资源。IBM Spectrum LSF Data Manager 利用智能托管缓存来重用多个工作负载通用的数据,并加快获得结果的时间。由于业务用户、客户和合作伙伴都访问相同的系统和数据,因此当数据从存储资源移动到计算资源并再返回时,关键工作负载可能会变慢。原创 2024-06-25 11:33:31 · 502 阅读 · 0 评论 -
澳汰尔(Altair) Accelerator 高吞吐量企业作业调度程序
通过功能完备的 GUI,可以全面了解每个作业以及关于排队作业、正在运行的作业和已分配资源的统计信息。Accelerator 可以暂停正在运行的作业,并在优先级较高的作业完成后恢复其运行,而无需为紧急作业预留许可证。此可扩展的事件驱动架构每天能够运行数百万个作业,并且其内存占用量小,只有亚毫秒级的调度延迟,能够加快设计吞吐量,极大程度地提高容量利用率。它只有亚毫秒级的延迟,可提供可靠的性能和用户体验,并让用户能够全面掌控关键作业资源,包括 CPU、内存和许可证。Inphi 工程事业部助理副总裁。原创 2024-06-21 14:40:30 · 393 阅读 · 0 评论 -
IBM Spectrum LSF Process Manager 在共享分布式计算环境中运行和管理业务关键工作流程
IBM Spectrum LSF Process Manager 结合了复杂的异常处理、IBM Spectrum LSF 固有的可靠性以及自动化和透明的故障转移功能,有助于确保工作流无需手动干预即可完成。使用直观的图形界面,您可以轻松记录工作流程的步骤和依赖关系,然后自动执行容易出现人为错误的冗长重复性任务。技术用户喜欢基于 XML 的文件格式和丰富的命令集,因为这些命令集允许他们触发随时间而变化的工作流,并使用可编写脚本的界面作为图形环境的替代方案来管理这些流。● 快速创建复杂的分布式工作流。原创 2024-06-14 09:37:17 · 623 阅读 · 0 评论 -
高性能计算(HPC)和云平台——Altair® HPCWorks
借助一套丰富的工具来访问、控制和优化计算资源,用户可以在任何地方进行协作,控制成本,在本地和云资源之间无缝移动,并通过详细的监控和报告数据做出更好的决策。由于每个计算环境都是独一无二的,作业调度自动化只是整体情况的一部分,因此 Altair HPCWorks 还提供了更优秀的工作负载管理解决方案,可满足各种需求,包括复杂的百亿亿级负载、大范围的分布式计算、硬件仿真环境以及半导体等领域的数百万次高频计算设计,通过分层调度实现更大的吞吐量。通过灵活的资源配置轻松扩展,并使用强大的自动化功能来管理集群。原创 2024-06-06 13:48:51 · 852 阅读 · 0 评论 -
芯片设计行业(EDA )的远程访问解决方案
OpenText™ Exceed TurboX (ETX) 是安全的虚拟桌面软件,可实现现代混合工作。利用 ETX 混合云虚拟桌面基础架构 (VDI),员工可以在任何地方和任何设备上工作。ETX 支持工程产品设计、半导体设计和其他图形密集型领域中使用的要求苛刻的高性能图形软件。原创 2024-05-27 09:42:06 · 1133 阅读 · 0 评论 -
Altair® Squeak and Rattle Director™ 品质认知度解决方案
借助 Altair 的 Squeak and Rattle Director,计算机辅助工程 (CAE) 的工程专业人士和初学者都能在早期设计阶段快速识别并消除产品中的异响。“使用 Squeak and Rattle Director 时,我们可以输入各种数据,这样我们就可以得到更精确有效的分析结果,也就能为整个项目提供更有价值的信息。基于用户体验的、直观的、过程驱动的、可自动执行的前处理和后处理任务,使用户能够快速识别异响风险,更快地做出更明智的设计决策。通过消除异响现象,提供高质量用户体验。原创 2024-05-24 10:41:14 · 408 阅读 · 0 评论 -
Altair® PBS Professional®——行业超前的 HPC 和高吞吐量计算工作负载管理器和作业调度程序
PBS Professional 是一款快速、强大的工作负载管理器,旨在提高生产力、优化利用率和效率,并简化集群、云和超级计算机的管理——从极大的 HPC 工作负载到数百万个小型、高吞吐量作业。采用高度冗余、无单点故障的自动故障转移架构,即使在出现服务器故障、网络故障甚至 PBS 后台程序崩溃的情况下,也永远不会发生作业丢失的现象,可保证作业继续运行。PBS Professional 还提供了一个工作负载仿真器,可让您轻松了解作业行为和政策变化的影响,此外,还具有让您管理整个企业预算的分配和预算管理功能。原创 2024-04-30 14:03:45 · 505 阅读 · 0 评论 -
Altair® HPCWorks™——高性能计算(HPC)和云平台
借助一套丰富的工具来访问、控制和优化计算资源,用户可以在任何地方进行协作,控制成本,在本地和云资源之间无缝移动,并通过详细的监控和报告数据做出更好的决策。由于每个计算环境都是独一无二的,作业调度自动化只是整体情况的一部分,因此 Altair HPCWorks 还提供了更优秀的工作负载管理解决方案,可满足各种需求,包括复杂的百亿亿级负载、大范围的分布式计算、硬件仿真环境以及半导体等领域的数百万次高频计算设计,通过分层调度实现更大的吞吐量。通过灵活的资源配置轻松扩展,并使用强大的自动化功能来管理集群。原创 2024-04-29 08:56:18 · 942 阅读 · 0 评论 -
Altair 澳汰尔 PBS Works™ 高性能计算 (HPC) 解决方案
Altair 能够提供易于使用的数据协作工具,支持在不进行大量下载的情况下实现远程可视化,并支持在远程云和集群中提交和监视作业。原创 2024-04-23 09:19:20 · 617 阅读 · 0 评论 -
Altair® (澳汰尔)Grid Engine® 分布式资源管理系统
Grid Engine 可通过优化应用程序、容器和服务的吞吐量和性能,同时极大化本地、混合和云基础设施之间的共享计算资源,来帮助组织提高 ROI 并更快交付优质结果。Grid Engine 是可靠的分布式资源管理系统,用于优化数千个数据中心的工作负载和资源,提高性能并提高生产力和效率。通过高效的工作负载管理降低硬件、软件和数据中心成本,减少等待时间、提高吞吐量和减少停机时间,从而提高用户工作效率。Grid Engine 支持从生命科学和制造到能源、机器学习和 AI 等领域的数千种商业和开源应用程序。原创 2024-04-19 10:11:26 · 471 阅读 · 0 评论 -
Altair® (澳汰尔)Accelerator™ 业界速度超快的企业作业调度程序,满足客户对半导体、电子设计自动化 (EDA) 和高性能计算 (HPC) 的全部需求
通过功能完备的 GUI,可以全面了解每个作业以及关于排队作业、正在运行的作业和已分配资源的统计信息。Altair® Accelerator™ Plus 包含分层调度程序,后者能够减轻基本调度程序的负担,提高吞吐量,提升许可证和资源利用率以及改善调度程序使用模型的灵活性。Accelerator 可以暂停正在运行的作业,并在优先级较高的作业完成后恢复其运行,而无需为紧急作业预留许可证。它只有亚毫秒级的延迟,可提供可靠的性能和用户体验,并让用户能够全面掌控关键作业资源,包括 CPU、内存和许可证。原创 2024-04-12 09:21:09 · 556 阅读 · 0 评论 -
IBM Spectrum LSF Process Manager 在共享分布式计算环境中运行和管理业务关键工作流程
IBM Spectrum LSF Process Manager 结合了复杂的异常处理、IBM Spectrum LSF 固有的可靠性以及自动化和透明的故障转移功能,有助于确保工作流无需手动干预即可完成。使用直观的图形界面,您可以轻松记录工作流程的步骤和依赖关系,然后自动执行容易出现人为错误的冗长重复性任务。技术用户喜欢基于 XML 的文件格式和丰富的命令集,因为这些命令集允许他们触发随时间而变化的工作流,并使用可编写脚本的界面作为图形环境的替代方案来管理这些流。设计、记录和运行复杂的计算工作流。原创 2024-02-20 10:53:47 · 678 阅读 · 0 评论 -
腾讯云与IBM共同打造“高性能计算服务解决方案“
IBM 是全球领先的混合云、人工智能及企业服务提供商,帮助超过 175 个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。未来期待腾讯和 IBM 有更多联合方案的创新和落地。腾讯云,腾讯集团倾力打造的云计算品牌,面向全世界各个国家和地区的政府机构、企业组织和个人开发者,提供全球领先的云计算、大数据、人工智能等技术产品与服务,以卓越的科技能力打造丰富的行业解决方案,构建开放共赢的云端生态,推动产业互联网建设,助力各行各业实现数字化升级。(以下简称 LSF )。原创 2024-02-06 10:48:18 · 2039 阅读 · 0 评论 -
什么是高性能计算 (HPC)?HPC 如何工作?HPC 用例
HPC 可处理大量数据,并且能够实时或接近实时地解决当今最复杂的计算问题。HPC 是一种技术,它使用并行工作的强大处理器集群,处理海量多维数据集(大数据),并以极高的速度解决复杂问题。HPC 系统的运行速度通常要比最快的商用台式机、笔记本电脑或服务器系统快一百万倍以上。超级计算机作为 HPC 系统的范式已存在了几十年,这是一种专门构建的计算机,它包含数百万个处理器或处理器核心。超级计算机如今仍在我们身边;原创 2024-01-18 13:26:29 · 1102 阅读 · 0 评论 -
芯片设计重要工具—— IBM LSF 分布式高性能计算调度平台
异构、高扩展性和可用架构可为传统的高性能计算和高吞吐量工作负载提供支持,也适用于大数据、认知、GPU 机器学习和容器化工作负载。:一个功能强大的界面,用于设计复杂的工程计算流程,并捕获可供其他用户使用的可重复的最佳实践。借助更多访问 HPC 资源的方式提高用户生产力,包括用于作业监视和通知的移动设备客户端,以及用于 Windows 环境的集成式桌面客户端。自动检测和配置 NVIDIA GPU 以简化 GPU 服务器的管理,并充分利用 NVIDIA GPU 的行为监视、运行状况和诊断以及会计和进程统计信息。原创 2024-01-15 09:56:07 · 1358 阅读 · 0 评论 -
NetApp 高性能计算解决方案,处理、存储和分析海量数据
如果您不认为我们生活在一个激动人心的时代,不妨考虑一下高性能计算 (HPC) 是如何突破 AI 极限的。从基因组学到金融服务,NetApp® HPC 解决方案一直在引领行业发展。原创 2023-12-06 09:49:20 · 980 阅读 · 0 评论