- 博客(32)
- 收藏
- 关注
原创 从基础算力协作到超智融合,超算互联网助力大语言模型研习
大语言模型(LLMs)的快速发展释放出了AI应用领域的巨大潜力。同时,大语言模型作为 AI领域的新兴且关键的技术进展,为 AI 带来了全新的发展方向和应用场景,给 AI 注入了新潜力,这体现在大语言模型独特的架构和训练方式,为后续研究提供了新思路,促使更多科研人员围绕其进行改进和拓展,如开发更高效的训练算法、适配不同场景的模型变体等。
2025-04-04 23:14:44
468
原创 本地部署基于DeepSeek驱动的AI智能助手实践
易用性与灵活性:方案开箱即用:整个系统无需复杂配置,用户可以通过简单的命令或图形界面快速完成部署和使用。定制化:支持高度定制,用户可以根据需求调整检索参数、优化性能或集成其他工具。拥有强大的知识管理能力多文件格式支持:支持PDF、TXT、DOCX、Excel等多种常见文档格式,方便用户将各类资料整合到知识库中。智能检索与向量化:通过向量数据库(如Pinecone、Weaviate)和语义检索技术,能够快速匹配用户问题与知识库中的相关内容,提供精准答案。动态更新。
2025-03-08 18:47:27
786
原创 DeepSeek:人工智能领域的革新者与未来展望
在当今这个数据驱动的时代,人工智能(AI)正以前所未有的速度发展,而DeepSeek作为这一领域的先锋,正引领着AI技术的创新与突破。作为一家致力于推动人工智能技术创新与应用的前沿企业,DeepSeek不仅在多语言编程、大型语言模型等方面取得了显著成就,更以其独特的洞察力和创新能力,为我们揭示了未来的无限可能。
2025-02-03 21:10:17
1471
原创 AI三驾马车——数据、算法与算力的一体化融合体验
目前,在人工智能快速发展的大背景下,智能算力、超级算力的规模和占比越来越大,算力需求逐步从通用计算转为智能与超级算力。因此,要解决以上提到的诸多问题,就需要一个融合丰富的算法、海量的数据和强大的算力等特点的平台,为企业或高校等科研人员提供高效便捷的使用体验。超算互联网平台提供了近三百份数据类型商品,其中包括各种类型的高质量数据集、行业数据、API数据以及模型框架扩展包等等,涵盖了人工智能、航空航天、汽车、船舶、能源、高科技电子、机械制造、化工冶金、生命医药、材料计算、气象海洋环境、量子计算等各种领域。
2024-12-27 23:09:40
1050
原创 国产关系型数据库介绍及选型建议
常见国产数据库主要有OceanBase、PolarDB、OpenGauss、TiDB、人大金仓、达梦、GBASE、GaussDB、TDSQL、GoldenDB等,其中OceanBase、TiDB、GBASE、GaussDB、TDSQL、GoldenDB为分布式部署数据库,OpenGauss为集中式部署数据库,PolarDB、人大金仓、达梦既支持分布式部署,也支持集中式部署。
2024-12-14 19:38:34
2337
原创 从容面对大规模作业:利用PMI提升作业启用和结束效率
默认情况下,此模式已开启,并使用基于TCP的实现,对应的环境变量为。随着超级计算机的发展,高性能计算系统面临多层次的大规模并行处理,为了满足百亿亿次级系统的要求,PMI社区开发出PMIx接口,PMIx是专门设计用于支持百亿亿次级系统的进程管理接口,针对传统应用程序进程启动过程中的耗时因素进行分析,定义新的启动顺序,力求在进程之间快速建立通信通道,缩短并行应用程序启动时间。在PMI-2中,针对PMI-1的几个方面进行了改进1,增加查询功能,2,扩大数据库信息范围3,增加线程安全,4,改善容错机制。
2024-12-07 17:30:36
1005
原创 高性能计算(HPC)与人工智能(AI)的结合,正成为创新的强力引擎!
当今步入数字经济时代,算力成为新型生产力,AI和大模型的发展对算力提出了前所未有的新需求,HPC与AI的融合将重塑计算科学、IT产业和人类社会发展的格局。
2024-12-01 11:28:25
1285
原创 突破计算极限:超算互联网技术如何彻底解决用户痛点
随着数据量的激增和计算需求的不断提升,传统计算基础设施的局限性愈发明显。随着数据量和计算任务复杂性的增加,串行计算效率显著下降。在数据驱动的时代,拥有强大的计算能力不仅是企业和科研机构成功的关键,更是推动技术创新和业务发展的重要保障。作为前沿的技术解决方案,超算互联网将继续引领计算领域的未来,为用户提供无与伦比的计算性能和灵活性。超算互联网提供按需付费的服务模式,用户只需为实际使用的计算资源付费,无需购买和维护昂贵的硬件。只有具备相应权限的用户才能访问特定的数据和资源,确保数据的安全性和合规性。
2024-11-24 14:56:32
1039
原创 探索KubeVirt:如何利用InfiniBand提升虚拟机性能
在本文中,我们探讨了在KubeVirt中应用InfiniBand高速网卡的方法,介绍了SR-IOV技术如何提升虚拟机的网络性能。通过将物理IB网卡划分为多个虚拟功能,虚拟机能够实现高带宽、低延迟的网络连接,这对于需要大规模计算和快速数据交换的应用场景尤为重要,例如科学研究、机器学习和金融分析。借助KubeVirt,企业可以在同一Kubernetes集群中灵活管理虚拟机与容器,为不同工作负载提供支持。这种技术的结合不仅优化了资源利用率,还简化了运维流程,使得开发和部署变得更加高效。
2024-11-16 19:45:09
1026
原创 运维智能化转型:AIOps引领IT运维新浪潮
所谓学件,亦称AI运维组件,类似程序中的API或公共库,但API及公共库不含具体业务数据,只是某种算法,而AI运维组件则是在类似API的基础上,兼具对某个运维场景智能化解决的“记忆”能力,将处理这个场景的智能规则保存在了这个组件中,学件(Learnware)= 模型(Model)+规约(Specification)。其中故障发现作为故障管理中最开始的一环,在当前海量指标场景下,自动发现故障和自动异常检测的需求甚为迫切,能极大地简化研发策略配置成本,提高告警的准确率,减少告警风暴和误告,从而提高研发的效率。
2024-11-10 16:41:49
1871
原创 HPC应用入门介绍
HPC,即High-Performance Computing(高性能计算)的缩写,是一种利用大规模并行处理器集群或超级计算机等高性能计算设备,以及高速网络互联技术,实现对大规模数据和复杂计算任务的高效处理和分析的技术。HPC系统通常由多个计算节点组成,每个节点都配备有高性能的处理器和大容量的内存,节点之间通过高速网络连接,实现数据的高速传输和共享。科学计算是HPC的重要应用领域之一,包括理论数学、物理学、地球科学、气象学、生物学和化学等领域的复杂计算问题。了解HPC的基本概念、技术特点和应用领域。
2024-11-02 23:13:27
1281
原创 创新驱动,智算未来:国产工业软件的崛起与突破
同时,中国抓住了互联网发展的时间窗口,在云计算、大数据、人工智能等方面取得了长足的进步,工业软件的应用领域和功能不断扩展,为国产工业软件提供了新的机遇。ANSYS在全球工业发展中的影响力,可以从无数成功案例中窥见一斑,如波音公司的飞机设计、特斯拉的电动汽车制造、西门子的自动化生产线等,ANSYS都是其中不可或缺的一部分。虽然国产工业软件的发展起步较晚,但在国家政策的支持和市场需求的推动下,正在快速追赶国际先进水平,涌现了一批具有先进生产力和实用性的软件。而中国的工业软件发展,可以概括为起步晚但发展迅速。
2024-10-27 10:59:26
1306
原创 为什么容器对于HPC如此重要?
为满足不同用户的要求,高性能计算系统通常提供带有特定软件版本的预定义模块,用户可通过加载或卸载模块来切换所需的软件包。编写软件时最常见的挑战之一就是代码中使用的不同版本库之间的行为差异。通过使用容器,无论我们使用的是笔记本电脑还是超级计算机,我们都能确保代码运行所依赖的版本是相同的。虽然使用一台计算机就可以预测天气,但由于需要处理的数据量太大,即使使用目前最快的计算机,也可能需要数天甚至数周的时间。然而,容器化应用可能会变得复杂,例如生产中可能需要数千个独立的容器,出于安全考虑,容器之间可能需要网络隔离。
2024-10-19 22:42:03
999
原创 高性能计算的未来展望:深度解析2024第二十届全国高性能计算学术年会
2024年9月24日至26日,第二十届全国高性能计算学术年会(CCF HPC China 2024)在湖北省武汉市成功举办,这场盛大的学术盛宴不仅汇聚了国内外顶尖学者和行业精英,还展示了众多高性能计算领域的最新产品与技术创新。随着AI技术的快速发展,高性能计算与AI的深度融合成为大势所趋。他们认为,高性能计算为AI提供了强大的算力支持,而AI则通过算法优化和模型训练等手段,进一步提升了高性能计算的应用效能。同时,我们还需要关注新兴技术的发展趋势,如量子计算、边缘计算等,为高性能计算技术的发展注入新的活力。
2024-09-28 15:20:45
1219
原创 优化多元异构计算中心:探索高效统一管理的创新策略与实践
多地多元异构计算中心的管理,不仅仅是简单的资源整合与分配,更是一场关于效率、安全、成本控制的综合战役。每个计算中心可能承载着不同的业务应用,拥有不同的硬件架构、操作系统、网络环境,甚至遵循着不同的运维标准和安全规范。然而,这也带来了前所未有的管理挑战:如何跨越物理与技术的边界,实现多计算中心的统一、高效管理,成为了摆在企业面前的一道难题。对于提供多租户服务的计算中心,确保平台能够隔离不同租户的资源,同时提供高效的管理。使用云管理平台(CMP)来提供一个统一的界面,管理不同计算中心的资源和服务。
2024-09-22 16:47:23
627
原创 世界三大超算盛会之CCF HPC China 2024盛会将启
随着高性能计算技术的快速发展和广泛应用,中国计算机学会(CCF)决定成立高性能计算专业委员会(简称“高专委”),并创办全国高性能计算学术年会(CCF HPC China),旨在搭建一个学术交流、技术创新与应用的平台。CCF HPC China,即中国计算机学会全国高性能计算学术年会,是中国高性能计算领域的一项重要盛会,其发展历程可以追溯到2006年,至今已走过近二十年的历程。年会的内容也不断丰富和完善,涵盖了高性能计算的各个方面,包括算法、体系结构、软件、应用等,为参会者提供了全面、深入的交流平台。
2024-09-15 21:31:49
1531
原创 细谈《黑神话:悟空》中的每一帧壁纸
国产3A游戏大作《黑神话:悟空》从刚面世到现在的热度持续不减,其不仅仅代表着中国文化在全球范围的广受欢迎和好评,也充分体现国产题材的3A游戏大作在国内潜在非常广阔的探索空间。3A游戏(AAA游戏),往往拥有庞大的开发制作团队,需要付出大量的金钱(A lot of money),大量的资源(A lot of resources),大量的时间(A lot of time),其制作出的作品代表着巅峰的制作质量、顶级的技术和巨大的市场影响力。
2024-09-08 10:41:09
1292
原创 MetaStack:采集用的好,下班下的早
MetaStack 提供了强大的作业采集能力,帮助管理员轻松管理集群作业,减少故障和资源浪费,使得运维人员准时下班不再是奢望。
2024-09-01 02:34:55
442
原创 OpenAPI:助力本地集群接入开放算力平台,开启无限可能
通过OpenAPI规范,开放算力平台提供标准化的API接口,使得本地集群能够轻松识别并调用这些接口,实现算力资源的远程调度。
2024-08-25 13:13:43
777
原创 智算时代的秘密武器:揭秘计算节点随机调度策略的独特优势
本文介绍了一种在高性能计算调度系统的调度策略,确保所选节点在处理作业时具备最佳资源配置的同时,又将各节点接收到的任务数量在统计上会趋于相等,避免任务频繁集中到某一些节点上,降低节点的故障率。
2024-08-18 14:42:16
425
原创 从算力荒到共享:超算互联网赋能物质科学研究
本文将从当前物质科学研究遇到的问题为出发点,探讨超算互联网如何通过共享算力,为物质科学研究注入新的活力。
2024-08-11 17:26:34
1351
2
原创 从多用户到多租户:高校和企业的场景对比与创新思考
得益于国内一系列高科技企业的不断创新与发展,国内的高性能计算(HPC)和超算领域获得了持续高速的发展,降低资源使用门槛的同时,也将更多的应用场景延伸至高校和企业,然后随之而来的资源使用的需求差异,也带来了不同的技术挑战和创新机遇。本文以高性能和超算领域出发,分析如何从多用户向多租户跨步,满足高校和企业的应用诉求。
2024-07-28 19:45:37
1379
原创 调度选得好,管理烦恼少:HPC集群管理员的真实独白
在高性能计算(HPC)集群管理的世界里,调度系统作为整个HPC系统的大脑和中枢,是管理员们最得力的助手之一。选择一个功能强大的调度系统,可以帮助管理员有效应对各种挑战,提高资源利用率,降低能耗,提升系统的稳定性和效率,让管理员在集群管理中游刃有余。这不仅能降低运营成本,还能为用户提供更优质的服务。
2024-07-20 21:52:30
774
原创 混合云方案:助力高性能计算资源高效扩展
企业或者高校客户仅需签订智算资源购买协议,在超算互联网平台(scnet.cn)完成计算资源的购买并激活资源授权码,在客户本地Gridview私有云中导入这些资源,即可轻松完成公有云资源的定价、管理和资源分配。与使用本地集群资源一样,私有云普通用户可轻松提交作业到公有云,操作简便,如下图所示。某高校客户在升级至Gridview混合云版本后,通过引入哈尔滨超算中心资源到私有云,为学校高性能计算用户分配公有云资源,有效解决了学校计算中心集群资源不足,用户作业排队时间长的问题,高效助力科研人员的研究工作。
2024-07-11 21:23:45
326
原创 从设想到现实:远程三维可视化让仿真设计触手可及
通过增强的真实感、高效的协作和灵活的仿真,工程师们能够更加高效地进行设计和优化。这项技术通过调用GPU来执行图形的渲染和填充,从而提升图形加载速度,降低CPU的负担,使系统运行更加流畅。GPU相较于CPU,拥有更多的处理单元和更高的并行处理能力,因此能够更快地处理大量的图形和图像数据。这意味着,无论身处何地,只要有一台性能适中的桌面终端,工程人员就能轻松接入强大的计算资源,进行高效的三维设计和仿真分析。提供的工业仿真应用,正是这一变革的先锋力量,它让工业仿真设计变得触手可及。
2024-07-02 19:26:53
291
原创 图形处理的新纪元—云端图形工作站
无论是设计与创意行业、工程与制造,还是影视后期制作和科研教育,云端图形工作站都能满足其高性能计算需求,并提供优良的协作和共享能力。Gridview是国内专业的HPC平台,云端强劲的算力资源能够为用户的图形处理和高性能计算需求提供卓越的支撑。远程桌面技术在云端图形工作站的实现中扮演着至关重要的角色,它连接了用户和云端资源,使用户能够在任何地方实时访问和操作高性能图形计算资源。云端图形工作站集成了大量的GPU和CPU算力资源,提供强大的计算和图形处理能力,可以处理复杂的计算任务和大规模数据。
2024-06-23 13:16:34
877
原创 告别卡顿,迎接流畅—TurboVNC:高效3D支持的下一代远程桌面解决方案
TurboVNC,作为一款开源的远程桌面管理工具,自2004年从TightVNC衍生而来,已经成为高效、高速的虚拟网络计算(VNC)实现的代表。它不仅继承了TightVNC 1.3.x的所有功能,更在此基础上进行了大量的功能增强和错误修复,同时集成了TightVNC和VirtualGL的先进技术,为用户提供了更为出色的远程桌面体验。2.在远程桌面环境中的应用:当TurboVNC与GPU加速技术结合时,远程桌面环境中的图形密集型应用(如3D游戏、CAD软件等)可以充分利用服务器端的GPU资源进行渲染。
2024-06-16 15:09:03
2732
原创 AWS为什么用Slurm作为EDA集群调度系统?
长期以来,芯片设计领域存在着由EDA工具厂商、IC设计厂和IC制造厂组成的“铁三角”的商业模式。Slurm针对EDA场景提供强大且丰富的调度策略,Gridview作为国内最专业的HPC集群管理平台,针对EDA场景对Slurm进行了二次开发,提供了跟家全面的功能覆盖和专业的技术支持,是国内IC设计厂建设EDA平台的不二之选。
2024-05-25 19:57:06
620
原创 调度系统浅谈
在对调度系统进行选型和对比分析过程中,发现了一款基于SLURM进行改进开发的一款新的国产调度系统—MetaStack,它在原生SLURM调度系统的基础上进行了包括吞吐率、稳定性、易用性、调度算法、调度架构、权限控制等在内的数十项重要改进,形成了具有特色的自有调度系统版本(MetaStack),且该调度系统应用于多个国家级超算中心,支撑了单集群大规模用户(2w+用户)、资源(1.5w+节点)、任务(15w+并发作业)的超算任务调度运行,支撑超算互联网业务拓展。每个调度系统在功能上都是趋同的。
2024-05-18 14:45:23
573
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人