自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 UNI-SMART:普适科学多模态分析与transformer研究

学术文章数量庞大,科学的文献分析可以使得研究人员快速立足于前人研究之上。LLMs可以提供强力支持,然而科学文献的呈现是多模态的,难以被语言模型分析和理解,为此提出Uni-SMART这一创新模型。通过跨多领域的严格定量评估,表现显著能力优势。将测试拓展至实际应用,包括专利侵权检测和图表分析,进一步证明能力。

2025-03-03 14:50:44 439

原创 TC*24_Opara:利用算子并行性加速GPU上的DNN推理

Opara 是一种轻量级操作符调度框架,旨在加速 GPU 上的 DNN 推理。通过减少操作符之间的同步开销,Opara 设计了一种流分配算法,能够自动将无依赖关系的操作符分配到不同的 CUDA 流中,从而实现高效的操作符并行。此外,Opara 利用非侵入式的推理分析,精确选择合适的操作符启动顺序,以减轻干扰并最大化 GPU 利用率。大量原型实验表明,与最新的操作符并行系统相比,Opara 能将 DNN 推理性能提高最多 29%。

2024-11-10 22:53:30 682

原创 TON‘21_CoEdge:异构边缘设备上具有自适应工作负载分区的协作 DNN 推理

边缘智能、协作DNN推理、分布式计算、能源效率

2024-11-09 23:37:46 1087

原创 USENIX ATC‘23_当心碎片:使用碎片梯度下降来调度 GPU 共享工作负载

文章提出了一种新颖的碎片测量方法,用于统计量化不同来源造成的 GPU 碎片程度。将 GPU 共享工作负载安排在碎片下降最陡的方向,这种方法称为碎片梯度下降 (Fragmentation Gradient Descent,FGD)。直观上,FGD 对任务进行打包,以最大限度地减少 GPU 碎片的增长,从而实现最大的 GPU 分配率。

2024-11-01 08:42:25 724

原创 Nature machine intelligence_支持机器学习的全局保证进化计算

2023_Nature machine intelligence_支持机器学习的全局保证进化计算_Code

2024-08-28 14:42:33 434 1

原创 TCYB_双层优化问题下进化算法的高效建模方法

动机/要解决的问题:上层问题的解决取决于相应下层问题的最优性,然而每个上层解决方案所需的大量下层优化消耗了太多的函数评估,导致 EA 的优化性能不佳。在欺骗性的情况下,不准确的较低级别最优解可能会误导算法。第三,下层问题的优化对于每个上层解决方案的评估是必要的。在低层优化过程中,BL-SAEA构建多个低层代理模型来初始化低层优化的种群,从而进一步减少函数评估的次数。实验结论:两个广泛使用的基准测试和两个现实世界的 BLOP 的实验结果证明了我们提出的算法在有效性和效率方面优于六种最先进的算法。

2024-02-25 12:27:37 483 1

原创 TEVC_加速进化算法解决黑盒优化问题

提出:一种能够在优化算法执行期间选择适当的近似函数成本的技术。在演化过程中,保真度是自动变化的。具体怎么变化呢?主要是看种群个体方差变化大不大,如果方差超过了置信区间,则重新估计保真度。

2024-02-12 22:43:31 473 5

Open-world semi-supervised relation extraction

Open-world semi-supervised relation extraction

2025-06-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除