- 博客(7)
- 收藏
- 关注
原创 UNI-SMART:普适科学多模态分析与transformer研究
学术文章数量庞大,科学的文献分析可以使得研究人员快速立足于前人研究之上。LLMs可以提供强力支持,然而科学文献的呈现是多模态的,难以被语言模型分析和理解,为此提出Uni-SMART这一创新模型。通过跨多领域的严格定量评估,表现显著能力优势。将测试拓展至实际应用,包括专利侵权检测和图表分析,进一步证明能力。
2025-03-03 14:50:44
439
原创 TC*24_Opara:利用算子并行性加速GPU上的DNN推理
Opara 是一种轻量级操作符调度框架,旨在加速 GPU 上的 DNN 推理。通过减少操作符之间的同步开销,Opara 设计了一种流分配算法,能够自动将无依赖关系的操作符分配到不同的 CUDA 流中,从而实现高效的操作符并行。此外,Opara 利用非侵入式的推理分析,精确选择合适的操作符启动顺序,以减轻干扰并最大化 GPU 利用率。大量原型实验表明,与最新的操作符并行系统相比,Opara 能将 DNN 推理性能提高最多 29%。
2024-11-10 22:53:30
682
原创 USENIX ATC‘23_当心碎片:使用碎片梯度下降来调度 GPU 共享工作负载
文章提出了一种新颖的碎片测量方法,用于统计量化不同来源造成的 GPU 碎片程度。将 GPU 共享工作负载安排在碎片下降最陡的方向,这种方法称为碎片梯度下降 (Fragmentation Gradient Descent,FGD)。直观上,FGD 对任务进行打包,以最大限度地减少 GPU 碎片的增长,从而实现最大的 GPU 分配率。
2024-11-01 08:42:25
724
原创 Nature machine intelligence_支持机器学习的全局保证进化计算
2023_Nature machine intelligence_支持机器学习的全局保证进化计算_Code
2024-08-28 14:42:33
434
1
原创 TCYB_双层优化问题下进化算法的高效建模方法
动机/要解决的问题:上层问题的解决取决于相应下层问题的最优性,然而每个上层解决方案所需的大量下层优化消耗了太多的函数评估,导致 EA 的优化性能不佳。在欺骗性的情况下,不准确的较低级别最优解可能会误导算法。第三,下层问题的优化对于每个上层解决方案的评估是必要的。在低层优化过程中,BL-SAEA构建多个低层代理模型来初始化低层优化的种群,从而进一步减少函数评估的次数。实验结论:两个广泛使用的基准测试和两个现实世界的 BLOP 的实验结果证明了我们提出的算法在有效性和效率方面优于六种最先进的算法。
2024-02-25 12:27:37
483
1
原创 TEVC_加速进化算法解决黑盒优化问题
提出:一种能够在优化算法执行期间选择适当的近似函数成本的技术。在演化过程中,保真度是自动变化的。具体怎么变化呢?主要是看种群个体方差变化大不大,如果方差超过了置信区间,则重新估计保真度。
2024-02-12 22:43:31
473
5
Open-world semi-supervised relation extraction
2025-06-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人