
LLM
文章平均质量分 80
LLM
Cyril_KI
LLM、图神经网络、社交网络挖掘、负荷预测、联邦学习
展开
-
verl单机多卡与多机多卡使用经验总结
verl单机多卡与多机多卡使用经验总结原创 2025-04-03 17:52:29 · 818 阅读 · 0 评论 -
verl:一个集SFT与RL于一体的灵活大模型post-training框架 (快速入门)
verl:一个集SFT与RL于一体的灵活大模型post-training框架 (快速入门)原创 2025-02-23 14:36:47 · 1367 阅读 · 1 评论 -
阿里斑马智行 2025届秋招 NLP算法工程师
阿里斑马智行 2025届秋招 NLP算法工程师原创 2024-11-17 12:53:23 · 1108 阅读 · 0 评论 -
智谱AI 2025届秋招 大模型算法工程师
智谱AI 2025届秋招 大模型算法工程师原创 2024-11-16 11:42:41 · 574 阅读 · 0 评论 -
蔚来 2025届秋招 大模型工程师
蔚来 2025届秋招 大模型工程师原创 2024-11-16 11:41:28 · 421 阅读 · 1 评论 -
京东 2025届秋招 自然语言处理
京东 2025届秋招 自然语言处理原创 2024-11-15 11:57:13 · 2330 阅读 · 0 评论 -
科大讯飞 2025届飞星计划 自然语言处理
科大讯飞 2025届飞星计划 自然语言处理原创 2024-11-14 12:19:04 · 380 阅读 · 0 评论 -
百度 2025届秋招提前批 文心一言大模型算法工程师
百度 2025届秋招提前批 文心一言大模型算法工程师原创 2024-11-13 22:20:18 · 1357 阅读 · 0 评论 -
滴滴 2025届秋招提前批 大模型算法工程师
滴滴 2025届秋招提前批 大模型算法工程原创 2024-11-13 22:12:52 · 1610 阅读 · 0 评论 -
LLM上下文长度扩展方案:YaRN
LLM上下文长度扩展方案:YaRN原创 2024-07-14 22:57:35 · 1935 阅读 · 2 评论 -
LLM上下文长度扩展方案:NTK-aware interpolation
LLM上下文长度扩展方案:NTK-aware interpolation原创 2024-06-20 11:52:13 · 2183 阅读 · 0 评论 -
LLM上下文长度扩展方案:Position Interpolation
LLM上下文长度扩展方案:Position Interpolation原创 2024-06-18 00:12:05 · 1397 阅读 · 0 评论 -
Long-Context LLM综述
Long-Context LLM,长上下文大模型综述原创 2024-06-10 14:01:15 · 2218 阅读 · 0 评论 -
ImportError: /usr/local/app/.local/lib/python3.10/site-packages/flash_attn_2_cuda.cpython-310-x86_64
pip install flash-attn==2.5.9.post1原创 2024-06-05 10:46:10 · 2692 阅读 · 1 评论 -
运行vllm报错:data did not match any variant of untagged enum PyPreTokenizerTypeWrapper
降低tokenizers版本原创 2024-06-03 23:47:00 · 7225 阅读 · 0 评论 -
详解Transformer在时序预测中的Encoder和Decoder过程:以负荷预测为例
详解Transformer在时序预测中的Encoder和Decoder过程:以负荷预测为例原创 2023-10-31 21:32:31 · 5661 阅读 · 2 评论