一、vllm一个重要参数enable-prefix-caching 特殊场景会在kvcache阶段提高5倍性能。有的平台是use_cache这个参数。
详细建视频:https://www.toutiao.com/video/7355331984845734435/?channel=&source=search_tab
二、vllm一个重要参数enable-prefix-caching 特殊场景会在perfill提高30%性能
Engine Arguments
Below, you ca
一、vllm一个重要参数enable-prefix-caching 特殊场景会在kvcache阶段提高5倍性能。有的平台是use_cache这个参数。
详细建视频:https://www.toutiao.com/video/7355331984845734435/?channel=&source=search_tab
二、vllm一个重要参数enable-prefix-caching 特殊场景会在perfill提高30%性能
Below, you ca
4310
1万+
2205
3408
2990
2913

被折叠的 条评论
为什么被折叠?