vllm
本项目属于「论坛社区源码」,按近期活跃更新与热度筛选,适合当前阶段参考或二次开发。
项目简介:A high-throughput and memory-efficient inference and serving engine for LLMs
- 仓库地址:https://github.com/vllm-project/vllm
- 源码下载:下载 ZIP 包
- 版本发布:Releases 下载页
- 项目主页:https://vllm.ai
- 主要语言:Python
- Stars:72733
- 最近推送:2026-03-10T16:50:41Z
- 最近更新:2026-03-10T16:36:06Z