主讲人 长琴 HuggingLLM 开源项目负责人
收获:本节课学习了大模型部署背景、LMDeploy简介,并在InternStudio平台实现了demo,并体验。
大模型的部署需要根据其特点做相应的优化 。
LMDeploy是LLM在英伟达设备上部署的全流程解决方案,包括模型轻量化、推理和服务。
LMDeploy在静态推理性能和动态推理性能都很强
LMDeploy的核心功能是量化、推理引擎、服务
首先是量化
然后是推理引擎TurboMind