社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

【MLC-LLM引擎:通用大型语言模型部署引擎,支持机器学习编译-20240608090211

爱可可-爱生活 • 1 年前 • 212 次点击  

2024-06-08 09:02

【MLC-LLM引擎:通用大型语言模型部署引擎,支持机器学习编译,实现云端和本地环境的高效部署】
- 当前LLM部署存在云端和本地环境的区分,MLC-LLM试图实现一个通用的部署引擎。它使用机器学习编译技术自动生成可移植的GPU代码,支持多种硬件和平台。
- MLCEngine提供了OpenAI风格的API,包括Python、Swift、Kotlin等语言绑定,实现了从云服务器到移动设备的无缝迁移。
- 支持连续批处理、预测解码、公共前缀缓存等技术,使其在云端具有高吞吐量和低延迟。同时保证在移动端的高性能。
- JSON模式下可生成结构化输出,遵循通用JSON格式或自定义schema。这可大大提升LLM的可控性和实用性。
- 已在Steam Deck、Orange Pi等平台验证,充分利用Vulkan和WebGPU使LLM部署更广泛。编译优化可减少工程量。
- 云端和本地共享同一代码库和优化技术,互相促进。未来可支持更多模型,做更多系统优化,使LLM部署更高效通用。
- MLC-LLM是一个开源项目,与社区共同推进,目标是让基础模型更普及开放。它为LLM在任何环境的部署提供了一个统一高效的解决方案。
'MLC-LLM: Universal LLM Deployment Engine with ML Compilation' 网页链接 #大型语言模型# #云端部署# #本地部署#
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/170992
 
212 次点击