社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

高性能支持LLM的机器学习Tensor库

ArronAI • 11 月前 • 102 次点击  

官网地址:http://ggml.ai 

Github地址:https://github.com/ggerganov/ggml

Examples

Short voice command detection on a Raspberry Pi 4 using whisper.cpp

Simultaneously running 4 instances of 13B LLaMA + Whisper Small on a single M1 Pro

Running 7B LLaMA at 40 tok/s on M2 Max

Here are some sample performance stats on Apple Silicon June 2023:

  • Whisper Small Encoder, M1 Pro, 7 CPU threads: 600 ms / run

  • Whisper Small Encoder, M1 Pro, ANE via Core ML: 200 ms / run

  • 7B LLaMA, 4-bit quantization, 3.5 GB, M1 Pro, 8 CPU threads: 43 ms / token

  • 13B LLaMA, 4-bit quantization, 6.8 GB, M1 Pro, 8 CPU threads: 73 ms / token

  • 7B LLaMA, 4-bit quantization, 3.5 GB, M2 Max GPU: 25 ms / token

  • 13B LLaMA, 4-bit quantization, 6.8 GB, M2 Max GPU: 42 ms / token

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/156336
 
102 次点击