SOTA lowbit LLM quantization INT8FP8INT4FP4NF4 sparsity lead — @tensorflowblog

@tensorflowblog1.5K подп.

2.3Kпросмотров

16 марта 2024 г.

Score: 2.5K

SOTA lowbit LLM quantization INT8FP8INT4FP4NF4 sparsity leading model compression techniques on TensorFlow PyTorch and ONNX Runtime View on Github.com

2.3K

просмотров

152

символов

Нет

эмодзи

Нет

медиа

Другие посты @tensorflowblog

💨 Scaling hierarchical agglomerative clustering to trillion-edge graphs Кластеризация графов объеди👁 2.4K 🌟SALSA: Стабильная адаптация линейного поиска Armijo. SALSA (Stable Armijo Line Search Adaptation)👁 2.3K https://blog.tensorflow.org/2024/04/faster-dynamically-quantized-inference-with-xnnpack.html @tenso👁 2.2K ⚡️ AutoBNN: Probabilistic time series forecasting with compositional bayesian neural networks Autob👁 2.2K https://blog.tensorflow.org/2024/03/whats-new-in-tensorflow-216.html @tensorflowblog👁 1.7K

Все посты канала →

Аналитика канала База постов