2.3Kпросмотров16 марта 2024 г.Score: 2.5KSOTA lowbit LLM quantization INT8FP8INT4FP4NF4 sparsity leading model compression techniques on TensorFlow PyTorch and ONNX Runtime View on Github.com