BALF: Budgeted Activation-Aware Low-Rank Factorization for Fine-Tuning-Free Model Compression

Discover BALF, a novel framework enabling efficient model compression without fine-tuning through activation-aware low-rank factorization, significantly redu...

Level: advanced

By Unknown

Category: research