Lizard: An Efficient Linearization Framework for Large Language Models

Lizard introduces a subquadratic attention framework to resolve memory and compute bottlenecks in large language models, delivering near-lossless performance...

Level: advanced

By Unknown

Category: research