Do Bias Benchmarks Generalise?

This research investigates why bias benchmarks in SpeechLLMs fail to generalize across tasks, revealing critical gaps in current evaluation methods for AI fa...

Level: advanced

By Unknown

Category: discussion