Operationalizing Pluralistic Values in Large Language Model Alignment Reveals Trade-offs in Safety, Inclusivity, and Model Behavior

This research investigates the complex trade-offs in aligning Large Language Models with pluralistic human values, revealing significant demographic disparit...

Level: advanced

By Dalia Ali, Dora Zhao, Allison Koenecke, Orestis Papakyriakopoulos

Category: discussion