Posts by Tags

AI safety

Why Some Models Shatter and Others Don’t: The Geometry of Emergent Misalignment Across Architectures

12 minute read

Published: April 06, 2026

Authors: Huy Nghiem

alignment

Why Some Models Shatter and Others Don’t: The Geometry of Emergent Misalignment Across Architectures

12 minute read

Published: April 06, 2026

Authors: Huy Nghiem

emergent misalignment

Why Some Models Shatter and Others Don’t: The Geometry of Emergent Misalignment Across Architectures

12 minute read

Published: April 06, 2026

Authors: Huy Nghiem

mechanistic interpretability

Why Some Models Shatter and Others Don’t: The Geometry of Emergent Misalignment Across Architectures

12 minute read

Published: April 06, 2026

Authors: Huy Nghiem