Benchmark Results: Accessibility Performance Across Models
(conesible.de)
Tipsad 2026-06-04 på Anders Ytterströms webblogg
Claude är avsevärt sämre på tillgänglighet, ChatGPT och Inception2 är mer acceptabla
En bra rapport att ta del av!
Claude bär stora skämskudden vad gäller att säkra tillgänglighet i slutprodukten. ChatGPT och Mercurys Inception2 ligger på acceptabel nivå - på ungefär samma nivå som riktiga programmerare.
LLM:er har som regel dåligt dataunderlag för detta, eftersom tillgänglighet ur ett historiskt perspektiv inte har varit prioriterat i branchen.