General-purpose large language models outperform specialized clinical AI tools on medical benchmarks

Nature Medicine, Published online: 12 June 2026; doi:10.1038/s41591-026-04431-5 In an independent evaluation, frontier large language models outperformed specialized clinical artificial intelligence tools on medical knowledge, clinician alignment and real-world clinical queries.