Eine strukturierte Evaluation der KI-gestützten Dokumentationsqualität im Vergleich zur manuellen ärztlichen Dokumentation in der ambulanten Rheumatologie. Basierend auf realen Konsultationen in einem spezialisierten deutschen Immunologiezentrum.
n = 15 Konsultationen
Parallele Dokumentation
Immunologikum Hamburg
Autor: PA — Dr. Peer Aries — Immunologikum Hamburg, Rheumatologie & Klinische Immunologie
Warum Dokumentationsqualität wichtiger ist als Geschwindigkeit
Geschwindigkeit ist die Kennzahl, über die alle reden. Aber in der Rheumatologie — einem Fach, das durch komplexe Medikationshistorien, Multisystemerkrankungen und kostenintensive Biologika-Therapien geprägt ist — bestimmt die Qualität der Dokumentation über Behandlungsergebnisse, Kostengutsprachen und rechtliche Absicherung.
Manuelle Dokumentation unter Zeitdruck ist eine Übung in Triage. Ärzt:innen erfassen, was sie für am dringendsten halten, in Kurzschrift und Abkürzungen, die für die eigene Erinnerung optimiert sind — nicht für externe Leser:innen, Prüfinstanzen oder die Versorgungskontinuität. Das Ergebnis sind Notizen, die diagnostisch funktional, aber strukturell unvollständig sind.
Diese Pilotstudie, durchgeführt von Dr. Peer Aries am Immunologikum Hamburg, stellt eine andere Frage als die typische KI-Dokumentationsstudie: nicht „Ist es schneller?" sondern „Ist es besser?" Durch parallele manuelle und KI-gestützte Dokumentation derselben Konsultationen isoliert die Evaluation den qualitativen Unterschied — Struktur, Vollständigkeit, klinische Tiefe und Lesbarkeit — zwischen der ärztlichen Dokumentation unter Zeitdruck und dem, was ein ambientes KI-System aus demselben Gespräch erfasst.
Studiendesign: Parallele Dokumentation im realen klinischen Workflow
Die Evaluation wurde in einer spezialisierten ambulanten immunologischen und rheumatologischen Versorgungseinheit durchgeführt. Fünfzehn Konsultationen wurden simultan mit zwei Methoden dokumentiert.
Ablauf
Jede Visite folgte einem standardisierten Workflow. Patient:innen füllten zunächst eine digitale Voranamnese aus (z. B. über Idana). Anschließend führte der Arzt die klinische Anamnese durch — und genau diese Phase wurde evaluiert. Die Dokumentation erfolgte parallel: Der Arzt schrieb seine übliche manuelle Notiz, während Nixi AIs ambientes System aus demselben gesprochenen Gespräch eine strukturierte Notiz generierte.
Der Vergleich bezieht sich ausschließlich auf die Anamnese — nicht auf Untersuchungsbefunde, Diagnosen oder Therapiepläne. Damit wird genau die Dokumentationsaufgabe isoliert, bei der der Zeitdruck am höchsten und der Informationsverlust am größten ist.
Evaluationskriterien
Sieben Dimensionen wurden über alle Fälle hinweg bewertet, gruppiert in vier Qualitätsdomänen.
Ergebnisse: Die strukturelle Lücke zwischen manueller und KI-Dokumentation
Sprache und Stil
Der auffälligste Unterschied liegt nicht darin, was dokumentiert wird, sondern wie. Manuelle Notizen sind in Telegrammstil verfasst — Fragmente, die für die eigene Erinnerung konzipiert sind und für Kolleg:innen, Gutachter:innen oder MDK-Prüfer:innen oft unverständlich bleiben.
Nixi AI produzierte narrative, vollständige Sätze, die klinische Präzision bewahrten und gleichzeitig für jede Leser:in verständlich waren. Gelegentliche Redundanzen wurden festgestellt — ein geringer Preis für den Gewinn an Vollständigkeit.
Struktur- und Informationslogik
Manuelle Notizen zeigten keine konsistente zeitliche Ordnung. Therapieverläufe wurden impliziert statt dargelegt. Komorbiditäten tauchten sporadisch oder gar nicht auf.
Nixi AI trennte konsistent den klinischen Verlauf von den aktuellen Beschwerden, etablierte klare chronologische Zeitachsen und verknüpfte Therapien explizit mit Ergebnissen — genau die Struktur, die für Therapieeskalationsdokumentation und Kostenübernahmeanträge erforderlich ist.
Klinische Tiefe: Was unter Zeitdruck verloren geht
Die Vollständigkeitslücke
Hier wird der qualitative Unterschied klinisch signifikant. Manuelle Notizen erfassten die diagnostischen Grundlagen — das Minimum, das ein Arzt braucht, um sich an den Fall zu erinnern. Aber sie ließen routinemäßig aus:
— Funktionsstatus (Griffstärke, Bewegungseinschränkungen, Alltagsauswirkungen)— Subjektive Symptomqualität („stechend," „tief und schwer," „gigantisch")— Präventiver Kontext (Impfstatus, Knochendichtescreening, Bewegungsgewohnheiten)— Risikorelevante Details (verbleibende Nervenschäden, Medikamentensensitivitätsmuster)— Die eigenen Worte und die Perspektive der Patient:innen
Nixi AI erfasste all dies — nicht weil es dafür programmiert wurde, sondern weil der Arzt während der Konsultation darüber sprach. Die Information war immer da. Sie schaffte es nur nicht in die schriftliche Dokumentation.
Die Stimme der Patient:innen
Vielleicht der auffälligste Befund: In manuellen Notizen war die Perspektive der Patient:innen selten erkennbar. Notizen lasen sich als ärztliche Bewertungen, nicht als Aufzeichnungen eines Gesprächs. Nixi AI bewahrte konsistent die Sprache, den Kontext und die Anliegen der Patient:innen — und schuf Notizen, die einen bilateralen Austausch widerspiegeln statt einer einseitigen Beurteilung.
Operativer Nutzen: Effizienz, Konsistenz und Auditfähigkeit
Konsistenz und Qualitätssicherung
Die Qualität manueller Dokumentation ist inhärent variabel. Sie hängt ab vom Energielevel der Ärzt:in, der Komplexität des vorherigen Falls, wie weit der Zeitplan überschritten ist, und ob eine vollständigere Notiz nachträglich diktiert werden soll (was in der Praxis selten mit derselben Genauigkeit geschieht).
Nixi AI produzierte standardisierte Ausgabequalität über alle Fälle hinweg — ob die Konsultation eine unkomplizierte Verlaufskontrolle oder eine komplexe Multisystem-Besprechung war. Diese Konsistenz ist besonders wertvoll für Mehrpersonenpraxen, Vertretungssituationen und die Vorbereitung externer Prüfungen.
Defensive Dokumentation und der Biologika-Genehmigungspfad
In der Rheumatologie wirkt sich die Dokumentationsqualität direkt auf den Therapiezugang aus. Biologische Therapien — die wirksamsten Behandlungen für Erkrankungen wie rheumatoide Arthritis und Psoriasis-Arthritis — erfordern eine detaillierte Dokumentation zur Vorabgenehmigung. Ablehnungen durch Kostenträger beruhen häufig auf:
— Unvollständiger Dokumentation früherer Therapieversagen („MTX versagt" vs. „MTX 15 mg nach 6 Monaten abgesetzt wegen persistierender GI-Nebenwirkungen trotz Dosisreduktion")— Fehlende Krankheitsaktivitätsscores oder Schweregradkriterien— Fehlende Dokumentation, warum Alternativen ungeeignet waren— Fehlende strukturierte Chronologie des Therapieverlaufs
In dieser Pilotstudie erfasste Nixi AI konsistent die granularen Details, die für die Biologika-Begründung erforderlich sind — Therapiezeitachsen, spezifische Versagensgründe, Nebenwirkungsinventare und funktionelle Auswirkungsbewertungen — Informationen, die während der Konsultation gesprochen, aber in der manuellen Dokumentation verloren gingen.
Fazit: Dokumentationsqualität als klinisches Ergebnis
Diese Evaluation zeigt, dass die Lücke zwischen manueller und KI-gestützter Dokumentation nicht primär eine Frage der Geschwindigkeit ist — sondern der Informationstreue. Der Arzt sprach in jedem Fall dieselben Worte. Der Unterschied liegt darin, was erfasst wurde.Manuelle Dokumentation unter Zeitdruck ist ein Akt der verlustbehafteten Kompression. Nixi AI funktioniert als verlustfreie Aufzeichnung — es bewahrt die klinische Narration so, wie sie gesprochen wurde, strukturiert für die nachgelagerte Verwendung.Die Implikationen gehen über Einzelpraxen hinaus. In einem Gesundheitssystem, das sich in Richtung wertbasierte Versorgung, Qualitätskennzahlen und einrichtungsübergreifenden Datenaustausch bewegt, wird die Vollständigkeit und Struktur der klinischen Dokumentation zu einer systemischen Variable — eine, die ambiente KI messbar verbessern kann.
Nächste Schritte
— Erweiterung auf weitere Dokumentationsbereiche (Untersuchungsbefunde, Verlaufsnotizen, Arztbriefe)
— Integration in PVS über GDT-/HL7-Schnittstellen
— Multizentrische Erprobung mit standardisierter Zeitmessung und Ärzt:innenfeedback
— Vergleich mit anderen Dokumentationssystemen zur Einordnung des Innovationsgrads