Wie nützlich ist KI wirklich für Ihren Job? Was 200.000 echte Gespräche mit Copilot verraten

In der Diskussion um Künstliche Intelligenz dominieren zwei Extreme: Die einen prophezeien, dass KI Millionen Jobs vernichtet. Die anderen tun sie als vorübergehenden Hype ab. Eine neue Studie von Microsoft Research bringt endlich Daten statt Spekulation in die Debatte — analysiert wurden 200.000 echte Gespräche mit Bing Copilot.

Die Forscher um Kiran Tomlinson und Sonia Jaffe wollten wissen: Für welche Arbeitstätigkeiten wird KI tatsächlich genutzt? Und wie erfolgreich ist sie dabei? Anders als frühere Studien, die auf Expertenbefragungen oder Labortests basierten, schaut diese Untersuchung auf reale Nutzungsdaten. Genau das macht sie wertvoll — aber auch angreifbar, wie wir noch sehen werden.

User Goal vs. KI-Handlung: Die zentrale Unterscheidung, die fast jeder übersieht

Eine der wichtigsten Erkenntnisse: KI wird auf zwei grundverschiedene Arten genutzt. Erstens sucht der Nutzer Hilfe bei einer eigenen Aufgabe — das sogenannte User Goal. Die KI unterstützt. Zweitens erledigt die KI selbst eine Aufgabe — die KI-Handlung. Sie übernimmt.

Ein Beispiel: Fragt jemand, wie man ein Dokument ausdruckt, ist das Nutzerziel „Bürogeräte bedienen“. Die KI-Handlung hingegen ist „Andere schulen“ — sie erklärt und lehrt. Diese Diskrepanz ist kein Randphänomen: In 40 Prozent der Gespräche überschneiden sich Nutzerziel und KI-Handlung überhaupt nicht. Für jede vom Nutzer verfolgte Tätigkeit erbringt die KI im Schnitt zwei eigene.

Was KI heute schon kann — und wo sie regelmäßig scheitert

Die Studie zeigt ein klares Muster: KI glänzt bei Informationsarbeit. Die häufigsten und erfolgreichsten Anwendungen fallen in vier Kategorien:

Lernen (neues Wissen aneignen)
Kommunizieren (Informationen austauschen)
Lehren und Erklären (Wissen weitergeben)
Schreiben (Texte erstellen)

Weniger gut läuft es bei Bildgenerierung und Datenanalyse. Hier sind die Erfolgsquoten niedriger. Für Unternehmen bedeutet das: Setzen Sie KI zuerst dort ein, wo es um Information geht — nicht dort, wo die Technik noch schwächelt.

Betroffen sind fast alle Berufe — aber unterschiedlich stark

Die vielleicht wichtigste Botschaft: KI ist kein Nischenthema für Tech-Berufe. Weil fast jeder Job Informationsarbeit enthält — schreiben, recherchieren, kommunizieren — ist KI branchenübergreifend relevant. Die Forscher haben einen „KI-Anwendbarkeitswert“ pro Beruf berechnet, basierend auf den O*NET-Klassifikationen.

Das Ergebnis: Berufe mit hoher Nutzerziel-Anwendbarkeit — etwa IT und Mathematik — nutzen KI zur Verbesserung bestehender Arbeitsabläufe. Berufe mit hoher KI-Handlungs-Anwendbarkeit — etwa Finanzen und Betriebswirtschaft — könnten dagegen Aufgaben an KI abgeben. Diese Unterscheidung haben wir auch schon in der Anthropic-Studie zur KI-Nutzung am Arbeitsplatz gesehen — das Muster wiederholt sich.

Der blinde Fleck: Wessen Daten sind das eigentlich?

Hier wird es kritisch — und das wird in der bisherigen Berichterstattung zur Studie kaum thematisiert. Die Daten stammen ausschließlich aus Bing Copilot, einem Microsoft-Produkt. Die Forscher sind Microsoft-Mitarbeiter. Das Paper wurde von Microsoft Research publiziert.

Das macht die Studie nicht wertlos — im Gegenteil. Aber es schränkt die Aussagekraft ein: Wir sehen hier nur, wie Menschen einen KI-Chatbot nutzen, nicht wie KI insgesamt in der Arbeitswelt eingesetzt wird. Wer ChatGPT, Claude oder Gemini verwendet, taucht in diesen Daten nicht auf. Auch Agenten-Systeme, die ohne Chat-Oberfläche im Hintergrund arbeiten, fehlen komplett.

Die Studie misst also streng genommen nicht „KI-Anwendbarkeit in Berufen“, sondern „Bing-Copilot-Nutzung in Berufen“. Das ist ein Unterschied, den man kennen sollte, bevor man die Zahlen 1:1 in Unternehmensstrategien übernimmt.

KI demokratisiert Expertise — oder überschätzen wir das?

Die optimistische Lesart der Studie: KI macht Fachwissen breiter verfügbar. Wie früher die Textverarbeitung das Tippen von einer Spezialaufgabe zur Alltagskompetenz machte, könnte KI den Zugang zu Expertise demokratisieren.

Die skeptischere Lesart, die ich für realistischer halte: KI verstärkt bestehende Ungleichheiten, weil diejenigen am meisten profitieren, die bereits wissen, wie man gute Prompts schreibt und KI-Outputs kritisch bewertet. Die Studie selbst zeigt, dass erfolgreiche Nutzung stark von der Fähigkeit abhängt, der KI die richtigen Aufgaben zu stellen — eine Meta-Kompetenz, die nicht gleich verteilt ist.

Genau hier liegt der Unterschied zwischen klassischer Automatisierung und KI-gestützter Arbeit. Während Automatisierung klare Input-Output-Regeln hat, ist KI-Erfolg stark kontextabhängig. Wer mehr dazu lesen will: KI-Agenten vs. Automation — die Unterschiede im Detail.

Was die Studie für den deutschen Arbeitsmarkt bedeutet

Für Deutschland sind die Ergebnisse zweischneidig. Einerseits hat Deutschland einen hohen Anteil an Industrie- und Fertigungsberufen, in denen physische Arbeit dominiert — die Studie zeigt, dass KI hier weniger direkt eingreift. Andererseits ist der Anteil an Informationsarbeit auch in der deutschen Wirtschaft massiv, gerade in Verwaltung, Beratung und wissensintensiven Dienstleistungen.

Das deckt sich mit Analysen, die wir hier bereits veröffentlicht haben: 35 Millionen Jobs im KI-Check: Was die deutsche Wirtschaft wirklich anfällig macht.

Praxis-Check: Wann KI im Job sinnvoll ist — und wann nicht

Aus den Studiendaten und der kritischen Distanz dazu lässt sich ein pragmatischer Fragenkatalog ableiten. Bevor Sie KI in einem Arbeitsbereich einsetzen, sollten Sie drei Dinge prüfen:

Informationsgehalt: Geht es um Texte, Recherche, Erklärungen oder Kommunikation? Wenn ja, ist KI vermutlich hilfreich. Wenn die Aufgabe physisch, sensorisch oder stark kontextabhängig ist, eher nicht.
Fehlerkosten: Was passiert, wenn die KI daneben liegt? Bei unkritischen Entwürfen und Recherchen ist das verkraftbar. Bei rechtsverbindlichen Dokumenten oder sicherheitskritischen Entscheidungen nicht.
Eigenkompetenz: Kann der Nutzer beurteilen, ob der KI-Output korrekt ist? Ohne diese Fähigkeit wird KI zum Risiko — man übernimmt Fehler, die man nicht erkennt.

Fazit: Gute Daten, falsche Framings

Die Microsoft-Studie ist ein wichtiger Beitrag zur KI-Arbeitsmarkt-Debatte — endlich echte Nutzungsdaten statt reiner Prognosen. Die zentrale Erkenntnis, dass KI vor allem Informationsarbeit betrifft und fast alle Berufe tangiert, ist belastbar und relevant.

Kritisch bleiben muss man beim Framing: Die Studie misst Bing-Copilot-Nutzung, nicht KI-Nutzung allgemein. Sie stammt von Microsoft, über Microsofts eigenes Produkt. Und sie erfasst nur Chat-basierte Interaktionen, nicht agentische Systeme oder API-basierte KI-Nutzung. Diese Einschränkungen machen die Ergebnisse nicht wertlos — aber sie verbieten simple Schlagzeilen nach dem Muster „KI ersetzt 40% aller Jobs“.

Die ehrlichere Aussage lautet: KI verändert, wie Informationsarbeit erledigt wird — und dieser Wandel ist real, messbar und branchenübergreifend. Die Frage ist nicht, ob Sie KI nutzen sollten. Die Frage ist, ob Sie verstehen, was die Technik kann und was nicht, bevor Sie strategische Entscheidungen darauf aufbauen.

FAQ

Was hat die Microsoft-Studie genau untersucht?

Die Forscher analysierten 200.000 anonymisierte Konversationen mit Microsoft Bing Copilot und klassifizierten mithilfe eines LLM-basierten Verfahrens, welche Arbeitstätigkeiten (basierend auf O*NET-Klassifikationen) in diesen Gesprächen vorkamen — sowohl auf Nutzerseite (User Goal) als auch auf KI-Seite (KI-Handlung).

Für welche Berufe ist KI besonders relevant?

Für fast alle. Weil Informationsarbeit in praktisch jedem Beruf vorkommt, hat die Studie für die meisten Berufe eine KI-Anwendbarkeit festgestellt. Besonders stark betroffen sind IT, Mathematik, Finanzen, Betriebswirtschaft und wissensintensive Dienstleistungen.

Kann man den Ergebnissen der Studie vertrauen?

Die Methodik ist solide, aber man muss die Einschränkungen kennen: Die Daten stammen nur aus Bing Copilot (Microsoft-eigenes Produkt), die Forscher sind Microsoft-Mitarbeiter, und es werden nur Chat-basierte Interaktionen erfasst — keine API- oder Agenten-Nutzung. Die Ergebnisse sind relevant, aber kein vollständiges Bild der KI-Nutzung am Arbeitsplatz.

Sollte mein Unternehmen jetzt KI für alle Informationsaufgaben einführen?

Nicht blind. Die Studie zeigt, wo KI grundsätzlich nützlich ist — aber der Erfolg hängt vom konkreten Anwendungsfall, den Fehlerkosten und der Kompetenz der Nutzer ab. Fangen Sie mit niedrig-riskanten Informationsaufgaben an und evaluieren Sie systematisch.

Wo finde ich die vollständige Studie?

Die Studie ist frei verfügbar auf arXiv: Working with AI: Measuring the Applicability of Generative AI to Occupations (arXiv:2507.07935). Der Code und die Daten sind auf GitHub veröffentlicht: github.com/microsoft/working-with-ai.