Es ist 8:54 Uhr, der Zoom-Raum füllt sich, und im Chat geht ein kleiner Atlas auf: „Guten Morgen aus Salzburg", „Servas aus Wien", „Moin aus Essen", „Grüsse aus der Schweiz", „Düsseldorf", „Hallo aus Hamburg". Bevor die erste Folie steht, gibt Raphael unserem Desktop Agent eine kleine Aufgabe: Begrüße alle, die schon im Chat geschrieben haben, mit Vornamen direkt auf unserer Website. Sekunden später liest auf der Live-Seite jeder seinen eigenen Namen, samt der Zeile: „Wenn du das hier liest, laufen live Demos. Wer jetzt nicht dabei ist, verpasst genau das." Es ist 9:02 Uhr, und der Crashkurs hat noch nicht richtig angefangen.
Wir starten, wie immer, mit der Standortfrage. „Sitze im Büro, arbeite schon mit Claude, aber bin absoluter Anfänger" schreibt Herbert. „Noch Anfänger, aber ChatGPT-Freak" schreibt Stefan. Und dann ist da Mareike, seit Dezember 2022 dabei, Founding Member, sonst immer inkognito, heute zum ersten Mal mit Gesicht im Panel. Genau für diese Mischung ist der AI Crashkurs gebaut: kein Hype, kein Tutorial, sondern eine Live-Demo, die zeigt, was sich gerade verschiebt.
Die meisten bringen dieselbe leise Frage mit: Lohnt es sich, jetzt eine Meinung zu Desktop Agents zu haben, oder ist das wieder nur das nächste Tool? Diese Ausgabe vom 27. Mai 2026 hat darauf eine ziemlich konkrete Antwort gegeben. Sie steckte in einem einzigen Live-Auftrag, in einer ehrlichen Debatte über Datenschutz und in ein paar Sätzen, die im Chat hängen geblieben sind. Wir nehmen dich mit.
Was sind Desktop Agents und warum gerade jetzt?
Ein Desktop Agent ist eine Anwendung, die nicht nur auf Fragen antwortet, sondern eigenständig mehrstufige Aufgaben auf deinem Computer erledigt. Er liest und schreibt Dateien in deinen lokalen Ordnern, steuert Programme wie Excel oder PowerPoint, recherchiert im Browser und bindet externe Dienste an. Du gibst ein Ziel vor, der Agent sucht sich den Weg dahin selbst.
Raphael führt das mit einem Bild ein, das im Chat sofort sitzt. Dreieinhalb Jahre lang hieß die Antwort auf jede Aufgabe: noch ein Tool. Ein Tool für Werbetexte, eines für E-Mails, eines für Logos, eines für Social Media, eines für Podcasts, eines für Landingpages, eines fürs Schneiden, eines für Voice-Cloning. „Deine Kreditkarte wurde gerade schon hundertmal abgebucht", sagt er, und selbst er als AI-Trainer komme da nicht mehr hinterher. Desktop Agents drehen diese Logik um: Statt zwischen zwanzig Oberflächen zu springen, steuerst du die Fähigkeiten aus einem Ort heraus.
Damit das funktioniert, brauchst du nur drei Begriffe. Skills sind Markdown-Anleitungen, die dem Agent erklären, wie er eine wiederkehrende Aufgabe in deinem Stil löst, etwa ein Angebot in deinem Branding. MCP-Server, auch Konnektoren genannt, sind Schnittstellen zu Tools wie Slack, Notion oder Google Drive. Und der Workspace ist schlicht ein Ordner auf deinem Rechner, in dem der Agent arbeitet, ablegt und nachschlägt.

Warum das ausgerechnet jetzt geht: Erst mit den jüngsten Modellen von Anthropic wurde es zuverlässig, Aufgaben über die Kommandozeile und angebundene Programme hinweg zu erledigen. Im Hintergrund schreibt der Agent sich die nötigen Befehle selbst und führt sie aus. Genau dieser Sprung macht aus einem Chatbot einen Mitarbeiter, der Dinge erledigt.
Desktop Agent oder Workflow-Agent wie n8n: Wo liegt der Unterschied?
Der Unterschied liegt in der Spontaneität. Ein Workflow-Agent, etwa in n8n, Make oder Zapier, ist für wiederkehrende Abläufe gebaut: Wenn A passiert, mache immer B. Ein Desktop Agent dagegen handelt ad hoc, du kannst ihm jeden Tag etwas völlig anderes auftragen.
Nick bringt die Frage im Chat genau auf den Punkt: „In n8n kann ich dem Agent ja auch mehrere Tools bereitstellen, die er frei verwendet. Wo liegen die Unterschiede und Vorteile vom Desktop Agent?" Raphaels ehrliche Antwort: Workflow-Agents haben ihn lange kaltgelassen, weil seine Aufgaben fast nie gleich ablaufen. Er will morgen etwas anderes als heute. Vorab konfigurierte, immer gleiche Prozesse passen dazu nicht. Beides hat seine Berechtigung, der Workflow-Agent für den verlässlichen Hintergrundprozess, der Desktop Agent für das spontane, kreative Arbeiten am Tag.
Wenn du tiefer in die Abgrenzung einsteigen willst, haben wir das im Detail in unserem Artikel zu Desktop Agents und Claude Cowork aufgeschrieben.
Der Live-Auftrag: drei Dokumente aus einem Interview, parallel gebaut
Aus dem Panel der angemeldeten Teilnehmenden wählen wir Manuel. Sein Unternehmen ist ein IT-Systemhaus, das die komplette IT für eine Steuerberatungsgruppe mit über 200 Mitarbeitenden betreut. Mehr Briefing als ein kurzes Live-Interview gibt es nicht. Manuels Kernproblem benennt er selbst: Wegen der Verschwiegenheitspflicht nach Paragraf 203 darf er Mandantendaten nicht einfach an Dritte geben, und eine Cloud-AI wäre dieser Dritte. Aktuell läuft AI dort nur eingeschränkt und anonymisiert über Microsoft Copilot. Das auf 200 Leute auszurollen, ist schwer.
Was dann passiert, ist der eigentliche Wow-Moment. Raphael legt das Interview-Transkript in unseren gemeinsamen Workspace-Ordner, und Liam und Jenny starten gleichzeitig drei verschiedene Aufträge. Niemand wartet auf den anderen. Während wir weiter Fragen aus dem Chat beantworten, bauen im Hintergrund mehrere Agenten parallel an unterschiedlichen Dokumenten. Genau das ist die neue Art zu arbeiten: drei, vier Tabs offen, und du springst immer zu dem, der gerade fertig ist.
Die ROI-Kalkulation zeigt, warum solche Demos im Chat für Bewegung sorgen. Die Annahmen waren bewusst konservativ, ein IT-Stundensatz und ein Verwaltungs-Stundensatz, die Manuel im Live-Interview sogar noch nach oben korrigiert hat. Das Ergebnis trotzdem deutlich:
| Szenario | Zeitersparnis (Annahme) | Return im 1. Jahr |
|---|---|---|
| Konservativ | gering angesetzt | rund das 10-Fache des Einsatzes |
| Realistisch | mittlere Annahme | rund das 23-Fache des Einsatzes |
| Optimistisch | hohe Annahme | deutlich darüber |
Wichtig zur Einordnung, und das haben wir auch im Chat klargemacht: Das sind die direkten Stundeneinsparungen aus einer Live-Demo, keine geprüfte Wirtschaftlichkeitsrechnung. Eileen fragt zu Recht, woher die Preise kommen, wenn sie nicht öffentlich sind, und Jason will wissen, ob solche ROIs realistisch sind. Der vollständige Business Case enthält Skill-Aufbau, Tool-Lizenzen und Schulungen und ist genau deshalb für jedes Unternehmen individuell.
Läuft das wirklich lokal? Die kritischen Fragen aus dem Chat
Nein, Claude Cowork läuft in der Standard-Variante nicht lokal, und das ist der wichtigste Punkt dieser Session. Sobald der Agent etwas verarbeitet, gehen die Daten über die Server des Anbieters. Genau hier wurde der Chat unbequem, und das ist gut so.
Florian formuliert es am schärfsten:
„Ihr zeigt Claude Cowork als lokale Lösung ohne API-Calls, aber sobald Claude etwas verarbeitet, gehen die Daten über Anthropics Server. Das ist die grundlegende Architektur, egal ob Desktop, Cowork oder Code."
Frank legt nach („Warum redet ihr über lokal? Das ist es doch gar nicht"), Hans wird spitz („Einfach mal den Netzwerkstecker ziehen, dann sieht man, wie gut Claude lokal läuft"), und Wilfried fragt, warum die kritischen Fragen nicht beantwortet werden. Diese Stimmen haben recht, und sie verdienen eine klare Antwort statt Marketing.
Die ehrliche Auflösung lieferte ein Teil der Community gleich selbst. Was sich tatsächlich lokal betreiben lässt, ist die Claude-Code-Oberfläche, die man auf ein lokal laufendes Open-Source-Modell wie Llama oder Mistral umleiten kann, etwa über Ollama. Florian bringt die Pointe selbst: „Dann läuft aber nicht mehr Claude, sondern Llama oder Mistral. Claude ist das Modell, kein Frontend." Genau so ist es. Wer von Mandantendaten und Paragraf 203 spricht, meint nicht „Claude lokal", sondern eine Architektur, in der ein lokales Modell die sensiblen Daten verarbeitet und der Komfort von Claude für unkritische Aufgaben bleibt. Daniela aus der Community bestätigt: „Mit dem richtigen Setup funktioniert es lokal sehr, sehr gut."
Was bedeutet das für dich? Datenschutz bei Desktop Agents ist eine Setup-Frage, keine Folie. Welche Daten in welche Cloud gehen und welche lokal bleiben, lässt sich in einer 90-minütigen Demo nicht seriös klären. Es gehört in einen sauberen Rollout, und genau das war auch unsere Empfehlung an Manuel: erst eine Potenzialanalyse mit lokalen Modellen, dann der Ausbau. Wie man so etwas grundsätzlich angeht, beschreiben wir in unserem Artikel zu Claude Cowork im Tool-Stack.
Was uns überrascht hat
Drei Dinge nehmen wir aus dieser Ausgabe besonders mit.
Erstens der Effekt, den Raphael „layer on layer on layer" nennt. Früher war jede AI-Aufgabe ein Einzelfall: aufwendig, und unklar, ob die Mühe sich später auszahlt. Heute baut die Arbeit auf sich selbst auf. Jeder Skill, jeder Konnektor, jede einmal gelöste Aufgabe macht die nächste schneller. Zehn investierte Minuten heute zahlen in Wochen noch ein.
Zweitens die Frage der Kosten, die im Chat oft kam, von Diana bis jahida. Wir legen sie offen: Unser gesamtes Team verbraucht aktuell rund 568 Euro im Monat. Klar, jede Anfrage kostet, und an Limits stößt man. Aber gemessen an dem, was an einem einzigen Vormittag entstanden ist, ist das eine andere Größenordnung als ein Schrank voller Tool-Abos.
Drittens, und das war der für viele befreiende Satz: Du arbeitest nicht umsonst. Skills sind reine Zip-Dateien, MCP-Server ein offener Standard. Was du einmal aufgebaut hast, kannst du in einen anderen Desktop Agent mitnehmen, fast eins zu eins. Kein Vendor-Lock-in. Wer anfängt, seine Prozesse als Skills aufzuschreiben, ist beim Tool-Wechsel frei. Wer alles nur in losen Chats hat, fängt bei jedem Anbieter von vorne an.
Fazit: Hol dir deine eigene Meinung
Ein Crashkurs ist kein Abschluss, sondern der Moment, in dem du dir selbst eine Meinung bildest, ob das hier etwas verändert. Am 27. Mai war diese Antwort schon nach dem ersten Live-Auftrag da: ein anonymisiertes Interview, und parallel daraus ein Angebot, eine ROI-Kalkulation, ein Pitch-Deck und ein Projekteintrag in den Systemen. Nicht weil ein PDF schön ist, sondern weil sich die Art zu arbeiten ändert.
Der nächste AI Crashkurs läuft bald wieder, jedes Mal ein bisschen anders, weil wir selbst dazulernen. Er ist kostenlos, dauert rund zwei Stunden, und du erlebst die Live-Demo statt sie dir erklären zu lassen. Sichere dir deinen Platz im nächsten AI Crashkurs und bilde dir deine eigene Meinung, am besten live im Chat.
Mehr in unserer KI-Tool-Übersicht
Die vollständige AITI-Tool-Übersicht zeigt alle Tools, die wir aktuell empfehlen, mit Bewertung, Use-Case-Logik und Lernpfad. Zur Vertiefung: Desktop-Agents.
Hinweis zu den O-Tönen: Sämtliche Zitate stammen aus dem Live-Chat des AI Crashkurs vom 27. Mai 2026. Die Teilnehmenden wurden zu Beginn der Session darauf hingewiesen, dass Chat-Beiträge zur Content-Erstellung verwendet werden. Aus Datenschutzgründen verwenden wir ausschließlich Vornamen, und der Name des im Interview vorgestellten Unternehmens wurde bewusst anonymisiert.

