OpenWAI News

OpenWAI News

kuratierte KI-Nachrichten, übersetzt und thematisch geordnet

Fehler in Docker Model Runner erlaubt Sandboxausbruch unter macOS

Nutzen Angreifer eine Sicherheitslücke in Docker unter macOS erfolgreich aus, können sie aus der Sandbox ausbrechen und Schadcode im Hostsystem ausführen. Eine dagegen gerüstete Version steht zum Download bereit. Die Sicherheitslücke In einer Warnmeldung erläutern die Entwickler, dass die Schwachstelle (CVE-2026-5843 „hoch“) in Docker Model Runner zum Laden und Ausführen von lokalen LLMs steckt. Darüber können Angreifer die Komponente dazu bringen, ein mit Schadcode verseuchtes KI-Modell zu laden. Dafür müssen sie aber über ein Netzwerk Zugriff auf Container haben. Das Sicherheitsproblem liegt konkret im Umgang mit Python-Code in diesem Kontext. Weil keine Überprüfung stattfindet, wird ein LLM ohne Sicherheitsabfrage direkt geladen. Unter macOS handhabt Apples MLX-Framework lokale KI-Modelle. In diesem Fall liest MLX die config.json und führt malicious_script.py direkt aus. Weil MLX außerhalb der Docker-Umgebung ohne Sandbox direkt auf Systemebene läuft, können Angreifer eigenen Code mit den Rechten des Nutzers ausführen können.

Die Entwickler geben an, dass Docker ab Version 4.56.0 bedroht ist. Sie versichern, die Sicherheitsproblematik in der Ausgabe 4.71.0 gelöst zu haben. Bislang gibt es keine Berichte, dass Angreifer die Lücke bereits ausnutzen. Die Version ist bereits seit April dieses Jahres verfügbar. Konkrete Informationen zur Lücke sind aber erst seit Kurzem bekannt. Aktuell ist die Ausgabe 4.75.0, in der die Entwickler unter macOS und Windows verschiedene Bugs ausgebügelt haben. In 4.72.0 haben sie die Linux-Kernel-Sicherheitslücke „Copy Fail“ (CVE-2026-31432 „hoch“) geschlossen. Die Copy-Fail-Schwachstelle wird bereits ausgenutzt und Angreifer kompromittieren darüber Systeme als root-Nutzer. Demzufolge sollten Admins sicherstellen, dass auf ihren Systemen eine aktuelle Ausgabe installiert ist.

Weiterlesen

Nutzen Angreifer eine Sicherheitslücke in Docker unter macOS erfolgreich aus, können sie aus der Sandbox ausbrechen und Schadcode im Hostsystem ausführen. Eine dagegen gerüstete Version steht zum Download bereit. Die Sicherheitslücke In einer Warnmeldung erläutern die Entwickler, dass die Schwachstelle (CVE-2026-5843 „hoch“) in Docker Model Runner zum Laden und Ausführen von lokalen LLMs steckt. Darüber können Angreifer die Komponente dazu bringen, ein mit Schadcode verseuchtes KI-Modell zu laden. Dafür müssen sie aber über ein Netzwerk Zugriff auf Container haben. Das Sicherheitsproblem liegt konkret im Umgang mit Python-Code in diesem Kontext. Weil keine Überprüfung stattfindet, wird ein LLM ohne Sicherheitsabfrage direkt geladen. Unter macOS handhabt Apples MLX-Framework lokale KI-Modelle. In diesem Fall liest MLX die config.json und führt malicious_script.py direkt aus. Weil MLX außerhalb der Docker-Umgebung ohne Sandbox direkt auf Systemebene läuft, können Angreifer eigenen Code mit den Rechten des Nutzers ausführen können.

Die Entwickler geben an, dass Docker ab Version 4.56.0 bedroht ist. Sie versichern, die Sicherheitsproblematik in der Ausgabe 4.71.0 gelöst zu haben. Bislang gibt es keine Berichte, dass Angreifer die Lücke bereits ausnutzen. Die Version ist bereits seit April dieses Jahres verfügbar. Konkrete Informationen zur Lücke sind aber erst seit Kurzem bekannt. Aktuell ist die Ausgabe 4.75.0, in der die Entwickler unter macOS und Windows verschiedene Bugs ausgebügelt haben. In 4.72.0 haben sie die Linux-Kernel-Sicherheitslücke „Copy Fail“ (CVE-2026-31432 „hoch“) geschlossen. Die Copy-Fail-Schwachstelle wird bereits ausgenutzt und Angreifer kompromittieren darüber Systeme als root-Nutzer. Demzufolge sollten Admins sicherstellen, dass auf ihren Systemen eine aktuelle Ausgabe installiert ist.

Dell AI Factory 2.0: Neue Server mit Nvidia B300 und eigenes Dateisystem

Auf seiner Hausmesse hat Dell neue und erweiterte Integrationen mit Nvidia, Intel, Google, Cohere, Hugging Face, Palantir und ServiceNow vorgestellt. Hinzu kamen Erweiterungen der Dell AI Data Platform, das Dell Data Lakehouse und das neue parallele Dateisystem Project Lightning. Damit soll die KI näher an die Unternehmensdaten gebracht werden. Laut Michael Dell planen 85 Prozent der Firmen, generative KI-Workloads innerhalb der nächsten 24 Monate on-premises auszuführen. Mehr On-Prem-Modelle und Partnerstacks Zentraler Baustein bleibt die Dell AI Factory mit Nvidia. Dell hat dazu Version 2.0 angekündigt. Sie kombiniert neue KI-Server, Netzwerk, Storage, Kühlung, Managed Services und Softwarekomponenten für Training, Inferenz und agentische KI. Dazu gehören unter anderem die PowerEdge-Systeme XE9780L und XE9785L mit jeweils acht Nvidia-B300-Beschleunigern sowie Support für Nvidia RTX Pro 6000. Daneben erweitert Dell die AI Factory um Intel-Gaudi-3-Beschleuniger und den PowerEdge XE9680. Dell positioniert die Plattform als validierte Komplettlösung mit PowerEdge-Servern, PowerScale-Storage, PowerSwitch-Netzwerk, Services und einem Open-Source-Softwarestack, beispielsweise PyTorch, Kubernetes, Grafana und Prometheus. Auch bei Modellen und Agentenplattformen baut Dell das Angebot aus. Gemeinsam mit Google Cloud sollen Gemini-Modelle on-premises bereitgestellt werden. Die Lösung steht exklusiv für Dell-Kunden zur Verfügung und soll mehr Kontrolle über Daten und Infrastruktur ermöglichen. Mit Cohere bringt Dell außerdem die Agentenplattform Cohere North auf die eigene Infrastruktur. North soll sich mit Dell-Storage und allen Datenquellen verbinden lassen. Als validierte On-Prem-Lösungen nennt Dell unter anderem Hugging Face, Palantir, Reflection, ServiceNow und SpaceXAI. Hinzu kommen validierte KI-Lösungen mit Mistral, Fogsphere, Ipsotek, UneeQ Digital Humans und Poolside, die über den Katalog der Dell Automation Platform bereitgestellt werden können. Damit deckt Dell ein breites Spektrum ab: Modelle, Agentenplattformen, Entwicklungswerkzeuge, Workflow-Automation, Computer Vision und verschiedene Formen des Datenzugriffs.

On-Prem-Modelle allein lösen das zentrale Problem allerdings nicht: Agenten, RAG-Anwendungen und domänenspezifische Modelle benötigen Zugriff auf bereinigte, auffindbare und schnell verfügbare Daten. Diese liegen häufig verteilt in File- und Object-Stores, Datenbanken, ERP- und CRM-Systemen oder an Edge-Standorten. Hier setzt Dell mit der erweiterten AI Data Platform an. Sie soll Datenquellen erschließen, Datenflüsse beschleunigen und Unternehmensdaten für KI-Anwendungen besser nutzbar machen. In der Keynote beschrieb Dell-COO Jeff Clarke die Plattform als neues Element der AI Factory. Sie soll helfen, Daten für KI-Workflows vorzubereiten, zu organisieren, zu verarbeiten und zu schützen. Lakehouse, PowerScale und ObjectScale Ein Baustein der AI Data Platform ist das Dell Data Lakehouse. Es kombiniert die Skalierbarkeit und Kosteneffizienz eines Data Lake mit der Struktur und Zuverlässigkeit eines Data Warehouse. Eine föderierte Query Engine soll Daten über verschiedene Umgebungen hinweg auffindbar, analysierbar und verarbeitbar machen. Zudem soll sie helfen, die Orchestrierung für Agenten zu automatisieren. Als Storage-Grundlage nennt Dell PowerScale und ObjectScale. PowerScale ist für File- und Object-Storage für unstrukturierte Daten und KI-Analysen zuständig, ObjectScale S3-kompatible Object-Workloads. Dell hatte bereits kurz vor der Veranstaltung angekündigt, PowerFlex in Dell Exascale Storage einzubinden. Damit deckt die Architektur Blockzugriffe über PowerFlex, File-Workloads über PowerScale und Lightning sowie Object-Storage über ObjectScale ab. Für KI-Anwendungen ist diese Trennung relevant, weil Trainings-, Inferenz- und RAG-Workloads häufig andere Datenpfade benötigen als klassische Unternehmensanwendungen. Während ERP- und Datenbankdaten oft blockbasiert verarbeitet werden, dominieren bei vielen KI-Workloads unstrukturierte Daten, File- und Object-Zugriffe, Vektorindizes, Metadaten und Kontextinformationen. Lightning File System für GPU-Workloads Mit Project Lightning kündigte Dell ein neues paralleles Dateisystem für KI- und HPC-Workloads an. Es ist für hohen Durchsatz, niedrige Latenz und parallele Zugriffe vieler GPU-Knoten ausgelegt. Dell nennt als Einsatzfelder unter anderem Training, Inferenz, Checkpointing, Key-Value-Caching und Metadatenanalysen. Pro Node verspricht Dell 97 GByte/s Random-Read-Durchsatz und 97 Prozent Bandbreiteneffizienz. Die Architektur nutzt RDMA-Netzwerke und unterstützt Nvidia GPUDirect Storage. Damit soll Lightning einen 67 Prozent schnelleren Datenzugriff und einen doppelt so hohen Durchsatz gegenüber dem Wettbewerb erreichen. Zusätzlich arbeitet Dell mit Nvidia an einer hochskalierbaren Caching-Lösung für beschleunigte Inferenz. Sie integriert sich mit Nvidias NIXL-Bibliothek und zielt auf agentische Workloads sowie Reasoning-Modelle mit langen Denk- und Kontextphasen. Dell nennt dafür bis zu 100-mal mehr Tokens pro Sekunde und 80 Prozent geringere Latenz. Eine On-Prem-Plattform für die ganze KI Dell entwickelt seine AI Factory von einer reinen GPU- und Infrastrukturplattform zu einer umfassenden Umgebung für Enterprise-KI. Die Partnerstacks liefern Modelle, Agenten und Integrationen; die AI Data Platform organisiert und beschleunigt den Zugriff auf Unternehmensdaten. Das passt zum On-Prem-Trend: KI soll dort laufen, wo Daten, Latenzanforderungen, Zugriffsrechte und Governance-Vorgaben liegen. Doch ob das in heterogenen Umgebungen funktioniert, hängt weniger vom Modellkatalog als von Datenqualität, Governance, Zugriffsrechten und den tatsächlichen Datenpfaden ab. Dell liefert dafür zwar mehr Bausteine, die eigentliche Arbeit bleibt jedoch die gleiche: Unternehmen müssen wissen, welche Daten sie haben, wie relevant sie im Einzelfall sind und ob sie für KI überhaupt brauchbar sind.

Weiterlesen

Auf seiner Hausmesse hat Dell neue und erweiterte Integrationen mit Nvidia, Intel, Google, Cohere, Hugging Face, Palantir und ServiceNow vorgestellt. Hinzu kamen Erweiterungen der Dell AI Data Platform, das Dell Data Lakehouse und das neue parallele Dateisystem Project Lightning. Damit soll die KI näher an die Unternehmensdaten gebracht werden. Laut Michael Dell planen 85 Prozent der Firmen, generative KI-Workloads innerhalb der nächsten 24 Monate on-premises auszuführen. Mehr On-Prem-Modelle und Partnerstacks Zentraler Baustein bleibt die Dell AI Factory mit Nvidia. Dell hat dazu Version 2.0 angekündigt. Sie kombiniert neue KI-Server, Netzwerk, Storage, Kühlung, Managed Services und Softwarekomponenten für Training, Inferenz und agentische KI. Dazu gehören unter anderem die PowerEdge-Systeme XE9780L und XE9785L mit jeweils acht Nvidia-B300-Beschleunigern sowie Support für Nvidia RTX Pro 6000. Daneben erweitert Dell die AI Factory um Intel-Gaudi-3-Beschleuniger und den PowerEdge XE9680. Dell positioniert die Plattform als validierte Komplettlösung mit PowerEdge-Servern, PowerScale-Storage, PowerSwitch-Netzwerk, Services und einem Open-Source-Softwarestack, beispielsweise PyTorch, Kubernetes, Grafana und Prometheus. Auch bei Modellen und Agentenplattformen baut Dell das Angebot aus. Gemeinsam mit Google Cloud sollen Gemini-Modelle on-premises bereitgestellt werden. Die Lösung steht exklusiv für Dell-Kunden zur Verfügung und soll mehr Kontrolle über Daten und Infrastruktur ermöglichen. Mit Cohere bringt Dell außerdem die Agentenplattform Cohere North auf die eigene Infrastruktur. North soll sich mit Dell-Storage und allen Datenquellen verbinden lassen. Als validierte On-Prem-Lösungen nennt Dell unter anderem Hugging Face, Palantir, Reflection, ServiceNow und SpaceXAI. Hinzu kommen validierte KI-Lösungen mit Mistral, Fogsphere, Ipsotek, UneeQ Digital Humans und Poolside, die über den Katalog der Dell Automation Platform bereitgestellt werden können. Damit deckt Dell ein breites Spektrum ab: Modelle, Agentenplattformen, Entwicklungswerkzeuge, Workflow-Automation, Computer Vision und verschiedene Formen des Datenzugriffs.

On-Prem-Modelle allein lösen das zentrale Problem allerdings nicht: Agenten, RAG-Anwendungen und domänenspezifische Modelle benötigen Zugriff auf bereinigte, auffindbare und schnell verfügbare Daten. Diese liegen häufig verteilt in File- und Object-Stores, Datenbanken, ERP- und CRM-Systemen oder an Edge-Standorten. Hier setzt Dell mit der erweiterten AI Data Platform an. Sie soll Datenquellen erschließen, Datenflüsse beschleunigen und Unternehmensdaten für KI-Anwendungen besser nutzbar machen. In der Keynote beschrieb Dell-COO Jeff Clarke die Plattform als neues Element der AI Factory. Sie soll helfen, Daten für KI-Workflows vorzubereiten, zu organisieren, zu verarbeiten und zu schützen. Lakehouse, PowerScale und ObjectScale Ein Baustein der AI Data Platform ist das Dell Data Lakehouse. Es kombiniert die Skalierbarkeit und Kosteneffizienz eines Data Lake mit der Struktur und Zuverlässigkeit eines Data Warehouse. Eine föderierte Query Engine soll Daten über verschiedene Umgebungen hinweg auffindbar, analysierbar und verarbeitbar machen. Zudem soll sie helfen, die Orchestrierung für Agenten zu automatisieren. Als Storage-Grundlage nennt Dell PowerScale und ObjectScale. PowerScale ist für File- und Object-Storage für unstrukturierte Daten und KI-Analysen zuständig, ObjectScale S3-kompatible Object-Workloads. Dell hatte bereits kurz vor der Veranstaltung angekündigt, PowerFlex in Dell Exascale Storage einzubinden. Damit deckt die Architektur Blockzugriffe über PowerFlex, File-Workloads über PowerScale und Lightning sowie Object-Storage über ObjectScale ab. Für KI-Anwendungen ist diese Trennung relevant, weil Trainings-, Inferenz- und RAG-Workloads häufig andere Datenpfade benötigen als klassische Unternehmensanwendungen. Während ERP- und Datenbankdaten oft blockbasiert verarbeitet werden, dominieren bei vielen KI-Workloads unstrukturierte Daten, File- und Object-Zugriffe, Vektorindizes, Metadaten und Kontextinformationen. Lightning File System für GPU-Workloads Mit Project Lightning kündigte Dell ein neues paralleles Dateisystem für KI- und HPC-Workloads an. Es ist für hohen Durchsatz, niedrige Latenz und parallele Zugriffe vieler GPU-Knoten ausgelegt. Dell nennt als Einsatzfelder unter anderem Training, Inferenz, Checkpointing, Key-Value-Caching und Metadatenanalysen. Pro Node verspricht Dell 97 GByte/s Random-Read-Durchsatz und 97 Prozent Bandbreiteneffizienz. Die Architektur nutzt RDMA-Netzwerke und unterstützt Nvidia GPUDirect Storage. Damit soll Lightning einen 67 Prozent schnelleren Datenzugriff und einen doppelt so hohen Durchsatz gegenüber dem Wettbewerb erreichen. Zusätzlich arbeitet Dell mit Nvidia an einer hochskalierbaren Caching-Lösung für beschleunigte Inferenz. Sie integriert sich mit Nvidias NIXL-Bibliothek und zielt auf agentische Workloads sowie Reasoning-Modelle mit langen Denk- und Kontextphasen. Dell nennt dafür bis zu 100-mal mehr Tokens pro Sekunde und 80 Prozent geringere Latenz. Eine On-Prem-Plattform für die ganze KI Dell entwickelt seine AI Factory von einer reinen GPU- und Infrastrukturplattform zu einer umfassenden Umgebung für Enterprise-KI. Die Partnerstacks liefern Modelle, Agenten und Integrationen; die AI Data Platform organisiert und beschleunigt den Zugriff auf Unternehmensdaten. Das passt zum On-Prem-Trend: KI soll dort laufen, wo Daten, Latenzanforderungen, Zugriffsrechte und Governance-Vorgaben liegen. Doch ob das in heterogenen Umgebungen funktioniert, hängt weniger vom Modellkatalog als von Datenqualität, Governance, Zugriffsrechten und den tatsächlichen Datenpfaden ab. Dell liefert dafür zwar mehr Bausteine, die eigentliche Arbeit bleibt jedoch die gleiche: Unternehmen müssen wissen, welche Daten sie haben, wie relevant sie im Einzelfall sind und ob sie für KI überhaupt brauchbar sind.

China verwandelt sein altes Kameranetz in einen Apparat für automatisierte Massenüberwachung

the_decoder·2026-05-27GesellschaftSicherheitAnwendungen

Kurz & Knapp

- Lokale Behörden in China rüsten ihr landesweites Überwachungssystem auf, indem sie Kameras mit Computer Vision und Sprachmodellen von Herstellern wie Hikvision und Huawei ausstatten.

- Die neuen Systeme ermöglichen es der Polizei, Videomaterial gezielt per Texteingabe zu durchsuchen, und können automatisch Auffälligkeiten wie Menschenansammlungen, unbefugten Zutritt oder suizidales Verhalten erkennen.

- Die Modernisierung folgt einer sicherheitspolitischen Direktive aus dem Jahr 2024 zur Vorhersage potenzieller Unruhen und weckt bei Menschenrechtsexperten die Sorge vor einer beispiellosen Überwachung des menschlichen Verhaltens in großem Maßstab.

Lokale Behörden in China statten Millionen alter Kameras mit Computer Vision und Sprachmodellen aus. Polizisten sollen Videomaterial künftig per Texteingabe durchsuchen und Unruhen vorhersagen.

China modernisiert sein landesweites Überwachungssystem mit generativer KI und gibt Polizeibehörden damit deutlich mehr Befugnisse zur automatisierten Verhaltensanalyse und Vorhersage potenzieller Unruhen. Das berichtet die Financial Times nach Auswertung von mehr als einem Dutzend Ausschreibungsdokumenten und Gesprächen mit Branchenkennern.

Gesichtserkennung, Kennzeichenscans und klassische Computer Vision setzt China seit Mitte der 2010er-Jahre flächendeckend ein. Das alte Netz war jedoch auf die Identifikation einzelner Personen ausgelegt, lief auf veralteter Hardware und schickte Material zur Auswertung in zentrale Rechenzentren. "Chinas altes Überwachungssystem ist reaktiv. Es ist nicht gut darin, die Absichten von Personen zu erahnen und zu verstehen, die nicht ausdrücklich überwacht werden", sagt Minxin Pei vom Claremont McKenna College gegenüber der FT.

Hersteller wie Hikvision und Huawei liefern laut dem Bericht inzwischen Kameras mit integrierter Computer Vision und Sprachmodellen. Die Systeme sollen erratisches Fahren, Menschenansammlungen, unbefugten Zutritt oder suizidales Verhalten an Brücken erkennen und Alarme auslösen. Die neueste Hikvision-Generation erlaubt es laut dem Bericht Beamten, Aufnahmen per Texteingabe zu durchsuchen, etwa nach "einer Frau mit rotem Hut".

"Die Polizei muss das Material nicht mehr manuell sichten. Sie füttert das System mit einem Text-Prompt, und es findet die Aufnahmen", sagte ein Hikvision-Manager der FT. Hikvision selbst erklärte, die Produkte digitalisierten "Routineaufgaben, die zuvor stark auf manueller Überprüfung beruhten".

Kleinere Budgets, gezielter Ausbau

Ein Beschaffungsdokument aus Yaodu in Sichuan sieht laut der FT etwa 175 HD-Kameras mit "intelligenter Videoanalyse" vor. Eine Ausschreibung der Polizei in Datong listet Hikvision-Kameras, die Geschlecht, Körperhaltung und Kleidung identifizieren. Die ersten Einsätze konzentrierten sich auf dicht besiedelte Stadtgebiete sowie Zonen um Militär- und Regierungsgebäude. Andere Behörden behalten bereits installierte Kameras, tauschen aber die Zwischenserver gegen "AI PCs" aus, die Video lokal verarbeiten und auch Cloud-Kosten senken sollen.

Die Aufrüstung folgt einer Direktive von Minister für öffentliche Sicherheit Wang Xiaohong aus dem Jahr 2024, die nach einer Serie von Gewalttaten erlassen wurde, die Fachleute auf eine durch Pandemielockdowns und schwächelnde Wirtschaft verstärkte mentale Gesundheitskrise zurückführen. Diese Vorfälle hätten "die Grenzen des derzeitigen Überwachungsapparats" offengelegt, so Pei. Maya Wang von Human Rights Watch warnt, die "Philosophie hinter Chinas Überwachungssystem wird umfassender". Generative KI und Computer Vision verschafften den Behörden "eine beispiellose Kapazität, Verhalten in großem Maßstab zu überwachen".

In einem Policy-Papier warnte Anthropic kürzlich, dass China bei weiter schließender Compute-Lücke bis 2028 nicht nur technologisch aufholen, sondern auch KI-gestützte Überwachung und Repression skalieren könnte.

Weiterlesen

Kurz & Knapp

- Lokale Behörden in China rüsten ihr landesweites Überwachungssystem auf, indem sie Kameras mit Computer Vision und Sprachmodellen von Herstellern wie Hikvision und Huawei ausstatten.

- Die neuen Systeme ermöglichen es der Polizei, Videomaterial gezielt per Texteingabe zu durchsuchen, und können automatisch Auffälligkeiten wie Menschenansammlungen, unbefugten Zutritt oder suizidales Verhalten erkennen.

- Die Modernisierung folgt einer sicherheitspolitischen Direktive aus dem Jahr 2024 zur Vorhersage potenzieller Unruhen und weckt bei Menschenrechtsexperten die Sorge vor einer beispiellosen Überwachung des menschlichen Verhaltens in großem Maßstab.

Lokale Behörden in China statten Millionen alter Kameras mit Computer Vision und Sprachmodellen aus. Polizisten sollen Videomaterial künftig per Texteingabe durchsuchen und Unruhen vorhersagen.

China modernisiert sein landesweites Überwachungssystem mit generativer KI und gibt Polizeibehörden damit deutlich mehr Befugnisse zur automatisierten Verhaltensanalyse und Vorhersage potenzieller Unruhen. Das berichtet die Financial Times nach Auswertung von mehr als einem Dutzend Ausschreibungsdokumenten und Gesprächen mit Branchenkennern.

Gesichtserkennung, Kennzeichenscans und klassische Computer Vision setzt China seit Mitte der 2010er-Jahre flächendeckend ein. Das alte Netz war jedoch auf die Identifikation einzelner Personen ausgelegt, lief auf veralteter Hardware und schickte Material zur Auswertung in zentrale Rechenzentren. "Chinas altes Überwachungssystem ist reaktiv. Es ist nicht gut darin, die Absichten von Personen zu erahnen und zu verstehen, die nicht ausdrücklich überwacht werden", sagt Minxin Pei vom Claremont McKenna College gegenüber der FT.

Hersteller wie Hikvision und Huawei liefern laut dem Bericht inzwischen Kameras mit integrierter Computer Vision und Sprachmodellen. Die Systeme sollen erratisches Fahren, Menschenansammlungen, unbefugten Zutritt oder suizidales Verhalten an Brücken erkennen und Alarme auslösen. Die neueste Hikvision-Generation erlaubt es laut dem Bericht Beamten, Aufnahmen per Texteingabe zu durchsuchen, etwa nach "einer Frau mit rotem Hut".

"Die Polizei muss das Material nicht mehr manuell sichten. Sie füttert das System mit einem Text-Prompt, und es findet die Aufnahmen", sagte ein Hikvision-Manager der FT. Hikvision selbst erklärte, die Produkte digitalisierten "Routineaufgaben, die zuvor stark auf manueller Überprüfung beruhten".

Kleinere Budgets, gezielter Ausbau

Ein Beschaffungsdokument aus Yaodu in Sichuan sieht laut der FT etwa 175 HD-Kameras mit "intelligenter Videoanalyse" vor. Eine Ausschreibung der Polizei in Datong listet Hikvision-Kameras, die Geschlecht, Körperhaltung und Kleidung identifizieren. Die ersten Einsätze konzentrierten sich auf dicht besiedelte Stadtgebiete sowie Zonen um Militär- und Regierungsgebäude. Andere Behörden behalten bereits installierte Kameras, tauschen aber die Zwischenserver gegen "AI PCs" aus, die Video lokal verarbeiten und auch Cloud-Kosten senken sollen.

Die Aufrüstung folgt einer Direktive von Minister für öffentliche Sicherheit Wang Xiaohong aus dem Jahr 2024, die nach einer Serie von Gewalttaten erlassen wurde, die Fachleute auf eine durch Pandemielockdowns und schwächelnde Wirtschaft verstärkte mentale Gesundheitskrise zurückführen. Diese Vorfälle hätten "die Grenzen des derzeitigen Überwachungsapparats" offengelegt, so Pei. Maya Wang von Human Rights Watch warnt, die "Philosophie hinter Chinas Überwachungssystem wird umfassender". Generative KI und Computer Vision verschafften den Behörden "eine beispiellose Kapazität, Verhalten in großem Maßstab zu überwachen".

In einem Policy-Papier warnte Anthropic kürzlich, dass China bei weiter schließender Compute-Lücke bis 2028 nicht nur technologisch aufholen, sondern auch KI-gestützte Überwachung und Repression skalieren könnte.

heise-Angebot: CLC 2026: KI-Agenten, Platform Engineering und Software Delivery im Fokus

Bei der von iX und dpunkt.verlag organisierten Konferenz CLC 2026 dreht sich vom 10. bis 12. November in Mannheim alles um die Bereiche Developer Experience, Platform Engineering und Software Delivery. Ein besonderer Fokus liegt in diesem Jahr darauf, wie Agentic AI die Arbeit von Senior-Softwareentwicklern, Software-Architekten, DevOps- und Platform Engineers verändert und wie sich digitale Souveränität nachhaltig erreichen lässt.

Die Veranstaltung beginnt am Dienstag, dem 10. November, mit drei ganztägigen Vor-Ort-Workshops. Daniel Bodky (NETWAYS) führt unter dem Titel „Von Zero Observability zu Zero-Code Observability“ in die praktische Arbeit mit OpenTelemetry ein. Mathias Tausig und Andreas Boll (SBA Research) widmen sich den „Container Security Fundamentals“, während Hossein Salahi (Liquid Reply) in seinem Workshop den Aufbau KI-nativer Plattformen behandelt.

KI-Agenten als roter Faden durch die Konferenztage

Den inhaltlichen Auftakt in das deutsch-englische Vortragsprogramm am Mittwoch, dem 11. November, bildet die Keynote „Why SREs and AI Agents Are a Perfect Match – Real demos, real infrastructure, real failures“ von Paul Stack (System Initiative). Die anschließenden Tracks zeigen, dass KI-Agenten und ihr Zusammenspiel mit klassischen Delivery-Praktiken einen Schwerpunkt der Konferenz bilden. Steffen Schluff und Thorsten Maier (Accenture) sprechen unter dem Titel „Weniger tippen, mehr denken“ über den Einfluss von KI-Agenten auf die Developer Experience. Robert Hoffmann und Christian Denich (Amazon Web Services) berichten in „From AI-frustrated to AI-native – The Amazon Story So Far“ über die interne Transformation des Konzerns.

Rainer Stropek (software architects) argumentiert in „From DevOps to AgentOps: Why Rock-Solid CI/CD Makes You AI-Ready“, dass solide Pipelines die Voraussetzung für den produktiven Einsatz von Agenten seien. Prerit Munjal (Groupon) verknüpft KI mit dem Abbau technischer Schulden („AI at the Door, Turning ‚Tech Debt Panic‘ into ‚Tech Debt Repairs‘“). Mirko Böttcher und Oliver Zeigermann (Techniker Krankenkasse) räumen unter „Wie erkläre ich es meinem Chef?“ mit Mythen und Missverständnissen rund um GenAI, LLMs und Agenten auf. Benjamin Hofmann (Hyground) erläutert in „How an AI SRE agent can manage 20,000 workloads“ den Einsatz eines SRE-Agenten im Großbetrieb. Ergänzend ist ein „Panel on AI in Software Delivery“ angesetzt.

Am Donnerstag schildern Oliver Nocon und Lukas Heimann (SAP) im Praxisbericht „Vibe Coding im Konzern“, wie SAP KI-gestützte Entwicklung skaliert, während Mario-Leander Reimer (QAware) mit „Zero Trust Agents“ zeigt, wie sich KI-Workloads mit OPA und Kubernetes absichern lassen.

Platform Engineering, Multi-Cluster-Betrieb und GitOps

Ein zweiter inhaltlicher Block widmet sich dem Aufbau und Betrieb interner Entwicklerplattformen. Dominik Schmidle (Giant Swarm) stellt in „What Platform-as-a-Product Actually Means (And What Most Teams Get Wrong)“ Produktdenken in der Plattformentwicklung in den Mittelpunkt. Sönke Sothmann und Johannes Koch (FICO) behandeln „Kubernetes Custom Resources as Your Platform API: Declarative Self-Service with Crossplane“. Alexander Troppmann und Bruno Margula (Carl ZEISS) berichten unter „Custom-build Platform Tooling mit AI“ darüber, was in der Praxis funktioniert und was nicht. Lian Li widmet sich dem Inner Sourcing einer Internal Developer Platform und Tobias Hauser (Vodafone) beschreibt mit „Vom Betreiber zum Plattformbauer“, wie IT-Operations zur Plattformorganisation wird.

Im Kubernetes-Umfeld erläutert Nicholas Dille (Haufe) die Cluster API, Marcelo Castro (intersoft) zeigt anhand von ArgoCD, Kured und Renovate ein „wartungsarmes Kubernetes on-prem“. Manuel Zapf (codecentric) stellt in „From Clusters to Control Planes“ Ansätze für Multi-Tenancy zur Diskussion, Robin Afflerbach behandelt „Zentrale Golden Paths für Cluster-Flotten“ und das Multi-Cluster-fähige Erweitern bestehender Controller. Thorsten Wussow (Slix) widmet sich dem Flux Operator als Weg zu „GitOps im Autopilot-Modus“ und Christian Fritz (QAware) bewertet die Kubernetes Gateway API in der Praxis. Stefan Nachtrab und Mirabell Büscher (adorsys) sprechen über den Übergang „Vom Multi-Cloud-Chaos zum Knowledge Graph“ inklusive FinOps- und Compliance-Aspekten.

Sicherheit in Pipelines, Lieferkette und Laufzeit

Security zieht sich quer durch das Programm. Sujeevan Vijayakumaran (Friday Deployments) bezeichnet in seinem Talk die CI/CD-Pipeline als „Einfallstor“. Moritz Johner (Form3) ordnet „CVE Remediation“ als Platform-Engineering-Aufgabe ein. Bertram Vogel (codecentric) plädiert mit „Move Slow to Secure Things“ für einen Update-Cooldown in Projekten. Marius Shekow (SprintEins) erklärt Container Image Signing und Attestations, Daniel Bodky (NETWAYS) stellt Echtzeit-Threat-Detection mit Falco vor.

Hinzu kommen Beiträge zu Architektur und Organisation: Miriam Greis (adorsys) typisiert in „Team Topologies in the Wild“ Teamstereotypen, Daniel Raniz Raneland (factor10) widmet sich der Modernisierung von Legacy-Systemen mit dem Strangler-Fig-Pattern, Tom Asel (tangible concepts) fordert unter „Continuous Architecture“ weniger Reden und mehr Umsetzung. Ludovic Toison (Opensend) berichtet über das Skalieren von Engineering-Teams über Kontinente hinweg. Observability adressieren Tobias Hauser (Vodafone) mit einem Personas-basierten Ansatz sowie Timon Engelke und Christian Rohmann (inovex), die mit eBPF unsichtbaren Traffic in Kubernetes aufdecken wollen. Elena Kulgavaya (Source2Sea) hinterfragt mit „Your Pipeline Is Ready. Your Tests Are Not.“ den Reifegrad gängiger Teststrategien, Max Schmidt (Liquid Reply) zeigt metrikgetriebene Canary-Rollouts. Christopher Haar (upbound) und Johannes Koch (FICO) beleuchten unter „LLM FinOps“ Fehler beim GPU-Kostenvergleich.

Digitale Souveränität und Open Source

Einen weiteren Strang bildet die Diskussion um digitale Souveränität. David Sterz argumentiert in seinem Vortrag, warum Europas Cloud-Markt souverän und dezentralisiert sein sollte. Stefan Nachtrab (adorsys) liefert mit „Von GitHub nach Codeberg“ einen Erfahrungsbericht zum Plattformwechsel. Sandra Parsick und Sebastian T. Tiemann (Open Elements) hinterfragen unter „Open Source gibt es doch gratis! Warum dafür zahlen?“ verbreitete Annahmen zur Finanzierung freier Software. Ergänzend ist eine Paneldiskussion zur digitalen Souveränität angesetzt.

Maren Afflerbach (Sixt) widmet sich mit „Our Monolith has no Owners“ der Frage, wie Runtime-Analyse Abhängigkeiten in monolithischen Systemen sichtbar macht. Viktor Didenchuk (JPMorgan) thematisiert unter „Notified ≠ Understood“ die Kommunikation von Plattform-Updates an die nutzenden Teams. Nikita Golovko (Siemens) skizziert in „From Data to Decisions“ einen domänengetriebenen Weg zu industrieller KI.

Tickets zum Frühbucherpreis sichern

Mit der Freigabe des Konferenzprogramms können sich Interessierte ab sofort Tickets zum Frühbucherpreis mit 200 Euro Rabatt sichern. Bis zum 22. September kostet das Konferenzticket 1149 Euro (alle Preise zzgl. MwSt.), für das Kombiticket aus Konferenz und 1-Tages-Workshop fallen 1699 Euro an. Die ganztägigen Workshops lassen sich einzeln zum Preis von 649 Euro buchen. Teams oder Gruppen ab drei Personen erhalten im Ticketshop zudem automatisch mindestens 15 Prozent Rabatt. Schülerinnen und Schüler, Studierende und Hochschulangehörige erhalten auf Anfrage ebenfalls einen Nachlass.

Wer über den Fortgang der Konferenz informiert bleiben möchte, kann sich auf der CLC-Website für den Newsletter registrieren oder den Veranstaltern auf LinkedIn folgen – der Hashtag lautet #CLC_Conf.

Weiterlesen

Bei der von iX und dpunkt.verlag organisierten Konferenz CLC 2026 dreht sich vom 10. bis 12. November in Mannheim alles um die Bereiche Developer Experience, Platform Engineering und Software Delivery. Ein besonderer Fokus liegt in diesem Jahr darauf, wie Agentic AI die Arbeit von Senior-Softwareentwicklern, Software-Architekten, DevOps- und Platform Engineers verändert und wie sich digitale Souveränität nachhaltig erreichen lässt.

Die Veranstaltung beginnt am Dienstag, dem 10. November, mit drei ganztägigen Vor-Ort-Workshops. Daniel Bodky (NETWAYS) führt unter dem Titel „Von Zero Observability zu Zero-Code Observability“ in die praktische Arbeit mit OpenTelemetry ein. Mathias Tausig und Andreas Boll (SBA Research) widmen sich den „Container Security Fundamentals“, während Hossein Salahi (Liquid Reply) in seinem Workshop den Aufbau KI-nativer Plattformen behandelt.

KI-Agenten als roter Faden durch die Konferenztage

Den inhaltlichen Auftakt in das deutsch-englische Vortragsprogramm am Mittwoch, dem 11. November, bildet die Keynote „Why SREs and AI Agents Are a Perfect Match – Real demos, real infrastructure, real failures“ von Paul Stack (System Initiative). Die anschließenden Tracks zeigen, dass KI-Agenten und ihr Zusammenspiel mit klassischen Delivery-Praktiken einen Schwerpunkt der Konferenz bilden. Steffen Schluff und Thorsten Maier (Accenture) sprechen unter dem Titel „Weniger tippen, mehr denken“ über den Einfluss von KI-Agenten auf die Developer Experience. Robert Hoffmann und Christian Denich (Amazon Web Services) berichten in „From AI-frustrated to AI-native – The Amazon Story So Far“ über die interne Transformation des Konzerns.

Rainer Stropek (software architects) argumentiert in „From DevOps to AgentOps: Why Rock-Solid CI/CD Makes You AI-Ready“, dass solide Pipelines die Voraussetzung für den produktiven Einsatz von Agenten seien. Prerit Munjal (Groupon) verknüpft KI mit dem Abbau technischer Schulden („AI at the Door, Turning ‚Tech Debt Panic‘ into ‚Tech Debt Repairs‘“). Mirko Böttcher und Oliver Zeigermann (Techniker Krankenkasse) räumen unter „Wie erkläre ich es meinem Chef?“ mit Mythen und Missverständnissen rund um GenAI, LLMs und Agenten auf. Benjamin Hofmann (Hyground) erläutert in „How an AI SRE agent can manage 20,000 workloads“ den Einsatz eines SRE-Agenten im Großbetrieb. Ergänzend ist ein „Panel on AI in Software Delivery“ angesetzt.

Am Donnerstag schildern Oliver Nocon und Lukas Heimann (SAP) im Praxisbericht „Vibe Coding im Konzern“, wie SAP KI-gestützte Entwicklung skaliert, während Mario-Leander Reimer (QAware) mit „Zero Trust Agents“ zeigt, wie sich KI-Workloads mit OPA und Kubernetes absichern lassen.

Platform Engineering, Multi-Cluster-Betrieb und GitOps

Ein zweiter inhaltlicher Block widmet sich dem Aufbau und Betrieb interner Entwicklerplattformen. Dominik Schmidle (Giant Swarm) stellt in „What Platform-as-a-Product Actually Means (And What Most Teams Get Wrong)“ Produktdenken in der Plattformentwicklung in den Mittelpunkt. Sönke Sothmann und Johannes Koch (FICO) behandeln „Kubernetes Custom Resources as Your Platform API: Declarative Self-Service with Crossplane“. Alexander Troppmann und Bruno Margula (Carl ZEISS) berichten unter „Custom-build Platform Tooling mit AI“ darüber, was in der Praxis funktioniert und was nicht. Lian Li widmet sich dem Inner Sourcing einer Internal Developer Platform und Tobias Hauser (Vodafone) beschreibt mit „Vom Betreiber zum Plattformbauer“, wie IT-Operations zur Plattformorganisation wird.

Im Kubernetes-Umfeld erläutert Nicholas Dille (Haufe) die Cluster API, Marcelo Castro (intersoft) zeigt anhand von ArgoCD, Kured und Renovate ein „wartungsarmes Kubernetes on-prem“. Manuel Zapf (codecentric) stellt in „From Clusters to Control Planes“ Ansätze für Multi-Tenancy zur Diskussion, Robin Afflerbach behandelt „Zentrale Golden Paths für Cluster-Flotten“ und das Multi-Cluster-fähige Erweitern bestehender Controller. Thorsten Wussow (Slix) widmet sich dem Flux Operator als Weg zu „GitOps im Autopilot-Modus“ und Christian Fritz (QAware) bewertet die Kubernetes Gateway API in der Praxis. Stefan Nachtrab und Mirabell Büscher (adorsys) sprechen über den Übergang „Vom Multi-Cloud-Chaos zum Knowledge Graph“ inklusive FinOps- und Compliance-Aspekten.

Sicherheit in Pipelines, Lieferkette und Laufzeit

Security zieht sich quer durch das Programm. Sujeevan Vijayakumaran (Friday Deployments) bezeichnet in seinem Talk die CI/CD-Pipeline als „Einfallstor“. Moritz Johner (Form3) ordnet „CVE Remediation“ als Platform-Engineering-Aufgabe ein. Bertram Vogel (codecentric) plädiert mit „Move Slow to Secure Things“ für einen Update-Cooldown in Projekten. Marius Shekow (SprintEins) erklärt Container Image Signing und Attestations, Daniel Bodky (NETWAYS) stellt Echtzeit-Threat-Detection mit Falco vor.

Hinzu kommen Beiträge zu Architektur und Organisation: Miriam Greis (adorsys) typisiert in „Team Topologies in the Wild“ Teamstereotypen, Daniel Raniz Raneland (factor10) widmet sich der Modernisierung von Legacy-Systemen mit dem Strangler-Fig-Pattern, Tom Asel (tangible concepts) fordert unter „Continuous Architecture“ weniger Reden und mehr Umsetzung. Ludovic Toison (Opensend) berichtet über das Skalieren von Engineering-Teams über Kontinente hinweg. Observability adressieren Tobias Hauser (Vodafone) mit einem Personas-basierten Ansatz sowie Timon Engelke und Christian Rohmann (inovex), die mit eBPF unsichtbaren Traffic in Kubernetes aufdecken wollen. Elena Kulgavaya (Source2Sea) hinterfragt mit „Your Pipeline Is Ready. Your Tests Are Not.“ den Reifegrad gängiger Teststrategien, Max Schmidt (Liquid Reply) zeigt metrikgetriebene Canary-Rollouts. Christopher Haar (upbound) und Johannes Koch (FICO) beleuchten unter „LLM FinOps“ Fehler beim GPU-Kostenvergleich.

Digitale Souveränität und Open Source

Einen weiteren Strang bildet die Diskussion um digitale Souveränität. David Sterz argumentiert in seinem Vortrag, warum Europas Cloud-Markt souverän und dezentralisiert sein sollte. Stefan Nachtrab (adorsys) liefert mit „Von GitHub nach Codeberg“ einen Erfahrungsbericht zum Plattformwechsel. Sandra Parsick und Sebastian T. Tiemann (Open Elements) hinterfragen unter „Open Source gibt es doch gratis! Warum dafür zahlen?“ verbreitete Annahmen zur Finanzierung freier Software. Ergänzend ist eine Paneldiskussion zur digitalen Souveränität angesetzt.

Maren Afflerbach (Sixt) widmet sich mit „Our Monolith has no Owners“ der Frage, wie Runtime-Analyse Abhängigkeiten in monolithischen Systemen sichtbar macht. Viktor Didenchuk (JPMorgan) thematisiert unter „Notified ≠ Understood“ die Kommunikation von Plattform-Updates an die nutzenden Teams. Nikita Golovko (Siemens) skizziert in „From Data to Decisions“ einen domänengetriebenen Weg zu industrieller KI.

Tickets zum Frühbucherpreis sichern

Mit der Freigabe des Konferenzprogramms können sich Interessierte ab sofort Tickets zum Frühbucherpreis mit 200 Euro Rabatt sichern. Bis zum 22. September kostet das Konferenzticket 1149 Euro (alle Preise zzgl. MwSt.), für das Kombiticket aus Konferenz und 1-Tages-Workshop fallen 1699 Euro an. Die ganztägigen Workshops lassen sich einzeln zum Preis von 649 Euro buchen. Teams oder Gruppen ab drei Personen erhalten im Ticketshop zudem automatisch mindestens 15 Prozent Rabatt. Schülerinnen und Schüler, Studierende und Hochschulangehörige erhalten auf Anfrage ebenfalls einen Nachlass.

Wer über den Fortgang der Konferenz informiert bleiben möchte, kann sich auf der CLC-Website für den Newsletter registrieren oder den Veranstaltern auf LinkedIn folgen – der Hashtag lautet #CLC_Conf.

Mittwoch: Starlink-Verteuerung für Drohnen, Spotify liest aus Zeitschriften vor

25.000 US-Dollar für einige Minuten Starlink-Anbindung kassiert SpaceX neuerdings vom US-Militär. Es hat keine Alternative für die Steuerung von Drohnen im Kampfgebiet. Doch die Versorgung der iranischen Bevölkerung mit Mobilfunk per Starlink war der US-Regierung zu teuer. Nicht teurer wird Spotify, obwohl der Streamingdienst neben Büchern nun auch Zeitschriftenartikel vorliest. Über 650 englischsprachige Beiträge bekannter Magazine gehören jetzt zur Hörbuch-Bibliothek. Damit sollen Nutzer an das Hören längerer Texte gewöhnt werden, um sie langfristig für Hörbücher zu gewinnen. Derweil sperren immer mehr Nachrichtenseiten die Wayback Machine aus – nicht nur in den USA. Denn sie befürchten, dass der bekannte Archivdienst fürs KI-Training benutzt wird. Eine Studie zeigt, dass die Zahl der Blockierer zuletzt rasant gewachsen ist – die wichtigsten Meldungen im kurzen Überblick.

Kamikazedrohnen des US-Militärs fliegen für ein paar Minuten oder höchstens Stunden, bevor sie mit einer tödlichen Explosion in ihr Ziel auf dem Boden krachen. Für die zur Steuerung notwendige Starlink-Anbindung hat das US-Militär bislang 5000 US-Dollar bezahlt, pro Flugdrohne. Während des Angriffs auf den Iran konnte Starlink-Betreiber SpaceX seine Marktmacht ausspielen und den Preis auf fast 25.000 US-Dollar verfünffachen, wie jetzt unter Berufung auf Dokumente des US-Verteidigungsministeriums und zwei namentlich nicht genannte Eingeweihte berichtet wird. Der Preis von knapp 25.000 Dollar ist demnach der monatliche Tarif für Starlink-Terminals in Flugzeugen. SpaceX setzt ihn jetzt auch für Kamikazedrohnen durch: Neuer Starlink-Tarif von 25.000 Dollar für US-Kamikazedrohnen. Keine Preiserhöhung gibt es bei Spotify, obwohl der Streamingdienst sein Angebot erweitert hat. Denn Spotify hat etliche Zeitschriftenartikel in die eigene Hörbuch-Bibliothek aufgenommen. Nutzer können sich jetzt aus bekannten Magazinen wie Rolling Stone, The Atlantic, Vogue, Variety, Billboard, GQ, Wired und Vanity Fair vorlesen lassen. Zu Beginn stehen mehr als 650 englischsprachige Artikel zur Auswahl. Das ist allerdings nicht weltweit verfügbar, sondern auf Regionen beschränkt, in denen auch Hörbücher angeboten werden. Das Vorlesen der Zeitschriftenartikel ist im Premium-Abo enthalten. Gratis-Nutzer können einzelne Beiträge zudem für 1,99 US-Dollar erwerben. Es gibt sowohl menschliche als auch digitale Vorleser: Spotify erweitert Hörangebot um das Vorlesen längerer Artikel aus Zeitschriften. Im Kampf gegen die nicht genehmigte Nutzung von Inhalten für das Training von KI-Modellen gerät das Internet Archive immer mehr zwischen die Fronten, und die Wayback Machine droht zum Kollateralschaden zu werden. Das legt eine Analyse des Nieman Journalism Lab an der Harvard University nahe, laut der immer mehr Nachrichtenseiten Crawler der Archivseite aussperren. Demnach schränken inzwischen mehr als 340 lokale Nachrichtenseiten „den Zugriff des Internet Archive auf ihre Artikel sowie deren Archivierung“ ein, aber auch überregionale und internationale Medien wie die New York Times beteiligen sich demnach. Europäische Medien finden sich ebenfalls auf der Liste, derzeit aber noch keine aus Deutschland: Im Kampf dem KI-Training sperren immer mehr Nachrichtenseiten Wayback Machine aus. Lange hat BMW die Einführung von Elektroautos auf Basis der Neuen Klasse medial vorbereitet. Die ungenierte Nutzung eines so bedeutsamen Begriffs aus der eigenen Firmen-Historie sollte verdeutlichen, wie groß der Schritt ist, den BMW hier vollzieht. Die Marke wollte ein Statement setzen, und liefert das durchaus auch. Im Test zeigte der BMW iX3 zahlreiche Stärken und nur wenige Schwächen, was für die Bayern an zwei Stellen zu einem Problem wird, etwa bei der Differenzierung der angebotenen Modelle iX3 40 und 50, wobei das Basismodell schon einen Einstiegspreis von 63.400 Euro trägt. Letztendlich zeigt sich, dass der iX3 zwar ein kostspieliges Elektroauto ist, aber auch eines der besten, die es momentan zu kaufen gibt: E-SUV BMW iX3 im Test – mehr Reichweite als ich. In gänzlich anderen Preissphären bewegt sich Ferraris erstes batterieelektrisches Modell. Das Elektroauto namens „Luce“ ist für Ferrari nicht einfach ein weiteres Angebot, es ist natürlich auch ein Wagnis angesichts der Tifosi, die sich schon immer und ganz mehrheitlich über die vielzylindrigen Verbrenner begeisterten – mehr als viele Anwohner selbstredend. Doch statt einfach einen elektrischen Ferrari Purosangue zu kreieren, würde dem Selbstverständnis der Marke aus Maranello widersprechen. Der Ferrari Luce ist ein geräumiger, 772 kW leistender GT-Crossover, bei dessen Design Ferrari Unterstützung von Apple-Designern gesucht hat. Das wird vor allem im aufgeräumten und schlichten Interieur mit abgerundeten Kanten sichtbar: Luxus-Elektroauto Ferrari Luce für über 500.000 Euro. Ferrari )Auch noch wichtig: - „Star Citizen“ wird seit 14 Jahren entwickelt, „Squadron 42“ nur unwesentlich weniger. Finanziert wird das von Fans, inzwischen mit mehr als einer Milliarde durch Crowdfunding: Eine Milliarde US-Dollar für „Star Citizen“ und „Squadron 42“. - AdminLTE erscheint in Version 4.0 – mit komplettem Umbau auf Bootstrap 5.3, ohne jQuery und mit 18 neuen Demo-Seiten: Neustart für das Dashboard-Framework AdminLTE 4.0. - Wie lange können Roboter am Stück arbeiten? Figure AI hat es getestet. Aus einer Acht-Stunden-Schicht wurden am Ende acht Tage: Figure AI lässt seine Roboter 200 Stunden am Stück arbeiten. - Epic hat erstmals die Unreal Engine 6 in „Rocket League“ angeteasert. Ein Release-Termin und eine Feature-Liste fehlen: Epic zeigt erste Szenen in „Rocket League“ mit Unreal Engine 6. - Mit „007 First Light“ schafft es James Bond zum ersten Mal seit 2012 wieder in ein Videospiel. Die Wartezeit hat sich gelohnt. Das zeigt „007 First Light“ im Test: Das beste Bond-Spiel seit „Goldeneye“. - Mit iPhone 16e, 17e und Air hat Apple mit den eigenen C1- und C1X-Modems neue Datenschutzfeatures eingeführt. Das steckt hinter der Funktion „Genauen Standort beschränken“: Was Apples Mobilfunksicherheitsfunktion kann. - Laut neuesten Forschungen schrumpft nicht nur in entwickelten Industrieländern die Geburtenrate, sondern global. Wir haben ein paar aktuelle Zahlen dazu: Nicht nur für Industrieländer sind 2,1 Kinder pro Familie immer schwerer erreichbar. - Eine vorinstallierte App auf Motorola-Smartphones leitet Amazon-Aufrufe um und injiziert Affiliate-Codes. Betroffene können die App deaktivieren auf Motorola-Smartphones: Vorinstallierte App schleust offenbar Affiliate-Links ein. - Ende Juni 2026 ist Schluss für Ubuntu Pastebin. Zahllose Links könnten ins Leere laufen. Ein Ersatzdienst ist bislang nicht angekündigt nach dem Aus für Ubuntu Pastebin: Abschaltung Ende Juni 2026. - In aktuellen Versionen von NGINX Open Source und NGINX Plus haben die Entwickler eine Sicherheitslücke geschlossen: DoS- und Schadcode-Attacken auf NGINX-Webserver vorstellbar. - Ab Ende September 2026 synchronisiert die Samsung-Galerie-App keine Fotos mehr mit OneDrive. Nutzer müssen für Backups auf die OneDrive-App umstellen: Samsungs Galerie-App verliert OneDrive-Synchronisierung. - Nach der Ankündigung einer Remote-Funktion über die ChatGPT-App legt OpenAI noch einmal nach. Codex soll den Mac via Computer Use im Locked-Modus kontrollieren: OpenAI Codex steuert Mac auch in gesperrtem Zustand. - Huawei hat aufgrund der Sanktionen Schwierigkeiten, Transistoren weiter zu schrumpfen. Kurze Signalwege mit gestapelten Chips sollen die Probleme kaschieren bei der Chip-Lithografie: Huawei will Moore's Law ablösen.

Weiterlesen

25.000 US-Dollar für einige Minuten Starlink-Anbindung kassiert SpaceX neuerdings vom US-Militär. Es hat keine Alternative für die Steuerung von Drohnen im Kampfgebiet. Doch die Versorgung der iranischen Bevölkerung mit Mobilfunk per Starlink war der US-Regierung zu teuer. Nicht teurer wird Spotify, obwohl der Streamingdienst neben Büchern nun auch Zeitschriftenartikel vorliest. Über 650 englischsprachige Beiträge bekannter Magazine gehören jetzt zur Hörbuch-Bibliothek. Damit sollen Nutzer an das Hören längerer Texte gewöhnt werden, um sie langfristig für Hörbücher zu gewinnen. Derweil sperren immer mehr Nachrichtenseiten die Wayback Machine aus – nicht nur in den USA. Denn sie befürchten, dass der bekannte Archivdienst fürs KI-Training benutzt wird. Eine Studie zeigt, dass die Zahl der Blockierer zuletzt rasant gewachsen ist – die wichtigsten Meldungen im kurzen Überblick.

Kamikazedrohnen des US-Militärs fliegen für ein paar Minuten oder höchstens Stunden, bevor sie mit einer tödlichen Explosion in ihr Ziel auf dem Boden krachen. Für die zur Steuerung notwendige Starlink-Anbindung hat das US-Militär bislang 5000 US-Dollar bezahlt, pro Flugdrohne. Während des Angriffs auf den Iran konnte Starlink-Betreiber SpaceX seine Marktmacht ausspielen und den Preis auf fast 25.000 US-Dollar verfünffachen, wie jetzt unter Berufung auf Dokumente des US-Verteidigungsministeriums und zwei namentlich nicht genannte Eingeweihte berichtet wird. Der Preis von knapp 25.000 Dollar ist demnach der monatliche Tarif für Starlink-Terminals in Flugzeugen. SpaceX setzt ihn jetzt auch für Kamikazedrohnen durch: Neuer Starlink-Tarif von 25.000 Dollar für US-Kamikazedrohnen. Keine Preiserhöhung gibt es bei Spotify, obwohl der Streamingdienst sein Angebot erweitert hat. Denn Spotify hat etliche Zeitschriftenartikel in die eigene Hörbuch-Bibliothek aufgenommen. Nutzer können sich jetzt aus bekannten Magazinen wie Rolling Stone, The Atlantic, Vogue, Variety, Billboard, GQ, Wired und Vanity Fair vorlesen lassen. Zu Beginn stehen mehr als 650 englischsprachige Artikel zur Auswahl. Das ist allerdings nicht weltweit verfügbar, sondern auf Regionen beschränkt, in denen auch Hörbücher angeboten werden. Das Vorlesen der Zeitschriftenartikel ist im Premium-Abo enthalten. Gratis-Nutzer können einzelne Beiträge zudem für 1,99 US-Dollar erwerben. Es gibt sowohl menschliche als auch digitale Vorleser: Spotify erweitert Hörangebot um das Vorlesen längerer Artikel aus Zeitschriften. Im Kampf gegen die nicht genehmigte Nutzung von Inhalten für das Training von KI-Modellen gerät das Internet Archive immer mehr zwischen die Fronten, und die Wayback Machine droht zum Kollateralschaden zu werden. Das legt eine Analyse des Nieman Journalism Lab an der Harvard University nahe, laut der immer mehr Nachrichtenseiten Crawler der Archivseite aussperren. Demnach schränken inzwischen mehr als 340 lokale Nachrichtenseiten „den Zugriff des Internet Archive auf ihre Artikel sowie deren Archivierung“ ein, aber auch überregionale und internationale Medien wie die New York Times beteiligen sich demnach. Europäische Medien finden sich ebenfalls auf der Liste, derzeit aber noch keine aus Deutschland: Im Kampf dem KI-Training sperren immer mehr Nachrichtenseiten Wayback Machine aus. Lange hat BMW die Einführung von Elektroautos auf Basis der Neuen Klasse medial vorbereitet. Die ungenierte Nutzung eines so bedeutsamen Begriffs aus der eigenen Firmen-Historie sollte verdeutlichen, wie groß der Schritt ist, den BMW hier vollzieht. Die Marke wollte ein Statement setzen, und liefert das durchaus auch. Im Test zeigte der BMW iX3 zahlreiche Stärken und nur wenige Schwächen, was für die Bayern an zwei Stellen zu einem Problem wird, etwa bei der Differenzierung der angebotenen Modelle iX3 40 und 50, wobei das Basismodell schon einen Einstiegspreis von 63.400 Euro trägt. Letztendlich zeigt sich, dass der iX3 zwar ein kostspieliges Elektroauto ist, aber auch eines der besten, die es momentan zu kaufen gibt: E-SUV BMW iX3 im Test – mehr Reichweite als ich. In gänzlich anderen Preissphären bewegt sich Ferraris erstes batterieelektrisches Modell. Das Elektroauto namens „Luce“ ist für Ferrari nicht einfach ein weiteres Angebot, es ist natürlich auch ein Wagnis angesichts der Tifosi, die sich schon immer und ganz mehrheitlich über die vielzylindrigen Verbrenner begeisterten – mehr als viele Anwohner selbstredend. Doch statt einfach einen elektrischen Ferrari Purosangue zu kreieren, würde dem Selbstverständnis der Marke aus Maranello widersprechen. Der Ferrari Luce ist ein geräumiger, 772 kW leistender GT-Crossover, bei dessen Design Ferrari Unterstützung von Apple-Designern gesucht hat. Das wird vor allem im aufgeräumten und schlichten Interieur mit abgerundeten Kanten sichtbar: Luxus-Elektroauto Ferrari Luce für über 500.000 Euro. Ferrari )Auch noch wichtig: - „Star Citizen“ wird seit 14 Jahren entwickelt, „Squadron 42“ nur unwesentlich weniger. Finanziert wird das von Fans, inzwischen mit mehr als einer Milliarde durch Crowdfunding: Eine Milliarde US-Dollar für „Star Citizen“ und „Squadron 42“. - AdminLTE erscheint in Version 4.0 – mit komplettem Umbau auf Bootstrap 5.3, ohne jQuery und mit 18 neuen Demo-Seiten: Neustart für das Dashboard-Framework AdminLTE 4.0. - Wie lange können Roboter am Stück arbeiten? Figure AI hat es getestet. Aus einer Acht-Stunden-Schicht wurden am Ende acht Tage: Figure AI lässt seine Roboter 200 Stunden am Stück arbeiten. - Epic hat erstmals die Unreal Engine 6 in „Rocket League“ angeteasert. Ein Release-Termin und eine Feature-Liste fehlen: Epic zeigt erste Szenen in „Rocket League“ mit Unreal Engine 6. - Mit „007 First Light“ schafft es James Bond zum ersten Mal seit 2012 wieder in ein Videospiel. Die Wartezeit hat sich gelohnt. Das zeigt „007 First Light“ im Test: Das beste Bond-Spiel seit „Goldeneye“. - Mit iPhone 16e, 17e und Air hat Apple mit den eigenen C1- und C1X-Modems neue Datenschutzfeatures eingeführt. Das steckt hinter der Funktion „Genauen Standort beschränken“: Was Apples Mobilfunksicherheitsfunktion kann. - Laut neuesten Forschungen schrumpft nicht nur in entwickelten Industrieländern die Geburtenrate, sondern global. Wir haben ein paar aktuelle Zahlen dazu: Nicht nur für Industrieländer sind 2,1 Kinder pro Familie immer schwerer erreichbar. - Eine vorinstallierte App auf Motorola-Smartphones leitet Amazon-Aufrufe um und injiziert Affiliate-Codes. Betroffene können die App deaktivieren auf Motorola-Smartphones: Vorinstallierte App schleust offenbar Affiliate-Links ein. - Ende Juni 2026 ist Schluss für Ubuntu Pastebin. Zahllose Links könnten ins Leere laufen. Ein Ersatzdienst ist bislang nicht angekündigt nach dem Aus für Ubuntu Pastebin: Abschaltung Ende Juni 2026. - In aktuellen Versionen von NGINX Open Source und NGINX Plus haben die Entwickler eine Sicherheitslücke geschlossen: DoS- und Schadcode-Attacken auf NGINX-Webserver vorstellbar. - Ab Ende September 2026 synchronisiert die Samsung-Galerie-App keine Fotos mehr mit OneDrive. Nutzer müssen für Backups auf die OneDrive-App umstellen: Samsungs Galerie-App verliert OneDrive-Synchronisierung. - Nach der Ankündigung einer Remote-Funktion über die ChatGPT-App legt OpenAI noch einmal nach. Codex soll den Mac via Computer Use im Locked-Modus kontrollieren: OpenAI Codex steuert Mac auch in gesperrtem Zustand. - Huawei hat aufgrund der Sanktionen Schwierigkeiten, Transistoren weiter zu schrumpfen. Kurze Signalwege mit gestapelten Chips sollen die Probleme kaschieren bei der Chip-Lithografie: Huawei will Moore's Law ablösen.

Spotify erweitert Hörangebot um das Vorlesen längerer Artikel aus Zeitschriften

heise_ki·2026-05-27AnwendungenGesellschaft

Der Streamingdienst Spotify hat etliche Zeitschriftenartikel in die eigene Hörbuch-Bibliothek aufgenommen. Nutzer können sich jetzt aus bekannten Magazinen wie Rolling Stone, The Atlantic, Vogue, Variety, Billboard, GQ, Wired und Vanity Fair vorlesen lassen. Zu Beginn stehen mehr als 650 englischsprachige Artikel zur Auswahl. Das ist allerdings nicht weltweit verfügbar, sondern auf Regionen beschränkt, in denen auch Hörbücher angeboten werden. Damit erweitert der Streamingdienst sein Angebot weiter, nachdem Spotify kürzlich erst KI-generierte Remixe und Podcasts angekündigt hatte. Das erlaubt Nutzern, eigene Coverversionen und Remixe von Liedern teilnehmender Musiker zu erstellen, allerdings nur als kostenpflichtiges Add-on zusätzlich zum Premium-Abonnement. Das Vorlesen der Zeitschriftenartikel ist dagegen im Premium-Abo enthalten. Gratis-Nutzer können einzelne Beiträge laut Spotify zudem für 1,99 US-Dollar erwerben. Das soll dem üblichen Preis für den lesenden Zugriff auf diese längeren Artikel entsprechen. Sowohl menschliche als auch digitale Vorleser Künstliche Intelligenz (KI) kommt aber auch beim Vorlesen der Zeitschriftenartikel zum Einsatz, wenn auch nicht bei allen. Der Streamingdienst „wird eine Mischung aus menschlicher und digitaler Sprachnarration verwenden“, erklärte Spotify-Sprecherin Rosalind Jeffcoat gegenüber The Verge. „Der Teil der Artikel, der digitale Sprachnarration verwendet, wird für die Nutzer deutlich gekennzeichnet sein.“ Damit will Spotify auch kürzere Beiträge anbieten können, die andernfalls möglicherweise nicht als Hörfassung produziert worden wären.

Für Spotify stellt dies eine Möglichkeit dar, Nutzer an das Hören längerer Texte zu gewöhnen, um sie langfristig für Hörbücher zu gewinnen. „Indem wir kurzformatige Inhalte in den Mix integrieren, holen wir unser Publikum dort ab, wo es sich befindet“, erklärt Colleen Prendergast von Spotify. „So fördern wir gesunde Hörgewohnheiten und steigern langfristig das Engagement für Bücher.“ Für die Verlage und Zeitschriften ist es ein weiterer Kanal zur Verbreitung der eigenen Artikel. Unklar ist bislang jedoch, wie Medienverlage und Magazinpartner an den Spotify-Umsätzen der Artikel beteiligt werden und ob das Angebot in Zukunft auch deutschsprachige Beiträge enthalten wird.

Weiterlesen

Der Streamingdienst Spotify hat etliche Zeitschriftenartikel in die eigene Hörbuch-Bibliothek aufgenommen. Nutzer können sich jetzt aus bekannten Magazinen wie Rolling Stone, The Atlantic, Vogue, Variety, Billboard, GQ, Wired und Vanity Fair vorlesen lassen. Zu Beginn stehen mehr als 650 englischsprachige Artikel zur Auswahl. Das ist allerdings nicht weltweit verfügbar, sondern auf Regionen beschränkt, in denen auch Hörbücher angeboten werden. Damit erweitert der Streamingdienst sein Angebot weiter, nachdem Spotify kürzlich erst KI-generierte Remixe und Podcasts angekündigt hatte. Das erlaubt Nutzern, eigene Coverversionen und Remixe von Liedern teilnehmender Musiker zu erstellen, allerdings nur als kostenpflichtiges Add-on zusätzlich zum Premium-Abonnement. Das Vorlesen der Zeitschriftenartikel ist dagegen im Premium-Abo enthalten. Gratis-Nutzer können einzelne Beiträge laut Spotify zudem für 1,99 US-Dollar erwerben. Das soll dem üblichen Preis für den lesenden Zugriff auf diese längeren Artikel entsprechen. Sowohl menschliche als auch digitale Vorleser Künstliche Intelligenz (KI) kommt aber auch beim Vorlesen der Zeitschriftenartikel zum Einsatz, wenn auch nicht bei allen. Der Streamingdienst „wird eine Mischung aus menschlicher und digitaler Sprachnarration verwenden“, erklärte Spotify-Sprecherin Rosalind Jeffcoat gegenüber The Verge. „Der Teil der Artikel, der digitale Sprachnarration verwendet, wird für die Nutzer deutlich gekennzeichnet sein.“ Damit will Spotify auch kürzere Beiträge anbieten können, die andernfalls möglicherweise nicht als Hörfassung produziert worden wären.

Für Spotify stellt dies eine Möglichkeit dar, Nutzer an das Hören längerer Texte zu gewöhnen, um sie langfristig für Hörbücher zu gewinnen. „Indem wir kurzformatige Inhalte in den Mix integrieren, holen wir unser Publikum dort ab, wo es sich befindet“, erklärt Colleen Prendergast von Spotify. „So fördern wir gesunde Hörgewohnheiten und steigern langfristig das Engagement für Bücher.“ Für die Verlage und Zeitschriften ist es ein weiterer Kanal zur Verbreitung der eigenen Artikel. Unklar ist bislang jedoch, wie Medienverlage und Magazinpartner an den Spotify-Umsätzen der Artikel beteiligt werden und ob das Angebot in Zukunft auch deutschsprachige Beiträge enthalten wird.

Europäische Antwort auf Mythos: Mistral und BNP kooperieren bei Bankensicherheit

Der französische Bankenkonzern BNP Paribas und Mistral AI haben ihre KI-Partnerschaft um drei Jahre verlängert und auf neue Bereiche ausgeweitet. Auf einer gemeinsamen Pressekonferenz in Paris kamen die Partner auch auf KI-gestützte Bedrohungen für Banken zu sprechen. „Das eigentlich Neue ist die Geschwindigkeit, mit der wir Sicherheitslücken beheben müssen, sowie deren schiere Menge. Es werden sehr viele Schwachstellen gleichzeitig entdeckt“, sagte der IT-Chef von BNP Paribas, Marc Camus, laut Reuters. „Darauf müssen wir uns vorbereiten, und genau daran arbeiten wir mit Hochdruck.“

Konkrete Ankündigungen zur Zusammenarbeit im Bereich Cybersicherheit machten die Partner zwar nicht. Bloomberg berichtet jedoch, dass das Pariser KI-Start-up ein eigenes KI-Modell für Cybersicherheit entwickelt hat und mit europäischen Banken Gespräche über dessen Einsatz führe. Einer dieser Partner sei BNP Paribas. „Die Debatte dreht sich derzeit stark darum, ob Mythos für manche Banken zugänglich ist oder nicht. Dabei sollte man nicht vergessen, dass es auch andere Modelle anderer Unternehmen gibt“, sagte Camus. Europa sucht nach Alternativen zu Mythos Seit der Vorstellung von Mythos im April steht die Bankenbranche unter Zugzwang. Das KI-Modell von Anthropic soll Sicherheitslücken deutlich schneller erkennen können als bisherige Systeme und daraus teils auch mögliche Angriffspfade ableiten. Über die Initiative „Project Glasswing“ erhielten zunächst vor allem US-Partner Zugriff, darunter große Tech- und Sicherheitsunternehmen sowie mehrere US-Banken, um kritische Software abzusichern, bevor vergleichbare Fähigkeiten breiter verfügbar werden. Ob und in welcher Form inzwischen auch europäische Banken direkten Zugang zu Mythos erhalten haben, ist öffentlich nicht bestätigt. Die jüngsten Aussagen von BNP Paribas und Mistral deuten jedoch darauf hin, dass europäische Institute weiter nach Alternativen suchen. Anthropic-Konkurrent OpenAI hat ein eigenes Modell für Cybersicherheit vorgestellt, auf das auch einige europäische Unternehmen Zugriff haben. Mit dem Pariser KI-Start-up Mistral entsteht nun offenbar auch eine europäische Antwort auf das Problem. Die Partnerschaft zwischen Mistral und BNP Paribas geht auf das Jahr 2023 zurück. Mit der Verlängerung werde die Zusammenarbeit laut Unternehmen über den bloßen Zugang zu großen Sprachmodellen hinaus ausgeweitet und umfasse auch Software, Lösungen sowie gemeinsame Forschungs- und Entwicklungsprojekte, schreibt BNP Paribas.

Weiterlesen

Der französische Bankenkonzern BNP Paribas und Mistral AI haben ihre KI-Partnerschaft um drei Jahre verlängert und auf neue Bereiche ausgeweitet. Auf einer gemeinsamen Pressekonferenz in Paris kamen die Partner auch auf KI-gestützte Bedrohungen für Banken zu sprechen. „Das eigentlich Neue ist die Geschwindigkeit, mit der wir Sicherheitslücken beheben müssen, sowie deren schiere Menge. Es werden sehr viele Schwachstellen gleichzeitig entdeckt“, sagte der IT-Chef von BNP Paribas, Marc Camus, laut Reuters. „Darauf müssen wir uns vorbereiten, und genau daran arbeiten wir mit Hochdruck.“

Konkrete Ankündigungen zur Zusammenarbeit im Bereich Cybersicherheit machten die Partner zwar nicht. Bloomberg berichtet jedoch, dass das Pariser KI-Start-up ein eigenes KI-Modell für Cybersicherheit entwickelt hat und mit europäischen Banken Gespräche über dessen Einsatz führe. Einer dieser Partner sei BNP Paribas. „Die Debatte dreht sich derzeit stark darum, ob Mythos für manche Banken zugänglich ist oder nicht. Dabei sollte man nicht vergessen, dass es auch andere Modelle anderer Unternehmen gibt“, sagte Camus. Europa sucht nach Alternativen zu Mythos Seit der Vorstellung von Mythos im April steht die Bankenbranche unter Zugzwang. Das KI-Modell von Anthropic soll Sicherheitslücken deutlich schneller erkennen können als bisherige Systeme und daraus teils auch mögliche Angriffspfade ableiten. Über die Initiative „Project Glasswing“ erhielten zunächst vor allem US-Partner Zugriff, darunter große Tech- und Sicherheitsunternehmen sowie mehrere US-Banken, um kritische Software abzusichern, bevor vergleichbare Fähigkeiten breiter verfügbar werden. Ob und in welcher Form inzwischen auch europäische Banken direkten Zugang zu Mythos erhalten haben, ist öffentlich nicht bestätigt. Die jüngsten Aussagen von BNP Paribas und Mistral deuten jedoch darauf hin, dass europäische Institute weiter nach Alternativen suchen. Anthropic-Konkurrent OpenAI hat ein eigenes Modell für Cybersicherheit vorgestellt, auf das auch einige europäische Unternehmen Zugriff haben. Mit dem Pariser KI-Start-up Mistral entsteht nun offenbar auch eine europäische Antwort auf das Problem. Die Partnerschaft zwischen Mistral und BNP Paribas geht auf das Jahr 2023 zurück. Mit der Verlängerung werde die Zusammenarbeit laut Unternehmen über den bloßen Zugang zu großen Sprachmodellen hinaus ausgeweitet und umfasse auch Software, Lösungen sowie gemeinsame Forschungs- und Entwicklungsprojekte, schreibt BNP Paribas.

Mistral und Harvey AI: Den Rechtssektor im Visier

Die Modelle des französischen KI-Unternehmens Mistral werden künftig über die Software-Plattform des US-Start-ups Harvey AI nutzbar sein. Das gab die Legal-AI-Plattform in einer Pressemitteilung bekannt. Zunächst werden die Mistral-Modelle Kunden in der Europäischen Union im Rahmen eines Early Access zur Verfügung gestellt. Ein breiterer Rollout soll in den kommenden Monaten erfolgen. Das in San Francisco ansässige Unternehmen Harvey AI wurde 2022 gegründet. Sein Hauptprodukt, die Software Harvey, bietet speziell für die Rechtsbranche zugeschnittene LLMs an. Durch die Partnerschaft erhält Mistral Zugang zu mehr als 1500 Kunden in 60 Ländern, die Harvey bereits in ihre Geschäftsprozesse integriert haben. KI für sensible Angelegenheiten Die Partnerschaft der beiden Unternehmen ist nicht neu. Bereits im Mai 2024 kündigte Harvey AI die Zusammenarbeit mit Mistral in einer Pressemitteilung an. Damals betonte das Unternehmen Mistrals Engagement für Transparenz, Effizienz und Anpassungsmöglichkeiten. Der Einsatz von generativer KI in stark regulierten Branchen erfordere ein Höchstmaß an Sicherheit und Transparenz, schrieb das Unternehmen auf seiner Website. Als klassischerweise textlastige Domäne bietet das Rechtswesen großes Potenzial für die Nutzung von KI. LLMs können Kanzleien und Institutionen der Justiz zum Beispiel dabei helfen, hunderte Seiten umfassende Prozessdokumente zu durchsuchen. Eine lukrative Branche Anwaltskanzleien setzen KI-Tools aber auch aus ökonomischen Gründen ein: Die Automatisierung von Aufgaben mittels KI verschafft Anwälten zusätzliche Zeit. So können sie mehr Fälle übernehmen.

Das Geschäftsfeld der Rechtsbranche ist bei den großen KI-Herstellern deshalb durchaus umkämpft. Erst kürzlich hatte Anthropic mehrere Plug-ins in seinen kostenpflichtigen KI-Agenten Claude Cowork integriert, die auf juristische Aufgaben spezialisiert sein sollen. Schattenseiten für die Justiz Dass künstliche Intelligenz vermehrt in der Rechtsbranche genutzt wird, hat derweil auch erhebliche Schattenseiten. Denn häufig wird generative KI eben nicht nur für die reine Dokumentanalyse genutzt. So haben Gerichte weltweit vermehrt mit Schriftsätzen zu kämpfen, die KI-Halluzinationen enthalten. Die KI-Tools zitieren dabei nicht existierende Gerichtsurteile, verfälschen Aussagen oder geben Urteile falsch wieder. Laut einer Online-Datenbank des Rechtswissenschaftlers Damien Charlotin von der Wirtschaftshochschule HEC Paris gab es Stand Ende Mai 2026 bereits knapp 1500 dokumentierte Gerichtsverfahren, in denen Personen wegen des Vorbringens von Dokumenten mit KI-Fehlern sanktioniert wurden. Charlotin zufolge habe die Menge der betroffenen Gerichtsverfahren seit vergangenem Jahr erheblich zugenommen. Auch in Deutschland gab es bereits erste Fälle. Anfang Mai rügte ein Berliner Kammergericht Anwälte wegen KI-Halluzinationen. Einige Gerichte in den USA haben bereits Kennzeichnungspflichten für mit KI bearbeitete Dokumente eingeführt. Experten betrachten diese aber als wenig praktikabel und zielführend. Da KI mittlerweile im standardmäßigen Funktionsumfang von Kanzleisoftware integriert ist, wäre nahezu jedes Dokument kennzeichnungspflichtig.

Weiterlesen

Die Modelle des französischen KI-Unternehmens Mistral werden künftig über die Software-Plattform des US-Start-ups Harvey AI nutzbar sein. Das gab die Legal-AI-Plattform in einer Pressemitteilung bekannt. Zunächst werden die Mistral-Modelle Kunden in der Europäischen Union im Rahmen eines Early Access zur Verfügung gestellt. Ein breiterer Rollout soll in den kommenden Monaten erfolgen. Das in San Francisco ansässige Unternehmen Harvey AI wurde 2022 gegründet. Sein Hauptprodukt, die Software Harvey, bietet speziell für die Rechtsbranche zugeschnittene LLMs an. Durch die Partnerschaft erhält Mistral Zugang zu mehr als 1500 Kunden in 60 Ländern, die Harvey bereits in ihre Geschäftsprozesse integriert haben. KI für sensible Angelegenheiten Die Partnerschaft der beiden Unternehmen ist nicht neu. Bereits im Mai 2024 kündigte Harvey AI die Zusammenarbeit mit Mistral in einer Pressemitteilung an. Damals betonte das Unternehmen Mistrals Engagement für Transparenz, Effizienz und Anpassungsmöglichkeiten. Der Einsatz von generativer KI in stark regulierten Branchen erfordere ein Höchstmaß an Sicherheit und Transparenz, schrieb das Unternehmen auf seiner Website. Als klassischerweise textlastige Domäne bietet das Rechtswesen großes Potenzial für die Nutzung von KI. LLMs können Kanzleien und Institutionen der Justiz zum Beispiel dabei helfen, hunderte Seiten umfassende Prozessdokumente zu durchsuchen. Eine lukrative Branche Anwaltskanzleien setzen KI-Tools aber auch aus ökonomischen Gründen ein: Die Automatisierung von Aufgaben mittels KI verschafft Anwälten zusätzliche Zeit. So können sie mehr Fälle übernehmen.

Das Geschäftsfeld der Rechtsbranche ist bei den großen KI-Herstellern deshalb durchaus umkämpft. Erst kürzlich hatte Anthropic mehrere Plug-ins in seinen kostenpflichtigen KI-Agenten Claude Cowork integriert, die auf juristische Aufgaben spezialisiert sein sollen. Schattenseiten für die Justiz Dass künstliche Intelligenz vermehrt in der Rechtsbranche genutzt wird, hat derweil auch erhebliche Schattenseiten. Denn häufig wird generative KI eben nicht nur für die reine Dokumentanalyse genutzt. So haben Gerichte weltweit vermehrt mit Schriftsätzen zu kämpfen, die KI-Halluzinationen enthalten. Die KI-Tools zitieren dabei nicht existierende Gerichtsurteile, verfälschen Aussagen oder geben Urteile falsch wieder. Laut einer Online-Datenbank des Rechtswissenschaftlers Damien Charlotin von der Wirtschaftshochschule HEC Paris gab es Stand Ende Mai 2026 bereits knapp 1500 dokumentierte Gerichtsverfahren, in denen Personen wegen des Vorbringens von Dokumenten mit KI-Fehlern sanktioniert wurden. Charlotin zufolge habe die Menge der betroffenen Gerichtsverfahren seit vergangenem Jahr erheblich zugenommen. Auch in Deutschland gab es bereits erste Fälle. Anfang Mai rügte ein Berliner Kammergericht Anwälte wegen KI-Halluzinationen. Einige Gerichte in den USA haben bereits Kennzeichnungspflichten für mit KI bearbeitete Dokumente eingeführt. Experten betrachten diese aber als wenig praktikabel und zielführend. Da KI mittlerweile im standardmäßigen Funktionsumfang von Kanzleisoftware integriert ist, wäre nahezu jedes Dokument kennzeichnungspflichtig.

Darknet Diaries Deutsch: Kids ohne Skrupel - Teil 2

Dies ist der zweite Teil von „Kids ohne Skrupel". Wenn Ihr Teil eins noch nicht gehört habt, fangt am besten da an. Im Englischen Original von Jack Rhysider trägt diese Episode den Namen „Dirty Coms“.

Die deutsche Produktion verantworten Isabel Grünewald und Marko Pauli von heise online. Der Podcast erscheint wöchentlich auf allen gängigen Podcast-Plattformen und kann hier abonniert werden.

JACK: Mein Gast ist „Drew" – ein junger Mann, der als Teenager tief in die Welt der Online-Untergrund-Communities abgerutscht ist. Er gibt uns einen schonungslosen Einblick in die Szene rund um Hacker, Betrüger und digitale Schwarzmärkte. Drew erzählte uns in der ersten Folge, wie er mit dreizehn Jahren über Roblox und dubiose Robux-Deals in kriminelle Kreise geriet, sich an Geschenkkarten-Phishing beteiligte und auf dem berüchtigten Forum OGUsers mit dem Handel gestohlener Benutzernamen Geld verdiente. Dabei wurde er selbst mehrfach gedoxxt, erpresst und zweimal mit 10.000 USPS-Kartons vor seiner Haustür zugemüllt – eine beispielhafte Geschichte, für den schonungslosen Umgang Krimineller untereinander. In Teil 1 haben wir gehört, wie Drew Schritt für Schritt in diese toxische Welt hineingezogen wurde, welche Lektionen er über Opsec und Vertrauen im Netz gelernt hat, und warum er diese Szene heute dokumentieren und offenlegen will. Jetzt in Teil 2 wird es konkreter – denn Drew fängt an, Namen zu nennen und Methoden zu enthüllen, mit denen in diesen Communities richtig viel Geld gemacht wird.

Das Geschäft mit dem SIM-Swapping

DREW: Lass mal überlegen. Was habe ich Kids in letzter Zeit tun sehen?

JACK: Lass uns doch beim SIM-Swapping einsteigen.

DREW: Wir können über SIM-Swapping sprechen.

JACK: Okay, also ihr wisst vielleicht, was SIM-Swapping ist, aber falls nicht, erkläre ich es ganz schnell. SIM-Swapping ist, wenn du die Telefongesellschaft austrickst, damit sie eine fremde Handynummer auf dein Telefon beziehungsweise Deine SIM-Karte überträgt. Wenn man zum Beispiel sein Handy verliert und ein neues bekommt, muss man der Telefongesellschaft sagen, dass man ein neues Telefon hat und dass die Nummer darauf funktionieren soll. Eigentlich sollte es nicht möglich sein, dass jemand einfach deine Telefonnummer übernimmt, aber es gibt Wege, wie das gemacht werden kann. Der erste Weg ist ziemlich offensichtlich.

DREW: Man sucht sich einen Insider in diesen Unternehmen, normalerweise einen – wie wir ihn nennen – „Manny“ oder Manager, der einem seine Zugangsdaten gibt oder einfach SIM-Swaps durchführt, wenn niemand hinschaut, als wäre es ein imaginärer Kunde. Diese Insider werden häufig mit etwa 10.000 Dollar pro Swap bezahlt. So hat das SIM-Swapping angefangen.

JACK: Okay, das ist also eine Möglichkeit, einen SIM-Swap durchzuführen. Wenn man Filialleiter eines Handyladens ist, hat man natürlich die Möglichkeit dazu. Wenn man das für eines dieser Kids macht, kann man richtig viel Geld verdienen, locker über 1.000 Dollar pro Nummer. Vielleicht sogar 10.000 Dollar pro Nummer. Aber es gibt eine neue Methode, wie diese Kidsr das machen, und die ist irrsinig, geradezu brutal.

DREW: Da ist es nicht so, dass man nicht die Telefongesellschaft anruft; die neue Methode nennt sich Remo-Snatching. Remo ist die Abkürzung für Remote-Tablet. Man geht also zum Beispiel zu T-Mobile. T-Mobile ist derzeit das einfachste Ziel. Man geht in einen T-Mobile-Laden, rennt rein, reißt dem Filialleiter das Tablet aus den Händen und rennt wieder raus.

JACK: Alles klar. Wenn man das Tablet des Filialleiters hat, ist das das Gerät, das autorisiert ist, Telefonnummern zu übertragen. Es macht also Sinn, dass man durch den Diebstahl einen SIM-Swap bei jemandem durchführen kann. Aber halt, ganz so einfach ist es nicht. Gehen wir einen Schritt zurück und zwar einen großen Schritt zurück. Zuerst muss man wissen, bei wem es sich lohnt, einen SIM-Swap durchzuführen. Das Ziel zu identifizieren, kann lange dauern, und dafür sind viele Schritte nötig, und die möchte ich hier aufschlüsseln. SIM-Swapping war schon ein paar Mal Thema in den US-Darknet Diaries, zum Beispiel in den Episoden The Pizza Problem und Tennessee. Das sind zwei Geschichten, in denen Leute ins Visier genommen wurden, einfach weil sie wertvolle Benutzernamen auf Instagram und Twitter hatten. Okay, das wäre also ein Grund, jemanden ins Visier zu nehmen: um die Kontrolle über seinen Benutzernamen zu erlangen und ihn auf OGUsers für ein paar tausend Dollar zu verkaufen. Aber ich habe das Gefühl, das ist mittlerweile ein alter Hut. Es gibt eine ganz neue Verbrechenswelle, die da über uns rollt.

DREW: Die Leute führen einen SIM-Swap für Bankzugänge durch – also Bank-Logins –, über die sie Geld überweisen oder eine Überweisung vornehmen.

JACK: Okay, also Bank-Daten; obwohl das in dieser Community ein großes Ding ist, ist es wirklich schwer, sowas tatsächlich durchzuziehen. Zuerst muss man ein gültiges Login für den Benutzer herausfinden, und woher man Passwörter bekommt, darauf kommen wir später. Aber nehmt für den Moment einfach an, dass wir einen funktionierenden Benutzernamen und ein Passwort für ein Bankkonto haben. Wir loggen uns also in das Konto ein.

DREW: Aber es gäbe keine Möglichkeit, das Geld abzuheben, denn dafür müsste man ein Einmalpasswort oder eine Einmal-PIN erhalten. Also versuchen sie, die SIM-Karte der Person zu tauschen, um an den Einmal-Code zu kommen. SIM-Swapping bei Banken ist eigentlich ein verrücktes Unterfangen, denn es liegt zwar eine Menge Geld auf Bankkonten, aber man braucht auch praktisches Wissen über Geldwäsche, da man buchstäblich das Geld der Person stiehlt und einen Weg finden muss, damit es nicht zu einem zurückverfolgt werden kann. Das ist natürlich extrem schwierig.

JACK: Richtig, während es also einige wirklich clevere Leute gibt, die in diesem Bereich mitmischen, ist das einfachere Ziel, es auf Leute abzusehen, die Kryptowährungen haben. Denn mit Kryptowährungen ist es kinderleicht, das ganze Geld in einer Wallet zu schnappen und es einfach an einen Anonymisierungsdienst wie Tornado Cash zu senden und auszahlen zu lassen. Da das aber so ein lohnendes Ziel ist, sind allerhand Leute hinter Kryptowährungen her. Wie auch immer, es ist für diese Kids sinnvoll, Leute mit prall gefüllten Krypto-Wallets ins Visier zu nehmen, aber wie findet man jemanden mit einer fetten Krypto-Wallet? Nun, das erfordert eine ganze Reihe von Schritten.

DREW: Es handelt sich also um einen riesigen Markt, der ziemlich im Verborgenen stattfindet. Die Leute nutzen sogenannte „Combo-Listen“, also im Grunde durchgesickerte Datenbanken mit Passwörtern und E-Mail-Adressen, wobei die Passwörter natürlich entschlüsselt wurden, etwa mit RainbowCrack oder John the Ripper. Sie lassen diese Daten durchlaufen und suchen nach sogenannten „Commons“, also Passwörtern, die auf mehreren Websites verwendet werden.

JACK: Okay, ihr habt hier ja schon öfter von großen Websites gehört, die von Datenlecks betroffen sind, wo die gesamte Benutzerdatenbank gestohlen wird. Wenn man Kunde auf einer dieser Seiten ist, zuckt man vielleicht einfach mit den Schultern, ändert vielleicht sein Passwort und macht weiter, in der Hoffnung, dass nichts auf einen zurückfällt, oder? Nun, solche Daten sind in diesen Kreisen Gold wert. Zuerst kann man auf eine Seite wie raidforums.com oder nulled.2 oder cracked.2 gehen. Seiten, die Tonnen von kompletten Datenbank-Leaks posten. Es kostet vielleicht ein paar Dollar, um ranzukommen, aber man kann sich die dann direkt dort herunterladen. Wir sprechen von großen Websites, die gehackt wurden; und deren Datenbanken liegen genau dort, leicht zu schnappen, Seiten wie Adobe, die Alaska-Wählerdatenbank. Es gibt dort anscheinend eine Apple-Datenbank. Adult Friend Finder, die Android-Foren, und das ist nur ein kleiner Auszug aus den A's. In diesen Datenbank-Dumps können eine Menge Infos sein, enthalten typischerweise enthalten sie aber den Namen einer Person, ihren Benutzernamen, ihre E-Mail, vielleicht ihre Telefonnummer, vielleicht ihre Adresse und ihr Passwort. Aber ihr Passwort ist in der Datenbank typischerweise gehasht, was bedeutet, dass man nicht wirklich sehen kann, wie es lautet.

Datenlecks als Schatzkarte für Hacker

Ab hier kommen Tools ins Spiel, die Passwort-Hashes knacken können. Es ist schwer, einen einzelnen Hash zu knacken, aber wenn es das ist, was man haben will und man gleichzeitig also hundert Millionen Datensätze in der Adobe-Datenbank hat, dann wird man wahrscheinlich einige Hashes finden können, die nicht besonders stark sind. Für diese Leute hat man dann gültige Benutzernamen und Passwörter. Jetzt nimmt man diesen Benutzernamen oder diese E-Mail-Adresse und gleicht sie mit anderen Datenlecks ab. Verwendet diese Person Passwörter wieder? Gibt es Benutzernamen und Passwörter im Adobe-Leak, die auch bei Netflix funktionieren? Die Antwort ist immer: Leider ja. Viele Leute suchen sich einfach ein Passwort aus und verwenden das dann auf allen Seiten, auf denen sie Konten haben. Nur durch das Knacken eines Datenbank-Dumps hat man nun also Zugriff auf das Netflix-Konto von jemandem, und schon das eröffnet einen völlig neuen, riesigen Markt in den Untergrund-Communitys. Die Leute kaufen Netflix-Konten für jeweils 2,50 Dollar, weil das offensichtlich viel billiger ist, als die 18 Dollar im Monat für ein Premium-Abonnement zu bezahlen.

DREW: Okay, übertragen wir das mal auf Walmart, Chipotle, Nordstrom, OnlyFans, Surfshark, NordVPN, Macy’s Credit, Buffalo Wild Wings und Papa Johns.

JACK: Es gibt Seiten, auf die man gehen kann, um Benutzerkonten für jede dieser Websites zu kaufen. Man bekommt vielleicht sogar ein Kombipaket für einen Haufen Logins, sagen wir 10 Dollar für das ganze Paket. Aber Moment, ihr fragt euch vielleicht, warum jemand ein Login für eine Restaurantkette wie Chipotle kaufen wollen würde? Nun, willkommen beim Fall der mysteriösen Burrito-Bestellungen, von dem Leute im Chipotle-Subreddit berichten. Man kann eine Chipotle-App auf sein Telefon herunterladen und sie nutzen, um Essen zu bestellen, aber die App ist oft mit der Kreditkarte verbunden. Man kann also das Chipotle-Konto von jemand anderem nutzen, um einen Burrito für sich selbst zu bestellen, und dann bezahlen die anderen dafür. Das Gleiche gilt für Papa Johns; kostenlose Pizza, wenn man ein gültiges Login für das Konto von jemand anderem hat. Das führt uns in die Welt der Pizza-Plugs, die ich schon eine Weile genau beobachte.

Es ist fast schon ein Mythos. Es gibt diese Chatrooms, in die man gehen und eine Essensbestellung aufgeben kann, wie zum Beispiel drei große Pizzen, und jemand im Chatroom nimmt die Bestellung an und verlangt vielleicht 5 Dollar von dir. Dann nutzen sie das gestohlene Pizza-Konto, um sich einzuloggen, die Bestellung aufzugeben und dir dann die Pizza zu schicken. Es hat sie 2 oder 3 Dollar gekostet, das Konto zu kaufen; sie verdienen 5 Dollar damit. Du bekommst drei Pizzen für 5 Dollar, und oh, der Kontoinhaber ist derjenige, der dafür bezahlt. Ich sage euch, das geht so viel tiefer, als ich Zeit dafür habe. Oh, und der Slang für den Kauf und Verkauf dieser gültigen Logins ist einfach Logs. Es gibt also einen Haufen Leute da draußen, die Datenbank-Dumps durchsuchen und versuchen, gültige Logs für so viele Orte wie möglich zu finden, damit sie diese Logs mit Gewinn verkaufen können.

DREW: Apple-Logs kannst du für bis zu 50 Dollar verkaufen, denn die Leute können mit deiner verknüpften Apple-Kreditkarte ein paar MacBook-Bestellungen aufgeben. Wenn du davon zehn Bestellungen pro Tag bekommst, sind das 500 Dollar am Tag.

JACK: Ein wirklich beliebtes Login im Moment sind Hilton Honors Logins, weil dir diese Logs ein paar kostenlose Übernachtungen in einem schicken Hotel bescheren können. Okay, also gibt es zwei Arten von Konten, die man bekommen kann; FA und NFA. Das heißt, Full Access (Vollzugriff) und Non-Full Access (kein Vollzugriff). Alle Konten, die wir gerade aufgelistet haben, sind im Grunde NFA, kein Vollzugriff. Ein Konto mit Vollzugriff ist eines, das all diese gültigen Logins hat, plus ein gültiges E-Mail-Konto-Login. Das bedeutet also, wenn man in das Outlook oder Gmail von jemandem hineinkommt, dann kann man ganz einfach das Passwort für jedes dieser anderen Konten zurücksetzen, in das man hinein will. Es gibt einem wirklich vollen Zugriff auf das digitale Leben von jemandem, und es gibt ein kleines Tool, das Leute benutzen, mit dem sie, sobald sie im E-Mail-Konto von jemandem sind, schnell alle E-Mails durchsuchen können, um zu sehen, ob es in diesen E-Mails wertvolle Informationen gibt.

DREW: Das Programm, das das macht, heißt Yahoo Arranger. Es sucht automatisch nach Schlüsselbegriffen innerhalb von Yahoo oder den Websites, von denen man wissen will, ob sie dort angemeldet sind. Wenn man also sehen will, ob sie bei Amex oder Bank of America oder Chipotle angemeldet sind, nutzt man einfach Yahoo Arranger und schaut nach.

JACK: Verrückt, oder? Aber es ist wirklich nicht so komplex, wenn man auch keine FA-Konten hat. Man kann einfach einen Datenbank-Dump nehmen und ihn in eine Combo-Liste umwandeln; das ist nur eine formatierte Liste, die Benutzername und Passwort anzeigt, und man könnte diese Combo-Liste nehmen und hätte ein Tool bauen, das einfach automatisch versucht, sich bei unzähligen Seiten einzuloggen, um zu prüfen, ob das Passwort irgendwo funktioniert.

DREW: Dann nutzen sie Software wie Sentry NBA, OpenBullet oder SilverBullet, um damit automatisch all diese Combo-Listen zu überprüfen. Das ist also kein manueller Prozess, und er läuft mit wahrscheinlich 5.000 CPM, was bedeutet, dass er oft mit 5.000 Versuchen pro Sekunde läuft. Die Leute verkaufen schätzungsweise bis zu 5.000 Logs am Tag in ihren Shops. Ich persönlich kann sehen wie viel Bestand ein Shop hat, also kann man erkennen, wie viele Verkäufe man pro Tag erzielt. Ich habe gesehen, wie Leute bis zu 10.000 Konten pro Tag für 3,50 Dollar pro Konto verkauft haben; 35.000 Dollar.

JACK: Okay, jetzt sollte klar sein, wie jemand an einen Haufen gültiger Logins für verschiedene Seiten kommen kann. Aber eigentlich wollte ich das alles nur sagen, weil das euch helfen wird zu verstehen, wie wir jemanden finden, der eine Menge Kryptowährung hat, um ihn ins Visier zu nehmen.

DREW: Die beliebteste Datenbank, die ich in meinen Jahren hier je gesehen habe, ist die Ledger-Datenbank. Ledger ist ein Unternehmen, das physische Cold-Wallet-Speicher für Bitcoin anbietet. Denn, was sagt es über jemanden aus, wenn er eine Ledger-Wallet kauft? Es bedeutet, dass er oder sie Bitcoin hat. Das macht diese Personen zu deiner perfekten Zielgruppe für Kryptowährungen.

JACK: Oh, sehr interessant. Ledger ist eine physische Krypto-Wallet, und im Jahr 2020 wurde deren Benutzerdatenbank gehackt. Fünf Monate später wurde die Datenbank in Raid-Foren gepostet. In der Datenbank befinden sich E-Mail, Name, physische Adresse und Telefonnummer. Es waren aber keine Passwörter oder Krypto-Schlüssel dabei. Aber man kann natürlich die E-Mail-Adresse aus der Ledger-Datenbank nehmen und abgleichen, ob sie mit E-Mails in einer anderen Datenbank übereinstimmt, und dort kann man dann nachschauen, ob es bekannte Passwörter für diese E-Mail-Adresse gibt. Dann kann man versuchen, diese E-Mail-Adresse und das Passwort bei Coinbase oder Binance oder Kraken oder FTX oder Gemini oder irgendeiner Krypto-Börse einzugeben, um zu sehen, ob es ein gültiges Login ist. Das sind alles Krypto-Börsen, wo Leute ihre Kryptowährung aufbewahren. Wenn man den Benutzernamen und das Passwort von jemandem bei einer Krypto-Börse kennt, bedeutet das natürlich echten Ärger für ihn. Aber es gibt ein paar Sicherheitsprüfungen, die diese Börsen eingerichtet haben, um Kids wie diese zu bremsen. Erstens ist es schon sehr viel wert, nur zu wissen, ob die Person zum Beispiel bei Coinbase registriert ist. Vergesst das Passwort für eine Sekunde; einfach nur, ist diese E-Mail hier überhaupt registriert?

Wenn man die E-Mail-Adresse von jemandem und ein falsches Passwort eingibt, gibt es keinen Hinweis darauf, ob diese E-Mail dort registriert ist oder nicht. Wenn man jedoch versucht, sich für ein neues Konto mit einer E-Mail-Adresse anzumelden, die bereits existiert, dann Bingo. Coinbase lässt sich in die Karten schauen und sagt, dass diese E-Mail hier bereits registriert ist. So kann jemand den Ledger-Datenbank-Dump nehmen und herausfinden, wer Konten bei Coinbase oder Gemini oder Kraken oder Binance oder wo auch immer hat, und das dann mit anderen Datenbank-Dumps abgleichen, um herauszufinden, wie das Passwort für diese Konten lautet.

Wenn nun ein Dieb eine gültige E-Mail und ein Passwort für dein Krypto-Konto hat, steht ihm immer noch eine große Hürde im Weg; 2FA. Alle Krypto-Börsen verlangen, dass man die Zwei-Faktor-Authentifizierung aktiviert. Sie empfehlen, sich so etwas wie Google Authenticator oder Authy zu besorgen. Das sind Apps auf deinem Handy, die eine sechsstellige Nummer generieren, die du brauchst, um dich einzuloggen. Aber als absolutes Minimum schicken sie dir zur 2 Faktor Authentifizierung eine SMS mit einem sechs- oder siebenstelligen Code zum Einloggen. Ein Benutzername und ein Passwort allein reichen also nicht aus, um in das Krypto-Konto von jemandem zu gelangen. Man braucht auch diesen 2FA-Code. Die große Mehrheit der Coinbase-Nutzer verwendet solche SMS-Codes. Und Ihr ahnt, wo wir jetzt angekommen sind?

DREW: Viele Leute auf Coinbase besitzen Millionen von Dollar, daher diese Welle von SIM-Swapping. Dafür nutzen sie allgemeine Daten aus Datenbanken, verschaffen sich Zugang zu Coinbase – das läuft alles automatisiert ab – und erhalten dann Zugriff auf das Guthaben; sie haben einen SIM-Swap durchgeführt. Das ist enorm profitabel - profitabler geht's derzeit wahrscheinlich nicht.

JACK: Zu diesem Zeitpunkt haben wir genug Informationen, um das Ziel per SIM-Swap anzugreifen. Wir wissen, dass sie eine Ledger-Wallet haben und wir wissen, dass sie ein Coinbase-Konto haben, und wir haben ihren Benutzernamen und ihr Passwort. Alles, was jetzt noch nötig ist, ist, die Kontrolle über ihre Telefonnummer zu übernehmen, damit wir die SMS empfangen können, um uns einzuloggen. Aber obwohl das vielleicht ausreicht, um jemanden per SIM-Swap anzugreifen, gehen die Diebe noch einen Schritt weiter und versuchen herauszufinden, wie viel auf dem Konto ist, bevor sie jemanden per SIM-Swap angreifen.

DREW: Ob du's glaubst oder nicht, aber es gab etwa einen Monat lang eine Sicherheitslücke bei Coinbase, durch die man den Kontostand jedes beliebigen gültigen Benutzernamens und Passworts abrufen konnte. Das ging einfach – egal wie. Man brauchte keinerlei Zugriff außer Benutzername und Passwort. Man musste also keine SIM-Karte nachahmen, um den Kontostand zu sehen. Also haben die Leute einfach Millionen und Abermillionen von Kombinationen durchgespielt, eine Kombinationsliste bei Coinbase, und haben einfach die Millionäre von Coinbase gefunden. Und von diesen gibt es offensichtlich Millionen.

JACK: Das heißt, wenn man nur einen gültigen Benutzernamen und ein Passwort hatte, konnte man sehen, wie viel auf dem Coinbase-Konto des Benutzers war. Dadurch ist es dann sonnenklar, wen genau man für einen saftigen SIM-Swap ins Visier nehmen sollte. Aber man braucht immer noch diesen 2FA-Code, um reinzukommen und das Geld zu holen. Es war nur so, dass man ihn eine Zeit lang nicht brauchte, um das Guthaben zu sehen. Bleeping Computer veröffentlichte im Oktober 2021 einen Artikel, in dem stand, dass die Krypto-Wallets von 6.000 Coinbase-Kunden aufgrund einer Schwachstelle im 2FA-System leergeräumt wurden. Ich bin mir ziemlich sicher, dass es um diesen Bug geht, den Drew gerade erwähnt hat. Genau zu wissen, wie viel Geld jemand auf seinem Konto hat, ist entscheidend, um so einen SIM-Swap wirklich erfolgreich zu machen.

Es gibt noch ein letztes Detail zu Coinbase; wenn man einen gültigen Benutzernamen und ein Passwort hat und sich einloggt, sieht man, ob dieser Nutzer SMS-2FA nutzt oder so etwas wie Google Authenticator hat, weil die Seite einem sagt, nach welchem Code sie sucht. Die große Mehrheit der Coinbase-Nutzerinnen und Nutzer verwendet textbasierte 2FA, also SMS. Es kann jetzt immer noch das eine Problem geben, dass der Angreifer die Telefonnummer nicht kennt. Manchmal haben die die einfach noch nicht, und wenn man jemanden per SIM-Swap angreifen will, braucht man genau diese Telefonnummer, nicht wahr? Aber da steht direkt auf der Seite ein Hinweis, und der zeigt die letzten beiden Ziffern der Telefonnummer an, und da steht ausdrücklich: Gib den siebenstelligen Code ein, den wir gerade an sowas wie xxx-xxx-xx37 gesendet haben. Dieser kleine Hinweis, nur zu wissen, was die letzten beiden Ziffern der Telefonnummer sind, reicht diesen Dieben schon aus, um die vollständige Telefonnummer zu bekommen.

DREW: Also, normalerweise geht das so: Finde ihren Namen, ihren ungefähren Standort, ihre Telefonnummer. Es gibt eine Million Möglichkeiten, das zu tun. Mein Rat wäre: entschlüssle die E-Mail, die Sicherheitsvorkehrungen waren wahrscheinlich nicht besonders gut, sonst wären ihre Passwörter nicht durchgesickert. Darin findest du ihre IP-Adresse oder etwas anderes, mit dem du ihren Standort ungefähr bestimmen kannst. Führe dann eine Personensuche auf White Pages oder BeenVerified in diesem Gebiet mit ihrem Namen durch, und du wirst ihre Telefonnummer finden, die mit den letzten beiden Ziffern des Hinweises übereinstimmt.

JACK: Okay, so wählen diese SIM-Swapper also ihre Ziele aus. Zu diesem Zeitpunkt kennen sie den Benutzernamen, das Passwort, die Telefonnummer und den Kontostand, um zu wissen, ob sie einen dicken Fisch an der Angel haben. Oh, und man kann schnell nachschauen, zu welcher Art von Anbieter die Telefonnummer gehört, damit man den SIM-Swap beim richtigen Anbieter durchführen kann. Aber das ist ein großer Vorbereitungsprozess, nur um herauszufinden, wer unser SIM-Swapping-Ziel sein wird. Es ist sogar so viel Arbeit, dass dies, zumindest in den USA, ein ganz eigener Markt ist. Allein eine Liste von Zielen zu identifizieren und diese Informationen zu verkaufen, ist ein eigenes Geschäft. Obwohl es also nach viel Arbeit aussieht, könnte jemand einfach hier einsteigen, die Daten kaufen und einen SIM-Swap durchziehen. Okay, jetzt sind wir bereit für das große SIM-Swap-Event. Ihr erinnert euch, wie der Prozess anfing, oder?

Physischer Angriff für digitalen Profit

JACK: Jemand rannte in einen T-Mobile-Laden, riss dem Filialleiter das Tablet aus den Händen und rannte wieder raus. Das nennt sich hier ein Remo, Remote-Tablet-Grab. Aber wir sind immer noch nicht bereit für diesen Teil. Bevor man nämlich das Tablet des Managers stiehlt, braucht man das Passwort des Managers, das auf dem Tablet ist, richtig? Man muss also den Laden auskundschaften, alles über den Manager herausfinden, was man kann, um Social Engineering bei ihm anzuwenden.

DREW: Einfach den Manager anrufen und eine Rolle einnehmen: Hey, hier ist John vom Help Desk bei T-Mobile. Kannst du dich bitte um dieses Ticket kümmern? Dann schicken sie schicken eine gefälschte URL, und er gibt sein Manager-Login ein.

JACK: Okay, jetzt hat man also das Passwort des Managers, um sich in das Tablet einzuloggen, und wir wissen, wie man an das Tablet kommt. Und das ist tatsächlich ein großes Problem, das T-Mobile zu bekämpfen versucht, und es kursieren derzeit interne Memos mit Anweisungen, was zu tun ist, wenn das in deinem Laden passiert. Eine Anweisung ist, sofort das IT Help Desk anzurufen, um das Tablet und das Manager-Konto deaktivieren zu lassen. Das dauert insgesamt typischerweise etwa zehn Minuten. Wir müssen also wieder einen Schritt zurückgehen, denn wir haben nur dieses Zehn-Minuten-Fenster, und wir müssen alles in diesem Zeitraum erledigen. Wir müssen also vorbereitet sein, und wir haben unsere Vorbereitungen noch nicht getroffen. Was ihr hier wissen müsst, ist, dass das nicht von einer Person gemacht wird; der Dieb, der in den Laden rennt, ist nur ein Bauer in diesem Spiel.

DREW: Die auf Telegram sie nicht die Art von Leuten, die in einen Laden rennen. Sie bezahlen irgendjemanden, den sie im echten Leben kennen, damit er für sie in den Laden rennt.

JACK: Die Person, die reinrennt, das Tablet schnappt und wieder rausrennt, wird auf der Liste hier wirklich am schlechtesten bezahlt.

DREW: Verdient wahrscheinlich 200 Dollar, Bro. Ich hab's gesehen, dass das so ist.

JACK: Sie zahlen also 200 Dollar dafür, dass jemand reingeht, das Tablet schnappt und es ihnen wieder rausbringt. Sie müssen in der Nähe sein, denn ihr erinnert euch, sie haben nur zehn Minuten Zeit dafür. Die Person, die das Tablet am Ende in den Händen hält, ist also besonders geschickt darin, durch die T-Mobile-Software zu navigieren, um den SIM-Swap durchzuführen. Das liegt vielleicht daran, dass sie vorher im Laden gearbeitet hat oder ein Video gesehen hat, wie es gemacht wird. Aber trotzdem ist die Person, die tatsächlich auf dem Tablet tippt und den SIM-Swap durchführt, noch immer nicht dieselbe Person, die die Kryptowährung von den Coinbase-Nutzern stehlen wird. Das ist eine ganz andere Gruppe von Leuten, die all diese Coinbase-Logs gesammelt haben und darauf warten, dass jemand einen Remo macht. Sie organisieren sich alle in einem Telegram-Chatroom, und sie sind bereit, einer Person für einen Remo-Swap manchmal 10.000 Dollar pro Nummer zu zahlen.

Nur um noch mal sicher zu gehen, diese Leute sind in diesem Telegram-Kanal und sagen: Okay, ich hoffe, jemand zieht heute Abend einen Remo durch ich habe drei Konten, die ich knacken will. Dann ist alles, was man tun muss, diese Telefonnummer an die Person weiterzugeben, die den Remo durchführt, richtig?

DREW: Perfekt, Mann. Du klingst jetzt wie ein echter Swapper. Du benutzt unseren Slang.

JACK: Die Leute sind also auf Telegram und es ist Freitagabend, Samstagabend, und jemand sagt: Okay, ich glaube, wir versuchen es. Sie sagen der Gruppe: Ich fahre da runter, ich versuche, das Tablet zu schnappen. Ich bin bereit.

DREW: Es ist echt intensiv.

JACK: Ja, da sind all diese Leute, sie schließen ihre Zimmertüren ab. So nach dem Motto: Komm nicht rein, Dad, ich bin heute Abend beschäftigt. Komm nicht ins Zimmer, was auch immer du tust. Und dann sagen die Eltern so: Okay, wir geben dir etwas Zeit. [LACHT].

DREW: Oh, definitiv. Ich weiß, wovon du sprichst. Das passiert; Leute sagen wirklich: Oh, ich kann jetzt nicht. Ich muss Abendessen.

JACK: Ja.

DREW: Da denkt man sich: Mann, wir haben buchstäblich zehn Minuten Zeit, um das zu tun. Da ist keine Zeit fürs Abendessen. Es ist entweder Abendessen oder 100.000 Dollar. Du entscheidest.

JACK: Ja.

DREW: Das ist wirklich – das ist keine Übertreibung – so ist es wirklich manchmal. Unsere Remos sind so kurz.

JACK: Das ist es, was ich mir so gerne vorstelle, die tatsächliche Person hinter dem Bildschirm, und wenn das ein Teenager ist, dann ja, dann besteht diese Möglichkeit, dass alles in jeder Sekunde schiefgeht, weil der bei seinen Eltern wohnt und sein Zimmer aufräumen muss. Aber gut, zurück zur Geschichte, sie sind bei Telegram, sie bekommen die Nachricht: Okay, ich habe den Remo. Was hast du gesagt, 10.000 Dollar pro Nummer?

DREW: Also, nach nach Anbieter aufgeschlüsselt sieht es so aus: Bei T-Mobile kostet ein Swap etwa 5.000 Dollar. Wenn es sich um ein Betrugsopfer handelt, kostet es dich 7.500 Dollar. Ein Betrugsopfer verfügt über spezielle Schutzmaßnahmen für sein Konto, die jedoch immer noch umgangen werden können. Verizon wird dich wahrscheinlich mehr als 50.000 $ kosten. Verizon ist extrem gut gesichert, aber mit der richtigen Ausrüstung ist es trotzdem möglich. Du brauchst zum Beispiel den Login eines Filialleiters, was eine sehr hohe Position ist. Du musst also in der Lage sein, diesen Verizon-Manager ordentlich zu bezahlen, und du kannst das System nicht hacken. Das geht nicht – so sieht es zumindest derzeit aus. Man braucht einen Insider. Man darf ihn natürlich nicht verraten oder so. Bei AT&T sinken die Preise auf 2.000 bis 3.000 $, weil ihr Opus-Tool nicht allzu sicher ist.

JACK: Okay, diese Person, die den Remo-Snatch durchführt, lässt also alle Stunden vorher wissen, dass sie plant, an diesem Abend einen Remo zu machen.

DREW: Der Activator ist die Person, die den Remo-Snatch koordiniert.

JACK: Der Activator teilt also allen im Discord-Kanal mit, dass sie den Remo haben und bereit für Aufträge sind. Die Leute auf Telegram fangen sofort an, ihm Informationen zu geben; Telefonnummer und ICC-ID. Das ist alles, was sie brauchen, um den Prozess zu starten, bei dem die Telefonnummer vom Telefon des Kunden auf das Telefon des Diebes in Telegram zu übertragen. Es sind intensive zehn Minuten. Die Zeit tickt und jeden Moment kann dieses Tablet deaktiviert werden, also müssen sie so schnell wie möglich arbeiten und in diesem Zeitraum so viele Nummern wie möglich austauschen. An einem guten Abend kann ein Activator damit über 100.000 Dollar verdienen.

DREW: Ja, an diesem Punkt gehst du einfach hin und machst deinen Lick.

JACK: Mehr Slang.

DREW: Ein „Lick“ ist, wenn man jemanden ausnimmt, das ist also einfach ein „erfolgreicher Log“ – in unserem Slang bedeutet „Log“ also „Login“. Wenn man also einen „Lick“ landet, bedeutet das, dass man das Guthaben der anderen Person abgehoben hat. Es gehört dir; du hast gewonnen. Es gibt also mehrere Möglichkeiten, diesen Slang zu verwenden. Man könnte sagen: „Diese Person sieht nach einem Lick aus.“ Mit anderen Worten: Diese Person sieht nach einem leichten Ziel aus. Man könnte sagen: „Ich habe heute einen Lick gelandet“, was bedeutet, dass ich eine erfolgreiche Abhebung von einem Coinbase-Konto durchgeführt habe.

JACK: Nun haben diese Jungs also die Kontrolle über die Telefonnummern ihrer Ziele, und müssen ab jetzt schnell wie möglich zu arbeiten.

DREW: Du schwitzt wie irre. Du gehst hin und setzt das Yahoo-Passwort zurück. Du bist über einen Proxy in ihrer Nähe verbunden, nutzt einen Residential-Proxy in der Nähe des Zielortes, loggst dich in ihr Yahoo-Konto ein und setzt das Passwort zurück, da es meistens nicht dasselbe ist wie das für Coinbase. Wir erhalten den Link zur Geräteauthentifizierung von Coinbase, während du immer noch am schwitzen bist. Dein Holder sollte die ganze Zeit über Codes erhalten; du schreist deinen Holder an, dir den Code sofort zu schicken, sonst wirst du ihn nicht bezahlen.

JACK: Was? Sorry, ein Holder ist was genau?

DREW: Ein „Holder“ ist jemand, der das Telefon, auf dem das Einmalpasswort eingeht, tatsächlich in der Hand hält. Meistens machen die Personen, die die Zieldaten und das Guthaben besitzen, das nicht selbst, da das die operative Sicherheit gefährden würde.

JACK: Heilige Scheiße.

DREW: Es gibt dafür spezielle Personen, die die Handys nur halten, damit die Person, die die Hinweise oder Ziele hat, nicht erwischt wird.

JACK: Oh Mann, da ist also auch noch ein Holder in die ganze Sache involviert. Ja, Holder werden einfach dafür bezahlt, dass sie diejenigen sind, die das Telefon gekauft haben und die Nummer darauf übertragen lassen. Okay, die Person, die den Lick machen will, fängt also vielleicht zuerst damit an, in die E-Mail des Opfers zu gehen und das Passwort zurückzusetzen. Bei vielen E-Mail-Anbietern wird dir eine SMS geschickt, um das Passwort zurückzusetzen. Der E-Mail-Anbieter schickt also die SMS und der Holder sagt der Person, wie die SMS lautet, und sie bekommen den Zugang zum E-Mail-Konto, und von dort aus versuchen sie, sich bei Coinbase einzuloggen. Nach Eingabe des Benutzernamens und Passworts wird eine SMS an das Telefon geschickt, das der Holder hat, und der Holder muss den Code an den eigentlichen Angreifer weitergeben. Der loggt sich nun bei Coinbase ein. Aber bei Coinbase gibt es typischerweise eine Prüfung, und dann steht da sowas wie: Wir erkennen dieses Gerät nicht. Wir senden dir eine E-Mail, um zu überprüfen, ob du es bist. Aber der Angreifer ist ja bereits in dem E-Mail-Konto des Opfers, also muss er nur auf die E-Mail warten und auf "Ja, ich bin's" klicken, und Coinbase lässt ihn rein. Jetzt ist er im Coinbase-Konto von jemandem, und dort liegen vielleicht 30.000, 100.000 oder manchmal sogar mehr als eine Million Dollar.

DREW: Anschließend überträgst du das Guthaben auf Coinbase Pro, damit du das Geld abheben kannst, und transferierst es dann in deine Exodus-, MetaMask- oder Electrum-Wallet.

JACK: Der Grund, warum sie es zu Coinbase Pro transferieren, ist, weil es dort ein höheres tägliches Abhebungslimit gibt. Aber dort gibt es auch eine Sicherheitsprüfung, bevor man da Geld abheben kann, eine weitere 2FA-Prüfung. Also muss man eine weitere SMS vom Holder bekommen, um die Überweisung einzuleiten. Aber da ist immer noch eine weitere Sicherheitshürde; Coinbase hat ein maximales tägliches Abhebungslimit, und manchmal haben die Leute mehr als das. Aber Drew sagt, das sei kein Problem.

DREW: Ja, es gibt ein paar Tricks. Die Leute nutzen Sicherheitslücken, über die ich nicht sprechen darf, aber ja, es gibt da Wege, 250.000 Dollar oder eine Million Dollar abzuheben. Man kann riesige Geldsummen abheben. Es gibt eine Methode, die jeder kennt und die ich dir verraten kann, ist, ein bestimmter Bot in einem Forum, der in der Lage ist, gleichzeitig eine Flut von Anfragen zu senden, um das System zu überlasten, sodass man eine Reihe kleinerer Transaktionen abwickeln kann. Aber es gibt auch andere Methoden, die direktere Sicherheitslücken ausnutzen.

JACK: Meine Güte, diese Kids haben echt gnadenlos entschlossen. Warum sollten sie das auch nicht sein, wenn es einen potenziellen Eine-Million-Dollar-Lick gibt, den sie damit abstauben können?

DREW: Die neue Generation der Krypto-Swapper – ich kenne da persönlich wahrscheinlich mindestens zehn Millionäre, die alle unter sechzehn sind und von denen ich mit Sicherheit weiß, dass sie nicht lügen; ich habe live gesehen, wie sie Transaktionen getätigt haben, und live miterlebt, wie sie Millionen-Dollar-Gewinne eingefahren haben. Was die ältere Generation angeht, diejenigen, die extrem früh dabei waren mit den verrückten 20-Millionen-Dollar-Zielen von Michael Turpin: Die haben 15 Millionen Dollar, 10 Millionen Dollar und sind in neuen Geschäften wie NFTs und Phishing tätig. Also wirklich high-level Sachen.

JACK: Okay, Michael Turpin ist ein Kryptowährungs-Investor, aber er hat auch ein paar Startups in diesem Bereich, wie Transform Group und BitAngels. Im Januar 2018 hat jemand die Schritte durchgeführt, die wir hier gerade erklärt haben, um sich in Turpins Krypto-Wallet zu hacken und Kryptowährungen im Wert von 23 Millionen Dollar daraus zu stehlen. 23 Millionen Dollar, in einer Nacht gestohlen. Und ihr wisst, sobald die Person das Geld hatte, musste sie all die Leute in der Kette bezahlen, die ihr geholfen haben, dorthin zu gelangen. In diesem Fall waren es Insider, die bei AT&T arbeiteten, die dabei halfen. Nun, einer der Typen, die 23 Millionen Dollar gestohlen hatten, war immer noch nicht glücklich. Er twitterte: Habe 23 Millionen Dollar gestohlen und kann mich trotzdem nicht von Drogen fernhalten. Habe 23 Millionen Dollar gestohlen und kriege mein Leben nicht auf die Reihe. Turpin ging natürlich zur Polizei, die anfing zu ermitteln und einige ziemlich handfeste Beweise finden konnte, die sie zu dem Urheber der Tweets namens Nicholas Truglia führten, der einundzwanzig war. Mastermind der Aktion war aber der erst 15-jährige Ellis Pinsky.

Weil er noch minderjährig war, konnte Ellis eine Verurteilung umgehen und das meiste Geld zurückgeben. Bei Nicholas war das anders: Gerichtsakten zeigen, dass er zum Zeitpunkt seiner Verhaftung über 70 Millionen Dollar an Vermögenswerten hatte. Er hatte sich schuldig bekannt und sollte zunächst nur 18 Monate absitzen und 20 Millionen Entschädigung an die Opfer zahlen. Weil er das nicht in der vorgegebenen Zeit tat, wurde er zu 12 Jahren Haft verurteilt. Was Michael Turpin betrifft, so war der richtig wütend, dass er 23 Millionen Dollar verloren hatte. Natürlich war er das, aber er hatte auch fünfzig andere Krypto-Konten und die waren alle in Ordnung, also bin ich mir nicht sicher, welcher Prozentsatz seiner Krypto-Gelder gestohlen wurde, aber er war auf jeden Fall so wütend, dass er sowohl Nicholas als auch AT&T verklagte. Er verklagte AT&T auf 200 Millionen Dollar und behauptete, die Person, mit der er am Telefon gesprochen hatte, habe gesagt, seine Telefonnummer sei sicher und könne nicht per SIM-Swap übernommen werden, und dennoch wurde sie es. Er wollte, dass AT&T zugibt, dass sie der Hauptgrund dafür sind, dass sein Geld gestohlen wurde. Der Richter wies den Fall jedoch ab. Aber Turpin verklagte auch den Hacker, Nicholas, und diese Klage gewann er. Der Richter sprach Turpin 75 Millionen Dollar zu. Während Turpin also 24 Millionen Dollar verlor, wurden ihm letztendlich 75 Millionen Dollar als Entschädigung zugesprochen. Wilde Sache.

Ellis Pinsky hat später übrigens Computer Wissenschaften und Philosophie an der NYU studiert und will mit seinen Jugendsünden nichts mehr zu tun haben.

DREW: Ein wichtiger Tipp für alle Krypto-Anleger da draußen oder alle, die Coinbase-Konten haben: Nutzt für verschiedene Zwecke jeweils eigene E-Mail-Adressen. Trennt eure private E-Mail-Adresse von der für eure Krypto-Investitionen.

JACK: Alles klar, das ist sinnvoll. Wir sind jetzt von "Verwendet keine Passwörter mehrmals" bei "Verwendet keine E-Mails auf hochkarätigen Konten wieder" gelandet. Wenn man eine E-Mail-Adresse hätte, die nur für die Krypto-Börse da wäre und man sie nirgendwo sonst nutzen würde, dann wäre es wirklich schwer, diese E-Mail-Adresse zu finden und sie zu knacken, denn schließlich braucht man einen Benutzernamen und ein Passwort, um in diese Börsen zu gelangen, also warum nicht den Benutzernamen wirklich schwer auffindbar machen? Wenn dein Benutzername Deine E-Mail-Adresse ist, die du für alles benutzt, dann ist das so, als würdest du jedem, mit dem du chattest, die Hälfte deines Logins geben. Wir sind jetzt die 100 Schritte durchgegangen, die es braucht, um jemanden per SIM-Swap anzugreifen und sein ganzes Geld zu stehlen. Das war alles andere als eine schnelle und einfache Methode, um reich zu werden. Es brauchte eine ganze Menge Recherche, um nur ein gutes Ziel zu finden, und das ist wichtig zu wissen, denn die Leute stellen mir ständig Fragen wie: Oh, wie gefährlich kann das sein, wenn ich mein Geburtsdatum auf meinem Facebook-Profil angebe? Sie erwarten irgendeine schnelle und einfache Möglichkeit, wie ein Hacker das gegen sie verwenden kann, aber es ist nicht immer schnell und einfach. Wenn diese Art von Kriminellen Wind davon bekommen, dass du etwas hast, was sie wollen, werden sie dein Leben auskundschaften und ein massives Dossier über dich anlegen, damit sie dein digitales Leben komplett übernehmen und zu dir werden können.

Jeder kleine Fetzen zusätzlicher Information, den sie über dich bekommen können, kann für sie potenziell zum massiven Zahltag werden. Wenn irgendeine obskure Website, bei der du ein Konto hattest, gehackt wird und sie das Passwort bekommen, das du benutzt hast, und du dieses Passwort woanders wiederverwendest, öffnet ihnen das einfach Tür und Tor. Offensichtlich hat es für sie einen Wert, in deine E-Mail und an deine Telefonnummer zu kommen, also sind sie begeistert davon, wenn du das einfach öffentlich postest. Aber dann gibt es noch die kleinen Dinge; in welcher Stadt du bist, welchen Browser du benutzt, welche Dinge du magst, wo du gerne Kaffee trinkst und wer deine Familienmitglieder sind. All diese Dinge können genutzt werden, um dich weiter auszunutzen. Wenn sie wissen, in welcher Stadt du bist, können sie einen Proxy an deinem Standort nutzen, um ihren Datenverkehr so aussehen zu lassen, als käme er von irgendwo in deiner Nähe. Wenn sie wissen, welchen Browser du benutzt, hilft ihnen das, mehr wie du auszusehen, wenn sie versuchen, auf deine Konten zuzugreifen, und wenn sie wissen, welche Dinge du magst, könnte ihnen das etwas über andere Bereiche deines Lebens verraten, die sie sich ansehen sollten. Und wenn sie wissen, wo du gerne Kaffee trinkst, könnte das dazu führen, dass sie dir dort auflauern und dir die Taschen ausräumen, während du in der Schlange für deinen Latte stehst.

Wenn sie Informationen darüber haben, wer deine Familienmitglieder sind, könnten diese Familienmitglieder ins Visier genommen werden. Drew hier hat mir eine Geschichte darüber erzählt, wie die Kids einmal, als sie in das Konto eines Typen kommen wollten, der Ehefrau eine SMS schrieben und sich als der Ehemann ausgaben, um sie dazu zu bringen, die 2-Faktor-Authentifizierungscodes über SMS vorzulesen. Je mehr Informationen sie über dich haben, desto einfacher macht es ihre Arbeit. Stell dir vor, sie hätten vollen Zugriff auf dein Bankkonto und beschließen, das gesamte Geld abzuheben, aber deine Bank entscheidet: Moment, da stimmt etwas nicht, und sie hinterfragen die Überweisung und sagen: Hm, nur um sicherzugehen, dass Sie es sind, wie lautet Ihr Geburtstag? Nun, dieses eine Datum, das du für so harmlos hieltest, um es einfach öffentlich zu teilen, hätte deine Rettung sein können, wenn du es nicht auf Facebook gepostet hättest. Ich hoffe, du bist jetzt überzeugt, deine privaten und persönlichen Daten niemals auf einer öffentlichen Website zu teilen.

Wie nennst du das, diese Gruppe?

DREW: Es gibt da ein paar verschiedene Begriffe. Wir nennen es vor allem „Com“.

JACK: Com, geschrieben C-O-M; das ist die Abkürzung für Community, und das ist neu für mich. Zu meiner Zeit nannten wir es die Szene. Jetzt ist es wohl die Community.

DREW: Ja, wir nennen es aber einfach „Com“. Dann gibt es noch „Simming Com“ und es gibt „Cracking Com“, „Roblox Com“, „Twitch Com“. Da geht's um Twitchzugänge. Es gibt ein „Vanilla Com“. Es gibt „Infosec Com“.

JACK: Huh, die Infosec-Com war mir nicht geläufig, aber Drew hat es mir erklärt. So wie er es sagt, gibt es einige Leute im IT-Sicherheitsbereich, die Teil des Infosec-Twitters seien und als gute Sicherheitsforscher respektiert werden wollen, aber gleichzeitig auch Dinge tun wollen, die illegal oder unethisch sind, und sich quasi gleichzeitig als unschuldiger White Hat und als zwielichtiger Black Hat verhalten, so wie Ryan Phobia Stevenson. Das ist der Typ, der ein paar Bugs meldete, die er bei Telekommunikationsunternehmen gefunden hatte, und dafür belohnt wurde. Aber dann nutzte er diese Bugs, um Kundendaten von Telekommunikationsunternehmen abzugreifen und sie auf Untergrundmärkten zu verkaufen. Der Typ hat doppelt kassiert. Es hört sich so an, als gäbe es Coms für jeden kleinen Schwerpunktbereich, in dem Leute online Geld verdienen können. Aber der rote Faden bei all dem ist, dass sie alle unethische Coms sind, und deshalb nenne ich sie schmutzige Coms. Das sind fiese Communitys.

Der Goldrausch im NFT-Markt

JACK: Lass uns über NFTs sprechen. Also, jeden Tag in den Nachrichten sehe ich einen weiteren Angriff auf NFTs, wie zum Beispiel, dass jemand um seinen Bored Ape betrogen wird oder...

DREW: Ja, natürlich.

JACK: Oder...

DREW: Der Klassiker...

JACK: Okay, fahr fort. Du hast das gesehen. Ist es jemand aus deinen Coms, der diese Dinge durchführt?

DREW: Okay, also, es geht um die ersten, wirklich, wirklich reichen SIM-Com-Nutzer, die ich erwähnt hatte. Also, diese ersten reichen Simmers, die nicht in der aktuellen Version sind, stehlen NFTs. Es gibt eine Gruppe von Leuten, die ich kenne – ich werde sie nicht namentlich nennen, aber im Grunde sind es einfach Leute, die buchstäblich auf Discord gehen; jemand sagt, er brauche Hilfe mit einem NFT. Sie schreiben ihnen eine Nachricht, sie posten ihre Links.

JACK: Huh, ich habe das selbst während des großen NFT-Hypes aus erster Hand miterlebt. Ich war in einem NFT-Discord. Und falls ihr nicht wisst, was ein NFT ist, in diesem Fall ist es einfach digitale Kunst, die man kaufen und verkaufen kann, und diese digitalen Kunstwerke gingen für Tausende von Dollar pro Stück weg, und manchmal sogar für Hunderttausende von Dollar pro Stück. In Discord bekam ich eine Direktnachricht, in der stand, ich sei ausgewählt worden, auf einer Vorverkaufsliste für einen dieser NFT-Drops zu stehen, und ich müsse ihn jetzt kaufen. Aber natürlich habe ich nicht auf den Link geklickt. Aber jemand im Kanal hat es getan, und die Seite sagte, um das NFT zu prägen, müsse man nur sein MetaMask-Krypto-Wallet verbinden und seine 24-Wort-Seed-Phrase eingeben. Nun, diese 24-Wörter sind absolut nichts, was man jemals teilen sollte. Das ist im Grunde das private Passwort zu deiner Krypto-Wallet, und wenn du das jemandem gibst, hast du ihm im Grunde die Kontrolle über deine gesamte Krypto-Wallet übergeben. Nun, diese Person gab ihre Seed-Phrase auf der gefälschten Website ein, und sobald sie das tat, gelangte der Dieb in ihre Krypto-Wallet und nahm all ihre wertvollen NFTs und verkaufte sie für etwa den halben Preis. Der Dieb machte etwa 40.000 Dollar in Ethereum in vielleicht fünf Minuten. Es war absolut verrückt, mitanzusehen, wie dieser Person direkt vor meinen Augen das Konto leergeräumt wurde, und es gab nichts, was irgendjemand tun konnte, um es zu stoppen.

Es gibt echt keinen Mangel an Geschichten von Leuten, die digital ausgeraubt werden und denen die Krypto-Wallet gestohlen wird, und ich glaube, der Grund ist der, dass diese Krypto-Wallets Unmengen an Geld beinhalten und sie genau wie Browser-Add-ons sind. Wenn du deine Krypto-Wallet mit der falschen Seite verbindest, ist das Spiel vorbei, und es ist so einfach, sie mit der falschen Seite zu verbinden. Es ist ein bisschen, als hätte man sein Bankkonto direkt im Browser als Plug-in zugänglich, und alle Seiten, die man besucht, wollen alle einen Blick darauf werfen. Aber das ist erst der Anfang; fast jeden Tag passiert das. Es gibt so viele Betrüger, die versuchen, Zugang zu den Krypto-Wallets von Leuten zu bekommen, in denen sich Kryptowährung oder ein NFT befinden könnte. Die Betrügereien sind riesig und schnell, sie kommen aus jedem Winkel auf dich zu, wenn du dich in diesem Bereich bewegst. Zum Beispiel war ein anderer großer Betrug, den ich gesehen habe, als ein NFT-Projekt kurz vor dem Start stand. Und der Starttag ist ein großer Tag. Jeder, der dabei sein will, will sich beeilen, um seine Token zu prägen und zu hoffen, dass der Preis steigt. In diesen Momenten herrscht also ein Rausch, weil es ein begrenztes Angebot gibt und man nicht leer ausgehen will. Wenn Leute es also eilig haben, etwas zu kaufen, sind sie bereits anfällig dafür, Fehler zu machen, und typischerweise werden eifrige Käufer im Discord-Chatroom für dieses NFT sein, um zu beobachten, was vor sich geht. Aber es gibt eine ganze Reihe von Dingen, die dabei schiefgehen können. Erstens kann der Besitzer des Discords gehackt werden, und Drew erklärt, wie das passiert.

DREW: Sie haben ihre Glaubwürdigkeit über einen Freund aufgebaut; so läuft das immer. „Hey, mein Freund meint, ich soll mal mit dir reden.“ Irgendwann schleicht er sich dann langsam heran, indem er eine Art Datei schickt, mit der sie ihn tatsächlich über das Discord-Token-Protokoll identifizieren können.

JACK: Wenn ihr Discord benutzt, stehen die Chancen gut, dass ihr nicht jedes Mal euren Benutzernamen und euer Passwort eingebt, wenn ihr die Seite besucht oder die App öffnet. Das liegt daran, dass, sobald man sich authentifiziert hat, ein kleines Authentifizierungs-Token auf dem Computer existiert, das einen eingeloggt hält. Aber wenn man einfach das Authentifizierungs-Token nehmen kann, dann kann man sich als diese Person einloggen, ohne ein Passwort zu benötigen. Das Authentifizierungs-Token hat all das Zeug da drin, und ja, wenn man jemanden dazu bringen kann, seine Malware zu installieren, kann die Malware das Token stehlen. Okay, wenn man also Zugang zum Konto eines Moderators auf einem beliebten Discord-Kanal bekommt, der kurz davor steht, ein NFT zu starten, dann kann man eine Menge Geld verdienen. Alles, was man tun muss, ist, die offizielle Website dieses NFTs zu kopieren, was super einfach ist, und eine ähnlich aussehende URL mit einem anderen Buchstaben zu erstellen, und zu ändern, wohin das Geld geht, wenn jemand das NFT kauft. Anstatt dass das Geld an den NFT-Macher geht, geht es jetzt in deine Wallet. Alles, was man jetzt noch tun muss, ist, die Leute auf seine Seite zu leiten, und da man ein Moderator ist, kann man das.

DREW: Poste eine Hauptnachricht, Feuer frei.

JACK: Die Nachricht könnte lauten: "Minting ist jetzt live, offen für alle, aber beeilt euch; wir schließen in zehn Minuten". Einige dieser Discord-Kanäle haben über 50.000 Leute da drin, alle bereit zum Kauf. Ihr könnt euch vorstellen, dass, wenn 50.000 Leute eine Nachricht wie diese sehen, dass das Projekt live gegangen ist und sie bereit zum Prägen sind, dass sie auf die Seite strömen werden, um ihre NFTs zu kaufen. Ich habe das immer und immer wieder gesehen. Betrüger infizieren Discord und verdienen damit in zehn Minuten über 100.000 Dollar. Aber es gibt auch andere Betrügereien, die auf Discord ablaufen.

DREW: Es gibt Leute, die tatsächlich NFT-Discords kaufen und sie dann künstlich anwachsen zu lassen. Das machen sie, um einen Exit-Scam durchzuziehen oder einfach um sie an jemanden zu verkaufen, der einen Exit-Scam durchziehen wird.

JACK: Oh ja, das habe ich auch gesehen. Wenn man ein NFT-Projekt findet, das 100.000 Follower auf Twitter und 80.000 Mitglieder auf Discord hat, wird man denken, dass das ein heißes NFT-Projekt ist, und sich mehr dafür begeistern. Aber die Zahlen sind alle gefälscht. Es ist ein Discord-Kanal, der erst letzte Woche gekauft wurde, und er kam schon mit 80.000 Mitgliedern, aber das sind alles Bots. Es erzeugt also einen falschen Hype darum, und sie starten ein Projekt und die Leute bezahlen sie, und sie bekommen nichts dafür außer irgendein billiges Kunstwerk, das von jemandem auf Fiverr gemacht wurde. Die Macher schnappen sich einfach das Geld und verschwinden. Auch hier kann ein Betrug wie dieser jemandem über 100.000 Dollar einbringen, wenn er richtig gemacht wird. Aber das sind sicherlich ziemlich aufwendige und komplexe Betrügereien. Es dauert lange; man muss eine Website bauen, einen NFT-Server kaufen, die ganzen Kunstwerke erstellen. Es ist nicht einfach und erfordert echtes Fingerspitzengefühl. Aber dann, als gäbe es nicht schon genug NFT-Betrügereien, passieren auch noch Influencer-Betrügereien.

DREW: Sie engagieren eine seriös wirkende Person als Strohmann. Es handelt sich um wohlhabende Leute, die als Krypto-Influencer auftreten und andere dazu bringen, auf diese Tricks hereinzufallen – zum Beispiel ihre Freunde. Sie überreden ihre Freunde, auf NFT-Betrügereien hereinzufallen, und hinter all dem stecken diese millionenschweren SIM-Swapper. Das ist schrecklich.

JACK: Yikes, Mann, man kann in NFT-Land nicht einmal seinen Freunden vertrauen. Sie könnten von den Betrügern dafür bezahlt werden, dich zu betrügen. Ich habe mich ein bisschen mit diesen NFTs beschäftigt und ich sage euch, das ist nichts für Anfänger. Es ist gespickt mit Landminen, Hackern, Dieben, Betrügern, Kriminellen und so vielem mehr, was für mich ein Spaß ist, den ganzen Wahnsinn zu beobachten.

Vom Kinderzimmer ins Gefängnis

JACK: Es ist aber nicht jedermanns Sache, und diese Leute versuchen hart, an deine Krypto-Wallet zu kommen und deine Vermögenswerte zu plündern. Sie können es ungestraft tun, weil es so schwer ist, Krypto-Raubüberfälle zurückzuverfolgen.

DREW: Die machen das aus reiner Profitgier, Leute wie Joel Ortiz, Nicholas Truglia, Xavier Clemente.

JACK: Warum nennst du hier diese Namen?

DREW: Die Namen sind ja bekannt, die wurden verhaftet.

JACK: Oh, okay. Oh, die – die wurden alle verhaftet?

DREW: Die berühmtesten SIM-Swapper, die verhaftet wurden sind; PlugWalkJoe, AKA Joseph, James O’Connor.

JACK: Okay, ich muss nachschauen, was diese Leute getan haben. Okay, Joel Ortiz wurde wegen SIM-Swapping verhaftet. Tatsächlich war er die allererste Person, die wegen SIM-Swapping verurteilt wurde. Das ist wild; 2019 ist das erste Mal, dass ein SIM-Swapper jemals verurteilt wurde. Das ist wirklich die Definition eines modernen Verbrechens, wenn erst vor ein paar Jahren das erste Mal überhaupt jemand dafür verurteilt wurde. Joel Ortiz war also einundzwanzig, aus Boston, und laut Polizei hat er vierzig Personenbetrogen und insgesamt 7 Millionen Dollar durch die Durchführung von SIM-Swaps gestohlen. Er wurde verhaftet und bekam dafür zehn Jahre Gefängnis. Wir haben bereits über Nicholas Truglia gesprochen, aber Drew erwähnte auch Xavier Clemente. Dieser Typ war neunzehn Jahre alt, als er wegen SIM-Swapping verhaftet wurde. Die Polizei sagt, er habe über eine Million Dollar in Kryptowährungen gestohlen. Ellis Pinsky bekam den Spitznamen Baby Al Capone, weil er erst fünfzehn Jahre alt war, als er verhaftet wurde. Oh, und übrigens, die von der Polizei beschlagnahmten Gegenstände sind unglaublich; Luxusuhren, Luxusautos, Penthouse-Wohnungen. Diese Kinder verpulvern es so schnell, wie sie es bekommen, und fast alle von ihnen haben eine Spielsucht, bei der sie etwas Geld in ein Online-Casino stecken und am Rad drehen und versuchen, den noch größeren Gewinn zu erzielen. Sie mögen es irgendwie, in Livestreams und so damit anzugeben, wieviel sie bereit sind zu setzen, damit andere sehen können, wie viel Geld sie haben. Es ist verrückt.

DREW: Auf ihren Telegram-Kanälen posten sie regelmäßig Screenshots ihrer Opfer, zeigen, wie viel Geld die auf ihren Konten haben, und erzählen, dass sie ihnen gerade Millionen von Dollar abgezockt haben. Das lässt sich leicht überprüfen, denn sie zeigen einem buchstäblich die Transaktions-IDs und ihre Bitcoin-Wallets, die mit Millionen von Dollar gefüllt sind. Jeden Tag verschenken sie Tausende von Dollar. Sie machen einfach total verrückte Sachen mit ihrem Geld, sind halt noch Kinder.

JACK: Diese Liste geht weiter und weiter. Viele Leute werden verhaftet, die unter achtzehn Jahre alt sind, und deshalb sehen wir ihre Namen einfach nie in den Nachrichten. Einige von ihnen werden erwischt und müssen einfach die Kryptowährung oder NFTs zurückgeben, die sie gestohlen haben, und sie bekommen nur eine strenge Verwarnung. Ich weiß nicht, wie es euch geht, aber all das haut mich einfach um. Ich hatte vorher keine Ahnung, wie diese Untergrund-Community aussah. Aber jetzt habe ich das Gefühl, dass sich meine Augen angepasst haben und ich im Dunkeln sehen kann. Geht es euch auch so? Ich habe das Gefühl, das Internet ist im Moment ein absolutes Kriegsgebiet. Jeden Tag hören wir von einem weiteren Unternehmen, das von Ransomware oder einem Datenleck getroffen wird, aber all das ist weit weg. Das passiert nicht in meiner Nachbarschaft. Aber das hier ist mein Hinterhof. Das sind Teenager, die ganz normale Leute ins Visier nehmen, und ihre Spitznamen sind kein Zufall. Baby Al Capone oder Billy the Kid. Billy the Kid hat früher Züge überfallen. Er hat einfach wahllos Leute überfallen und Geld von ihnen gefordert, im Grunde passiert hier das Gleiche. Wenn man öffentlich erwähnt, dass man eine Menge Kryptowährung hat, kann man wahrscheinlich damit rechnen, dass jemand das von einem stehlen will. Es ist nicht einfach, das sicher aufzubewahren. Es ist wirklich knifflig.

Wenn ihr also Krypto habt, dann rate ich euch dringend, nicht all euer Zeug auf eine Adresse zu legen. Teilt es auf verschiedene Wallets auf, denn wenn etwas kompromittiert wird, wollt ihr nicht, dass sie das ganze Sparschwein mitnehmen. Die Telefongesellschaften sollten wahrscheinlich ihre Sicherheit erhöhen. Es macht den Eindruck, als würden sie versuchen, es schwieriger zu machen, und deshalb zahlen die Leute heute auch 10.000 Dollar pro SIM-Swap. Aber wie können sie es eliminieren, wenn es Insider gibt, die als Regionalmanager arbeiten und an dem Betrug beteiligt sind? Sie könnten das Äquivalent eines ganzen Jahresgehalts bekommen, indem sie einem SIM-Swapper helfen, einen Millionen-Dollar-Lick zu landen. Das könnte schwer abzulehnen sein für jemanden, der das Geld wirklich braucht. Vielleicht ist die Antwort, keine SIM-Karten mehr zu verwenden und einfach immer einen WLAN-Hotspot in der Tasche zu haben und das Telefon darüber laufen zu lassen, wenn man jemanden anrufen muss. Ich weiß es nicht. Börsen wie Coinbase machen einen ziemlich guten Job dabei, es Kriminellen schwer zu machen, in das Konto von jemandem zu gelangen. Tatsächlich glaube ich, dass Coinbase beim Exploit, von dem Drew sprach und der es jemandem ermöglichte, das Guthaben eines Kontos ohne 2FA zu überprüfen, alle Leute entschädigt hat, die von diesem Exploit betroffen waren.

Aber vielleicht sollten sie jeden dazu zwingen, Google Authenticator zu nutzen. Das würde es für diese Leute schwieriger machen, oder vielleicht die Option geben, ein zweites Passwort auf der Seite zu haben, das nur für Überweisungen ist. Das Problem ist, je schwerer sie es Kriminellen machen, Dinge zu stehlen, desto schwerer machen sie es den Nutzern, die Seite zu bedienen. Es wird also zu einer schwierigen Balance. Obendrein bin ich mir sicher, dass Nordkorea Coinbase die ganze Zeit angreift und versucht, irgendwo eine Hot Wallet zu finden, um da reinzugreifen. Sie haben also wirklich ein ziemliches Päckchen, gegen das sie sich verteidigen müssen. No pressure? Aber mir scheint zumindest offensichtlich, dass, selbst wenn man ein paar dieser Probleme behebt, die Leute in diesen schmutzigen Coms einfach einen anderen Weg finden, es zu tun. Da das Internet sich mit der Geschwindigkeit bewegt, mit der es sich bewegt, stellen Software und Websites die Sicherheit nicht immer an erste Stelle. Das sind einige der Konsequenzen, wenn man das nicht tut. Wie ich am Anfang sagte, wird nicht viel Weisheit von Generation zu Generation darüber weitergegeben, was die Gefahren des Internets sind, sei es für die Nutzer der Seite oder die Teenager, die versuchen, sich in sie zu hacken. Ich glaube, es wird noch schlimmer werden, bevor es besser wird.

Es könnte sogar noch vierzig Jahre dauern, bis wir eine Welt sehen, in der die Leute auf sichere, verantwortungsvolle Weise online gehen, in der die Nutzer ihre Privatsphäre und Sicherheit über alles schätzen und wissen, dass sie keine Apps installieren oder Geräte kaufen sollten, die ihre Privatsphäre gefährden, und ein starkes Verständnis für die digitalen Gefahren da draußen haben und Dinge tun, um sich selbst zu schützen. Deshalb habe ich diese Episode für euch gemacht, jetzt habt ihr einen viel klareren Blick darauf, warum euch jemand ins Visier nehmen würde und wie sie es tun, wenn ihr vielleicht vorher nie gedacht hättet, dass ihr das Ziel wärt.

Deshalb gibt es Dinge wie die Defcon. Das ist eine Konferenz, zu der Hacker gehen, um all die neuen Wege zu zeigen, die sie gelernt haben, um sich in Dinge zu hacken. Der Hauptfokus dort liegt darauf, offensive Hacking-Techniken zu teilen, und das Teilen dieser Techniken hat die Sicherheit wohl besser gemacht, denn wenn die Leute sie nicht teilen, dann wissen wir nicht, dass das Problem existiert, und man kann nichts unternehmen, um sich dagegen zu verteidigen.

Die echten Kriminellen und staatlichen Akteure teilen ihre Techniken nicht öffentlich, weil sie nicht wollen, dass sie behoben werden. Wir können das nicht einfach ignorieren und hoffen, dass Sicherheitsprobleme sich irgendwie von alleine beheben. Meine Hoffnung ist, dass ihr, nachdem ihr von all diesen Techniken gehört habt, euer digitales Leben nun ernster nehmt als zuvor. Ich stelle mir eine Welt vor, in der die Nutzer so gut über Sicherheit aufgeklärt sind, dass sie es auf sich nehmen, ihre Umgebungen extrem abzusichern, weil sie zu oft von bösen Akteuren getroffen wurden oder einfach gelernt haben, wie man das Internet sicher nutzt. Aber es wird lange dauern, bis wir dort ankommen. Manchmal müssen Dinge zusammenbrechen, bevor sie durchbrechen können. Es ist ein Kriegsgebiet da draußen. Seid vorsichtig, aber seid mutig. Haltet durch. Ihr schafft das. Nehmt eure eigene digitale Sicherheit ernst. Praktiziert gute digitale Hygiene. Viel Glück beim Ausweichen vor den Kugeln.

JACK: (OUTRO): Ein großes Dankeschön an Drew für das Teilen dieses Einblicks in die verschiedenen Coms und was dort vor sich geht.

Diese Episode wurde im englischen Original von Jack Rhysider erstellt. Den Text haben Marko Pauli und Isabel Grünewald übersetzt und gesprochen.

Produktion: Marko Pauli

Titelmusik: Breakmaster Cylinder

Dies sind die Darknet Diaries auf Deutsch von Heise Online.

Weiterlesen

Dies ist der zweite Teil von „Kids ohne Skrupel". Wenn Ihr Teil eins noch nicht gehört habt, fangt am besten da an. Im Englischen Original von Jack Rhysider trägt diese Episode den Namen „Dirty Coms“.

Die deutsche Produktion verantworten Isabel Grünewald und Marko Pauli von heise online. Der Podcast erscheint wöchentlich auf allen gängigen Podcast-Plattformen und kann hier abonniert werden.

JACK: Mein Gast ist „Drew" – ein junger Mann, der als Teenager tief in die Welt der Online-Untergrund-Communities abgerutscht ist. Er gibt uns einen schonungslosen Einblick in die Szene rund um Hacker, Betrüger und digitale Schwarzmärkte. Drew erzählte uns in der ersten Folge, wie er mit dreizehn Jahren über Roblox und dubiose Robux-Deals in kriminelle Kreise geriet, sich an Geschenkkarten-Phishing beteiligte und auf dem berüchtigten Forum OGUsers mit dem Handel gestohlener Benutzernamen Geld verdiente. Dabei wurde er selbst mehrfach gedoxxt, erpresst und zweimal mit 10.000 USPS-Kartons vor seiner Haustür zugemüllt – eine beispielhafte Geschichte, für den schonungslosen Umgang Krimineller untereinander. In Teil 1 haben wir gehört, wie Drew Schritt für Schritt in diese toxische Welt hineingezogen wurde, welche Lektionen er über Opsec und Vertrauen im Netz gelernt hat, und warum er diese Szene heute dokumentieren und offenlegen will. Jetzt in Teil 2 wird es konkreter – denn Drew fängt an, Namen zu nennen und Methoden zu enthüllen, mit denen in diesen Communities richtig viel Geld gemacht wird.

Das Geschäft mit dem SIM-Swapping

DREW: Lass mal überlegen. Was habe ich Kids in letzter Zeit tun sehen?

JACK: Lass uns doch beim SIM-Swapping einsteigen.

DREW: Wir können über SIM-Swapping sprechen.

JACK: Okay, also ihr wisst vielleicht, was SIM-Swapping ist, aber falls nicht, erkläre ich es ganz schnell. SIM-Swapping ist, wenn du die Telefongesellschaft austrickst, damit sie eine fremde Handynummer auf dein Telefon beziehungsweise Deine SIM-Karte überträgt. Wenn man zum Beispiel sein Handy verliert und ein neues bekommt, muss man der Telefongesellschaft sagen, dass man ein neues Telefon hat und dass die Nummer darauf funktionieren soll. Eigentlich sollte es nicht möglich sein, dass jemand einfach deine Telefonnummer übernimmt, aber es gibt Wege, wie das gemacht werden kann. Der erste Weg ist ziemlich offensichtlich.

DREW: Man sucht sich einen Insider in diesen Unternehmen, normalerweise einen – wie wir ihn nennen – „Manny“ oder Manager, der einem seine Zugangsdaten gibt oder einfach SIM-Swaps durchführt, wenn niemand hinschaut, als wäre es ein imaginärer Kunde. Diese Insider werden häufig mit etwa 10.000 Dollar pro Swap bezahlt. So hat das SIM-Swapping angefangen.

JACK: Okay, das ist also eine Möglichkeit, einen SIM-Swap durchzuführen. Wenn man Filialleiter eines Handyladens ist, hat man natürlich die Möglichkeit dazu. Wenn man das für eines dieser Kids macht, kann man richtig viel Geld verdienen, locker über 1.000 Dollar pro Nummer. Vielleicht sogar 10.000 Dollar pro Nummer. Aber es gibt eine neue Methode, wie diese Kidsr das machen, und die ist irrsinig, geradezu brutal.

DREW: Da ist es nicht so, dass man nicht die Telefongesellschaft anruft; die neue Methode nennt sich Remo-Snatching. Remo ist die Abkürzung für Remote-Tablet. Man geht also zum Beispiel zu T-Mobile. T-Mobile ist derzeit das einfachste Ziel. Man geht in einen T-Mobile-Laden, rennt rein, reißt dem Filialleiter das Tablet aus den Händen und rennt wieder raus.

JACK: Alles klar. Wenn man das Tablet des Filialleiters hat, ist das das Gerät, das autorisiert ist, Telefonnummern zu übertragen. Es macht also Sinn, dass man durch den Diebstahl einen SIM-Swap bei jemandem durchführen kann. Aber halt, ganz so einfach ist es nicht. Gehen wir einen Schritt zurück und zwar einen großen Schritt zurück. Zuerst muss man wissen, bei wem es sich lohnt, einen SIM-Swap durchzuführen. Das Ziel zu identifizieren, kann lange dauern, und dafür sind viele Schritte nötig, und die möchte ich hier aufschlüsseln. SIM-Swapping war schon ein paar Mal Thema in den US-Darknet Diaries, zum Beispiel in den Episoden The Pizza Problem und Tennessee. Das sind zwei Geschichten, in denen Leute ins Visier genommen wurden, einfach weil sie wertvolle Benutzernamen auf Instagram und Twitter hatten. Okay, das wäre also ein Grund, jemanden ins Visier zu nehmen: um die Kontrolle über seinen Benutzernamen zu erlangen und ihn auf OGUsers für ein paar tausend Dollar zu verkaufen. Aber ich habe das Gefühl, das ist mittlerweile ein alter Hut. Es gibt eine ganz neue Verbrechenswelle, die da über uns rollt.

DREW: Die Leute führen einen SIM-Swap für Bankzugänge durch – also Bank-Logins –, über die sie Geld überweisen oder eine Überweisung vornehmen.

JACK: Okay, also Bank-Daten; obwohl das in dieser Community ein großes Ding ist, ist es wirklich schwer, sowas tatsächlich durchzuziehen. Zuerst muss man ein gültiges Login für den Benutzer herausfinden, und woher man Passwörter bekommt, darauf kommen wir später. Aber nehmt für den Moment einfach an, dass wir einen funktionierenden Benutzernamen und ein Passwort für ein Bankkonto haben. Wir loggen uns also in das Konto ein.

DREW: Aber es gäbe keine Möglichkeit, das Geld abzuheben, denn dafür müsste man ein Einmalpasswort oder eine Einmal-PIN erhalten. Also versuchen sie, die SIM-Karte der Person zu tauschen, um an den Einmal-Code zu kommen. SIM-Swapping bei Banken ist eigentlich ein verrücktes Unterfangen, denn es liegt zwar eine Menge Geld auf Bankkonten, aber man braucht auch praktisches Wissen über Geldwäsche, da man buchstäblich das Geld der Person stiehlt und einen Weg finden muss, damit es nicht zu einem zurückverfolgt werden kann. Das ist natürlich extrem schwierig.

JACK: Richtig, während es also einige wirklich clevere Leute gibt, die in diesem Bereich mitmischen, ist das einfachere Ziel, es auf Leute abzusehen, die Kryptowährungen haben. Denn mit Kryptowährungen ist es kinderleicht, das ganze Geld in einer Wallet zu schnappen und es einfach an einen Anonymisierungsdienst wie Tornado Cash zu senden und auszahlen zu lassen. Da das aber so ein lohnendes Ziel ist, sind allerhand Leute hinter Kryptowährungen her. Wie auch immer, es ist für diese Kids sinnvoll, Leute mit prall gefüllten Krypto-Wallets ins Visier zu nehmen, aber wie findet man jemanden mit einer fetten Krypto-Wallet? Nun, das erfordert eine ganze Reihe von Schritten.

DREW: Es handelt sich also um einen riesigen Markt, der ziemlich im Verborgenen stattfindet. Die Leute nutzen sogenannte „Combo-Listen“, also im Grunde durchgesickerte Datenbanken mit Passwörtern und E-Mail-Adressen, wobei die Passwörter natürlich entschlüsselt wurden, etwa mit RainbowCrack oder John the Ripper. Sie lassen diese Daten durchlaufen und suchen nach sogenannten „Commons“, also Passwörtern, die auf mehreren Websites verwendet werden.

JACK: Okay, ihr habt hier ja schon öfter von großen Websites gehört, die von Datenlecks betroffen sind, wo die gesamte Benutzerdatenbank gestohlen wird. Wenn man Kunde auf einer dieser Seiten ist, zuckt man vielleicht einfach mit den Schultern, ändert vielleicht sein Passwort und macht weiter, in der Hoffnung, dass nichts auf einen zurückfällt, oder? Nun, solche Daten sind in diesen Kreisen Gold wert. Zuerst kann man auf eine Seite wie raidforums.com oder nulled.2 oder cracked.2 gehen. Seiten, die Tonnen von kompletten Datenbank-Leaks posten. Es kostet vielleicht ein paar Dollar, um ranzukommen, aber man kann sich die dann direkt dort herunterladen. Wir sprechen von großen Websites, die gehackt wurden; und deren Datenbanken liegen genau dort, leicht zu schnappen, Seiten wie Adobe, die Alaska-Wählerdatenbank. Es gibt dort anscheinend eine Apple-Datenbank. Adult Friend Finder, die Android-Foren, und das ist nur ein kleiner Auszug aus den A's. In diesen Datenbank-Dumps können eine Menge Infos sein, enthalten typischerweise enthalten sie aber den Namen einer Person, ihren Benutzernamen, ihre E-Mail, vielleicht ihre Telefonnummer, vielleicht ihre Adresse und ihr Passwort. Aber ihr Passwort ist in der Datenbank typischerweise gehasht, was bedeutet, dass man nicht wirklich sehen kann, wie es lautet.

Datenlecks als Schatzkarte für Hacker

Ab hier kommen Tools ins Spiel, die Passwort-Hashes knacken können. Es ist schwer, einen einzelnen Hash zu knacken, aber wenn es das ist, was man haben will und man gleichzeitig also hundert Millionen Datensätze in der Adobe-Datenbank hat, dann wird man wahrscheinlich einige Hashes finden können, die nicht besonders stark sind. Für diese Leute hat man dann gültige Benutzernamen und Passwörter. Jetzt nimmt man diesen Benutzernamen oder diese E-Mail-Adresse und gleicht sie mit anderen Datenlecks ab. Verwendet diese Person Passwörter wieder? Gibt es Benutzernamen und Passwörter im Adobe-Leak, die auch bei Netflix funktionieren? Die Antwort ist immer: Leider ja. Viele Leute suchen sich einfach ein Passwort aus und verwenden das dann auf allen Seiten, auf denen sie Konten haben. Nur durch das Knacken eines Datenbank-Dumps hat man nun also Zugriff auf das Netflix-Konto von jemandem, und schon das eröffnet einen völlig neuen, riesigen Markt in den Untergrund-Communitys. Die Leute kaufen Netflix-Konten für jeweils 2,50 Dollar, weil das offensichtlich viel billiger ist, als die 18 Dollar im Monat für ein Premium-Abonnement zu bezahlen.

DREW: Okay, übertragen wir das mal auf Walmart, Chipotle, Nordstrom, OnlyFans, Surfshark, NordVPN, Macy’s Credit, Buffalo Wild Wings und Papa Johns.

JACK: Es gibt Seiten, auf die man gehen kann, um Benutzerkonten für jede dieser Websites zu kaufen. Man bekommt vielleicht sogar ein Kombipaket für einen Haufen Logins, sagen wir 10 Dollar für das ganze Paket. Aber Moment, ihr fragt euch vielleicht, warum jemand ein Login für eine Restaurantkette wie Chipotle kaufen wollen würde? Nun, willkommen beim Fall der mysteriösen Burrito-Bestellungen, von dem Leute im Chipotle-Subreddit berichten. Man kann eine Chipotle-App auf sein Telefon herunterladen und sie nutzen, um Essen zu bestellen, aber die App ist oft mit der Kreditkarte verbunden. Man kann also das Chipotle-Konto von jemand anderem nutzen, um einen Burrito für sich selbst zu bestellen, und dann bezahlen die anderen dafür. Das Gleiche gilt für Papa Johns; kostenlose Pizza, wenn man ein gültiges Login für das Konto von jemand anderem hat. Das führt uns in die Welt der Pizza-Plugs, die ich schon eine Weile genau beobachte.

Es ist fast schon ein Mythos. Es gibt diese Chatrooms, in die man gehen und eine Essensbestellung aufgeben kann, wie zum Beispiel drei große Pizzen, und jemand im Chatroom nimmt die Bestellung an und verlangt vielleicht 5 Dollar von dir. Dann nutzen sie das gestohlene Pizza-Konto, um sich einzuloggen, die Bestellung aufzugeben und dir dann die Pizza zu schicken. Es hat sie 2 oder 3 Dollar gekostet, das Konto zu kaufen; sie verdienen 5 Dollar damit. Du bekommst drei Pizzen für 5 Dollar, und oh, der Kontoinhaber ist derjenige, der dafür bezahlt. Ich sage euch, das geht so viel tiefer, als ich Zeit dafür habe. Oh, und der Slang für den Kauf und Verkauf dieser gültigen Logins ist einfach Logs. Es gibt also einen Haufen Leute da draußen, die Datenbank-Dumps durchsuchen und versuchen, gültige Logs für so viele Orte wie möglich zu finden, damit sie diese Logs mit Gewinn verkaufen können.

DREW: Apple-Logs kannst du für bis zu 50 Dollar verkaufen, denn die Leute können mit deiner verknüpften Apple-Kreditkarte ein paar MacBook-Bestellungen aufgeben. Wenn du davon zehn Bestellungen pro Tag bekommst, sind das 500 Dollar am Tag.

JACK: Ein wirklich beliebtes Login im Moment sind Hilton Honors Logins, weil dir diese Logs ein paar kostenlose Übernachtungen in einem schicken Hotel bescheren können. Okay, also gibt es zwei Arten von Konten, die man bekommen kann; FA und NFA. Das heißt, Full Access (Vollzugriff) und Non-Full Access (kein Vollzugriff). Alle Konten, die wir gerade aufgelistet haben, sind im Grunde NFA, kein Vollzugriff. Ein Konto mit Vollzugriff ist eines, das all diese gültigen Logins hat, plus ein gültiges E-Mail-Konto-Login. Das bedeutet also, wenn man in das Outlook oder Gmail von jemandem hineinkommt, dann kann man ganz einfach das Passwort für jedes dieser anderen Konten zurücksetzen, in das man hinein will. Es gibt einem wirklich vollen Zugriff auf das digitale Leben von jemandem, und es gibt ein kleines Tool, das Leute benutzen, mit dem sie, sobald sie im E-Mail-Konto von jemandem sind, schnell alle E-Mails durchsuchen können, um zu sehen, ob es in diesen E-Mails wertvolle Informationen gibt.

DREW: Das Programm, das das macht, heißt Yahoo Arranger. Es sucht automatisch nach Schlüsselbegriffen innerhalb von Yahoo oder den Websites, von denen man wissen will, ob sie dort angemeldet sind. Wenn man also sehen will, ob sie bei Amex oder Bank of America oder Chipotle angemeldet sind, nutzt man einfach Yahoo Arranger und schaut nach.

JACK: Verrückt, oder? Aber es ist wirklich nicht so komplex, wenn man auch keine FA-Konten hat. Man kann einfach einen Datenbank-Dump nehmen und ihn in eine Combo-Liste umwandeln; das ist nur eine formatierte Liste, die Benutzername und Passwort anzeigt, und man könnte diese Combo-Liste nehmen und hätte ein Tool bauen, das einfach automatisch versucht, sich bei unzähligen Seiten einzuloggen, um zu prüfen, ob das Passwort irgendwo funktioniert.

DREW: Dann nutzen sie Software wie Sentry NBA, OpenBullet oder SilverBullet, um damit automatisch all diese Combo-Listen zu überprüfen. Das ist also kein manueller Prozess, und er läuft mit wahrscheinlich 5.000 CPM, was bedeutet, dass er oft mit 5.000 Versuchen pro Sekunde läuft. Die Leute verkaufen schätzungsweise bis zu 5.000 Logs am Tag in ihren Shops. Ich persönlich kann sehen wie viel Bestand ein Shop hat, also kann man erkennen, wie viele Verkäufe man pro Tag erzielt. Ich habe gesehen, wie Leute bis zu 10.000 Konten pro Tag für 3,50 Dollar pro Konto verkauft haben; 35.000 Dollar.

JACK: Okay, jetzt sollte klar sein, wie jemand an einen Haufen gültiger Logins für verschiedene Seiten kommen kann. Aber eigentlich wollte ich das alles nur sagen, weil das euch helfen wird zu verstehen, wie wir jemanden finden, der eine Menge Kryptowährung hat, um ihn ins Visier zu nehmen.

DREW: Die beliebteste Datenbank, die ich in meinen Jahren hier je gesehen habe, ist die Ledger-Datenbank. Ledger ist ein Unternehmen, das physische Cold-Wallet-Speicher für Bitcoin anbietet. Denn, was sagt es über jemanden aus, wenn er eine Ledger-Wallet kauft? Es bedeutet, dass er oder sie Bitcoin hat. Das macht diese Personen zu deiner perfekten Zielgruppe für Kryptowährungen.

JACK: Oh, sehr interessant. Ledger ist eine physische Krypto-Wallet, und im Jahr 2020 wurde deren Benutzerdatenbank gehackt. Fünf Monate später wurde die Datenbank in Raid-Foren gepostet. In der Datenbank befinden sich E-Mail, Name, physische Adresse und Telefonnummer. Es waren aber keine Passwörter oder Krypto-Schlüssel dabei. Aber man kann natürlich die E-Mail-Adresse aus der Ledger-Datenbank nehmen und abgleichen, ob sie mit E-Mails in einer anderen Datenbank übereinstimmt, und dort kann man dann nachschauen, ob es bekannte Passwörter für diese E-Mail-Adresse gibt. Dann kann man versuchen, diese E-Mail-Adresse und das Passwort bei Coinbase oder Binance oder Kraken oder FTX oder Gemini oder irgendeiner Krypto-Börse einzugeben, um zu sehen, ob es ein gültiges Login ist. Das sind alles Krypto-Börsen, wo Leute ihre Kryptowährung aufbewahren. Wenn man den Benutzernamen und das Passwort von jemandem bei einer Krypto-Börse kennt, bedeutet das natürlich echten Ärger für ihn. Aber es gibt ein paar Sicherheitsprüfungen, die diese Börsen eingerichtet haben, um Kids wie diese zu bremsen. Erstens ist es schon sehr viel wert, nur zu wissen, ob die Person zum Beispiel bei Coinbase registriert ist. Vergesst das Passwort für eine Sekunde; einfach nur, ist diese E-Mail hier überhaupt registriert?

Wenn man die E-Mail-Adresse von jemandem und ein falsches Passwort eingibt, gibt es keinen Hinweis darauf, ob diese E-Mail dort registriert ist oder nicht. Wenn man jedoch versucht, sich für ein neues Konto mit einer E-Mail-Adresse anzumelden, die bereits existiert, dann Bingo. Coinbase lässt sich in die Karten schauen und sagt, dass diese E-Mail hier bereits registriert ist. So kann jemand den Ledger-Datenbank-Dump nehmen und herausfinden, wer Konten bei Coinbase oder Gemini oder Kraken oder Binance oder wo auch immer hat, und das dann mit anderen Datenbank-Dumps abgleichen, um herauszufinden, wie das Passwort für diese Konten lautet.

Wenn nun ein Dieb eine gültige E-Mail und ein Passwort für dein Krypto-Konto hat, steht ihm immer noch eine große Hürde im Weg; 2FA. Alle Krypto-Börsen verlangen, dass man die Zwei-Faktor-Authentifizierung aktiviert. Sie empfehlen, sich so etwas wie Google Authenticator oder Authy zu besorgen. Das sind Apps auf deinem Handy, die eine sechsstellige Nummer generieren, die du brauchst, um dich einzuloggen. Aber als absolutes Minimum schicken sie dir zur 2 Faktor Authentifizierung eine SMS mit einem sechs- oder siebenstelligen Code zum Einloggen. Ein Benutzername und ein Passwort allein reichen also nicht aus, um in das Krypto-Konto von jemandem zu gelangen. Man braucht auch diesen 2FA-Code. Die große Mehrheit der Coinbase-Nutzer verwendet solche SMS-Codes. Und Ihr ahnt, wo wir jetzt angekommen sind?

DREW: Viele Leute auf Coinbase besitzen Millionen von Dollar, daher diese Welle von SIM-Swapping. Dafür nutzen sie allgemeine Daten aus Datenbanken, verschaffen sich Zugang zu Coinbase – das läuft alles automatisiert ab – und erhalten dann Zugriff auf das Guthaben; sie haben einen SIM-Swap durchgeführt. Das ist enorm profitabel - profitabler geht's derzeit wahrscheinlich nicht.

JACK: Zu diesem Zeitpunkt haben wir genug Informationen, um das Ziel per SIM-Swap anzugreifen. Wir wissen, dass sie eine Ledger-Wallet haben und wir wissen, dass sie ein Coinbase-Konto haben, und wir haben ihren Benutzernamen und ihr Passwort. Alles, was jetzt noch nötig ist, ist, die Kontrolle über ihre Telefonnummer zu übernehmen, damit wir die SMS empfangen können, um uns einzuloggen. Aber obwohl das vielleicht ausreicht, um jemanden per SIM-Swap anzugreifen, gehen die Diebe noch einen Schritt weiter und versuchen herauszufinden, wie viel auf dem Konto ist, bevor sie jemanden per SIM-Swap angreifen.

DREW: Ob du's glaubst oder nicht, aber es gab etwa einen Monat lang eine Sicherheitslücke bei Coinbase, durch die man den Kontostand jedes beliebigen gültigen Benutzernamens und Passworts abrufen konnte. Das ging einfach – egal wie. Man brauchte keinerlei Zugriff außer Benutzername und Passwort. Man musste also keine SIM-Karte nachahmen, um den Kontostand zu sehen. Also haben die Leute einfach Millionen und Abermillionen von Kombinationen durchgespielt, eine Kombinationsliste bei Coinbase, und haben einfach die Millionäre von Coinbase gefunden. Und von diesen gibt es offensichtlich Millionen.

JACK: Das heißt, wenn man nur einen gültigen Benutzernamen und ein Passwort hatte, konnte man sehen, wie viel auf dem Coinbase-Konto des Benutzers war. Dadurch ist es dann sonnenklar, wen genau man für einen saftigen SIM-Swap ins Visier nehmen sollte. Aber man braucht immer noch diesen 2FA-Code, um reinzukommen und das Geld zu holen. Es war nur so, dass man ihn eine Zeit lang nicht brauchte, um das Guthaben zu sehen. Bleeping Computer veröffentlichte im Oktober 2021 einen Artikel, in dem stand, dass die Krypto-Wallets von 6.000 Coinbase-Kunden aufgrund einer Schwachstelle im 2FA-System leergeräumt wurden. Ich bin mir ziemlich sicher, dass es um diesen Bug geht, den Drew gerade erwähnt hat. Genau zu wissen, wie viel Geld jemand auf seinem Konto hat, ist entscheidend, um so einen SIM-Swap wirklich erfolgreich zu machen.

Es gibt noch ein letztes Detail zu Coinbase; wenn man einen gültigen Benutzernamen und ein Passwort hat und sich einloggt, sieht man, ob dieser Nutzer SMS-2FA nutzt oder so etwas wie Google Authenticator hat, weil die Seite einem sagt, nach welchem Code sie sucht. Die große Mehrheit der Coinbase-Nutzerinnen und Nutzer verwendet textbasierte 2FA, also SMS. Es kann jetzt immer noch das eine Problem geben, dass der Angreifer die Telefonnummer nicht kennt. Manchmal haben die die einfach noch nicht, und wenn man jemanden per SIM-Swap angreifen will, braucht man genau diese Telefonnummer, nicht wahr? Aber da steht direkt auf der Seite ein Hinweis, und der zeigt die letzten beiden Ziffern der Telefonnummer an, und da steht ausdrücklich: Gib den siebenstelligen Code ein, den wir gerade an sowas wie xxx-xxx-xx37 gesendet haben. Dieser kleine Hinweis, nur zu wissen, was die letzten beiden Ziffern der Telefonnummer sind, reicht diesen Dieben schon aus, um die vollständige Telefonnummer zu bekommen.

DREW: Also, normalerweise geht das so: Finde ihren Namen, ihren ungefähren Standort, ihre Telefonnummer. Es gibt eine Million Möglichkeiten, das zu tun. Mein Rat wäre: entschlüssle die E-Mail, die Sicherheitsvorkehrungen waren wahrscheinlich nicht besonders gut, sonst wären ihre Passwörter nicht durchgesickert. Darin findest du ihre IP-Adresse oder etwas anderes, mit dem du ihren Standort ungefähr bestimmen kannst. Führe dann eine Personensuche auf White Pages oder BeenVerified in diesem Gebiet mit ihrem Namen durch, und du wirst ihre Telefonnummer finden, die mit den letzten beiden Ziffern des Hinweises übereinstimmt.

JACK: Okay, so wählen diese SIM-Swapper also ihre Ziele aus. Zu diesem Zeitpunkt kennen sie den Benutzernamen, das Passwort, die Telefonnummer und den Kontostand, um zu wissen, ob sie einen dicken Fisch an der Angel haben. Oh, und man kann schnell nachschauen, zu welcher Art von Anbieter die Telefonnummer gehört, damit man den SIM-Swap beim richtigen Anbieter durchführen kann. Aber das ist ein großer Vorbereitungsprozess, nur um herauszufinden, wer unser SIM-Swapping-Ziel sein wird. Es ist sogar so viel Arbeit, dass dies, zumindest in den USA, ein ganz eigener Markt ist. Allein eine Liste von Zielen zu identifizieren und diese Informationen zu verkaufen, ist ein eigenes Geschäft. Obwohl es also nach viel Arbeit aussieht, könnte jemand einfach hier einsteigen, die Daten kaufen und einen SIM-Swap durchziehen. Okay, jetzt sind wir bereit für das große SIM-Swap-Event. Ihr erinnert euch, wie der Prozess anfing, oder?

Physischer Angriff für digitalen Profit

JACK: Jemand rannte in einen T-Mobile-Laden, riss dem Filialleiter das Tablet aus den Händen und rannte wieder raus. Das nennt sich hier ein Remo, Remote-Tablet-Grab. Aber wir sind immer noch nicht bereit für diesen Teil. Bevor man nämlich das Tablet des Managers stiehlt, braucht man das Passwort des Managers, das auf dem Tablet ist, richtig? Man muss also den Laden auskundschaften, alles über den Manager herausfinden, was man kann, um Social Engineering bei ihm anzuwenden.

DREW: Einfach den Manager anrufen und eine Rolle einnehmen: Hey, hier ist John vom Help Desk bei T-Mobile. Kannst du dich bitte um dieses Ticket kümmern? Dann schicken sie schicken eine gefälschte URL, und er gibt sein Manager-Login ein.

JACK: Okay, jetzt hat man also das Passwort des Managers, um sich in das Tablet einzuloggen, und wir wissen, wie man an das Tablet kommt. Und das ist tatsächlich ein großes Problem, das T-Mobile zu bekämpfen versucht, und es kursieren derzeit interne Memos mit Anweisungen, was zu tun ist, wenn das in deinem Laden passiert. Eine Anweisung ist, sofort das IT Help Desk anzurufen, um das Tablet und das Manager-Konto deaktivieren zu lassen. Das dauert insgesamt typischerweise etwa zehn Minuten. Wir müssen also wieder einen Schritt zurückgehen, denn wir haben nur dieses Zehn-Minuten-Fenster, und wir müssen alles in diesem Zeitraum erledigen. Wir müssen also vorbereitet sein, und wir haben unsere Vorbereitungen noch nicht getroffen. Was ihr hier wissen müsst, ist, dass das nicht von einer Person gemacht wird; der Dieb, der in den Laden rennt, ist nur ein Bauer in diesem Spiel.

DREW: Die auf Telegram sie nicht die Art von Leuten, die in einen Laden rennen. Sie bezahlen irgendjemanden, den sie im echten Leben kennen, damit er für sie in den Laden rennt.

JACK: Die Person, die reinrennt, das Tablet schnappt und wieder rausrennt, wird auf der Liste hier wirklich am schlechtesten bezahlt.

DREW: Verdient wahrscheinlich 200 Dollar, Bro. Ich hab's gesehen, dass das so ist.

JACK: Sie zahlen also 200 Dollar dafür, dass jemand reingeht, das Tablet schnappt und es ihnen wieder rausbringt. Sie müssen in der Nähe sein, denn ihr erinnert euch, sie haben nur zehn Minuten Zeit dafür. Die Person, die das Tablet am Ende in den Händen hält, ist also besonders geschickt darin, durch die T-Mobile-Software zu navigieren, um den SIM-Swap durchzuführen. Das liegt vielleicht daran, dass sie vorher im Laden gearbeitet hat oder ein Video gesehen hat, wie es gemacht wird. Aber trotzdem ist die Person, die tatsächlich auf dem Tablet tippt und den SIM-Swap durchführt, noch immer nicht dieselbe Person, die die Kryptowährung von den Coinbase-Nutzern stehlen wird. Das ist eine ganz andere Gruppe von Leuten, die all diese Coinbase-Logs gesammelt haben und darauf warten, dass jemand einen Remo macht. Sie organisieren sich alle in einem Telegram-Chatroom, und sie sind bereit, einer Person für einen Remo-Swap manchmal 10.000 Dollar pro Nummer zu zahlen.

Nur um noch mal sicher zu gehen, diese Leute sind in diesem Telegram-Kanal und sagen: Okay, ich hoffe, jemand zieht heute Abend einen Remo durch ich habe drei Konten, die ich knacken will. Dann ist alles, was man tun muss, diese Telefonnummer an die Person weiterzugeben, die den Remo durchführt, richtig?

DREW: Perfekt, Mann. Du klingst jetzt wie ein echter Swapper. Du benutzt unseren Slang.

JACK: Die Leute sind also auf Telegram und es ist Freitagabend, Samstagabend, und jemand sagt: Okay, ich glaube, wir versuchen es. Sie sagen der Gruppe: Ich fahre da runter, ich versuche, das Tablet zu schnappen. Ich bin bereit.

DREW: Es ist echt intensiv.

JACK: Ja, da sind all diese Leute, sie schließen ihre Zimmertüren ab. So nach dem Motto: Komm nicht rein, Dad, ich bin heute Abend beschäftigt. Komm nicht ins Zimmer, was auch immer du tust. Und dann sagen die Eltern so: Okay, wir geben dir etwas Zeit. [LACHT].

DREW: Oh, definitiv. Ich weiß, wovon du sprichst. Das passiert; Leute sagen wirklich: Oh, ich kann jetzt nicht. Ich muss Abendessen.

JACK: Ja.

DREW: Da denkt man sich: Mann, wir haben buchstäblich zehn Minuten Zeit, um das zu tun. Da ist keine Zeit fürs Abendessen. Es ist entweder Abendessen oder 100.000 Dollar. Du entscheidest.

JACK: Ja.

DREW: Das ist wirklich – das ist keine Übertreibung – so ist es wirklich manchmal. Unsere Remos sind so kurz.

JACK: Das ist es, was ich mir so gerne vorstelle, die tatsächliche Person hinter dem Bildschirm, und wenn das ein Teenager ist, dann ja, dann besteht diese Möglichkeit, dass alles in jeder Sekunde schiefgeht, weil der bei seinen Eltern wohnt und sein Zimmer aufräumen muss. Aber gut, zurück zur Geschichte, sie sind bei Telegram, sie bekommen die Nachricht: Okay, ich habe den Remo. Was hast du gesagt, 10.000 Dollar pro Nummer?

DREW: Also, nach nach Anbieter aufgeschlüsselt sieht es so aus: Bei T-Mobile kostet ein Swap etwa 5.000 Dollar. Wenn es sich um ein Betrugsopfer handelt, kostet es dich 7.500 Dollar. Ein Betrugsopfer verfügt über spezielle Schutzmaßnahmen für sein Konto, die jedoch immer noch umgangen werden können. Verizon wird dich wahrscheinlich mehr als 50.000 $ kosten. Verizon ist extrem gut gesichert, aber mit der richtigen Ausrüstung ist es trotzdem möglich. Du brauchst zum Beispiel den Login eines Filialleiters, was eine sehr hohe Position ist. Du musst also in der Lage sein, diesen Verizon-Manager ordentlich zu bezahlen, und du kannst das System nicht hacken. Das geht nicht – so sieht es zumindest derzeit aus. Man braucht einen Insider. Man darf ihn natürlich nicht verraten oder so. Bei AT&T sinken die Preise auf 2.000 bis 3.000 $, weil ihr Opus-Tool nicht allzu sicher ist.

JACK: Okay, diese Person, die den Remo-Snatch durchführt, lässt also alle Stunden vorher wissen, dass sie plant, an diesem Abend einen Remo zu machen.

DREW: Der Activator ist die Person, die den Remo-Snatch koordiniert.

JACK: Der Activator teilt also allen im Discord-Kanal mit, dass sie den Remo haben und bereit für Aufträge sind. Die Leute auf Telegram fangen sofort an, ihm Informationen zu geben; Telefonnummer und ICC-ID. Das ist alles, was sie brauchen, um den Prozess zu starten, bei dem die Telefonnummer vom Telefon des Kunden auf das Telefon des Diebes in Telegram zu übertragen. Es sind intensive zehn Minuten. Die Zeit tickt und jeden Moment kann dieses Tablet deaktiviert werden, also müssen sie so schnell wie möglich arbeiten und in diesem Zeitraum so viele Nummern wie möglich austauschen. An einem guten Abend kann ein Activator damit über 100.000 Dollar verdienen.

DREW: Ja, an diesem Punkt gehst du einfach hin und machst deinen Lick.

JACK: Mehr Slang.

DREW: Ein „Lick“ ist, wenn man jemanden ausnimmt, das ist also einfach ein „erfolgreicher Log“ – in unserem Slang bedeutet „Log“ also „Login“. Wenn man also einen „Lick“ landet, bedeutet das, dass man das Guthaben der anderen Person abgehoben hat. Es gehört dir; du hast gewonnen. Es gibt also mehrere Möglichkeiten, diesen Slang zu verwenden. Man könnte sagen: „Diese Person sieht nach einem Lick aus.“ Mit anderen Worten: Diese Person sieht nach einem leichten Ziel aus. Man könnte sagen: „Ich habe heute einen Lick gelandet“, was bedeutet, dass ich eine erfolgreiche Abhebung von einem Coinbase-Konto durchgeführt habe.

JACK: Nun haben diese Jungs also die Kontrolle über die Telefonnummern ihrer Ziele, und müssen ab jetzt schnell wie möglich zu arbeiten.

DREW: Du schwitzt wie irre. Du gehst hin und setzt das Yahoo-Passwort zurück. Du bist über einen Proxy in ihrer Nähe verbunden, nutzt einen Residential-Proxy in der Nähe des Zielortes, loggst dich in ihr Yahoo-Konto ein und setzt das Passwort zurück, da es meistens nicht dasselbe ist wie das für Coinbase. Wir erhalten den Link zur Geräteauthentifizierung von Coinbase, während du immer noch am schwitzen bist. Dein Holder sollte die ganze Zeit über Codes erhalten; du schreist deinen Holder an, dir den Code sofort zu schicken, sonst wirst du ihn nicht bezahlen.

JACK: Was? Sorry, ein Holder ist was genau?

DREW: Ein „Holder“ ist jemand, der das Telefon, auf dem das Einmalpasswort eingeht, tatsächlich in der Hand hält. Meistens machen die Personen, die die Zieldaten und das Guthaben besitzen, das nicht selbst, da das die operative Sicherheit gefährden würde.

JACK: Heilige Scheiße.

DREW: Es gibt dafür spezielle Personen, die die Handys nur halten, damit die Person, die die Hinweise oder Ziele hat, nicht erwischt wird.

JACK: Oh Mann, da ist also auch noch ein Holder in die ganze Sache involviert. Ja, Holder werden einfach dafür bezahlt, dass sie diejenigen sind, die das Telefon gekauft haben und die Nummer darauf übertragen lassen. Okay, die Person, die den Lick machen will, fängt also vielleicht zuerst damit an, in die E-Mail des Opfers zu gehen und das Passwort zurückzusetzen. Bei vielen E-Mail-Anbietern wird dir eine SMS geschickt, um das Passwort zurückzusetzen. Der E-Mail-Anbieter schickt also die SMS und der Holder sagt der Person, wie die SMS lautet, und sie bekommen den Zugang zum E-Mail-Konto, und von dort aus versuchen sie, sich bei Coinbase einzuloggen. Nach Eingabe des Benutzernamens und Passworts wird eine SMS an das Telefon geschickt, das der Holder hat, und der Holder muss den Code an den eigentlichen Angreifer weitergeben. Der loggt sich nun bei Coinbase ein. Aber bei Coinbase gibt es typischerweise eine Prüfung, und dann steht da sowas wie: Wir erkennen dieses Gerät nicht. Wir senden dir eine E-Mail, um zu überprüfen, ob du es bist. Aber der Angreifer ist ja bereits in dem E-Mail-Konto des Opfers, also muss er nur auf die E-Mail warten und auf "Ja, ich bin's" klicken, und Coinbase lässt ihn rein. Jetzt ist er im Coinbase-Konto von jemandem, und dort liegen vielleicht 30.000, 100.000 oder manchmal sogar mehr als eine Million Dollar.

DREW: Anschließend überträgst du das Guthaben auf Coinbase Pro, damit du das Geld abheben kannst, und transferierst es dann in deine Exodus-, MetaMask- oder Electrum-Wallet.

JACK: Der Grund, warum sie es zu Coinbase Pro transferieren, ist, weil es dort ein höheres tägliches Abhebungslimit gibt. Aber dort gibt es auch eine Sicherheitsprüfung, bevor man da Geld abheben kann, eine weitere 2FA-Prüfung. Also muss man eine weitere SMS vom Holder bekommen, um die Überweisung einzuleiten. Aber da ist immer noch eine weitere Sicherheitshürde; Coinbase hat ein maximales tägliches Abhebungslimit, und manchmal haben die Leute mehr als das. Aber Drew sagt, das sei kein Problem.

DREW: Ja, es gibt ein paar Tricks. Die Leute nutzen Sicherheitslücken, über die ich nicht sprechen darf, aber ja, es gibt da Wege, 250.000 Dollar oder eine Million Dollar abzuheben. Man kann riesige Geldsummen abheben. Es gibt eine Methode, die jeder kennt und die ich dir verraten kann, ist, ein bestimmter Bot in einem Forum, der in der Lage ist, gleichzeitig eine Flut von Anfragen zu senden, um das System zu überlasten, sodass man eine Reihe kleinerer Transaktionen abwickeln kann. Aber es gibt auch andere Methoden, die direktere Sicherheitslücken ausnutzen.

JACK: Meine Güte, diese Kids haben echt gnadenlos entschlossen. Warum sollten sie das auch nicht sein, wenn es einen potenziellen Eine-Million-Dollar-Lick gibt, den sie damit abstauben können?

DREW: Die neue Generation der Krypto-Swapper – ich kenne da persönlich wahrscheinlich mindestens zehn Millionäre, die alle unter sechzehn sind und von denen ich mit Sicherheit weiß, dass sie nicht lügen; ich habe live gesehen, wie sie Transaktionen getätigt haben, und live miterlebt, wie sie Millionen-Dollar-Gewinne eingefahren haben. Was die ältere Generation angeht, diejenigen, die extrem früh dabei waren mit den verrückten 20-Millionen-Dollar-Zielen von Michael Turpin: Die haben 15 Millionen Dollar, 10 Millionen Dollar und sind in neuen Geschäften wie NFTs und Phishing tätig. Also wirklich high-level Sachen.

JACK: Okay, Michael Turpin ist ein Kryptowährungs-Investor, aber er hat auch ein paar Startups in diesem Bereich, wie Transform Group und BitAngels. Im Januar 2018 hat jemand die Schritte durchgeführt, die wir hier gerade erklärt haben, um sich in Turpins Krypto-Wallet zu hacken und Kryptowährungen im Wert von 23 Millionen Dollar daraus zu stehlen. 23 Millionen Dollar, in einer Nacht gestohlen. Und ihr wisst, sobald die Person das Geld hatte, musste sie all die Leute in der Kette bezahlen, die ihr geholfen haben, dorthin zu gelangen. In diesem Fall waren es Insider, die bei AT&T arbeiteten, die dabei halfen. Nun, einer der Typen, die 23 Millionen Dollar gestohlen hatten, war immer noch nicht glücklich. Er twitterte: Habe 23 Millionen Dollar gestohlen und kann mich trotzdem nicht von Drogen fernhalten. Habe 23 Millionen Dollar gestohlen und kriege mein Leben nicht auf die Reihe. Turpin ging natürlich zur Polizei, die anfing zu ermitteln und einige ziemlich handfeste Beweise finden konnte, die sie zu dem Urheber der Tweets namens Nicholas Truglia führten, der einundzwanzig war. Mastermind der Aktion war aber der erst 15-jährige Ellis Pinsky.

Weil er noch minderjährig war, konnte Ellis eine Verurteilung umgehen und das meiste Geld zurückgeben. Bei Nicholas war das anders: Gerichtsakten zeigen, dass er zum Zeitpunkt seiner Verhaftung über 70 Millionen Dollar an Vermögenswerten hatte. Er hatte sich schuldig bekannt und sollte zunächst nur 18 Monate absitzen und 20 Millionen Entschädigung an die Opfer zahlen. Weil er das nicht in der vorgegebenen Zeit tat, wurde er zu 12 Jahren Haft verurteilt. Was Michael Turpin betrifft, so war der richtig wütend, dass er 23 Millionen Dollar verloren hatte. Natürlich war er das, aber er hatte auch fünfzig andere Krypto-Konten und die waren alle in Ordnung, also bin ich mir nicht sicher, welcher Prozentsatz seiner Krypto-Gelder gestohlen wurde, aber er war auf jeden Fall so wütend, dass er sowohl Nicholas als auch AT&T verklagte. Er verklagte AT&T auf 200 Millionen Dollar und behauptete, die Person, mit der er am Telefon gesprochen hatte, habe gesagt, seine Telefonnummer sei sicher und könne nicht per SIM-Swap übernommen werden, und dennoch wurde sie es. Er wollte, dass AT&T zugibt, dass sie der Hauptgrund dafür sind, dass sein Geld gestohlen wurde. Der Richter wies den Fall jedoch ab. Aber Turpin verklagte auch den Hacker, Nicholas, und diese Klage gewann er. Der Richter sprach Turpin 75 Millionen Dollar zu. Während Turpin also 24 Millionen Dollar verlor, wurden ihm letztendlich 75 Millionen Dollar als Entschädigung zugesprochen. Wilde Sache.

Ellis Pinsky hat später übrigens Computer Wissenschaften und Philosophie an der NYU studiert und will mit seinen Jugendsünden nichts mehr zu tun haben.

DREW: Ein wichtiger Tipp für alle Krypto-Anleger da draußen oder alle, die Coinbase-Konten haben: Nutzt für verschiedene Zwecke jeweils eigene E-Mail-Adressen. Trennt eure private E-Mail-Adresse von der für eure Krypto-Investitionen.

JACK: Alles klar, das ist sinnvoll. Wir sind jetzt von "Verwendet keine Passwörter mehrmals" bei "Verwendet keine E-Mails auf hochkarätigen Konten wieder" gelandet. Wenn man eine E-Mail-Adresse hätte, die nur für die Krypto-Börse da wäre und man sie nirgendwo sonst nutzen würde, dann wäre es wirklich schwer, diese E-Mail-Adresse zu finden und sie zu knacken, denn schließlich braucht man einen Benutzernamen und ein Passwort, um in diese Börsen zu gelangen, also warum nicht den Benutzernamen wirklich schwer auffindbar machen? Wenn dein Benutzername Deine E-Mail-Adresse ist, die du für alles benutzt, dann ist das so, als würdest du jedem, mit dem du chattest, die Hälfte deines Logins geben. Wir sind jetzt die 100 Schritte durchgegangen, die es braucht, um jemanden per SIM-Swap anzugreifen und sein ganzes Geld zu stehlen. Das war alles andere als eine schnelle und einfache Methode, um reich zu werden. Es brauchte eine ganze Menge Recherche, um nur ein gutes Ziel zu finden, und das ist wichtig zu wissen, denn die Leute stellen mir ständig Fragen wie: Oh, wie gefährlich kann das sein, wenn ich mein Geburtsdatum auf meinem Facebook-Profil angebe? Sie erwarten irgendeine schnelle und einfache Möglichkeit, wie ein Hacker das gegen sie verwenden kann, aber es ist nicht immer schnell und einfach. Wenn diese Art von Kriminellen Wind davon bekommen, dass du etwas hast, was sie wollen, werden sie dein Leben auskundschaften und ein massives Dossier über dich anlegen, damit sie dein digitales Leben komplett übernehmen und zu dir werden können.

Jeder kleine Fetzen zusätzlicher Information, den sie über dich bekommen können, kann für sie potenziell zum massiven Zahltag werden. Wenn irgendeine obskure Website, bei der du ein Konto hattest, gehackt wird und sie das Passwort bekommen, das du benutzt hast, und du dieses Passwort woanders wiederverwendest, öffnet ihnen das einfach Tür und Tor. Offensichtlich hat es für sie einen Wert, in deine E-Mail und an deine Telefonnummer zu kommen, also sind sie begeistert davon, wenn du das einfach öffentlich postest. Aber dann gibt es noch die kleinen Dinge; in welcher Stadt du bist, welchen Browser du benutzt, welche Dinge du magst, wo du gerne Kaffee trinkst und wer deine Familienmitglieder sind. All diese Dinge können genutzt werden, um dich weiter auszunutzen. Wenn sie wissen, in welcher Stadt du bist, können sie einen Proxy an deinem Standort nutzen, um ihren Datenverkehr so aussehen zu lassen, als käme er von irgendwo in deiner Nähe. Wenn sie wissen, welchen Browser du benutzt, hilft ihnen das, mehr wie du auszusehen, wenn sie versuchen, auf deine Konten zuzugreifen, und wenn sie wissen, welche Dinge du magst, könnte ihnen das etwas über andere Bereiche deines Lebens verraten, die sie sich ansehen sollten. Und wenn sie wissen, wo du gerne Kaffee trinkst, könnte das dazu führen, dass sie dir dort auflauern und dir die Taschen ausräumen, während du in der Schlange für deinen Latte stehst.

Wenn sie Informationen darüber haben, wer deine Familienmitglieder sind, könnten diese Familienmitglieder ins Visier genommen werden. Drew hier hat mir eine Geschichte darüber erzählt, wie die Kids einmal, als sie in das Konto eines Typen kommen wollten, der Ehefrau eine SMS schrieben und sich als der Ehemann ausgaben, um sie dazu zu bringen, die 2-Faktor-Authentifizierungscodes über SMS vorzulesen. Je mehr Informationen sie über dich haben, desto einfacher macht es ihre Arbeit. Stell dir vor, sie hätten vollen Zugriff auf dein Bankkonto und beschließen, das gesamte Geld abzuheben, aber deine Bank entscheidet: Moment, da stimmt etwas nicht, und sie hinterfragen die Überweisung und sagen: Hm, nur um sicherzugehen, dass Sie es sind, wie lautet Ihr Geburtstag? Nun, dieses eine Datum, das du für so harmlos hieltest, um es einfach öffentlich zu teilen, hätte deine Rettung sein können, wenn du es nicht auf Facebook gepostet hättest. Ich hoffe, du bist jetzt überzeugt, deine privaten und persönlichen Daten niemals auf einer öffentlichen Website zu teilen.

Wie nennst du das, diese Gruppe?

DREW: Es gibt da ein paar verschiedene Begriffe. Wir nennen es vor allem „Com“.

JACK: Com, geschrieben C-O-M; das ist die Abkürzung für Community, und das ist neu für mich. Zu meiner Zeit nannten wir es die Szene. Jetzt ist es wohl die Community.

DREW: Ja, wir nennen es aber einfach „Com“. Dann gibt es noch „Simming Com“ und es gibt „Cracking Com“, „Roblox Com“, „Twitch Com“. Da geht's um Twitchzugänge. Es gibt ein „Vanilla Com“. Es gibt „Infosec Com“.

JACK: Huh, die Infosec-Com war mir nicht geläufig, aber Drew hat es mir erklärt. So wie er es sagt, gibt es einige Leute im IT-Sicherheitsbereich, die Teil des Infosec-Twitters seien und als gute Sicherheitsforscher respektiert werden wollen, aber gleichzeitig auch Dinge tun wollen, die illegal oder unethisch sind, und sich quasi gleichzeitig als unschuldiger White Hat und als zwielichtiger Black Hat verhalten, so wie Ryan Phobia Stevenson. Das ist der Typ, der ein paar Bugs meldete, die er bei Telekommunikationsunternehmen gefunden hatte, und dafür belohnt wurde. Aber dann nutzte er diese Bugs, um Kundendaten von Telekommunikationsunternehmen abzugreifen und sie auf Untergrundmärkten zu verkaufen. Der Typ hat doppelt kassiert. Es hört sich so an, als gäbe es Coms für jeden kleinen Schwerpunktbereich, in dem Leute online Geld verdienen können. Aber der rote Faden bei all dem ist, dass sie alle unethische Coms sind, und deshalb nenne ich sie schmutzige Coms. Das sind fiese Communitys.

Der Goldrausch im NFT-Markt

JACK: Lass uns über NFTs sprechen. Also, jeden Tag in den Nachrichten sehe ich einen weiteren Angriff auf NFTs, wie zum Beispiel, dass jemand um seinen Bored Ape betrogen wird oder...

DREW: Ja, natürlich.

JACK: Oder...

DREW: Der Klassiker...

JACK: Okay, fahr fort. Du hast das gesehen. Ist es jemand aus deinen Coms, der diese Dinge durchführt?

DREW: Okay, also, es geht um die ersten, wirklich, wirklich reichen SIM-Com-Nutzer, die ich erwähnt hatte. Also, diese ersten reichen Simmers, die nicht in der aktuellen Version sind, stehlen NFTs. Es gibt eine Gruppe von Leuten, die ich kenne – ich werde sie nicht namentlich nennen, aber im Grunde sind es einfach Leute, die buchstäblich auf Discord gehen; jemand sagt, er brauche Hilfe mit einem NFT. Sie schreiben ihnen eine Nachricht, sie posten ihre Links.

JACK: Huh, ich habe das selbst während des großen NFT-Hypes aus erster Hand miterlebt. Ich war in einem NFT-Discord. Und falls ihr nicht wisst, was ein NFT ist, in diesem Fall ist es einfach digitale Kunst, die man kaufen und verkaufen kann, und diese digitalen Kunstwerke gingen für Tausende von Dollar pro Stück weg, und manchmal sogar für Hunderttausende von Dollar pro Stück. In Discord bekam ich eine Direktnachricht, in der stand, ich sei ausgewählt worden, auf einer Vorverkaufsliste für einen dieser NFT-Drops zu stehen, und ich müsse ihn jetzt kaufen. Aber natürlich habe ich nicht auf den Link geklickt. Aber jemand im Kanal hat es getan, und die Seite sagte, um das NFT zu prägen, müsse man nur sein MetaMask-Krypto-Wallet verbinden und seine 24-Wort-Seed-Phrase eingeben. Nun, diese 24-Wörter sind absolut nichts, was man jemals teilen sollte. Das ist im Grunde das private Passwort zu deiner Krypto-Wallet, und wenn du das jemandem gibst, hast du ihm im Grunde die Kontrolle über deine gesamte Krypto-Wallet übergeben. Nun, diese Person gab ihre Seed-Phrase auf der gefälschten Website ein, und sobald sie das tat, gelangte der Dieb in ihre Krypto-Wallet und nahm all ihre wertvollen NFTs und verkaufte sie für etwa den halben Preis. Der Dieb machte etwa 40.000 Dollar in Ethereum in vielleicht fünf Minuten. Es war absolut verrückt, mitanzusehen, wie dieser Person direkt vor meinen Augen das Konto leergeräumt wurde, und es gab nichts, was irgendjemand tun konnte, um es zu stoppen.

Es gibt echt keinen Mangel an Geschichten von Leuten, die digital ausgeraubt werden und denen die Krypto-Wallet gestohlen wird, und ich glaube, der Grund ist der, dass diese Krypto-Wallets Unmengen an Geld beinhalten und sie genau wie Browser-Add-ons sind. Wenn du deine Krypto-Wallet mit der falschen Seite verbindest, ist das Spiel vorbei, und es ist so einfach, sie mit der falschen Seite zu verbinden. Es ist ein bisschen, als hätte man sein Bankkonto direkt im Browser als Plug-in zugänglich, und alle Seiten, die man besucht, wollen alle einen Blick darauf werfen. Aber das ist erst der Anfang; fast jeden Tag passiert das. Es gibt so viele Betrüger, die versuchen, Zugang zu den Krypto-Wallets von Leuten zu bekommen, in denen sich Kryptowährung oder ein NFT befinden könnte. Die Betrügereien sind riesig und schnell, sie kommen aus jedem Winkel auf dich zu, wenn du dich in diesem Bereich bewegst. Zum Beispiel war ein anderer großer Betrug, den ich gesehen habe, als ein NFT-Projekt kurz vor dem Start stand. Und der Starttag ist ein großer Tag. Jeder, der dabei sein will, will sich beeilen, um seine Token zu prägen und zu hoffen, dass der Preis steigt. In diesen Momenten herrscht also ein Rausch, weil es ein begrenztes Angebot gibt und man nicht leer ausgehen will. Wenn Leute es also eilig haben, etwas zu kaufen, sind sie bereits anfällig dafür, Fehler zu machen, und typischerweise werden eifrige Käufer im Discord-Chatroom für dieses NFT sein, um zu beobachten, was vor sich geht. Aber es gibt eine ganze Reihe von Dingen, die dabei schiefgehen können. Erstens kann der Besitzer des Discords gehackt werden, und Drew erklärt, wie das passiert.

DREW: Sie haben ihre Glaubwürdigkeit über einen Freund aufgebaut; so läuft das immer. „Hey, mein Freund meint, ich soll mal mit dir reden.“ Irgendwann schleicht er sich dann langsam heran, indem er eine Art Datei schickt, mit der sie ihn tatsächlich über das Discord-Token-Protokoll identifizieren können.

JACK: Wenn ihr Discord benutzt, stehen die Chancen gut, dass ihr nicht jedes Mal euren Benutzernamen und euer Passwort eingebt, wenn ihr die Seite besucht oder die App öffnet. Das liegt daran, dass, sobald man sich authentifiziert hat, ein kleines Authentifizierungs-Token auf dem Computer existiert, das einen eingeloggt hält. Aber wenn man einfach das Authentifizierungs-Token nehmen kann, dann kann man sich als diese Person einloggen, ohne ein Passwort zu benötigen. Das Authentifizierungs-Token hat all das Zeug da drin, und ja, wenn man jemanden dazu bringen kann, seine Malware zu installieren, kann die Malware das Token stehlen. Okay, wenn man also Zugang zum Konto eines Moderators auf einem beliebten Discord-Kanal bekommt, der kurz davor steht, ein NFT zu starten, dann kann man eine Menge Geld verdienen. Alles, was man tun muss, ist, die offizielle Website dieses NFTs zu kopieren, was super einfach ist, und eine ähnlich aussehende URL mit einem anderen Buchstaben zu erstellen, und zu ändern, wohin das Geld geht, wenn jemand das NFT kauft. Anstatt dass das Geld an den NFT-Macher geht, geht es jetzt in deine Wallet. Alles, was man jetzt noch tun muss, ist, die Leute auf seine Seite zu leiten, und da man ein Moderator ist, kann man das.

DREW: Poste eine Hauptnachricht, Feuer frei.

JACK: Die Nachricht könnte lauten: "Minting ist jetzt live, offen für alle, aber beeilt euch; wir schließen in zehn Minuten". Einige dieser Discord-Kanäle haben über 50.000 Leute da drin, alle bereit zum Kauf. Ihr könnt euch vorstellen, dass, wenn 50.000 Leute eine Nachricht wie diese sehen, dass das Projekt live gegangen ist und sie bereit zum Prägen sind, dass sie auf die Seite strömen werden, um ihre NFTs zu kaufen. Ich habe das immer und immer wieder gesehen. Betrüger infizieren Discord und verdienen damit in zehn Minuten über 100.000 Dollar. Aber es gibt auch andere Betrügereien, die auf Discord ablaufen.

DREW: Es gibt Leute, die tatsächlich NFT-Discords kaufen und sie dann künstlich anwachsen zu lassen. Das machen sie, um einen Exit-Scam durchzuziehen oder einfach um sie an jemanden zu verkaufen, der einen Exit-Scam durchziehen wird.

JACK: Oh ja, das habe ich auch gesehen. Wenn man ein NFT-Projekt findet, das 100.000 Follower auf Twitter und 80.000 Mitglieder auf Discord hat, wird man denken, dass das ein heißes NFT-Projekt ist, und sich mehr dafür begeistern. Aber die Zahlen sind alle gefälscht. Es ist ein Discord-Kanal, der erst letzte Woche gekauft wurde, und er kam schon mit 80.000 Mitgliedern, aber das sind alles Bots. Es erzeugt also einen falschen Hype darum, und sie starten ein Projekt und die Leute bezahlen sie, und sie bekommen nichts dafür außer irgendein billiges Kunstwerk, das von jemandem auf Fiverr gemacht wurde. Die Macher schnappen sich einfach das Geld und verschwinden. Auch hier kann ein Betrug wie dieser jemandem über 100.000 Dollar einbringen, wenn er richtig gemacht wird. Aber das sind sicherlich ziemlich aufwendige und komplexe Betrügereien. Es dauert lange; man muss eine Website bauen, einen NFT-Server kaufen, die ganzen Kunstwerke erstellen. Es ist nicht einfach und erfordert echtes Fingerspitzengefühl. Aber dann, als gäbe es nicht schon genug NFT-Betrügereien, passieren auch noch Influencer-Betrügereien.

DREW: Sie engagieren eine seriös wirkende Person als Strohmann. Es handelt sich um wohlhabende Leute, die als Krypto-Influencer auftreten und andere dazu bringen, auf diese Tricks hereinzufallen – zum Beispiel ihre Freunde. Sie überreden ihre Freunde, auf NFT-Betrügereien hereinzufallen, und hinter all dem stecken diese millionenschweren SIM-Swapper. Das ist schrecklich.

JACK: Yikes, Mann, man kann in NFT-Land nicht einmal seinen Freunden vertrauen. Sie könnten von den Betrügern dafür bezahlt werden, dich zu betrügen. Ich habe mich ein bisschen mit diesen NFTs beschäftigt und ich sage euch, das ist nichts für Anfänger. Es ist gespickt mit Landminen, Hackern, Dieben, Betrügern, Kriminellen und so vielem mehr, was für mich ein Spaß ist, den ganzen Wahnsinn zu beobachten.

Vom Kinderzimmer ins Gefängnis

JACK: Es ist aber nicht jedermanns Sache, und diese Leute versuchen hart, an deine Krypto-Wallet zu kommen und deine Vermögenswerte zu plündern. Sie können es ungestraft tun, weil es so schwer ist, Krypto-Raubüberfälle zurückzuverfolgen.

DREW: Die machen das aus reiner Profitgier, Leute wie Joel Ortiz, Nicholas Truglia, Xavier Clemente.

JACK: Warum nennst du hier diese Namen?

DREW: Die Namen sind ja bekannt, die wurden verhaftet.

JACK: Oh, okay. Oh, die – die wurden alle verhaftet?

DREW: Die berühmtesten SIM-Swapper, die verhaftet wurden sind; PlugWalkJoe, AKA Joseph, James O’Connor.

JACK: Okay, ich muss nachschauen, was diese Leute getan haben. Okay, Joel Ortiz wurde wegen SIM-Swapping verhaftet. Tatsächlich war er die allererste Person, die wegen SIM-Swapping verurteilt wurde. Das ist wild; 2019 ist das erste Mal, dass ein SIM-Swapper jemals verurteilt wurde. Das ist wirklich die Definition eines modernen Verbrechens, wenn erst vor ein paar Jahren das erste Mal überhaupt jemand dafür verurteilt wurde. Joel Ortiz war also einundzwanzig, aus Boston, und laut Polizei hat er vierzig Personenbetrogen und insgesamt 7 Millionen Dollar durch die Durchführung von SIM-Swaps gestohlen. Er wurde verhaftet und bekam dafür zehn Jahre Gefängnis. Wir haben bereits über Nicholas Truglia gesprochen, aber Drew erwähnte auch Xavier Clemente. Dieser Typ war neunzehn Jahre alt, als er wegen SIM-Swapping verhaftet wurde. Die Polizei sagt, er habe über eine Million Dollar in Kryptowährungen gestohlen. Ellis Pinsky bekam den Spitznamen Baby Al Capone, weil er erst fünfzehn Jahre alt war, als er verhaftet wurde. Oh, und übrigens, die von der Polizei beschlagnahmten Gegenstände sind unglaublich; Luxusuhren, Luxusautos, Penthouse-Wohnungen. Diese Kinder verpulvern es so schnell, wie sie es bekommen, und fast alle von ihnen haben eine Spielsucht, bei der sie etwas Geld in ein Online-Casino stecken und am Rad drehen und versuchen, den noch größeren Gewinn zu erzielen. Sie mögen es irgendwie, in Livestreams und so damit anzugeben, wieviel sie bereit sind zu setzen, damit andere sehen können, wie viel Geld sie haben. Es ist verrückt.

DREW: Auf ihren Telegram-Kanälen posten sie regelmäßig Screenshots ihrer Opfer, zeigen, wie viel Geld die auf ihren Konten haben, und erzählen, dass sie ihnen gerade Millionen von Dollar abgezockt haben. Das lässt sich leicht überprüfen, denn sie zeigen einem buchstäblich die Transaktions-IDs und ihre Bitcoin-Wallets, die mit Millionen von Dollar gefüllt sind. Jeden Tag verschenken sie Tausende von Dollar. Sie machen einfach total verrückte Sachen mit ihrem Geld, sind halt noch Kinder.

JACK: Diese Liste geht weiter und weiter. Viele Leute werden verhaftet, die unter achtzehn Jahre alt sind, und deshalb sehen wir ihre Namen einfach nie in den Nachrichten. Einige von ihnen werden erwischt und müssen einfach die Kryptowährung oder NFTs zurückgeben, die sie gestohlen haben, und sie bekommen nur eine strenge Verwarnung. Ich weiß nicht, wie es euch geht, aber all das haut mich einfach um. Ich hatte vorher keine Ahnung, wie diese Untergrund-Community aussah. Aber jetzt habe ich das Gefühl, dass sich meine Augen angepasst haben und ich im Dunkeln sehen kann. Geht es euch auch so? Ich habe das Gefühl, das Internet ist im Moment ein absolutes Kriegsgebiet. Jeden Tag hören wir von einem weiteren Unternehmen, das von Ransomware oder einem Datenleck getroffen wird, aber all das ist weit weg. Das passiert nicht in meiner Nachbarschaft. Aber das hier ist mein Hinterhof. Das sind Teenager, die ganz normale Leute ins Visier nehmen, und ihre Spitznamen sind kein Zufall. Baby Al Capone oder Billy the Kid. Billy the Kid hat früher Züge überfallen. Er hat einfach wahllos Leute überfallen und Geld von ihnen gefordert, im Grunde passiert hier das Gleiche. Wenn man öffentlich erwähnt, dass man eine Menge Kryptowährung hat, kann man wahrscheinlich damit rechnen, dass jemand das von einem stehlen will. Es ist nicht einfach, das sicher aufzubewahren. Es ist wirklich knifflig.

Wenn ihr also Krypto habt, dann rate ich euch dringend, nicht all euer Zeug auf eine Adresse zu legen. Teilt es auf verschiedene Wallets auf, denn wenn etwas kompromittiert wird, wollt ihr nicht, dass sie das ganze Sparschwein mitnehmen. Die Telefongesellschaften sollten wahrscheinlich ihre Sicherheit erhöhen. Es macht den Eindruck, als würden sie versuchen, es schwieriger zu machen, und deshalb zahlen die Leute heute auch 10.000 Dollar pro SIM-Swap. Aber wie können sie es eliminieren, wenn es Insider gibt, die als Regionalmanager arbeiten und an dem Betrug beteiligt sind? Sie könnten das Äquivalent eines ganzen Jahresgehalts bekommen, indem sie einem SIM-Swapper helfen, einen Millionen-Dollar-Lick zu landen. Das könnte schwer abzulehnen sein für jemanden, der das Geld wirklich braucht. Vielleicht ist die Antwort, keine SIM-Karten mehr zu verwenden und einfach immer einen WLAN-Hotspot in der Tasche zu haben und das Telefon darüber laufen zu lassen, wenn man jemanden anrufen muss. Ich weiß es nicht. Börsen wie Coinbase machen einen ziemlich guten Job dabei, es Kriminellen schwer zu machen, in das Konto von jemandem zu gelangen. Tatsächlich glaube ich, dass Coinbase beim Exploit, von dem Drew sprach und der es jemandem ermöglichte, das Guthaben eines Kontos ohne 2FA zu überprüfen, alle Leute entschädigt hat, die von diesem Exploit betroffen waren.

Aber vielleicht sollten sie jeden dazu zwingen, Google Authenticator zu nutzen. Das würde es für diese Leute schwieriger machen, oder vielleicht die Option geben, ein zweites Passwort auf der Seite zu haben, das nur für Überweisungen ist. Das Problem ist, je schwerer sie es Kriminellen machen, Dinge zu stehlen, desto schwerer machen sie es den Nutzern, die Seite zu bedienen. Es wird also zu einer schwierigen Balance. Obendrein bin ich mir sicher, dass Nordkorea Coinbase die ganze Zeit angreift und versucht, irgendwo eine Hot Wallet zu finden, um da reinzugreifen. Sie haben also wirklich ein ziemliches Päckchen, gegen das sie sich verteidigen müssen. No pressure? Aber mir scheint zumindest offensichtlich, dass, selbst wenn man ein paar dieser Probleme behebt, die Leute in diesen schmutzigen Coms einfach einen anderen Weg finden, es zu tun. Da das Internet sich mit der Geschwindigkeit bewegt, mit der es sich bewegt, stellen Software und Websites die Sicherheit nicht immer an erste Stelle. Das sind einige der Konsequenzen, wenn man das nicht tut. Wie ich am Anfang sagte, wird nicht viel Weisheit von Generation zu Generation darüber weitergegeben, was die Gefahren des Internets sind, sei es für die Nutzer der Seite oder die Teenager, die versuchen, sich in sie zu hacken. Ich glaube, es wird noch schlimmer werden, bevor es besser wird.

Es könnte sogar noch vierzig Jahre dauern, bis wir eine Welt sehen, in der die Leute auf sichere, verantwortungsvolle Weise online gehen, in der die Nutzer ihre Privatsphäre und Sicherheit über alles schätzen und wissen, dass sie keine Apps installieren oder Geräte kaufen sollten, die ihre Privatsphäre gefährden, und ein starkes Verständnis für die digitalen Gefahren da draußen haben und Dinge tun, um sich selbst zu schützen. Deshalb habe ich diese Episode für euch gemacht, jetzt habt ihr einen viel klareren Blick darauf, warum euch jemand ins Visier nehmen würde und wie sie es tun, wenn ihr vielleicht vorher nie gedacht hättet, dass ihr das Ziel wärt.

Deshalb gibt es Dinge wie die Defcon. Das ist eine Konferenz, zu der Hacker gehen, um all die neuen Wege zu zeigen, die sie gelernt haben, um sich in Dinge zu hacken. Der Hauptfokus dort liegt darauf, offensive Hacking-Techniken zu teilen, und das Teilen dieser Techniken hat die Sicherheit wohl besser gemacht, denn wenn die Leute sie nicht teilen, dann wissen wir nicht, dass das Problem existiert, und man kann nichts unternehmen, um sich dagegen zu verteidigen.

Die echten Kriminellen und staatlichen Akteure teilen ihre Techniken nicht öffentlich, weil sie nicht wollen, dass sie behoben werden. Wir können das nicht einfach ignorieren und hoffen, dass Sicherheitsprobleme sich irgendwie von alleine beheben. Meine Hoffnung ist, dass ihr, nachdem ihr von all diesen Techniken gehört habt, euer digitales Leben nun ernster nehmt als zuvor. Ich stelle mir eine Welt vor, in der die Nutzer so gut über Sicherheit aufgeklärt sind, dass sie es auf sich nehmen, ihre Umgebungen extrem abzusichern, weil sie zu oft von bösen Akteuren getroffen wurden oder einfach gelernt haben, wie man das Internet sicher nutzt. Aber es wird lange dauern, bis wir dort ankommen. Manchmal müssen Dinge zusammenbrechen, bevor sie durchbrechen können. Es ist ein Kriegsgebiet da draußen. Seid vorsichtig, aber seid mutig. Haltet durch. Ihr schafft das. Nehmt eure eigene digitale Sicherheit ernst. Praktiziert gute digitale Hygiene. Viel Glück beim Ausweichen vor den Kugeln.

JACK: (OUTRO): Ein großes Dankeschön an Drew für das Teilen dieses Einblicks in die verschiedenen Coms und was dort vor sich geht.

Diese Episode wurde im englischen Original von Jack Rhysider erstellt. Den Text haben Marko Pauli und Isabel Grünewald übersetzt und gesprochen.

Produktion: Marko Pauli

Titelmusik: Breakmaster Cylinder

Dies sind die Darknet Diaries auf Deutsch von Heise Online.

Mercedes: Teilautonomer Fahrassistent soll Anfang 2027 deutschlandweit starten

Der Stuttgarter Autobauer Mercedes-Benz will seine autonome Fahrassistenz MB.Drive Assist Pro ab Ende 2026 in ersten deutschen Städten für einige Fahrzeugmodelle verfügbar machen. Das System bietet eine autonome Tür-zu-Tür-Navigation auf Basis des SAE-Levels 2++. Anfang 2027 soll es „deutschlandweit ausgerollt werden“. In enger Abstimmung mit dem Bundesverkehrsministerium Mercedes' teilautonome Fahrassistenz MB.Drive Assist Pro ist zuerst auf der IAA 2025 angekündigt worden und konnte Anfang dieses Jahres von heise Autos in einem Mercedes CLA ausprobiert werden. Das System basiert auf dem SAE-Level 2++, bei dem das Fahrzeug selbst lenken kann, aber der Fahrer immer in der Verantwortung bleibt und jederzeit wieder übernehmen können muss. Die Fahrerin oder der Fahrer darf während der Fahrt zeitweilig die Hände vom Lenkrad nehmen, jedoch nie die Augen von der Straße abwenden – daher spricht man bei diesem Grad der Automation auch von „hands-off, eyes-on“. Dieser Automatisierungsgrad ist bis Ende dieses Jahres zunächst in Innenstädten erlaubt, wie der Mercedes-Entwicklungsvorstand Jörg Burzer in einem LinkedIn-Beitrag nach einem Termin mit Verkehrsminister Patrick Schnieder (CDU) schreibt. Die ersten Städte werden laut dem Handelsblatt Stuttgart und München sein. „Damit bringen wir diese Technologie neben China und den USA nun auch auf unseren Heimatmarkt“, teilte Burzer mit. Dabei erfolgt die Einführung des Systems „in enger Abstimmung mit dem Bundesverkehrsministerium“. Deutschland ist dabei nicht das erste Land, in dem MB.Drive Assist Pro verfügbar sein wird: Denn in China bietet Mercedes das teilautomatisierte Fahren schon seit Herbst 2025 an. Dafür kooperiert das Unternehmen mit der chinesischen KI- und Softwarefirma Momenta. In den USA und auch für den hiesigen Markt setzt Mercedes auf den US-Konzern Nvidia als Partner. Das System setze hardwareseitig auf etwa 30 Sensoren, darunter zehn Kameras, fünf Radarsensoren und zwölf Ultraschallsensoren, erklärt Mercedes.

Laut Mercedes-Benz soll das Level-2++-System „Fahrassistenz und Navigation zu einem neuen, sicheren Fahrerlebnis“ verschmelzen. So lasse sich das Fahrzeug auf Knopfdruck „mit fortschrittlicher SAE-Level-2-Unterstützung durch die Stadt navigieren – vom Parkplatz bis zum Ziel“. Mithilfe eines kooperativen Lenkansatzes seien zudem Lenkanpassungen jederzeit möglich, ohne das System zu deaktivieren, erklärt das Unternehmen. Günstiger als Level 3 oder 4 Dass Mercedes künftig verstärkt auf Level 2 setzt – das bestätige der Konzern im Zuge der Ankündigung der überarbeiteten S-Klasse Anfang dieses Jahres – hat dem Unternehmen zufolge unter anderem wirtschaftliche Gründe. Denn nur wenige Kunden sind bereit, für die recht übersichtlichen Fähigkeiten dieses autonomen Levels mehrere Tausend Euro zusätzlich zu investieren. Unter anderem kann Mercedes den Einsatz teurer Lidar-Sensoren sparen. Durch weniger technischen Aufwand im Fahrzeug bei Level 2 gehen geringere Kosten einher. Mercedes geht damit einerseits von einer größeren Verbreitung aus, andererseits eröffnet es dem Hersteller die Möglichkeit, aus gesammelten Daten zu lernen. Davon profitieren dann auch Systeme, die versprechen, in bestimmten Situationen allein klarzukommen. Denn Mercedes stampft Level 3 und 4 nicht komplett ein. Jedoch lässt Mercedes offen, wann vollautonomes Fahren hierzulande Einzug halten könnte. In Abu Dhabi, der Hauptstadt der Vereinigten Arabischen Emirate (VAE), lässt Mercedes derweil die S-Klasse als Robotaxi mit Momenta-Software fahren. Das MB.Drive Assist Pro-System kommt jedoch nicht in allen Fahrzeugen zum Einsatz, zudem lässt es sich nicht einfach per Softwareupdate nachrüsten. So soll das Einstiegsmodell CLA das System nicht unterstützen, da Mercedes die Hardware laut Handelsblatt in Deutschland bislang nicht verbaut. In den teureren Modellen wie dem GLC und der S-Klasse seien die Sensoren standardmäßig an Bord. Neben Mercedes-Benz hat übrigens auch BMW seinen Fokus von Level 3 auf Level 2 verschoben.

Weiterlesen

Der Stuttgarter Autobauer Mercedes-Benz will seine autonome Fahrassistenz MB.Drive Assist Pro ab Ende 2026 in ersten deutschen Städten für einige Fahrzeugmodelle verfügbar machen. Das System bietet eine autonome Tür-zu-Tür-Navigation auf Basis des SAE-Levels 2++. Anfang 2027 soll es „deutschlandweit ausgerollt werden“. In enger Abstimmung mit dem Bundesverkehrsministerium Mercedes' teilautonome Fahrassistenz MB.Drive Assist Pro ist zuerst auf der IAA 2025 angekündigt worden und konnte Anfang dieses Jahres von heise Autos in einem Mercedes CLA ausprobiert werden. Das System basiert auf dem SAE-Level 2++, bei dem das Fahrzeug selbst lenken kann, aber der Fahrer immer in der Verantwortung bleibt und jederzeit wieder übernehmen können muss. Die Fahrerin oder der Fahrer darf während der Fahrt zeitweilig die Hände vom Lenkrad nehmen, jedoch nie die Augen von der Straße abwenden – daher spricht man bei diesem Grad der Automation auch von „hands-off, eyes-on“. Dieser Automatisierungsgrad ist bis Ende dieses Jahres zunächst in Innenstädten erlaubt, wie der Mercedes-Entwicklungsvorstand Jörg Burzer in einem LinkedIn-Beitrag nach einem Termin mit Verkehrsminister Patrick Schnieder (CDU) schreibt. Die ersten Städte werden laut dem Handelsblatt Stuttgart und München sein. „Damit bringen wir diese Technologie neben China und den USA nun auch auf unseren Heimatmarkt“, teilte Burzer mit. Dabei erfolgt die Einführung des Systems „in enger Abstimmung mit dem Bundesverkehrsministerium“. Deutschland ist dabei nicht das erste Land, in dem MB.Drive Assist Pro verfügbar sein wird: Denn in China bietet Mercedes das teilautomatisierte Fahren schon seit Herbst 2025 an. Dafür kooperiert das Unternehmen mit der chinesischen KI- und Softwarefirma Momenta. In den USA und auch für den hiesigen Markt setzt Mercedes auf den US-Konzern Nvidia als Partner. Das System setze hardwareseitig auf etwa 30 Sensoren, darunter zehn Kameras, fünf Radarsensoren und zwölf Ultraschallsensoren, erklärt Mercedes.

Laut Mercedes-Benz soll das Level-2++-System „Fahrassistenz und Navigation zu einem neuen, sicheren Fahrerlebnis“ verschmelzen. So lasse sich das Fahrzeug auf Knopfdruck „mit fortschrittlicher SAE-Level-2-Unterstützung durch die Stadt navigieren – vom Parkplatz bis zum Ziel“. Mithilfe eines kooperativen Lenkansatzes seien zudem Lenkanpassungen jederzeit möglich, ohne das System zu deaktivieren, erklärt das Unternehmen. Günstiger als Level 3 oder 4 Dass Mercedes künftig verstärkt auf Level 2 setzt – das bestätige der Konzern im Zuge der Ankündigung der überarbeiteten S-Klasse Anfang dieses Jahres – hat dem Unternehmen zufolge unter anderem wirtschaftliche Gründe. Denn nur wenige Kunden sind bereit, für die recht übersichtlichen Fähigkeiten dieses autonomen Levels mehrere Tausend Euro zusätzlich zu investieren. Unter anderem kann Mercedes den Einsatz teurer Lidar-Sensoren sparen. Durch weniger technischen Aufwand im Fahrzeug bei Level 2 gehen geringere Kosten einher. Mercedes geht damit einerseits von einer größeren Verbreitung aus, andererseits eröffnet es dem Hersteller die Möglichkeit, aus gesammelten Daten zu lernen. Davon profitieren dann auch Systeme, die versprechen, in bestimmten Situationen allein klarzukommen. Denn Mercedes stampft Level 3 und 4 nicht komplett ein. Jedoch lässt Mercedes offen, wann vollautonomes Fahren hierzulande Einzug halten könnte. In Abu Dhabi, der Hauptstadt der Vereinigten Arabischen Emirate (VAE), lässt Mercedes derweil die S-Klasse als Robotaxi mit Momenta-Software fahren. Das MB.Drive Assist Pro-System kommt jedoch nicht in allen Fahrzeugen zum Einsatz, zudem lässt es sich nicht einfach per Softwareupdate nachrüsten. So soll das Einstiegsmodell CLA das System nicht unterstützen, da Mercedes die Hardware laut Handelsblatt in Deutschland bislang nicht verbaut. In den teureren Modellen wie dem GLC und der S-Klasse seien die Sensoren standardmäßig an Bord. Neben Mercedes-Benz hat übrigens auch BMW seinen Fokus von Level 3 auf Level 2 verschoben.

Figure AI lässt seine Roboter 200 Stunden am Stück arbeiten

heise_ki·2026-05-26RobotikAnwendungenWirtschaft

200 Stunden ohne Hardware-Problem: Das US-Unternehmen Figure AI hat drei humanoide Roboter vom Typ Figure 03 (F.03) acht Tage lang an einem Fließband Pakete sortieren lassen. Das schafften die Roboter ohne eine Störung.

Die Roboter standen an einem Fließband mit Paketen. Sie sollten darauf den Barcode suchen, das Paket nehmen und umdrehen, sodass der Barcode unten liegt. Eine Kamera beobachtete sie dabei und streamte ins Internet. Die Zuschauer gaben den dreien die Namen Bob, Jim und Rose.

Ursprünglich war eine Acht-Stunden-Schicht geplant. Daraus wurden zunächst 20 und schließlich 200 Stunden, in denen die drei 249.560 Pakete bearbeiteten. Dabei sei es zu keinem Ausfall gekommen, teilte Figure-AI-Chef Brett Adcock über den Kurznachrichtendienst X mit. Es traten allerdings kleinere Fehler auf, etwa dass ein Roboter ein Paket auf den Boden fallen ließ oder eines nicht richtig auf das Band legte.

Ablösung bei niedrigem Akkustand

Die Roboter rotierten bei der Arbeit: Neigte sich der Ladestand des Akkus dem Ende zu, wurde er automatisch von einem anderen abgelöst. Er begab sich dann zu einer drahtlosen Ladestation, um sich auf seinen nächsten Einsatz vorzubereiten. Der Akku des F.03 hält etwa vier Stunden durch.

Die Idee zu der Aktion entstand, als der Robotiker Scott Walter Figure AI aufforderte, die Leistungsfähigkeit des F.03 zu demonstrieren. Nachdem am ersten Tag aber keine Störungen auftraten, wurde der Test ausgeweitet. „Das ist Neuland“, kommentierte Adcock.

Zuvor hatte das Unternehmen einen Praktikanten gegen den Roboter antreten lassen: Beide sollten in einer 10-Stunden-Schicht Pakete sortieren. Der Roboter schaffte 12.732 Pakete, was einer Zeit von 2,83 Sekunden pro Paket entspricht. Der Praktikant schlug ihn knapp mit 12.924 Paketen – das sind 2,79 Sekunden pro Paket –, war allerdings körperlich deutlich gestresst. Aber, so kommentierte Adcock: „Das ist das letzte Mal, dass ein Mensch gewinnt.“

Figure 03 ist ein humanoider Roboter, der etwa 1,70 Meter groß ist und gut 60 Kilogramm wiegt. Gesteuert wird er von einem KI-System mit der Bezeichnung Helix 02, das Figure AI selbst entwickelt hat. Die Vorgänger Figure 01 und Figure 02 sind bereits seit einiger Zeit im Einsatz in der Industrie.

Weiterlesen

200 Stunden ohne Hardware-Problem: Das US-Unternehmen Figure AI hat drei humanoide Roboter vom Typ Figure 03 (F.03) acht Tage lang an einem Fließband Pakete sortieren lassen. Das schafften die Roboter ohne eine Störung.

Die Roboter standen an einem Fließband mit Paketen. Sie sollten darauf den Barcode suchen, das Paket nehmen und umdrehen, sodass der Barcode unten liegt. Eine Kamera beobachtete sie dabei und streamte ins Internet. Die Zuschauer gaben den dreien die Namen Bob, Jim und Rose.

Ursprünglich war eine Acht-Stunden-Schicht geplant. Daraus wurden zunächst 20 und schließlich 200 Stunden, in denen die drei 249.560 Pakete bearbeiteten. Dabei sei es zu keinem Ausfall gekommen, teilte Figure-AI-Chef Brett Adcock über den Kurznachrichtendienst X mit. Es traten allerdings kleinere Fehler auf, etwa dass ein Roboter ein Paket auf den Boden fallen ließ oder eines nicht richtig auf das Band legte.

Ablösung bei niedrigem Akkustand

Die Roboter rotierten bei der Arbeit: Neigte sich der Ladestand des Akkus dem Ende zu, wurde er automatisch von einem anderen abgelöst. Er begab sich dann zu einer drahtlosen Ladestation, um sich auf seinen nächsten Einsatz vorzubereiten. Der Akku des F.03 hält etwa vier Stunden durch.

Die Idee zu der Aktion entstand, als der Robotiker Scott Walter Figure AI aufforderte, die Leistungsfähigkeit des F.03 zu demonstrieren. Nachdem am ersten Tag aber keine Störungen auftraten, wurde der Test ausgeweitet. „Das ist Neuland“, kommentierte Adcock.

Zuvor hatte das Unternehmen einen Praktikanten gegen den Roboter antreten lassen: Beide sollten in einer 10-Stunden-Schicht Pakete sortieren. Der Roboter schaffte 12.732 Pakete, was einer Zeit von 2,83 Sekunden pro Paket entspricht. Der Praktikant schlug ihn knapp mit 12.924 Paketen – das sind 2,79 Sekunden pro Paket –, war allerdings körperlich deutlich gestresst. Aber, so kommentierte Adcock: „Das ist das letzte Mal, dass ein Mensch gewinnt.“

Figure 03 ist ein humanoider Roboter, der etwa 1,70 Meter groß ist und gut 60 Kilogramm wiegt. Gesteuert wird er von einem KI-System mit der Bezeichnung Helix 02, das Figure AI selbst entwickelt hat. Die Vorgänger Figure 01 und Figure 02 sind bereits seit einiger Zeit im Einsatz in der Industrie.

Dell disaggregiert Private Cloud für mehr Skalierbarkeit

Dell hat auf seiner Hausmesse neue Funktionen für die Dell Private Cloud, die Dell Distributed Private Cloud und für die Dell Automation Platform vorgestellt. Sie zielen auf disaggregierte Rechenzentrumsarchitekturen, bei denen Compute, Storage und Netzwerk nicht mehr als gekoppelte HCI-Einheit betrieben werden, sondern getrennt eingerichtet und skaliert werden können. Die Dell Private Cloud unterstützt dafür mehrere Cloud-Betriebssysteme auf PowerEdge-Servern und PowerStore-Storage. Genannt werden VMware Cloud Foundation 9.1, Microsoft Azure Local und Nutanix AHV mit Dell PowerStore. Das adressiert Umgebungen, in denen mehrere Hypervisoren, Private-Cloud-Plattformen oder mehrere Cloud-Stacks betrieben werden. Dell begründet den neuen Ansatz unter anderem mit Multi-Hypervisor-Umgebungen, geringerem Vendor-Lock-in, der Möglichkeit zum Wechsel zwischen Cloud-Betriebssystemen und der unabhängigen Skalierung von Rechenleistung und Speicher. Neue Architektur richtet sich an KI-Workloads Der Ansatz ist ein Gegenpol zu HCI, wo Compute, Storage und Virtualisierung in einem eng gekoppelten Stack verknüpft sind. Das vereinfacht Beschaffung, Aufbau und Betrieb. Entsprechend groß ist HCI in vielen Private-Cloud-Umgebungen verbreitet. Die Kehrseite ist aber, dass die Skalierung und Modernisierung der Ressourcen ebenfalls miteinander verknüpft sind. Bei KI- und datenintensiven Workloads kann das zum Problem werden, denn GPU-Leistung, Storage-Kapazität, File- und Object-Zugriffe, Netzwerkbandbreite, Stromversorgung und Kühlung wachsen selten im gleichen Takt. Hinzu kommt, dass sich viele KI-Anwendungen und Agenten noch in der Pilotphase, dem Proof of Concept oder im begrenzten Fachbereichstest befinden. Sobald ein Use Case produktiv ausgerollt wird, ändern sich Nutzerzahlen, Inferenzlast, Datenzugriffe, Verfügbarkeitsanforderungen und Sicherheitsvorgaben teils sprunghaft. Damit wird die Infrastrukturplanung schwieriger als bei klassischen Unternehmensanwendungen mit vergleichsweise stabilen Lastprofilen. Automation Platform für Betrieb und Orchestrierung Eine disaggregierte Infrastruktur schafft mehr Freiheitsgrade, erhöht aber auch den Aufwand für Planung und Betrieb. Eine Umgebung aus getrennt skalierbaren Server-, Storage-, Netzwerk- und Cloud-Stacks ist kein Rundum-sorglos-Paket. Dell versucht, den zusätzlichen Betriebsaufwand über validierte Designs, zentrale Verwaltung und Automatisierung einzugrenzen. Dazu wurden mehrere Erweiterungen der Automation Platform vorgestellt, beispielsweise die Kombination von KI-Agenten mit einer dialogorientierten Bedienoberfläche. Die neue Plattform kann Cloud-Betriebssysteme auf PowerEdge und PowerStore installieren und über ein gemeinsames Managementmodell betreiben. Automation Studio ergänzt diese Funktionen. Damit sollen Unternehmen eigene Automatisierungs-Workflows über Infrastruktur und Anwendungen hinweg erstellen können. Dell adressiert damit nicht nur Erstinstallation und Provisionierung, sondern auch wiederkehrende Aufgaben im laufenden Betrieb. HCI unter Kostendruck Neben der technischen Flexibilität sprechen für eine Disaggregierung auch die Kostenvorteile. In einem Gespräch mit iX sagte Dell-Fellow Onur Celebioglu: „HCI-Systeme stehen wegen ihrer Architektur besonders unter Kostendruck, da sie viel DRAM und Laufwerke benötigen. Extern skalierbare Storage-Systeme können damit in bestimmten Refresh-Szenarien wirtschaftlich attraktiver werden.“ Ein weiterer Punkt ist die Hypervisor-Bindung. HCI ist architektonisch eng mit dem jeweiligen Virtualisierungs-Stack verbunden. Wer sich für ein Ökosystem entscheidet, bleibt in der Regel auch daran gebunden. Disaggregierte Architekturen mit externer Storage lockern diese enge Bindung. Dell verkauft diese Entkopplung als „Optionality“, also als Wahlfreiheit für unterschiedliche Cloud- und Virtualisierungsumgebungen.

Distributed Private Cloud für Edge-Locations Für Edge-Standorte erweitert Dell seine Distributed Private Cloud, früher NativeEdge. Die Plattform bekommt Zwei-Node-HA-Cluster, automatisches Failover und integrierte Zero-Trust-Funktionen. Das zielt auf Fertigungsumgebungen, Logistikzentren oder andere dezentrale Standorte, an denen Latenz, Datenhaltung oder Ausfallsicherheit gegen einen reinen Cloud-Betrieb sprechen, aber kaum eigenes IT-Knowhow vor Ort verfügbar ist. Auch hier folgt Dell der gleichen Logik: Infrastruktur soll näher an Daten und Anwendungen rücken, trotzdem aber zentral verwaltet und automatisiert betrieben werden. Dells neue Private-Cloud-Strategie ist keine einfache Rückkehr zur klassischen Drei-Schichten-Architektur. Der Hersteller versucht vielmehr, die Flexibilität getrennter Compute-, Storage- und Netzwerkressourcen mit Cloud-Stack-Optionen und Automatisierung zu verbinden. Ob die Automation Platform den zusätzlichen Betriebsaufwand ausreichend auffängt, muss sich im produktiven Betrieb zeigen. Klar ist aber: Wer KI-Workloads lokal betreiben will, muss mit volatilen Lastprofilen, schnellen Architekturwechseln und deutlich komplexeren Datenpfaden rechnen. Dell reagiert darauf mit mehr Disaggregation und nimmt dafür in Kauf, dass die Private Cloud wieder stärker geplant, dimensioniert und orchestriert werden muss.

Weiterlesen

Dell hat auf seiner Hausmesse neue Funktionen für die Dell Private Cloud, die Dell Distributed Private Cloud und für die Dell Automation Platform vorgestellt. Sie zielen auf disaggregierte Rechenzentrumsarchitekturen, bei denen Compute, Storage und Netzwerk nicht mehr als gekoppelte HCI-Einheit betrieben werden, sondern getrennt eingerichtet und skaliert werden können. Die Dell Private Cloud unterstützt dafür mehrere Cloud-Betriebssysteme auf PowerEdge-Servern und PowerStore-Storage. Genannt werden VMware Cloud Foundation 9.1, Microsoft Azure Local und Nutanix AHV mit Dell PowerStore. Das adressiert Umgebungen, in denen mehrere Hypervisoren, Private-Cloud-Plattformen oder mehrere Cloud-Stacks betrieben werden. Dell begründet den neuen Ansatz unter anderem mit Multi-Hypervisor-Umgebungen, geringerem Vendor-Lock-in, der Möglichkeit zum Wechsel zwischen Cloud-Betriebssystemen und der unabhängigen Skalierung von Rechenleistung und Speicher. Neue Architektur richtet sich an KI-Workloads Der Ansatz ist ein Gegenpol zu HCI, wo Compute, Storage und Virtualisierung in einem eng gekoppelten Stack verknüpft sind. Das vereinfacht Beschaffung, Aufbau und Betrieb. Entsprechend groß ist HCI in vielen Private-Cloud-Umgebungen verbreitet. Die Kehrseite ist aber, dass die Skalierung und Modernisierung der Ressourcen ebenfalls miteinander verknüpft sind. Bei KI- und datenintensiven Workloads kann das zum Problem werden, denn GPU-Leistung, Storage-Kapazität, File- und Object-Zugriffe, Netzwerkbandbreite, Stromversorgung und Kühlung wachsen selten im gleichen Takt. Hinzu kommt, dass sich viele KI-Anwendungen und Agenten noch in der Pilotphase, dem Proof of Concept oder im begrenzten Fachbereichstest befinden. Sobald ein Use Case produktiv ausgerollt wird, ändern sich Nutzerzahlen, Inferenzlast, Datenzugriffe, Verfügbarkeitsanforderungen und Sicherheitsvorgaben teils sprunghaft. Damit wird die Infrastrukturplanung schwieriger als bei klassischen Unternehmensanwendungen mit vergleichsweise stabilen Lastprofilen. Automation Platform für Betrieb und Orchestrierung Eine disaggregierte Infrastruktur schafft mehr Freiheitsgrade, erhöht aber auch den Aufwand für Planung und Betrieb. Eine Umgebung aus getrennt skalierbaren Server-, Storage-, Netzwerk- und Cloud-Stacks ist kein Rundum-sorglos-Paket. Dell versucht, den zusätzlichen Betriebsaufwand über validierte Designs, zentrale Verwaltung und Automatisierung einzugrenzen. Dazu wurden mehrere Erweiterungen der Automation Platform vorgestellt, beispielsweise die Kombination von KI-Agenten mit einer dialogorientierten Bedienoberfläche. Die neue Plattform kann Cloud-Betriebssysteme auf PowerEdge und PowerStore installieren und über ein gemeinsames Managementmodell betreiben. Automation Studio ergänzt diese Funktionen. Damit sollen Unternehmen eigene Automatisierungs-Workflows über Infrastruktur und Anwendungen hinweg erstellen können. Dell adressiert damit nicht nur Erstinstallation und Provisionierung, sondern auch wiederkehrende Aufgaben im laufenden Betrieb. HCI unter Kostendruck Neben der technischen Flexibilität sprechen für eine Disaggregierung auch die Kostenvorteile. In einem Gespräch mit iX sagte Dell-Fellow Onur Celebioglu: „HCI-Systeme stehen wegen ihrer Architektur besonders unter Kostendruck, da sie viel DRAM und Laufwerke benötigen. Extern skalierbare Storage-Systeme können damit in bestimmten Refresh-Szenarien wirtschaftlich attraktiver werden.“ Ein weiterer Punkt ist die Hypervisor-Bindung. HCI ist architektonisch eng mit dem jeweiligen Virtualisierungs-Stack verbunden. Wer sich für ein Ökosystem entscheidet, bleibt in der Regel auch daran gebunden. Disaggregierte Architekturen mit externer Storage lockern diese enge Bindung. Dell verkauft diese Entkopplung als „Optionality“, also als Wahlfreiheit für unterschiedliche Cloud- und Virtualisierungsumgebungen.

Distributed Private Cloud für Edge-Locations Für Edge-Standorte erweitert Dell seine Distributed Private Cloud, früher NativeEdge. Die Plattform bekommt Zwei-Node-HA-Cluster, automatisches Failover und integrierte Zero-Trust-Funktionen. Das zielt auf Fertigungsumgebungen, Logistikzentren oder andere dezentrale Standorte, an denen Latenz, Datenhaltung oder Ausfallsicherheit gegen einen reinen Cloud-Betrieb sprechen, aber kaum eigenes IT-Knowhow vor Ort verfügbar ist. Auch hier folgt Dell der gleichen Logik: Infrastruktur soll näher an Daten und Anwendungen rücken, trotzdem aber zentral verwaltet und automatisiert betrieben werden. Dells neue Private-Cloud-Strategie ist keine einfache Rückkehr zur klassischen Drei-Schichten-Architektur. Der Hersteller versucht vielmehr, die Flexibilität getrennter Compute-, Storage- und Netzwerkressourcen mit Cloud-Stack-Optionen und Automatisierung zu verbinden. Ob die Automation Platform den zusätzlichen Betriebsaufwand ausreichend auffängt, muss sich im produktiven Betrieb zeigen. Klar ist aber: Wer KI-Workloads lokal betreiben will, muss mit volatilen Lastprofilen, schnellen Architekturwechseln und deutlich komplexeren Datenpfaden rechnen. Dell reagiert darauf mit mehr Disaggregation und nimmt dafür in Kauf, dass die Private Cloud wieder stärker geplant, dimensioniert und orchestriert werden muss.

OpenAI Codex steuert Mac auch in gesperrtem Zustand

heise_ki·2026-05-26AgentenSicherheitAnwendungen

Agentische KI steuert Mac, ohne dass der Nutzer dies sieht: Für manche User mag das dystopisch klingen, für OpenAIs Coding-Assistenten Codex ist das künftig Realität. Mit der jüngsten Version der App samt entsprechenden Rechten muss die Maschine nicht mehr entsperrt sein, damit die KI aktiv werden kann. Das kündigte OpenAI in der vergangenen Woche via X an und ergänzte auch seine Dokumentation von Codex entsprechend. Computer Use und Locked Use nicht innerhalb des EWR Laut dem Unternehmen muss der Mac durch den Nutzer nicht mehr „unlocked“ sein, „damit Codex Deinen Computer verwenden kann“. Die entsprechende Option in der macOS-App nennt sich „Locked Use“. Sie ist, genauso wie die Rechnersteuerung durch Codex an sich („Computer Use“), derzeit allerdings noch nicht innerhalb des Europäischen Wirtschaftsraums (inklusive EU), der Schweiz sowie Großbritannien verfügbar. Auch für Windows oder Linux gibt es weder Locked Use noch Computer Use.

Damit Computer Use grundsätzlich funktioniert, muss man Codex die Rechte für Bildschirmaufnahmen sowie den Zugriff für Bedienungshilfen geben – die App kann damit grundsätzlich alles auf dem Rechner tun. Immerhin fragt Codex innerhalb der App selbst allerdings nach, welche macOS-Anwendungen Nutzer für den Coding-Assistenten erlauben wollen und welche nicht. Für den Einsatz des Locked Use reichen die beiden Freigaben allerdings nicht. Apple verlangt hierfür ein sogenanntes Authorization Plug-in, das den „macOS Unlock Flow“ unterstützt. Sicherheitserwägungen – und Fernsteuerung vom Mobilgerät OpenAI ist sich bewusst, dass sowohl Computer Use als auch Locked Use ein Sicherheitsproblem darstellen können. So rät der KI-Konzern Nutzern beispielsweise, Codex „klare Ziel-Apps oder Flows“ zu geben und dabei jeweils nur eine. Innerhalb des Locked Use erkennt Codex eine Verwendung von Tastatur, Trackpad oder Maus durch den Nutzer und deaktiviert den automatischen Unlock dann zunächst, bis der nächste manuelle Unlock erfolgt. Codex soll Zugriff auf alle Bildschirme haben, allerdings nur während „aktiver Computer-Use-Turns“. Zudem sei das Autorisierungsfenster „kurz und auf den aktuellen Entsperrversuch“ konzentriert. Dennoch sollten sich Nutzer genau überlegen, was sie hier tun. Zuletzt hatte OpenAI die ChatGPT-App mit neuen Fernsteuerungsfunktionen für Codex auf dem Mac ausgerüstet. Dies funktioniert sowohl unter iOS als auch unter Android. Die Funktion gilt derzeit noch offiziell als „Preview“. Sie kann nun direkt im Zusammenhang mit dem Locked Use verwendet werden. Zuvor musste der heimische Mac entsperrt bleiben, was unsicher war.

Weiterlesen

Agentische KI steuert Mac, ohne dass der Nutzer dies sieht: Für manche User mag das dystopisch klingen, für OpenAIs Coding-Assistenten Codex ist das künftig Realität. Mit der jüngsten Version der App samt entsprechenden Rechten muss die Maschine nicht mehr entsperrt sein, damit die KI aktiv werden kann. Das kündigte OpenAI in der vergangenen Woche via X an und ergänzte auch seine Dokumentation von Codex entsprechend. Computer Use und Locked Use nicht innerhalb des EWR Laut dem Unternehmen muss der Mac durch den Nutzer nicht mehr „unlocked“ sein, „damit Codex Deinen Computer verwenden kann“. Die entsprechende Option in der macOS-App nennt sich „Locked Use“. Sie ist, genauso wie die Rechnersteuerung durch Codex an sich („Computer Use“), derzeit allerdings noch nicht innerhalb des Europäischen Wirtschaftsraums (inklusive EU), der Schweiz sowie Großbritannien verfügbar. Auch für Windows oder Linux gibt es weder Locked Use noch Computer Use.

Damit Computer Use grundsätzlich funktioniert, muss man Codex die Rechte für Bildschirmaufnahmen sowie den Zugriff für Bedienungshilfen geben – die App kann damit grundsätzlich alles auf dem Rechner tun. Immerhin fragt Codex innerhalb der App selbst allerdings nach, welche macOS-Anwendungen Nutzer für den Coding-Assistenten erlauben wollen und welche nicht. Für den Einsatz des Locked Use reichen die beiden Freigaben allerdings nicht. Apple verlangt hierfür ein sogenanntes Authorization Plug-in, das den „macOS Unlock Flow“ unterstützt. Sicherheitserwägungen – und Fernsteuerung vom Mobilgerät OpenAI ist sich bewusst, dass sowohl Computer Use als auch Locked Use ein Sicherheitsproblem darstellen können. So rät der KI-Konzern Nutzern beispielsweise, Codex „klare Ziel-Apps oder Flows“ zu geben und dabei jeweils nur eine. Innerhalb des Locked Use erkennt Codex eine Verwendung von Tastatur, Trackpad oder Maus durch den Nutzer und deaktiviert den automatischen Unlock dann zunächst, bis der nächste manuelle Unlock erfolgt. Codex soll Zugriff auf alle Bildschirme haben, allerdings nur während „aktiver Computer-Use-Turns“. Zudem sei das Autorisierungsfenster „kurz und auf den aktuellen Entsperrversuch“ konzentriert. Dennoch sollten sich Nutzer genau überlegen, was sie hier tun. Zuletzt hatte OpenAI die ChatGPT-App mit neuen Fernsteuerungsfunktionen für Codex auf dem Mac ausgerüstet. Dies funktioniert sowohl unter iOS als auch unter Android. Die Funktion gilt derzeit noch offiziell als „Preview“. Sie kann nun direkt im Zusammenhang mit dem Locked Use verwendet werden. Zuvor musste der heimische Mac entsperrt bleiben, was unsicher war.

Investor hinter Airbnb und OpenAI warnt Startups: Wer KI-Mails schickt, wird nicht ernst genommen

the_decoder·2026-05-26GesellschaftAnwendungen

Kurz & Knapp

- Y-Combinator-Gründer Paul Graham liest keine von KI verfassten E-Mails, da der Einsatz von Textgeneratoren in diesem Kontext auf ihn täuschend wirkt und eine mangelnde Eigenleistung des Absenders signalisiert.

- Studien deuten darauf hin, dass Graham mit dieser Haltung kein Einzelfall ist. Eine Untersuchung der Ohio State University belegt, dass Empfänger KI-generierte Nachrichten oft als Zeichen von Bequemlichkeit und mangelnder Aufrichtigkeit werten, was zu einem Vertrauensverlust führt.

- Laut einer Befragung von BetterUp Labs erhalten 40 Prozent der US-Beschäftigten regelmäßig substanzlose KI-Inhalte von Kollegen. Etwa die Hälfte der Befragten hält die Absender solcher Nachrichten für weniger kreativ, fähig und vertrauenswürdig.

Y-Combinator-Gründer Paul Graham liest keine mit KI geschriebenen E-Mails. Immer mehr Gründer würden ihm in einem "knallharten journalistischen Stil" anschreiben, so Graham.

Sobald man merke, dass ein Text von KI stamme, sei es schwer, ihn nicht zu ignorieren. Graham geht noch weiter. Er habe noch nie eine E-Mail zu Ende gelesen, die von einem Menschen unterschrieben, aber von KI verfasst wurde. Es fühle sich an, als werde man belogen.

Man solle KI nutzen, aber auf die richtige Art, so Graham. KI-generierte Texte ließen ihn weniger vom Autor halten. Sie zeigten, dass jemand ohne Hilfe nicht gut schreiben könne oder sich das zumindest einrede, und dass er versuche, sein Gegenüber zu täuschen. Es sei nicht beeindruckend, KI für sich schreiben zu lassen. Das könne jeder Teenager.

Eine generelle Abneigung gegen KI hat Graham sicher nicht. Y Combinator gehörte unter anderem zu den frühen Investoren von OpenAI und steckt tief in KI-Investitionen. Warum also stört sich Graham so stark an einem offensichtlichen Anwendungsszenario? Er bemängelt schließlich nicht die Qualität des Inhalts, so weit kommt er offenbar gar nicht.

Schlechter KI-Einsatz kann zu Vertrauensverlust führen

Wahrscheinlich zeigen sich bei ihm zwei Phänomene, die auch in Studien untersucht wurden. Soziale Abwertung und Vertrauensverlust.

Eine Studie der Ohio State University mit 208 Teilnehmern zeigt, dass Empfänger KI-generierte Nachrichten negativer bewerten, weil der Absender die Arbeit an eine Maschine delegiert hat, statt sich selbst die Mühe zu machen.

Hauptautorin Bingjie Liu erklärt, der Einsatz von KI werde als Bequemlichkeit und Mangel an Aufrichtigkeit wahrgenommen. Empfänger fühlten sich in ihrer Beziehung zum Absender unsicherer und weniger zufrieden. Liu vermutet zudem, dass Menschen inzwischen einen unbewussten "Turing-Test im Kopf" durchführen, bei dem sie Nachrichten automatisch nach KI-Mustern scannen.

Genau das beschreibt auch Graham: Er erkennt den KI-Stil sofort, weil kein Gründer je so geschrieben hat. Fliegt die KI-Nutzung auf, kippt die Wahrnehmung vom Inhalt der Nachricht hin zur Frage, wie wenig sich der Absender für den Empfänger interessiert.

Forschende von BetterUp Labs haben in Zusammenarbeit mit dem Stanford Social Media Lab 1.150 US-Beschäftigte befragt. 40 Prozent erhalten demnach regelmäßig oberflächliche, aber substanzlose KI-Inhalte von Kollegen.

Das hat soziale Folgen: 53 Prozent der Befragten fühlen sich durch solche Inhalte genervt. Etwa die Hälfte bewertet Absender von Workslop als weniger kreativ, fähig und zuverlässig. 42 Prozent halten sie für weniger vertrauenswürdig. Ein Drittel will künftig weniger mit diesen Personen zusammenarbeiten.

Die Studienautoren von BetterUp Labs unterscheiden zwischen "Pilots", die KI gezielt und eigenverantwortlich einsetzen, und "Passengers", die sie primär zur Arbeitsvermeidung nutzen. Graham ordnet Gründer, die KI-E-Mails versenden, offenbar pauschal der zweiten Gruppe zu.

Weiterlesen

Kurz & Knapp

- Y-Combinator-Gründer Paul Graham liest keine von KI verfassten E-Mails, da der Einsatz von Textgeneratoren in diesem Kontext auf ihn täuschend wirkt und eine mangelnde Eigenleistung des Absenders signalisiert.

- Studien deuten darauf hin, dass Graham mit dieser Haltung kein Einzelfall ist. Eine Untersuchung der Ohio State University belegt, dass Empfänger KI-generierte Nachrichten oft als Zeichen von Bequemlichkeit und mangelnder Aufrichtigkeit werten, was zu einem Vertrauensverlust führt.

- Laut einer Befragung von BetterUp Labs erhalten 40 Prozent der US-Beschäftigten regelmäßig substanzlose KI-Inhalte von Kollegen. Etwa die Hälfte der Befragten hält die Absender solcher Nachrichten für weniger kreativ, fähig und vertrauenswürdig.

Y-Combinator-Gründer Paul Graham liest keine mit KI geschriebenen E-Mails. Immer mehr Gründer würden ihm in einem "knallharten journalistischen Stil" anschreiben, so Graham.

Sobald man merke, dass ein Text von KI stamme, sei es schwer, ihn nicht zu ignorieren. Graham geht noch weiter. Er habe noch nie eine E-Mail zu Ende gelesen, die von einem Menschen unterschrieben, aber von KI verfasst wurde. Es fühle sich an, als werde man belogen.

Man solle KI nutzen, aber auf die richtige Art, so Graham. KI-generierte Texte ließen ihn weniger vom Autor halten. Sie zeigten, dass jemand ohne Hilfe nicht gut schreiben könne oder sich das zumindest einrede, und dass er versuche, sein Gegenüber zu täuschen. Es sei nicht beeindruckend, KI für sich schreiben zu lassen. Das könne jeder Teenager.

Eine generelle Abneigung gegen KI hat Graham sicher nicht. Y Combinator gehörte unter anderem zu den frühen Investoren von OpenAI und steckt tief in KI-Investitionen. Warum also stört sich Graham so stark an einem offensichtlichen Anwendungsszenario? Er bemängelt schließlich nicht die Qualität des Inhalts, so weit kommt er offenbar gar nicht.

Schlechter KI-Einsatz kann zu Vertrauensverlust führen

Wahrscheinlich zeigen sich bei ihm zwei Phänomene, die auch in Studien untersucht wurden. Soziale Abwertung und Vertrauensverlust.

Eine Studie der Ohio State University mit 208 Teilnehmern zeigt, dass Empfänger KI-generierte Nachrichten negativer bewerten, weil der Absender die Arbeit an eine Maschine delegiert hat, statt sich selbst die Mühe zu machen.

Hauptautorin Bingjie Liu erklärt, der Einsatz von KI werde als Bequemlichkeit und Mangel an Aufrichtigkeit wahrgenommen. Empfänger fühlten sich in ihrer Beziehung zum Absender unsicherer und weniger zufrieden. Liu vermutet zudem, dass Menschen inzwischen einen unbewussten "Turing-Test im Kopf" durchführen, bei dem sie Nachrichten automatisch nach KI-Mustern scannen.

Genau das beschreibt auch Graham: Er erkennt den KI-Stil sofort, weil kein Gründer je so geschrieben hat. Fliegt die KI-Nutzung auf, kippt die Wahrnehmung vom Inhalt der Nachricht hin zur Frage, wie wenig sich der Absender für den Empfänger interessiert.

Forschende von BetterUp Labs haben in Zusammenarbeit mit dem Stanford Social Media Lab 1.150 US-Beschäftigte befragt. 40 Prozent erhalten demnach regelmäßig oberflächliche, aber substanzlose KI-Inhalte von Kollegen.

Das hat soziale Folgen: 53 Prozent der Befragten fühlen sich durch solche Inhalte genervt. Etwa die Hälfte bewertet Absender von Workslop als weniger kreativ, fähig und zuverlässig. 42 Prozent halten sie für weniger vertrauenswürdig. Ein Drittel will künftig weniger mit diesen Personen zusammenarbeiten.

Die Studienautoren von BetterUp Labs unterscheiden zwischen "Pilots", die KI gezielt und eigenverantwortlich einsetzen, und "Passengers", die sie primär zur Arbeitsvermeidung nutzen. Graham ordnet Gründer, die KI-E-Mails versenden, offenbar pauschal der zweiten Gruppe zu.

Zwischen Systemkollaps und Gerechtigkeit: KI-Klagen stürzen die US-Justiz in ein Dilemma

the_decoder·2026-05-26GesellschaftForschungAnwendungen

Eine neue Studie des MIT und der University of Southern California zeigt, dass die Zahl der Klagen ohne Anwalt an US-Bundesgerichten seit der Verbreitung von ChatGPT fast doppelt so hoch ist wie zuvor. Jede fünfte Klageschrift enthält mittlerweile KI-generierten Text. Richter greifen zu teilweise drastischen Maßnahmen, um mit der Dokumentenflut klarzukommen.

Die Forscher werteten 4,5 Millionen zivile Klagen aus den Geschäftsjahren 2005 bis 2026 sowie 46 Millionen Einträge aus dem elektronischen Aktenregister PACER aus. Im Zentrum steht die "pro se"-Quote, also der Anteil der Klagen, bei denen sich der Kläger selbst vertritt, ohne Anwalt. Das Recht auf Selbstvertretung ist in den USA älter als die Bill of Rights und liegt seit zwei Jahrzehnten stabil bei rund 11 Prozent aller Zivilklagen vor Bundesgerichten. Im Geschäftsjahr 2025 schoss er auf 16,8 Prozent. Allein 2025 wurden 41.490 Pro-se-Klagen eingereicht, fast doppelt so viele wie im Vor-KI-Durchschnitt. 59 Prozent des gesamten Wachstums der Zivilklagen entfallen laut Studie auf selbstvertretende Kläger.

Der Befund ist deshalb bemerkenswert, weil US-Bundesgerichte für Laienkläger die höchsten Hürden im amerikanischen System aufstellen. Die Einreichungsgebühr liegt bei 405 Dollar, etwa doppelt so hoch wie bei den meisten Bundesstaatsgerichten, und die formalen Anforderungen an Klageschriften sind deutlich strenger. Über 90 Prozent aller Zivilverfahren in den USA laufen ohnehin vor staatlichen oder kommunalen Gerichten; dort dürfte der KI-Effekt laut Studie noch größer sein.

Einfache Fälle profitieren, komplexe nicht

Der Anstieg konzentriert sich auf Fallkategorien, in denen formelhafte Dokumentenerstellung die Hauptarbeit ausmacht: Bürgerrechtsklagen, Verbraucherkredit-Streitigkeiten, Zwangsvollstreckungen. In Bereichen mit anhaltendem Spezialwissen wie Patent- oder Wertpapierrecht zeigt sich kein Effekt. Die Forscher interpretieren das als Beleg, dass LLMs jene Kosten senken, die für Laien bislang prohibitiv waren: das Verfassen prozessual tragfähiger Schriftsätze. Der Anstieg ist fast ausschließlich klägerseitig und tritt in 44 von 50 Bundesstaaten gleichzeitig auf, was lokale Erklärungen ausschließt.

Falldauern und Ausgangsverteilungen sind dagegen weitgehend unverändert, doch innerhalb der Verfahren explodiert die Aktivität. Die Zahl der Akteneinträge pro Gericht durch Pro-se-Kläger in den ersten 180 Tagen liegt im zweiten Quartal 2025 um 158 Prozent über dem Vor-KI-Mittel. Jeder dieser Einträge, ob Antrag, Erwiderung oder Anordnung, beansprucht Bearbeitungszeit. Auch anwaltlich vertretene Verfahren generieren mehr Einträge (+23 Prozent pro Fall), was darauf hindeutet, dass auch Kanzleien LLMs einsetzen.

Pangram-Detektor: 18 Prozent KI-Text in Klagen von 2026

Den direktesten Nachweis liefert ein Test mit dem von Imas und Jabarian als recht zuverlässig validierten KI-Textdetektor Pangram. Die Forscher zogen 1.600 zufällige Bundesklagen aus dem Archiv CourtListener, einer öffentlichen Sammlung amerikanischer Gerichtsdokumente. Vor 2023 markierte Pangram nur ein einziges Dokument von 800 als KI-generiert. Die Quote stieg dann monoton: 1,0 Prozent 2023, 3,5 Prozent 2024, 10,5 Prozent 2025, 18,0 Prozent Anfang 2026.

Ein besonders auffälliger Fall ist der Bundesgerichtsbezirk Vermont, wo Pro-se-Klagen von rund 45 pro Jahr auf über 1.100 im Geschäftsjahr 2024 sprangen. Nahezu der gesamte Anstieg geht auf sogenannte Mandamus-Klagen gegen die US-Einwanderungsbehörde USCIS zurück, mit denen Antragsteller eine gerichtliche Anordnung erzwingen wollen, ihre seit Jahren liegengebliebenen Green-Card- oder Einbürgerungsverfahren zu bearbeiten.

Online-Anleitungen auf Reddit empfehlen, mit Microsoft Copilot einen Klageentwurf zu erzeugen, ihn für 150 Dollar von einem Anwalt auf der Freelancer-Plattform Fiverr prüfen zu lassen und gezielt in Vermont einzureichen, weil das dortige Gericht als schnell gilt.

Reaktionen der Richter: Schreddern und Bußgelder

Ein Bericht der New York Times illustriert die Belastung an einem konkreten Fall. Der 69-jährige Donald Sauve aus Minnesota verklagte nach einer Scheidung seine Ex-Frau, deren Anwalt und einen Staatsrichter. Eine erste handschriftliche Klage über 275.000 Dollar Schadenersatz wurde binnen eines Monats wegen fehlender Zuständigkeit abgewiesen. Drei Monate später reichte Sauve mithilfe von ChatGPT und Claude eine neue Klage ein, dieses Mal sauber getippt und ergänzt um 50 weitere Eingaben samt einer "Case Law Synthesis", einer Zusammenstellung angeblich stützender Präzedenzfälle.

Jede dieser Eingaben musste vom Gericht gelesen, katalogisiert und ins öffentliche Docket eingetragen werden, bevor Richter Patrick J. Schiltz die Klage in einer 14-seitigen Entscheidung erneut abwies. Schiltz verfügte, dass weitere Eingaben Sauves "ohne weitere Benachrichtigung geschreddert" würden, da ein Kläger nicht "hunderte Seiten Dokumente beim Gericht abladen" könne in der Erwartung, dass das Gericht selbst nach stützenden Argumenten suche.

Gegenüber der NYT bezeichnet Schiltz die Entwicklung als "existenzielle Bedrohung für die Bundesgerichte". Sauve, der derzeit aus seinem Auto heraus lebt, kündigte an, mit KI-Hilfe bald Eingaben in "Supreme-Court-Qualität" zu produzieren.

Zugang zur Justiz als Gegenargument

Bei aller Belastung der Gerichte hat der Trend auch eine demokratisierende Seite. Die Forschenden ordnen ihre Befunde explizit in die Forschungsliteratur zur "justice gap" ein, also der Lücke zwischen rechtlichem Bedarf und tatsächlich verfügbarer anwaltlicher Vertretung für Geringverdiener.

Richter Michael Y. Scudder vom Berufungsgericht des Seventh Circuit schreibt in einer aktuellen Entscheidung, KI biete "großes Versprechen, den Zugang zur Justiz für jene zu verbessern, die sich keine Vertretung leisten können".

Der New Yorker Rechtshilfe-Anwalt Sateesh Nori weist gegenüber der NYT darauf hin, dass trotz eines Gesetzes von 2017, das einkommensschwachen Mietern in New York kostenlose Vertretung bei Räumungsklagen garantiert, bis zu 50 Prozent der Betroffenen ohne Anwalt vor Gericht erscheinen. Seine Frage: "Warum haben diese Leute keinen anderen Weg als KI?"

Strukturelles Dilemma der US-Justiz

Die Autoren skizzieren zwei mögliche Folgen des KI-Einsatzes: ein "Wettrüsten" zwischen Pro-se-Klägern und anwaltlich vertretenen Gegnern, das pro Fall immer mehr Gerichtszeit bindet, sowie eine asymmetrische Belastung staatlicher Stellen, die als Beklagte in Bürgerrechts-, Einwanderungs- und Sozialleistungsverfahren besonders häufig auftreten und ihre eigene Bearbeitungskapazität nicht spiegelbildlich skalieren können.

Als Lösungsansätze nennen die Autoren drei nicht-exklusive Optionen. Erstens könnte das KI-Verbot für Bundesrichter beim Verfassen von Urteilen gelockert werden, um auf der Adjudikationsseite einen Produktivitätsschub zu ermöglichen, der dem auf der Klägerseite entspricht.

Zweitens könnten einfache Fälle gezielter an "Magistrate Judges", also untergeordnete Bundesrichter ohne lebenslange Ernennung, oder an spezialisierte Triage-Verfahren weitergeleitet werden.

Drittens halten die Autoren auch die Schaffung einer neuen unteren Instanz für denkbar, die die einfachsten Fälle "größtenteils mit KI" bearbeitet. Jede dieser Optionen sei nicht kostenlos, aber wahrscheinlich besser als die Alternative eines wachsenden Rückstaus in einem System mit fixer Bearbeitungskapazität.

Juristische Ausbildung und Berufspraxis ziehen Grenzen

Während die Studie vor allem die Belastung der Gerichte beschreibt, reagieren juristische Fakultäten und Aufsichtsstellen bereits auf eine verwandte Frage: Wo endet zulässige KI-Nutzung im Rechtssystem? So erlaubt die UC Berkeley Law School KI ab Sommer 2026 nur noch zur Recherche und verbietet den Einsatz für Konzeption, Gliederung, Schreiben oder Überarbeitung bewerteter Arbeiten. Nicht existierende Quellenverweise gelten dort als Hinweis auf unzulässige Nutzung.

Wie real dieses Risiko ist, zeigt eine Datenbank mit 129 dokumentierten KI-Fake-Fällen, in denen Anwälte aus zwölf Ländern erfundene Inhalte in Gerichtsverfahren eingebracht haben. Selbst KI-Unternehmen sind nicht davor geschützt: Im Urheberrechtsstreit mit Musikverlagen musste sich Anthropic entschuldigen, nachdem Claude eine Quelle im eigenen Prozess erfunden hatte.

Weiterlesen

Eine neue Studie des MIT und der University of Southern California zeigt, dass die Zahl der Klagen ohne Anwalt an US-Bundesgerichten seit der Verbreitung von ChatGPT fast doppelt so hoch ist wie zuvor. Jede fünfte Klageschrift enthält mittlerweile KI-generierten Text. Richter greifen zu teilweise drastischen Maßnahmen, um mit der Dokumentenflut klarzukommen.

Die Forscher werteten 4,5 Millionen zivile Klagen aus den Geschäftsjahren 2005 bis 2026 sowie 46 Millionen Einträge aus dem elektronischen Aktenregister PACER aus. Im Zentrum steht die "pro se"-Quote, also der Anteil der Klagen, bei denen sich der Kläger selbst vertritt, ohne Anwalt. Das Recht auf Selbstvertretung ist in den USA älter als die Bill of Rights und liegt seit zwei Jahrzehnten stabil bei rund 11 Prozent aller Zivilklagen vor Bundesgerichten. Im Geschäftsjahr 2025 schoss er auf 16,8 Prozent. Allein 2025 wurden 41.490 Pro-se-Klagen eingereicht, fast doppelt so viele wie im Vor-KI-Durchschnitt. 59 Prozent des gesamten Wachstums der Zivilklagen entfallen laut Studie auf selbstvertretende Kläger.

Der Befund ist deshalb bemerkenswert, weil US-Bundesgerichte für Laienkläger die höchsten Hürden im amerikanischen System aufstellen. Die Einreichungsgebühr liegt bei 405 Dollar, etwa doppelt so hoch wie bei den meisten Bundesstaatsgerichten, und die formalen Anforderungen an Klageschriften sind deutlich strenger. Über 90 Prozent aller Zivilverfahren in den USA laufen ohnehin vor staatlichen oder kommunalen Gerichten; dort dürfte der KI-Effekt laut Studie noch größer sein.

Einfache Fälle profitieren, komplexe nicht

Der Anstieg konzentriert sich auf Fallkategorien, in denen formelhafte Dokumentenerstellung die Hauptarbeit ausmacht: Bürgerrechtsklagen, Verbraucherkredit-Streitigkeiten, Zwangsvollstreckungen. In Bereichen mit anhaltendem Spezialwissen wie Patent- oder Wertpapierrecht zeigt sich kein Effekt. Die Forscher interpretieren das als Beleg, dass LLMs jene Kosten senken, die für Laien bislang prohibitiv waren: das Verfassen prozessual tragfähiger Schriftsätze. Der Anstieg ist fast ausschließlich klägerseitig und tritt in 44 von 50 Bundesstaaten gleichzeitig auf, was lokale Erklärungen ausschließt.

Falldauern und Ausgangsverteilungen sind dagegen weitgehend unverändert, doch innerhalb der Verfahren explodiert die Aktivität. Die Zahl der Akteneinträge pro Gericht durch Pro-se-Kläger in den ersten 180 Tagen liegt im zweiten Quartal 2025 um 158 Prozent über dem Vor-KI-Mittel. Jeder dieser Einträge, ob Antrag, Erwiderung oder Anordnung, beansprucht Bearbeitungszeit. Auch anwaltlich vertretene Verfahren generieren mehr Einträge (+23 Prozent pro Fall), was darauf hindeutet, dass auch Kanzleien LLMs einsetzen.

Pangram-Detektor: 18 Prozent KI-Text in Klagen von 2026

Den direktesten Nachweis liefert ein Test mit dem von Imas und Jabarian als recht zuverlässig validierten KI-Textdetektor Pangram. Die Forscher zogen 1.600 zufällige Bundesklagen aus dem Archiv CourtListener, einer öffentlichen Sammlung amerikanischer Gerichtsdokumente. Vor 2023 markierte Pangram nur ein einziges Dokument von 800 als KI-generiert. Die Quote stieg dann monoton: 1,0 Prozent 2023, 3,5 Prozent 2024, 10,5 Prozent 2025, 18,0 Prozent Anfang 2026.

Ein besonders auffälliger Fall ist der Bundesgerichtsbezirk Vermont, wo Pro-se-Klagen von rund 45 pro Jahr auf über 1.100 im Geschäftsjahr 2024 sprangen. Nahezu der gesamte Anstieg geht auf sogenannte Mandamus-Klagen gegen die US-Einwanderungsbehörde USCIS zurück, mit denen Antragsteller eine gerichtliche Anordnung erzwingen wollen, ihre seit Jahren liegengebliebenen Green-Card- oder Einbürgerungsverfahren zu bearbeiten.

Online-Anleitungen auf Reddit empfehlen, mit Microsoft Copilot einen Klageentwurf zu erzeugen, ihn für 150 Dollar von einem Anwalt auf der Freelancer-Plattform Fiverr prüfen zu lassen und gezielt in Vermont einzureichen, weil das dortige Gericht als schnell gilt.

Reaktionen der Richter: Schreddern und Bußgelder

Ein Bericht der New York Times illustriert die Belastung an einem konkreten Fall. Der 69-jährige Donald Sauve aus Minnesota verklagte nach einer Scheidung seine Ex-Frau, deren Anwalt und einen Staatsrichter. Eine erste handschriftliche Klage über 275.000 Dollar Schadenersatz wurde binnen eines Monats wegen fehlender Zuständigkeit abgewiesen. Drei Monate später reichte Sauve mithilfe von ChatGPT und Claude eine neue Klage ein, dieses Mal sauber getippt und ergänzt um 50 weitere Eingaben samt einer "Case Law Synthesis", einer Zusammenstellung angeblich stützender Präzedenzfälle.

Jede dieser Eingaben musste vom Gericht gelesen, katalogisiert und ins öffentliche Docket eingetragen werden, bevor Richter Patrick J. Schiltz die Klage in einer 14-seitigen Entscheidung erneut abwies. Schiltz verfügte, dass weitere Eingaben Sauves "ohne weitere Benachrichtigung geschreddert" würden, da ein Kläger nicht "hunderte Seiten Dokumente beim Gericht abladen" könne in der Erwartung, dass das Gericht selbst nach stützenden Argumenten suche.

Gegenüber der NYT bezeichnet Schiltz die Entwicklung als "existenzielle Bedrohung für die Bundesgerichte". Sauve, der derzeit aus seinem Auto heraus lebt, kündigte an, mit KI-Hilfe bald Eingaben in "Supreme-Court-Qualität" zu produzieren.

Zugang zur Justiz als Gegenargument

Bei aller Belastung der Gerichte hat der Trend auch eine demokratisierende Seite. Die Forschenden ordnen ihre Befunde explizit in die Forschungsliteratur zur "justice gap" ein, also der Lücke zwischen rechtlichem Bedarf und tatsächlich verfügbarer anwaltlicher Vertretung für Geringverdiener.

Richter Michael Y. Scudder vom Berufungsgericht des Seventh Circuit schreibt in einer aktuellen Entscheidung, KI biete "großes Versprechen, den Zugang zur Justiz für jene zu verbessern, die sich keine Vertretung leisten können".

Der New Yorker Rechtshilfe-Anwalt Sateesh Nori weist gegenüber der NYT darauf hin, dass trotz eines Gesetzes von 2017, das einkommensschwachen Mietern in New York kostenlose Vertretung bei Räumungsklagen garantiert, bis zu 50 Prozent der Betroffenen ohne Anwalt vor Gericht erscheinen. Seine Frage: "Warum haben diese Leute keinen anderen Weg als KI?"

Strukturelles Dilemma der US-Justiz

Die Autoren skizzieren zwei mögliche Folgen des KI-Einsatzes: ein "Wettrüsten" zwischen Pro-se-Klägern und anwaltlich vertretenen Gegnern, das pro Fall immer mehr Gerichtszeit bindet, sowie eine asymmetrische Belastung staatlicher Stellen, die als Beklagte in Bürgerrechts-, Einwanderungs- und Sozialleistungsverfahren besonders häufig auftreten und ihre eigene Bearbeitungskapazität nicht spiegelbildlich skalieren können.

Als Lösungsansätze nennen die Autoren drei nicht-exklusive Optionen. Erstens könnte das KI-Verbot für Bundesrichter beim Verfassen von Urteilen gelockert werden, um auf der Adjudikationsseite einen Produktivitätsschub zu ermöglichen, der dem auf der Klägerseite entspricht.

Zweitens könnten einfache Fälle gezielter an "Magistrate Judges", also untergeordnete Bundesrichter ohne lebenslange Ernennung, oder an spezialisierte Triage-Verfahren weitergeleitet werden.

Drittens halten die Autoren auch die Schaffung einer neuen unteren Instanz für denkbar, die die einfachsten Fälle "größtenteils mit KI" bearbeitet. Jede dieser Optionen sei nicht kostenlos, aber wahrscheinlich besser als die Alternative eines wachsenden Rückstaus in einem System mit fixer Bearbeitungskapazität.

Juristische Ausbildung und Berufspraxis ziehen Grenzen

Während die Studie vor allem die Belastung der Gerichte beschreibt, reagieren juristische Fakultäten und Aufsichtsstellen bereits auf eine verwandte Frage: Wo endet zulässige KI-Nutzung im Rechtssystem? So erlaubt die UC Berkeley Law School KI ab Sommer 2026 nur noch zur Recherche und verbietet den Einsatz für Konzeption, Gliederung, Schreiben oder Überarbeitung bewerteter Arbeiten. Nicht existierende Quellenverweise gelten dort als Hinweis auf unzulässige Nutzung.

Wie real dieses Risiko ist, zeigt eine Datenbank mit 129 dokumentierten KI-Fake-Fällen, in denen Anwälte aus zwölf Ländern erfundene Inhalte in Gerichtsverfahren eingebracht haben. Selbst KI-Unternehmen sind nicht davor geschützt: Im Urheberrechtsstreit mit Musikverlagen musste sich Anthropic entschuldigen, nachdem Claude eine Quelle im eigenen Prozess erfunden hatte.

Intelligente Überwachung verlängert Lebensdauer von Brücken

heise_ki·2026-05-26AnwendungenInfrastruktur

So einen Moment wie Ende Januar will Tobias Fischer nicht noch einmal erleben. Von jetzt auf gleich musste die Autobahn GmbH damals eine der wichtigsten Verbindungen zwischen Rheinland und Ruhrgebiet sperren: Die A52-Brücke über die Ruhr zwischen Düsseldorf und Essen. In der Fahrbahndecke hatte sich ein Spalt aufgetan. „Sowas ist eine Vollkatastrophe“, sagt Fischer, der bei der Autobahn GmbH für den Erhalt der Brücken im Ruhrgebiet und im Bergischen Land zuständig ist. Mehr als 80.000 Fahrzeuge fahren normalerweise jeden Tag über die 1,8 Kilometer lange Mintarder Brücke bei Mülheim an der Ruhr. Auf den Umleitungsstrecken gab es während der Sperrung wochenlang Chaos. Um solche bösen Überraschungen in Zukunft zu vermeiden, wird die Brücke im Moment mit Sensoren ausgestattet, die jede noch so kleine Veränderung an der Substanz des Bauwerks registrieren. Es ist ein Pilotprojekt, auf dem große Hoffnungen ruhen – denn im ganzen Land gibt es noch viele weitere Brücken, die in keinem guten Zustand sind. Die Hoffnung ist, dass Schäden durch die neue Technik so früh bemerkt werden, dass man rechtzeitig handeln und ungeplante Sperrungen vermeiden kann. KI analysiert die Daten in Echtzeit Rund 150 Sensoren installieren Techniker im Moment an der längsten Stahlbrücke Deutschlands. Wenn alles funktioniert, werden sie eine riesige Menge an Daten übermitteln. „Wir bekommen hier an der Brücke 100.000 Messwerte pro Sekunde“, erklärt Panagiotis Martakis, der das System entwickelt hat und nun über seine Firma Irmos anbietet.

Während jeder Mensch von 100.000 Messwerten pro Sekunde völlig überfordert wäre, kann die KI die Datenmengen in Echtzeit auswerten – 24 Stunden am Tag. „Die KI versteht nach und nach die Eigenarten einer jeden Brücke“, erklärt Fischer. „Wir bekommen dadurch ein viel besseres Gefühl für die Brücke.“ Dehnt sich das Material an einer Stelle, weil die Sonne es im Frühling erwärmt – oder weil es einen Riss im Material gibt? Hoffnung auf längere Nutzungsdauer von Brücken Die Autobahn GmbH hofft durch das KI-gestützte Brückenmonitoring auf einen „echten Paradigmenwechsel“ bei der Instandhaltung alter Brücken. „Wenn dieser Ansatz trägt, könnten Deutschlands Brücken künftig nicht nur saniert, sondern verstanden werden – mit deutlich optimierter Nutzungsdauer“, heißt es in der Projektbeschreibung. Ursprünglich war geplant, das neue System fünf Jahre lang an elf Brücken im Ruhrgebiet und im Bergischen Land zu testen. Doch die ersten Ergebnisse sind so positiv und der Handlungsdruck ist bundesweit so groß, dass die Technologie nun sehr viel schneller ausgerollt werden soll. „Der entscheidende Vorteil für uns ist, dass wir viel schneller und gezielter reagieren können, noch bevor Schäden entstehen“, erklärt Fischer. ADAC: Brücken in NRW liegen auf der Intensivstation Wie wichtig das KI-gestützte Brückenmonitoring werden könnte, zeigt ein Blick auf den Zustand der Autobahnbrücken im Land. 55 Prozent aller Brücken wurden laut Autobahn GmbH vor 1985 errichtet. Sie seien für weniger Verkehr und vor allem nur für leichtere Lastwagen gebaut worden. Auch die Materialqualität und Bauweise der 1960er und 1970er Jahre entsprächen nicht mehr den heutigen Anforderungen. „Die Brücken in NRW liegen auf der Intensivstation“, bestätigt der Leiter des Fachbereichs Verkehr und Umwelt beim ADAC Nordrhein, Roman Suthold. „Mit jedem Jahr, das bei der Erneuerung einer Brücke ungenutzt verstreicht, steigen die Risiken für Folgeschäden und damit für starke Belastungen von Autofahrern, Anwohnern und Volkswirtschaft erheblich.“ Das KI-gestützte Monitoring könne die Situation wirklich verbessern, glaubt Suthold. „Wenn dadurch frühzeitig gehandelt wird und vor allem sinnvolle Maßnahmen ergriffen werden, profitieren alle davon.“ Zugleich mahnt der ADAC-Verkehrsexperte, dass nicht nur Autobahnbrücken in die Jahre gekommen sind. „Auch das Land und die Kommunen sollten überlegen, ob sie die Technik für Brücken in ihrem Straßennetz einsetzen. Denn da warten noch viel mehr marode Brücken.“ Andere Projekte analysieren die Geräusche von Brücken Projekte, die künstliche Intelligenz nutzen wollen, um den Zustand alter Brücken zu überwachen, gibt es inzwischen mehrere in Deutschland. Das Fraunhofer-Institut für Digitale Medientechnologie (IDMT) nimmt mit Mikrofonen die Geräusche auf, die Fahrzeuge verursachen, wenn sie über Brücken fahren. Die KI analysiert die Geräusche dann und soll anhand kleinster Veränderungen erkennen, wenn sich der Zustand einer Brücke verschlechtert. Kosten bleiben überschaubar Die Autobahn GmbH will nun weiter Erfahrungen mit dem KI-gestützten Brückenmonitoring der Firma Irmos sammeln. Fischer ist nicht zuletzt auch wegen der überschaubaren Kosten von dem neuen System überzeugt. Einige zehntausend Euro müsse man pro Brücke rechnen, sagt er. Eine Kleinigkeit, wenn man bedenkt, welche Kosten durch eine Vollsperrung für die Wirtschaft entstehen können. Bei der Rahmedetalbrücke auf der A45 im Sauerland hat das Institut der Deutschen Wirtschaft den Schaden für die Unternehmen in der Region durch die vierjährige Sperrung auf rund 1,5 Milliarden Euro beziffert.

Weiterlesen

So einen Moment wie Ende Januar will Tobias Fischer nicht noch einmal erleben. Von jetzt auf gleich musste die Autobahn GmbH damals eine der wichtigsten Verbindungen zwischen Rheinland und Ruhrgebiet sperren: Die A52-Brücke über die Ruhr zwischen Düsseldorf und Essen. In der Fahrbahndecke hatte sich ein Spalt aufgetan. „Sowas ist eine Vollkatastrophe“, sagt Fischer, der bei der Autobahn GmbH für den Erhalt der Brücken im Ruhrgebiet und im Bergischen Land zuständig ist. Mehr als 80.000 Fahrzeuge fahren normalerweise jeden Tag über die 1,8 Kilometer lange Mintarder Brücke bei Mülheim an der Ruhr. Auf den Umleitungsstrecken gab es während der Sperrung wochenlang Chaos. Um solche bösen Überraschungen in Zukunft zu vermeiden, wird die Brücke im Moment mit Sensoren ausgestattet, die jede noch so kleine Veränderung an der Substanz des Bauwerks registrieren. Es ist ein Pilotprojekt, auf dem große Hoffnungen ruhen – denn im ganzen Land gibt es noch viele weitere Brücken, die in keinem guten Zustand sind. Die Hoffnung ist, dass Schäden durch die neue Technik so früh bemerkt werden, dass man rechtzeitig handeln und ungeplante Sperrungen vermeiden kann. KI analysiert die Daten in Echtzeit Rund 150 Sensoren installieren Techniker im Moment an der längsten Stahlbrücke Deutschlands. Wenn alles funktioniert, werden sie eine riesige Menge an Daten übermitteln. „Wir bekommen hier an der Brücke 100.000 Messwerte pro Sekunde“, erklärt Panagiotis Martakis, der das System entwickelt hat und nun über seine Firma Irmos anbietet.

Während jeder Mensch von 100.000 Messwerten pro Sekunde völlig überfordert wäre, kann die KI die Datenmengen in Echtzeit auswerten – 24 Stunden am Tag. „Die KI versteht nach und nach die Eigenarten einer jeden Brücke“, erklärt Fischer. „Wir bekommen dadurch ein viel besseres Gefühl für die Brücke.“ Dehnt sich das Material an einer Stelle, weil die Sonne es im Frühling erwärmt – oder weil es einen Riss im Material gibt? Hoffnung auf längere Nutzungsdauer von Brücken Die Autobahn GmbH hofft durch das KI-gestützte Brückenmonitoring auf einen „echten Paradigmenwechsel“ bei der Instandhaltung alter Brücken. „Wenn dieser Ansatz trägt, könnten Deutschlands Brücken künftig nicht nur saniert, sondern verstanden werden – mit deutlich optimierter Nutzungsdauer“, heißt es in der Projektbeschreibung. Ursprünglich war geplant, das neue System fünf Jahre lang an elf Brücken im Ruhrgebiet und im Bergischen Land zu testen. Doch die ersten Ergebnisse sind so positiv und der Handlungsdruck ist bundesweit so groß, dass die Technologie nun sehr viel schneller ausgerollt werden soll. „Der entscheidende Vorteil für uns ist, dass wir viel schneller und gezielter reagieren können, noch bevor Schäden entstehen“, erklärt Fischer. ADAC: Brücken in NRW liegen auf der Intensivstation Wie wichtig das KI-gestützte Brückenmonitoring werden könnte, zeigt ein Blick auf den Zustand der Autobahnbrücken im Land. 55 Prozent aller Brücken wurden laut Autobahn GmbH vor 1985 errichtet. Sie seien für weniger Verkehr und vor allem nur für leichtere Lastwagen gebaut worden. Auch die Materialqualität und Bauweise der 1960er und 1970er Jahre entsprächen nicht mehr den heutigen Anforderungen. „Die Brücken in NRW liegen auf der Intensivstation“, bestätigt der Leiter des Fachbereichs Verkehr und Umwelt beim ADAC Nordrhein, Roman Suthold. „Mit jedem Jahr, das bei der Erneuerung einer Brücke ungenutzt verstreicht, steigen die Risiken für Folgeschäden und damit für starke Belastungen von Autofahrern, Anwohnern und Volkswirtschaft erheblich.“ Das KI-gestützte Monitoring könne die Situation wirklich verbessern, glaubt Suthold. „Wenn dadurch frühzeitig gehandelt wird und vor allem sinnvolle Maßnahmen ergriffen werden, profitieren alle davon.“ Zugleich mahnt der ADAC-Verkehrsexperte, dass nicht nur Autobahnbrücken in die Jahre gekommen sind. „Auch das Land und die Kommunen sollten überlegen, ob sie die Technik für Brücken in ihrem Straßennetz einsetzen. Denn da warten noch viel mehr marode Brücken.“ Andere Projekte analysieren die Geräusche von Brücken Projekte, die künstliche Intelligenz nutzen wollen, um den Zustand alter Brücken zu überwachen, gibt es inzwischen mehrere in Deutschland. Das Fraunhofer-Institut für Digitale Medientechnologie (IDMT) nimmt mit Mikrofonen die Geräusche auf, die Fahrzeuge verursachen, wenn sie über Brücken fahren. Die KI analysiert die Geräusche dann und soll anhand kleinster Veränderungen erkennen, wenn sich der Zustand einer Brücke verschlechtert. Kosten bleiben überschaubar Die Autobahn GmbH will nun weiter Erfahrungen mit dem KI-gestützten Brückenmonitoring der Firma Irmos sammeln. Fischer ist nicht zuletzt auch wegen der überschaubaren Kosten von dem neuen System überzeugt. Einige zehntausend Euro müsse man pro Brücke rechnen, sagt er. Eine Kleinigkeit, wenn man bedenkt, welche Kosten durch eine Vollsperrung für die Wirtschaft entstehen können. Bei der Rahmedetalbrücke auf der A45 im Sauerland hat das Institut der Deutschen Wirtschaft den Schaden für die Unternehmen in der Region durch die vierjährige Sperrung auf rund 1,5 Milliarden Euro beziffert.

Kampf dem KI-Training: Immer mehr Nachrichtenseiten sperren Wayback Machine aus

Im Kampf gegen die nicht genehmigte Nutzung von Inhalten für das Training von KI-Modellen gerät das Internet Archive immer mehr zwischen die Fronten und die Wayback Machine droht zum Kollateralschaden zu werden. Das legt eine Analyse des Nieman Journalism Lab an der Harvard University nahe, laut der immer mehr Nachrichtenseiten Crawler der Archivseite aussperren. Demnach schränken inzwischen mehr als 340 lokale Nachrichtenseiten „den Zugriff des Internet Archive auf ihre Artikel sowie deren Archivierung“ ein, aber auch überregionale und internationale Medien wie die New York Times beteiligen sich demnach. Europäische Medien finden sich ebenfalls auf der Liste, derzeit aber noch keine aus Deutschland. Zahl der Blockierer wächst rasant Für die Analyse haben ein Autor und eine Autorin des Nieman Lab eine umfangreiche Datenbank von robots.txt-Dateien ausgewertet, die von Nachrichtenseiten in aller Welt stammen. Wenn darin eine oder mehrere Crawler ausgesperrt wurden, die vom Internet Archive stammen oder zu stammen scheinen, haben sie sie aufgenommen. Demnach wird der Archivierungsdienst hauptsächlich von Regionalzeitungen blockiert, die zu einem von fünf großen US-Medienhäusern gehören. Allein zwischen Januar und Mai ist die Zahl der Seiten, die die Wayback Machine aussperren, demnach um mehr als 50 Prozent gestiegen. Insgesamt sind es in der Stichprobe jetzt 382, bei der übergroßen Mehrheit handelt es sich um Lokal- und Regionalzeitungen. Im Januar haben die Autoren Stimmen großer Medien zusammengetragen, in denen die Aussperrung des Internet Archive mit dem Versuch begründet wurde, die eigenen Inhalte KI-Modellen vorzuenthalten. Seit Monaten wird kritisiert, dass KI-Unternehmen alle möglichen Inhalte im Internet für das Training akquirieren und sich dabei auch nicht an Gepflogenheiten wie die robots.txt halten. Damit können Seitenbetreiber KI-Modelle eigentlich aussperren, dazu müssten sich die KI-Firmen aber daran halten. Das tun sie aber nicht. Aber selbst wenn sie das tun würden, wäre der Weg über die archivierten Inhalte bei der Wayback Machine aber ein Umweg, den immer mehr Verantwortliche nun verschließen wollen. Das hat zum Beispiel auch schon Reddit gemacht.

Die Wayback Machine ist zwar nur einer der Dienste des Internet Archive, aber wohl der bekannteste. Darin werden seit Jahrzehnten Internetseiten archiviert. Die Seite ist längst zur mit Abstand umfangreichsten Quelle geworden, in der sich die Entwicklung des Internets nachverfolgen lässt. Das Vorgehen war aber schon immer mit Konflikten verbunden, denn immer wieder sind dabei gegenläufige Interessen aufeinandergetroffen. Schon 2017 hatte das Internet Archive beispielsweise erklärt, Vorgaben in der robots.txt nicht mehr ausnahmslos befolgen zu wollen. Im Fall der jüngsten Aussperrungen scheint das aber der Fall zu sein, wie man etwa für die Seiten von El País oder Le Monde sehen kann.

Weiterlesen

Im Kampf gegen die nicht genehmigte Nutzung von Inhalten für das Training von KI-Modellen gerät das Internet Archive immer mehr zwischen die Fronten und die Wayback Machine droht zum Kollateralschaden zu werden. Das legt eine Analyse des Nieman Journalism Lab an der Harvard University nahe, laut der immer mehr Nachrichtenseiten Crawler der Archivseite aussperren. Demnach schränken inzwischen mehr als 340 lokale Nachrichtenseiten „den Zugriff des Internet Archive auf ihre Artikel sowie deren Archivierung“ ein, aber auch überregionale und internationale Medien wie die New York Times beteiligen sich demnach. Europäische Medien finden sich ebenfalls auf der Liste, derzeit aber noch keine aus Deutschland. Zahl der Blockierer wächst rasant Für die Analyse haben ein Autor und eine Autorin des Nieman Lab eine umfangreiche Datenbank von robots.txt-Dateien ausgewertet, die von Nachrichtenseiten in aller Welt stammen. Wenn darin eine oder mehrere Crawler ausgesperrt wurden, die vom Internet Archive stammen oder zu stammen scheinen, haben sie sie aufgenommen. Demnach wird der Archivierungsdienst hauptsächlich von Regionalzeitungen blockiert, die zu einem von fünf großen US-Medienhäusern gehören. Allein zwischen Januar und Mai ist die Zahl der Seiten, die die Wayback Machine aussperren, demnach um mehr als 50 Prozent gestiegen. Insgesamt sind es in der Stichprobe jetzt 382, bei der übergroßen Mehrheit handelt es sich um Lokal- und Regionalzeitungen. Im Januar haben die Autoren Stimmen großer Medien zusammengetragen, in denen die Aussperrung des Internet Archive mit dem Versuch begründet wurde, die eigenen Inhalte KI-Modellen vorzuenthalten. Seit Monaten wird kritisiert, dass KI-Unternehmen alle möglichen Inhalte im Internet für das Training akquirieren und sich dabei auch nicht an Gepflogenheiten wie die robots.txt halten. Damit können Seitenbetreiber KI-Modelle eigentlich aussperren, dazu müssten sich die KI-Firmen aber daran halten. Das tun sie aber nicht. Aber selbst wenn sie das tun würden, wäre der Weg über die archivierten Inhalte bei der Wayback Machine aber ein Umweg, den immer mehr Verantwortliche nun verschließen wollen. Das hat zum Beispiel auch schon Reddit gemacht.

Die Wayback Machine ist zwar nur einer der Dienste des Internet Archive, aber wohl der bekannteste. Darin werden seit Jahrzehnten Internetseiten archiviert. Die Seite ist längst zur mit Abstand umfangreichsten Quelle geworden, in der sich die Entwicklung des Internets nachverfolgen lässt. Das Vorgehen war aber schon immer mit Konflikten verbunden, denn immer wieder sind dabei gegenläufige Interessen aufeinandergetroffen. Schon 2017 hatte das Internet Archive beispielsweise erklärt, Vorgaben in der robots.txt nicht mehr ausnahmslos befolgen zu wollen. Im Fall der jüngsten Aussperrungen scheint das aber der Fall zu sein, wie man etwa für die Seiten von El País oder Le Monde sehen kann.

Meta testet Reddit-Konkurrenz: Neue App „Forum“ für Facebook-Gruppen

heise_ki·2026-05-25AnwendungenGesellschaft

Meta hat ohne großes Aufsehen eine neue App für iOS veröffentlicht, die Facebook-Gruppen in den Mittelpunkt stellt. Die Anwendung namens „Forum“ richtet sich an Nutzer, die tiefere Diskussionen und Frage-Antwort-Formate suchen – ein Konzept, das stark an Reddit erinnert. Bislang ist die App nur in wenigen Märkten verfügbar, darunter die USA. Ein offizieller Starttermin für Deutschland, Österreich und die Schweiz steht noch nicht fest. Eng verzahnt mit Facebook Wie aus dem Eintrag im Apple App Store hervorgeht, versteht Meta Forum als „einen eigenen Raum für tiefere Diskussionen, echte Antworten und die Communities, die dir wichtig sind“. Die App erfordert iOS 18 und ein Facebook-Konto. Bestehende Gruppen, Profile und Aktivitäten werden automatisch übernommen. Was Nutzer in Forum posten, erscheint auch in den jeweiligen Facebook-Gruppen – und umgekehrt. Entdeckt hat die App der Geekout-Gründer und Social-Media-Analyst Matt Navarra. Er beschreibt die App auf Threads als „very Reddit-coded“ und hebt den Fokus auf Empfehlungen und „echte Antworten von echten Menschen“ hervor. Der wesentliche Unterschied zur Facebook-Haupt-App liegt im Feed: Forum zeigt ausschließlich Inhalte aus Gruppen – keine Beiträge von Freunden, keine Seiten, keine Reels. Nutzer können zudem unter einem Pseudonym posten, ähnlich wie bei Reddit, wobei Gruppen-Admins weiterhin die echte Identität einsehen können. Bei der ersten Anmeldung fragt die App nach Themenpräferenzen und schlägt passende Gruppen vor. Wie nicht anders zu erwarten, nutzt die neue App auch künstliche Intelligenz: Ein Tab namens „Ask“ fasst Antworten aus verschiedenen Gruppen zusammen, sodass Nutzer nicht mehr jede Community einzeln durchsuchen müssen. Dabei werden die Originalbeiträge verlinkt, aus denen die KI ihre Zusammenfassungen speist. Für Admins stellt Meta einen KI-Assistenten bereit, der bei der Moderation und Pflege der Community helfen soll. Meta betont, Admins behielten die volle Kontrolle und könnten weiterhin ihre bestehenden Tools in Facebook nutzen. Transparenz und Datenschutz bleiben vage Wie genau die KI Inhalte priorisiert, welche Signale das Ranking bestimmen und ob sich die KI-Funktionen abschalten lassen, dokumentiert Meta bislang nicht. Im App Store listet das Unternehmen eine breite Palette an erhobenen Daten, darunter Gesundheits- und Finanzdaten, Standort, Suchverlauf und sensible Informationen – obwohl Forum primär Gruppeninhalte verarbeitet. Für einen möglichen Start in der EU dürften sich daraus Fragen ergeben, etwa mit Blick auf die DSGVO und den AI Act.

Reddit-Aktie reagiert – Meta testet leise Nach Bekanntwerden der neuen App fiel die Reddit-Aktie um rund sechs Prozent. Analysten sehen Forum als Versuch von Meta, sich stärker im Markt für öffentliche Diskussionen und Nischen-Communities zu positionieren. Bereits 2014 hatte Facebook eine eigenständige Gruppen-App gestartet, diese aber 2017 wieder eingestellt. Forum ist nun der zweite Anlauf – diesmal mit deutlich mehr KI. Zum Start der App erklärte Meta lediglich, man teste „viele neue Produkte öffentlich, um zu sehen, was die Leute interessant und nützlich finden“. Anders als Reddit, das iOS-Nutzer zunehmend aggressiv in die eigene App drängt, setzt Meta bei Forum vorerst auf einen stillen Testlauf ohne sichtbaren App-Zwang.

Weiterlesen

Meta hat ohne großes Aufsehen eine neue App für iOS veröffentlicht, die Facebook-Gruppen in den Mittelpunkt stellt. Die Anwendung namens „Forum“ richtet sich an Nutzer, die tiefere Diskussionen und Frage-Antwort-Formate suchen – ein Konzept, das stark an Reddit erinnert. Bislang ist die App nur in wenigen Märkten verfügbar, darunter die USA. Ein offizieller Starttermin für Deutschland, Österreich und die Schweiz steht noch nicht fest. Eng verzahnt mit Facebook Wie aus dem Eintrag im Apple App Store hervorgeht, versteht Meta Forum als „einen eigenen Raum für tiefere Diskussionen, echte Antworten und die Communities, die dir wichtig sind“. Die App erfordert iOS 18 und ein Facebook-Konto. Bestehende Gruppen, Profile und Aktivitäten werden automatisch übernommen. Was Nutzer in Forum posten, erscheint auch in den jeweiligen Facebook-Gruppen – und umgekehrt. Entdeckt hat die App der Geekout-Gründer und Social-Media-Analyst Matt Navarra. Er beschreibt die App auf Threads als „very Reddit-coded“ und hebt den Fokus auf Empfehlungen und „echte Antworten von echten Menschen“ hervor. Der wesentliche Unterschied zur Facebook-Haupt-App liegt im Feed: Forum zeigt ausschließlich Inhalte aus Gruppen – keine Beiträge von Freunden, keine Seiten, keine Reels. Nutzer können zudem unter einem Pseudonym posten, ähnlich wie bei Reddit, wobei Gruppen-Admins weiterhin die echte Identität einsehen können. Bei der ersten Anmeldung fragt die App nach Themenpräferenzen und schlägt passende Gruppen vor. Wie nicht anders zu erwarten, nutzt die neue App auch künstliche Intelligenz: Ein Tab namens „Ask“ fasst Antworten aus verschiedenen Gruppen zusammen, sodass Nutzer nicht mehr jede Community einzeln durchsuchen müssen. Dabei werden die Originalbeiträge verlinkt, aus denen die KI ihre Zusammenfassungen speist. Für Admins stellt Meta einen KI-Assistenten bereit, der bei der Moderation und Pflege der Community helfen soll. Meta betont, Admins behielten die volle Kontrolle und könnten weiterhin ihre bestehenden Tools in Facebook nutzen. Transparenz und Datenschutz bleiben vage Wie genau die KI Inhalte priorisiert, welche Signale das Ranking bestimmen und ob sich die KI-Funktionen abschalten lassen, dokumentiert Meta bislang nicht. Im App Store listet das Unternehmen eine breite Palette an erhobenen Daten, darunter Gesundheits- und Finanzdaten, Standort, Suchverlauf und sensible Informationen – obwohl Forum primär Gruppeninhalte verarbeitet. Für einen möglichen Start in der EU dürften sich daraus Fragen ergeben, etwa mit Blick auf die DSGVO und den AI Act.

Reddit-Aktie reagiert – Meta testet leise Nach Bekanntwerden der neuen App fiel die Reddit-Aktie um rund sechs Prozent. Analysten sehen Forum als Versuch von Meta, sich stärker im Markt für öffentliche Diskussionen und Nischen-Communities zu positionieren. Bereits 2014 hatte Facebook eine eigenständige Gruppen-App gestartet, diese aber 2017 wieder eingestellt. Forum ist nun der zweite Anlauf – diesmal mit deutlich mehr KI. Zum Start der App erklärte Meta lediglich, man teste „viele neue Produkte öffentlich, um zu sehen, was die Leute interessant und nützlich finden“. Anders als Reddit, das iOS-Nutzer zunehmend aggressiv in die eigene App drängt, setzt Meta bei Forum vorerst auf einen stillen Testlauf ohne sichtbaren App-Zwang.

heise-Angebot: iX-Workshop: KI-Methoden und -Werkzeuge für die IT-Sicherheit

heise_ki·2026-05-25SicherheitAnwendungenForschung

KI-gestützte Werkzeuge können dabei helfen, Schwachstellen schneller zu identifizieren und Sicherheitsanalysen effizienter durchzuführen. Gleichzeitig stellt sich in der Praxis jedoch die Frage, wann der Einsatz von KI tatsächlich einen Mehrwert bietet und wann klassische Methoden die verlässlichere Wahl sind.

Der iX-Workshop IT-Security: Künstliche Intelligenz für effiziente IT-Sicherheitsstrategien stellt verschiedene KI-Methoden und -Werkzeuge vor. Sie lernen, wann und wie diese Technologien sinnvoll in Sicherheitsprozessen eingesetzt werden können und welche Rolle sie bei der Analyse, Priorisierung und Abwehr von Sicherheitsrisiken spielen.

Der Workshop verbindet technische Grundlagen mit realistischen Anwendungsszenarien aus dem Bereich der IT-Sicherheit. Sie erhalten Einblicke in moderne Security-Audits sowie Abwehrmechanismen und setzen ausgewählte KI-Tools direkt in praxisnahen Übungen ein. Dabei wird bewusst auch der kritische Blick geschärft: Sie lernen, sinnvolle von weniger geeigneten Einsatzszenarien zu unterscheiden und die Grenzen von KI-gestützten Ansätzen realistisch einzuschätzen.

KI-Werkzeuge verstehen und gezielt einsetzen

Im Mittelpunkt stehen konkrete Anwendungsfälle aus der Sicherheitspraxis. Sie erfahren, wie sich Sicherheitsprozesse durch KI-Unterstützung strukturieren und beschleunigen lassen – etwa bei der Auswertung von Schwachstellenscans oder Penetrationstests.

Darüber hinaus lernen Sie, wie Blue Teams KI-gestützte Systeme zur Bedrohungserkennung nutzen können, um Angriffe früher zu erkennen und schneller darauf zu reagieren. So erhalten Sie ein praxisnahes Verständnis dafür, wie KI bestehende Security-Workflows sinnvoll ergänzen kann.

Etwa 25 Prozent des Workshops sind der praktischen Anwendung gewidmet, sodass Sie die vorgestellten Methoden und Werkzeuge direkt ausprobieren und bewerten können.

Von Erfahrungen aus der Praxis lernen

Sie profitieren von der direkten Anleitung durch Ihren Trainer Yves Kraft, Head of Security Academy bei der Oneconsult AG. Als ehemaliger Penetration Tester und Security Consultant verfügt er über langjährige Erfahrung in der Schwachstellenanalyse und Angriffssimulation. Im Workshop vermittelt er praxisnahe Einblicke aus realen Sicherheitsprojekten und zeigt, wie KI-gestützte Werkzeuge verantwortungsvoll und effektiv in der IT-Security eingesetzt werden können.

Für wen ist dieser Workshop geeignet?

Der Workshop richtet sich an sicherheitsaffine IT-Fachkräfte – von Security Managern über Administratoren und SOC-Mitarbeitende bis hin zu Softwareentwicklern mit Interesse an IT-Sicherheit.

Weiterlesen

KI-gestützte Werkzeuge können dabei helfen, Schwachstellen schneller zu identifizieren und Sicherheitsanalysen effizienter durchzuführen. Gleichzeitig stellt sich in der Praxis jedoch die Frage, wann der Einsatz von KI tatsächlich einen Mehrwert bietet und wann klassische Methoden die verlässlichere Wahl sind.

Der iX-Workshop IT-Security: Künstliche Intelligenz für effiziente IT-Sicherheitsstrategien stellt verschiedene KI-Methoden und -Werkzeuge vor. Sie lernen, wann und wie diese Technologien sinnvoll in Sicherheitsprozessen eingesetzt werden können und welche Rolle sie bei der Analyse, Priorisierung und Abwehr von Sicherheitsrisiken spielen.

Der Workshop verbindet technische Grundlagen mit realistischen Anwendungsszenarien aus dem Bereich der IT-Sicherheit. Sie erhalten Einblicke in moderne Security-Audits sowie Abwehrmechanismen und setzen ausgewählte KI-Tools direkt in praxisnahen Übungen ein. Dabei wird bewusst auch der kritische Blick geschärft: Sie lernen, sinnvolle von weniger geeigneten Einsatzszenarien zu unterscheiden und die Grenzen von KI-gestützten Ansätzen realistisch einzuschätzen.

KI-Werkzeuge verstehen und gezielt einsetzen

Im Mittelpunkt stehen konkrete Anwendungsfälle aus der Sicherheitspraxis. Sie erfahren, wie sich Sicherheitsprozesse durch KI-Unterstützung strukturieren und beschleunigen lassen – etwa bei der Auswertung von Schwachstellenscans oder Penetrationstests.

Darüber hinaus lernen Sie, wie Blue Teams KI-gestützte Systeme zur Bedrohungserkennung nutzen können, um Angriffe früher zu erkennen und schneller darauf zu reagieren. So erhalten Sie ein praxisnahes Verständnis dafür, wie KI bestehende Security-Workflows sinnvoll ergänzen kann.

Etwa 25 Prozent des Workshops sind der praktischen Anwendung gewidmet, sodass Sie die vorgestellten Methoden und Werkzeuge direkt ausprobieren und bewerten können.

Von Erfahrungen aus der Praxis lernen

Sie profitieren von der direkten Anleitung durch Ihren Trainer Yves Kraft, Head of Security Academy bei der Oneconsult AG. Als ehemaliger Penetration Tester und Security Consultant verfügt er über langjährige Erfahrung in der Schwachstellenanalyse und Angriffssimulation. Im Workshop vermittelt er praxisnahe Einblicke aus realen Sicherheitsprojekten und zeigt, wie KI-gestützte Werkzeuge verantwortungsvoll und effektiv in der IT-Security eingesetzt werden können.

Für wen ist dieser Workshop geeignet?

Der Workshop richtet sich an sicherheitsaffine IT-Fachkräfte – von Security Managern über Administratoren und SOC-Mitarbeitende bis hin zu Softwareentwicklern mit Interesse an IT-Sicherheit.

„Fabula Rasa“ ist ein faszinierender Ausblick auf KI-gestütztes Storytelling

heise_ki·2026-05-25AnwendungenForschung

Während sich Videospiele seit den ersten Heimcomputern von einfachen Pixelkulissen zu riesigen, glaubhaft simulierten Welten entwickelt haben, wirken Gespräche mit NPCs oft noch erstaunlich statisch. Spieler klicken sich meist durch fest definierte Antworten und vorgefertigte Dialogbäume. KI-Sprachmodelle versprechen einen neuen Ansatz mit natürlicheren Gesprächen und NPCs, die dynamisch auf das reagieren, was Spieler sagen.

Arvore gehört zu den ersten Studios, die ernsthaft mit diesen Möglichkeiten experimentieren. Dessen märchenhafte VR-Erfahrung „Fabula Rasa: Dead Man Talking“ ist ein früher, aber vielversprechender Versuch, in dieses Neuland vorzudringen.

Bislang war das KI-gestützte Storytelling-Experiment nur auf Festivals wie dem SXSW zu sehen, wo es einen Publikumspreis gewann. Wir haben „Fabula Rasa“ ausprobiert und waren trotz seines frühen Entwicklungsstands fasziniert von den Möglichkeiten, die sich hier auftun. Gleichzeitig stellte sich die Frage, ob „Fabula Rasa“ überhaupt noch ein klassisches Videospiel ist oder eine neue Form interaktiver Erfahrung.

Wenn ein Videospiel rhetorisches Geschick verlangt

Der Name ist eine Anspielung auf die lateinische Redewendung „Tabula rasa“, nur dass hier nicht die Tafel unbeschrieben ist, sondern ausdrücklich die „Fabula“, also die Geschichte selbst, die durch Äußerungen des Spielers mitgestaltet wird.

Der Einstieg ist kafkaesk: Man erwacht in einem Kerker, während ein ogerhafter Protokollant verkündet, man habe ein Verbrechen begangen und werde einem Monster zum Fraß vorgeworfen. Er fordert den Spieler auf, Namen und Beruf zu nennen, und will außerdem wissen, welches Delikt ihm zur Last gelegt wird. Wir antworteten auf Englisch, wir seien Journalist und hätten Gerüchte über den König verbreitet.

Nach dem Abtransport auf einen mittelalterlichen Markt- und Richtplatz treten nach und nach verschiedene Charaktere an den Käfig und verwickeln den Spieler in Gespräche, darunter eine Hexe, eine Bardin und der Vollstrecker selbst, die jeweils eigene Persönlichkeiten und Anliegen haben.

Ziel ist es, die Figuren für sich zu gewinnen, damit sie beim bald eintreffenden König ein gutes Wort einlegen und das Todesurteil abwenden. Die Charaktere nennen den Spieler beim Namen und kommen wiederholt auf den genannten Beruf zurück. Die Bardin fragte uns etwa, welche Gerüchte wir verbreitet hätten und ob es Zeugen dafür gebe, bevor sie daraus ein Lied improvisierte. Statt in generisches NPC-Geschwätz zu verfallen, reagierten die Charaktere mit schnippischen Kommentaren und überraschend passenden Nachfragen.

Weiterlesen

Während sich Videospiele seit den ersten Heimcomputern von einfachen Pixelkulissen zu riesigen, glaubhaft simulierten Welten entwickelt haben, wirken Gespräche mit NPCs oft noch erstaunlich statisch. Spieler klicken sich meist durch fest definierte Antworten und vorgefertigte Dialogbäume. KI-Sprachmodelle versprechen einen neuen Ansatz mit natürlicheren Gesprächen und NPCs, die dynamisch auf das reagieren, was Spieler sagen.

Arvore gehört zu den ersten Studios, die ernsthaft mit diesen Möglichkeiten experimentieren. Dessen märchenhafte VR-Erfahrung „Fabula Rasa: Dead Man Talking“ ist ein früher, aber vielversprechender Versuch, in dieses Neuland vorzudringen.

Bislang war das KI-gestützte Storytelling-Experiment nur auf Festivals wie dem SXSW zu sehen, wo es einen Publikumspreis gewann. Wir haben „Fabula Rasa“ ausprobiert und waren trotz seines frühen Entwicklungsstands fasziniert von den Möglichkeiten, die sich hier auftun. Gleichzeitig stellte sich die Frage, ob „Fabula Rasa“ überhaupt noch ein klassisches Videospiel ist oder eine neue Form interaktiver Erfahrung.

Wenn ein Videospiel rhetorisches Geschick verlangt

Der Name ist eine Anspielung auf die lateinische Redewendung „Tabula rasa“, nur dass hier nicht die Tafel unbeschrieben ist, sondern ausdrücklich die „Fabula“, also die Geschichte selbst, die durch Äußerungen des Spielers mitgestaltet wird.

Der Einstieg ist kafkaesk: Man erwacht in einem Kerker, während ein ogerhafter Protokollant verkündet, man habe ein Verbrechen begangen und werde einem Monster zum Fraß vorgeworfen. Er fordert den Spieler auf, Namen und Beruf zu nennen, und will außerdem wissen, welches Delikt ihm zur Last gelegt wird. Wir antworteten auf Englisch, wir seien Journalist und hätten Gerüchte über den König verbreitet.

Nach dem Abtransport auf einen mittelalterlichen Markt- und Richtplatz treten nach und nach verschiedene Charaktere an den Käfig und verwickeln den Spieler in Gespräche, darunter eine Hexe, eine Bardin und der Vollstrecker selbst, die jeweils eigene Persönlichkeiten und Anliegen haben.

Ziel ist es, die Figuren für sich zu gewinnen, damit sie beim bald eintreffenden König ein gutes Wort einlegen und das Todesurteil abwenden. Die Charaktere nennen den Spieler beim Namen und kommen wiederholt auf den genannten Beruf zurück. Die Bardin fragte uns etwa, welche Gerüchte wir verbreitet hätten und ob es Zeugen dafür gebe, bevor sie daraus ein Lied improvisierte. Statt in generisches NPC-Geschwätz zu verfallen, reagierten die Charaktere mit schnippischen Kommentaren und überraschend passenden Nachfragen.

Künstliche Intelligenz bei Gericht: Wie die Justiz digital aufrüstet

Die Digitalisierung der Justiz nimmt Fahrt auf. Doch beim Thema Künstliche Intelligenz klaffen Erwartungshaltung und statistische Gewissheit auseinander. In Justizkreisen wird vermehrt moniert, dass algorithmische Textgeneratoren die Gerichte mit automatisierten Schriftsätzen fluten. Der Bundesregierung fehlen dafür aber Belege. In ihrer Antwort auf eine Anfrage der AfD-Fraktion erklärt sie, ihr lägen keine konkreten Erkenntnisse über eine aktuelle Zunahme von KI-generierten Anträgen vor. Systematische Erhebungen oder belastbare Zahlen dazu existierten nicht.

Es sei bekannt, dass KI-Systeme im juristischen Alltag auch zur Formulierung von Schriftsätzen herangezogen würden, schreibt das federführende Bundesjustizministerium. Dabei handele es sich aber nicht um eine völlig neue Entwicklung.

Parallel treibt der Staat den Einsatz von KI auf der anderen Seite des Richtertisches voran. In der deutschen Justizlandschaft existieren zahlreiche Vorhaben, bei denen Algorithmen erprobt oder punktuell schon in den Echtbetrieb überführt wurden. Ziel ist es laut der Auskunft, die Justiz bei der Bewältigung ihrer Verfahrensberge zu entlasten und Prozesse zu optimieren. Der Fokus liege auf der Automatisierung gleichförmiger, standardisierter Arbeitsschritte. Dazu gehörten vor allem die automatisierte Anonymisierung von Urteilen, die Strukturierung von Verfahrensunterlagen sowie die Auswertung und Extraktion relevanter Daten.

Praxistest in den Bundesländern

Wie das in der Praxis aussieht, zeigen diverse Länderprojekte. Unter den Namen „Aleks“ in Niedersachsen und Bayern sowie „Jano“ in Hessen und Baden-Württemberg laufen einschlägige KI-Anwendungen zur Anonymisierung. Letztere ist im Dezember in der Zivilgerichtsbarkeit in den Regelbetrieb gegangen.

Die bisherigen Erfahrungen sollen positiv sein, da die Algorithmen bei Routineaufgaben bereits höhere Trefferquoten erzielten als die manuelle Bearbeitung. Ein weiteres Exempel ist das niedersächsische Vorhaben „Maki“. Es ist darauf ausgerichtet, den Umgang mit Massenverfahren zu erleichtern und die juristische Analyse von Akten und Schriftsätzen zu unterstützen.

Dass die Sorgen vor ungeprüften KI-Inhalten im Rechtsverkehr nicht unbegründet sind, zeigt ein aktueller Fall. Erfundene Aktenzeichen und frei halluzinierte Urteile in Rechtsmittelschriftsätzen sorgten für Ärger. Berliner Richter sahen sich daher gezwungen, die Anwaltschaft zu rügen.

Europäische Leitplanken

Der Bundesregierung sind die mit KI-gestützten Entscheidungen verbundenen Risiken bewusst. Sie warnt vor Verzerrungen durch fehlerhafte oder unvollständige Daten, algorithmischen Blendwerken und der menschlichen Neigung, automatisierten Vorschlägen blind zu vertrauen. Auch mangelnde Nachvollziehbarkeit und Manipulationsanfälligkeit seien ein Thema. Um diesen Gefahren zu begegnen, griffen regulatorische Leitplanken.

Der Einsatz von KI in gerichtlichen und staatsanwaltschaftlichen Verfahren richte sich maßgeblich nach der KI-Verordnung der EU, heißt es aus dem Justizressort. Diese stufe solche Systeme zur Entscheidungsunterstützung konsequent als Hochrisiko-KI ein. Damit einher gingen gesetzliche Pflichten rund um Risikomanagement, Datenqualität, lückenlose Dokumentation, Cybersicherheit und menschliche Aufsicht.

Flankierend haben Bund und Länder voriges Jahr eine gemeinsame KI-Strategie für die Justiz verabschiedet, um eine rechtssichere und einheitliche Anwendung zu gewährleisten. Derzeit werden in diesem Rahmen Standards für Risikomanagementsysteme sowie verbindliche Leitlinien zu Daten-Governance und -qualität ausgearbeitet.

Menschliche Verantwortung

Über den technologischen Entwicklungen steht ein Dogma des deutschen Grundgesetzes: Der verfassungsrechtliche Rahmen der richterlichen Unabhängigkeit setzt der Automatisierung Grenzen. Die judikative Gewalt sei ausschließlich den gewählten Richtern vorbehalten, betont das Ministerium. Die endgültige Entscheidung in einem Rechtsstreit müsse so immer von einem Menschen getroffen und persönlich verantwortet werden. KI dürfe nur unterstützend agieren. Die menschliche Aufsicht diene als Kontrollmechanismus, um Fehlentwicklungen der Maschine rechtzeitig zu erkennen und zu korrigieren.

Damit das Justizpersonal überhaupt in der Lage ist, diese Funktion auszuüben, setzt die Exekutive auf gezielte Qualifikation. Kompetenzen zu den technischen, rechtlichen und ethischen Fragestellungen rund um die Technik sollen durch neue Aus- und Fortbildungsangebote gestärkt werden. Teil der nationalen KI-Strategie ist das Erstellen eines Kompetenzrahmens, um ein gemeinsames Verständnis zu etablieren und maßgeschneiderte Schulungsmaßnahmen abzuleiten.

Millionen für die Digitalsäule des Rechtsstaats

Finanziert und vorangetrieben wird der Wandel durch eine Kooperation zwischen Bund und Ländern. Die im Sommer 2025 beschlossene Strategie bildet das Fundament, das nach aktuellem Planungsstand bis Ende 2026 weitgehend umgesetzt sein soll. Der Bund beteiligt sich im Zuge seiner Digitalisierungsinitiative finanziell und fachlich an den KI-Vorhaben der Länder. Diese Anschubfinanzierung läuft ebenfalls bis Dezember.

Danach soll sich nahtlos der neue Pakt für den Rechtsstaat anschließen. Dessen sogenannte Digitalsäule sieht die weitere Förderung mit einer Laufzeit von drei Jahren vor. Ob und inwieweit zusätzlich gesetzgeberischer Handlungsbedarf im Bereich des europäischen Datenschutzrechts oder bei haftungsrechtlichen Fragestellungen zu automatisierten Verarbeitungen besteht, prüft die Exekutive noch.

Weiterlesen

Die Digitalisierung der Justiz nimmt Fahrt auf. Doch beim Thema Künstliche Intelligenz klaffen Erwartungshaltung und statistische Gewissheit auseinander. In Justizkreisen wird vermehrt moniert, dass algorithmische Textgeneratoren die Gerichte mit automatisierten Schriftsätzen fluten. Der Bundesregierung fehlen dafür aber Belege. In ihrer Antwort auf eine Anfrage der AfD-Fraktion erklärt sie, ihr lägen keine konkreten Erkenntnisse über eine aktuelle Zunahme von KI-generierten Anträgen vor. Systematische Erhebungen oder belastbare Zahlen dazu existierten nicht.

Es sei bekannt, dass KI-Systeme im juristischen Alltag auch zur Formulierung von Schriftsätzen herangezogen würden, schreibt das federführende Bundesjustizministerium. Dabei handele es sich aber nicht um eine völlig neue Entwicklung.

Parallel treibt der Staat den Einsatz von KI auf der anderen Seite des Richtertisches voran. In der deutschen Justizlandschaft existieren zahlreiche Vorhaben, bei denen Algorithmen erprobt oder punktuell schon in den Echtbetrieb überführt wurden. Ziel ist es laut der Auskunft, die Justiz bei der Bewältigung ihrer Verfahrensberge zu entlasten und Prozesse zu optimieren. Der Fokus liege auf der Automatisierung gleichförmiger, standardisierter Arbeitsschritte. Dazu gehörten vor allem die automatisierte Anonymisierung von Urteilen, die Strukturierung von Verfahrensunterlagen sowie die Auswertung und Extraktion relevanter Daten.

Praxistest in den Bundesländern

Wie das in der Praxis aussieht, zeigen diverse Länderprojekte. Unter den Namen „Aleks“ in Niedersachsen und Bayern sowie „Jano“ in Hessen und Baden-Württemberg laufen einschlägige KI-Anwendungen zur Anonymisierung. Letztere ist im Dezember in der Zivilgerichtsbarkeit in den Regelbetrieb gegangen.

Die bisherigen Erfahrungen sollen positiv sein, da die Algorithmen bei Routineaufgaben bereits höhere Trefferquoten erzielten als die manuelle Bearbeitung. Ein weiteres Exempel ist das niedersächsische Vorhaben „Maki“. Es ist darauf ausgerichtet, den Umgang mit Massenverfahren zu erleichtern und die juristische Analyse von Akten und Schriftsätzen zu unterstützen.

Dass die Sorgen vor ungeprüften KI-Inhalten im Rechtsverkehr nicht unbegründet sind, zeigt ein aktueller Fall. Erfundene Aktenzeichen und frei halluzinierte Urteile in Rechtsmittelschriftsätzen sorgten für Ärger. Berliner Richter sahen sich daher gezwungen, die Anwaltschaft zu rügen.

Europäische Leitplanken

Der Bundesregierung sind die mit KI-gestützten Entscheidungen verbundenen Risiken bewusst. Sie warnt vor Verzerrungen durch fehlerhafte oder unvollständige Daten, algorithmischen Blendwerken und der menschlichen Neigung, automatisierten Vorschlägen blind zu vertrauen. Auch mangelnde Nachvollziehbarkeit und Manipulationsanfälligkeit seien ein Thema. Um diesen Gefahren zu begegnen, griffen regulatorische Leitplanken.

Der Einsatz von KI in gerichtlichen und staatsanwaltschaftlichen Verfahren richte sich maßgeblich nach der KI-Verordnung der EU, heißt es aus dem Justizressort. Diese stufe solche Systeme zur Entscheidungsunterstützung konsequent als Hochrisiko-KI ein. Damit einher gingen gesetzliche Pflichten rund um Risikomanagement, Datenqualität, lückenlose Dokumentation, Cybersicherheit und menschliche Aufsicht.

Flankierend haben Bund und Länder voriges Jahr eine gemeinsame KI-Strategie für die Justiz verabschiedet, um eine rechtssichere und einheitliche Anwendung zu gewährleisten. Derzeit werden in diesem Rahmen Standards für Risikomanagementsysteme sowie verbindliche Leitlinien zu Daten-Governance und -qualität ausgearbeitet.

Menschliche Verantwortung

Über den technologischen Entwicklungen steht ein Dogma des deutschen Grundgesetzes: Der verfassungsrechtliche Rahmen der richterlichen Unabhängigkeit setzt der Automatisierung Grenzen. Die judikative Gewalt sei ausschließlich den gewählten Richtern vorbehalten, betont das Ministerium. Die endgültige Entscheidung in einem Rechtsstreit müsse so immer von einem Menschen getroffen und persönlich verantwortet werden. KI dürfe nur unterstützend agieren. Die menschliche Aufsicht diene als Kontrollmechanismus, um Fehlentwicklungen der Maschine rechtzeitig zu erkennen und zu korrigieren.

Damit das Justizpersonal überhaupt in der Lage ist, diese Funktion auszuüben, setzt die Exekutive auf gezielte Qualifikation. Kompetenzen zu den technischen, rechtlichen und ethischen Fragestellungen rund um die Technik sollen durch neue Aus- und Fortbildungsangebote gestärkt werden. Teil der nationalen KI-Strategie ist das Erstellen eines Kompetenzrahmens, um ein gemeinsames Verständnis zu etablieren und maßgeschneiderte Schulungsmaßnahmen abzuleiten.

Millionen für die Digitalsäule des Rechtsstaats

Finanziert und vorangetrieben wird der Wandel durch eine Kooperation zwischen Bund und Ländern. Die im Sommer 2025 beschlossene Strategie bildet das Fundament, das nach aktuellem Planungsstand bis Ende 2026 weitgehend umgesetzt sein soll. Der Bund beteiligt sich im Zuge seiner Digitalisierungsinitiative finanziell und fachlich an den KI-Vorhaben der Länder. Diese Anschubfinanzierung läuft ebenfalls bis Dezember.

Danach soll sich nahtlos der neue Pakt für den Rechtsstaat anschließen. Dessen sogenannte Digitalsäule sieht die weitere Förderung mit einer Laufzeit von drei Jahren vor. Ob und inwieweit zusätzlich gesetzgeberischer Handlungsbedarf im Bereich des europäischen Datenschutzrechts oder bei haftungsrechtlichen Fragestellungen zu automatisierten Verarbeitungen besteht, prüft die Exekutive noch.

Studie: KI bleibt oft im Testlauf stecken

heise_ki·2026-05-24WirtschaftForschungAnwendungen

Künstliche Intelligenz ist in den Zukunftsplanungen der deutschen Wirtschaft fest verankert, doch auf dem Weg in den produktiven Arbeitsalltag in den Unternehmen verliert sie oft massiv an Schwung. Das ist das zentrale Ergebnis einer Studie des IT-Beratungsunternehmens Zoi. Für einen erfolgreichen KI-Einsatz mangle es weniger an Geld, sondern an der passenden Unternehmensorganisation und der praktischen Umsetzung. Basis der Studie ist eine Befragung von 500 IT-Verantwortlichen aus Unternehmen mit mehr als 2.000 Beschäftigten durch das Meinungsforschungsinstitut Civey. Wissenschaftlich begleitet wurde die Umfrage von der Hochschule der Medien in Stuttgart. Lücke zwischen Pilotprojekt und Arbeitsalltag Drei Jahre nach dem großen technologischen Durchbruch haben der Studie zufolge die meisten deutschen Großunternehmen erste Anwendungsfälle ausgemacht und Pilotprojekte gestartet. Doch zwischen dem ersten Ausprobieren und dem tatsächlichen, gewinnbringenden Einsatz im normalen Betrieb klaffe in vielen Unternehmen eine erhebliche Lücke.

In der Umfrage wurde auch nach konkreten Hindernissen gefragt, die einen erfolgreichen KI-Einsatz erschweren. Die IT-Verantwortlichen nannten dabei die Komplexität der bestehenden IT-Infrastruktur, fehlendes Fachwissen beim Personal sowie die schwierige Integration der neuen Technik in veraltete Computersysteme. Budgetfragen oder Unsicherheiten über den finanziellen Nutzen wurden hingegen deutlich seltener als Hindernis genannt. Die Studie ergab auch, dass ausgerechnet die erfolgreichen Vorreiter-Unternehmen stark unter der Komplexität ihrer Technik leiden. Zu selten messbare Ziele In vielen Fällen sind die Fehlerursachen demnach in der Chefetage zu suchen: Zwar geben rund drei Viertel der Unternehmen an, über eine schriftlich festgehaltene Strategie der Unternehmensleitung zu verfügen, doch nur bei etwa einem Drittel ist diese auch mit konkreten messbaren Zielen verknüpft. Ohne solche Erfolgskennzahlen bleibe die Strategie oft nur eine Absichtserklärung. Zoi-Geschäftsführer Benjamin Hermann sagte, die Studienergebnisse zeigten, dass bei der KI-Transformation zwischen der technologischen Exzellenz und einer vorbildhaften operativen Umsetzung noch Welten lägen. „Mit KI anfangen ist einfacher, als mit KI produktiv zu sein.“ Professor Jan Kirenz von der Hochschule der Medien Stuttgart sagte, die Daten zeichneten ein klares Bild: „76 Prozent der deutschen Großunternehmen erproben KI-Agenten bereits aktiv, was das breite Innovationsinteresse belegt.“ Aber da erst 19 Prozent diese Technologien in ihren Kernprozessen einsetzten, stehe die breite Wertschöpfung noch aus. IT-Verantwortliche sehen KI nicht als Jobkiller In der Studie wurden die IT-Verantwortlichen auch danach gefragt, ob der KI-Einsatz mit einem massiven Jobverlust verbunden sei. Davon gehen die Befragten mehrheitlich nicht aus: 79 Prozent der befragten IT-Entscheider sagten, dass generative KI die Mitarbeiterzahl im Unternehmen stabil halte oder sogar steigen lasse.

Weiterlesen

Künstliche Intelligenz ist in den Zukunftsplanungen der deutschen Wirtschaft fest verankert, doch auf dem Weg in den produktiven Arbeitsalltag in den Unternehmen verliert sie oft massiv an Schwung. Das ist das zentrale Ergebnis einer Studie des IT-Beratungsunternehmens Zoi. Für einen erfolgreichen KI-Einsatz mangle es weniger an Geld, sondern an der passenden Unternehmensorganisation und der praktischen Umsetzung. Basis der Studie ist eine Befragung von 500 IT-Verantwortlichen aus Unternehmen mit mehr als 2.000 Beschäftigten durch das Meinungsforschungsinstitut Civey. Wissenschaftlich begleitet wurde die Umfrage von der Hochschule der Medien in Stuttgart. Lücke zwischen Pilotprojekt und Arbeitsalltag Drei Jahre nach dem großen technologischen Durchbruch haben der Studie zufolge die meisten deutschen Großunternehmen erste Anwendungsfälle ausgemacht und Pilotprojekte gestartet. Doch zwischen dem ersten Ausprobieren und dem tatsächlichen, gewinnbringenden Einsatz im normalen Betrieb klaffe in vielen Unternehmen eine erhebliche Lücke.

In der Umfrage wurde auch nach konkreten Hindernissen gefragt, die einen erfolgreichen KI-Einsatz erschweren. Die IT-Verantwortlichen nannten dabei die Komplexität der bestehenden IT-Infrastruktur, fehlendes Fachwissen beim Personal sowie die schwierige Integration der neuen Technik in veraltete Computersysteme. Budgetfragen oder Unsicherheiten über den finanziellen Nutzen wurden hingegen deutlich seltener als Hindernis genannt. Die Studie ergab auch, dass ausgerechnet die erfolgreichen Vorreiter-Unternehmen stark unter der Komplexität ihrer Technik leiden. Zu selten messbare Ziele In vielen Fällen sind die Fehlerursachen demnach in der Chefetage zu suchen: Zwar geben rund drei Viertel der Unternehmen an, über eine schriftlich festgehaltene Strategie der Unternehmensleitung zu verfügen, doch nur bei etwa einem Drittel ist diese auch mit konkreten messbaren Zielen verknüpft. Ohne solche Erfolgskennzahlen bleibe die Strategie oft nur eine Absichtserklärung. Zoi-Geschäftsführer Benjamin Hermann sagte, die Studienergebnisse zeigten, dass bei der KI-Transformation zwischen der technologischen Exzellenz und einer vorbildhaften operativen Umsetzung noch Welten lägen. „Mit KI anfangen ist einfacher, als mit KI produktiv zu sein.“ Professor Jan Kirenz von der Hochschule der Medien Stuttgart sagte, die Daten zeichneten ein klares Bild: „76 Prozent der deutschen Großunternehmen erproben KI-Agenten bereits aktiv, was das breite Innovationsinteresse belegt.“ Aber da erst 19 Prozent diese Technologien in ihren Kernprozessen einsetzten, stehe die breite Wertschöpfung noch aus. IT-Verantwortliche sehen KI nicht als Jobkiller In der Studie wurden die IT-Verantwortlichen auch danach gefragt, ob der KI-Einsatz mit einem massiven Jobverlust verbunden sei. Davon gehen die Befragten mehrheitlich nicht aus: 79 Prozent der befragten IT-Entscheider sagten, dass generative KI die Mitarbeiterzahl im Unternehmen stabil halte oder sogar steigen lasse.

heise-Angebot: Product Owner AI Day 2026: Konferenz und Workshop für KI im Produktmanagement

heise_ki·2026-05-23AnwendungenAgentenWirtschaft

Künstliche Intelligenz ist inzwischen in der Produktarbeit angekommen. Nach der erfolgreichen Erstausgabe des Product Owner AI Day im Herbst 2025 findet die Online-Konferenz am 9. Juli 2026 zum zweiten Mal statt. Der Schwerpunkt liegt dieses Mal auf KI-Agenten und Automationen, um Workflows im Arbeitsalltag zu vereinfachen, Produkte mit KI sinnvoll zu gestalten und bessere Produktentscheidungen zu treffen. Ausgerichtet wird die Konferenz von dpunkt.verlag und iX in Kooperation mit Marc Bless. Frühbucher profitieren derzeit von vergünstigten Preisen.

Der Product Owner AI Day richtet sich an all jene, die an der Schnittstelle von Produkt, Technologie und Innovation arbeiten – etwa Product Owner, Produktmanagerinnen, Innovation-Manager oder Product Leads und Heads of Product.

Workshop am 10. Juli: Automationen und Agenten für Product Owner und Produktmanager

Am Tag nach der Online-Konferenz, dem 10. Juli, bietet Marc Bless einen ganztägigen Online-Workshop an. Dort können Produktmanagerinnen und -manager sowie Product Owner in einen KI-Deep-Dive eintauchen. Sie lernen praktisch, wie sie mit Automationen und KI-Agenten echte Produktivitätsgewinne erzielen und komplette Workflows neu denken. Wer teilnimmt, sollte sowohl Zugang zu KI-Tools als auch bereits eine grundlegende Erfahrung damit besitzen. Detaillierte Angaben zu den Voraussetzungen sind auf der Konferenz-Website hinterlegt.

Am Ende des Tages sollen die Workshop-Besucher ein tiefes Verständnis für moderne KI-Anwendungen über ChatGPT hinaus mitnehmen, eigene Automationen und Agenten für ihre tägliche Arbeit konzipieren können und wissen, wie sie ihre Effizienz durch smarte, wiederverwendbare Workflows steigern können.

Ein Ticket für den Workshop lässt sich im Online-Ticketshop für 599 Euro (zzgl. MwSt.) buchen.

Product Owner AI Day: KI für Automation und Produktgestaltung einsetzen

Das Programm der Online-Konferenz am 9. Juli besteht aus sechs jeweils 45-minütigen Vorträgen sowie einer Abschlussdiskussion unter Moderation von Marc Bless mit den Referentinnen und Referenten des Tages. Die Vorträge gehen praxisnah darauf ein, wie künstliche Intelligenz in der Produktentwicklung unterstützen kann.

So zeigt Gregor Biswanger unter dem Motto „Nichts lügt mehr als eine veraltete Dokumentation“, wie sich KI durch Spec-Driven Development präzise steuern lässt. Miriam Suchet demonstriert, wie Product Owner mit KI in fünf konkreten Schritten von der tragfähigen Vision bis zur Stakeholder-Freigabe kommen, während laut Markus Andrezak künstliche Intelligenz die Fleißarbeit übernehmen kann, damit Menschen zur aktiven Gestaltung zurückkehren können.

Eine grundlegende Veränderung, die mit KI einhergeht, kommt bei Ralf D. Müller zur Sprache: KI-Agenten verschieben die klassische Arbeitsteilung zwischen Product Owner und Developer. Das birgt neue Herausforderungen, etwa dass der Product Owner zum neuen Bottleneck werden könnte. Und schließlich bleibt auch beim KI-Einsatz nach wie vor menschliches Verständnis gefragt: Wie Julia Bastian gleich zum Einstieg in den Tag warnt, kann KI glänzenden „Discovery-Müll“ produzieren, den es erst einmal kritisch zu bewerten gilt.

Vergünstigte Tickets für Frühbucher und Teams

Frühbucher können noch bis zum 11. Juni sparen: Bis dahin kostet ein Ticket für den Konferenztag 249 Euro (zzgl. 19 % MwSt.), nach Ablauf des Early-Bird-Tarifs 299 Euro. Teams ab drei Personen erhalten zusätzlich gestaffelte Gruppenrabatte, die der Online-Ticketshop automatisch berechnet. Ein Ticket für den Ganztages-Workshop kostet 599 Euro pro Person.

Weitere Informationen zur Konferenz finden sich auf der Website. Dort lässt sich auch ein Newsletter abonnieren, um über diese und weitere Veranstaltungen aus der Reihe inside agile auf dem Laufenden zu bleiben.

Weiterlesen

Künstliche Intelligenz ist inzwischen in der Produktarbeit angekommen. Nach der erfolgreichen Erstausgabe des Product Owner AI Day im Herbst 2025 findet die Online-Konferenz am 9. Juli 2026 zum zweiten Mal statt. Der Schwerpunkt liegt dieses Mal auf KI-Agenten und Automationen, um Workflows im Arbeitsalltag zu vereinfachen, Produkte mit KI sinnvoll zu gestalten und bessere Produktentscheidungen zu treffen. Ausgerichtet wird die Konferenz von dpunkt.verlag und iX in Kooperation mit Marc Bless. Frühbucher profitieren derzeit von vergünstigten Preisen.

Der Product Owner AI Day richtet sich an all jene, die an der Schnittstelle von Produkt, Technologie und Innovation arbeiten – etwa Product Owner, Produktmanagerinnen, Innovation-Manager oder Product Leads und Heads of Product.

Workshop am 10. Juli: Automationen und Agenten für Product Owner und Produktmanager

Am Tag nach der Online-Konferenz, dem 10. Juli, bietet Marc Bless einen ganztägigen Online-Workshop an. Dort können Produktmanagerinnen und -manager sowie Product Owner in einen KI-Deep-Dive eintauchen. Sie lernen praktisch, wie sie mit Automationen und KI-Agenten echte Produktivitätsgewinne erzielen und komplette Workflows neu denken. Wer teilnimmt, sollte sowohl Zugang zu KI-Tools als auch bereits eine grundlegende Erfahrung damit besitzen. Detaillierte Angaben zu den Voraussetzungen sind auf der Konferenz-Website hinterlegt.

Am Ende des Tages sollen die Workshop-Besucher ein tiefes Verständnis für moderne KI-Anwendungen über ChatGPT hinaus mitnehmen, eigene Automationen und Agenten für ihre tägliche Arbeit konzipieren können und wissen, wie sie ihre Effizienz durch smarte, wiederverwendbare Workflows steigern können.

Ein Ticket für den Workshop lässt sich im Online-Ticketshop für 599 Euro (zzgl. MwSt.) buchen.

Product Owner AI Day: KI für Automation und Produktgestaltung einsetzen

Das Programm der Online-Konferenz am 9. Juli besteht aus sechs jeweils 45-minütigen Vorträgen sowie einer Abschlussdiskussion unter Moderation von Marc Bless mit den Referentinnen und Referenten des Tages. Die Vorträge gehen praxisnah darauf ein, wie künstliche Intelligenz in der Produktentwicklung unterstützen kann.

So zeigt Gregor Biswanger unter dem Motto „Nichts lügt mehr als eine veraltete Dokumentation“, wie sich KI durch Spec-Driven Development präzise steuern lässt. Miriam Suchet demonstriert, wie Product Owner mit KI in fünf konkreten Schritten von der tragfähigen Vision bis zur Stakeholder-Freigabe kommen, während laut Markus Andrezak künstliche Intelligenz die Fleißarbeit übernehmen kann, damit Menschen zur aktiven Gestaltung zurückkehren können.

Eine grundlegende Veränderung, die mit KI einhergeht, kommt bei Ralf D. Müller zur Sprache: KI-Agenten verschieben die klassische Arbeitsteilung zwischen Product Owner und Developer. Das birgt neue Herausforderungen, etwa dass der Product Owner zum neuen Bottleneck werden könnte. Und schließlich bleibt auch beim KI-Einsatz nach wie vor menschliches Verständnis gefragt: Wie Julia Bastian gleich zum Einstieg in den Tag warnt, kann KI glänzenden „Discovery-Müll“ produzieren, den es erst einmal kritisch zu bewerten gilt.

Vergünstigte Tickets für Frühbucher und Teams

Frühbucher können noch bis zum 11. Juni sparen: Bis dahin kostet ein Ticket für den Konferenztag 249 Euro (zzgl. 19 % MwSt.), nach Ablauf des Early-Bird-Tarifs 299 Euro. Teams ab drei Personen erhalten zusätzlich gestaffelte Gruppenrabatte, die der Online-Ticketshop automatisch berechnet. Ein Ticket für den Ganztages-Workshop kostet 599 Euro pro Person.

Weitere Informationen zur Konferenz finden sich auf der Website. Dort lässt sich auch ein Newsletter abonnieren, um über diese und weitere Veranstaltungen aus der Reihe inside agile auf dem Laufenden zu bleiben.

Developer-Häppchen fürs Wochenende – kleinere News der Woche

In unserem leckeren Häppchen-Überblick servieren wir alles, was es zwar nicht in die News geschafft hat, wir aber dennoch für spannend halten:

- Die Version 4.1 des Python-Compilers Nuitka bietet viele neue Funktionen und Korrekturen. Sie legen den Fokus auf asynchronen Code, fehlende Generics‑Funktionen und die Unterstützung von Python 3.14. Außerdem hat das Nuitka-Team die Skalierbarkeit der Python‑Kompilierung verbessert.

- Das plattformübergreifende UI‑Framework Compose Multiplatform erhält mit Version 1.11.0 eine experimentelle native Texteingabe für iOS, neue v2‑UI‑Test‑APIs und ein standardmäßig aktiviertes Concurrent-Rendering. Das Scrollen in Compose‑Web‑Apps geht jetzt deutlich flüssiger.

- Mit der neuen

needs_is_sandboxed

-Option können Filter, Funktionen und Tests von Twig 3.25.0 ihr Verhalten anpassen, wenn sie innerhalb einer Sandbox laufen. Ebenfalls neu: Die Template‑Engine für PHP behandelt den kompilierten Output von Templates, die{% embed %}

verwenden, nun über mehrere Durchläufe hinweg deterministisch. Ferner behebt sie eine langjährige Einschränkung, die das Überschreiben vonEscaperRuntime

über einen benutzerdefinierten Runtime‑Loader verhindert hat.

Die betterCode() Testing 2026 zeigt am 8. Juni 2026, wie das Zusammenspiel von Mensch, Tools und Prozessen den Erfolg moderner Software sichert. Im Fokus stehen Testing mit und von KI, Testautomatisierung und Praxisberichte, die zeigen, was wirklich getestet werden sollte.

- IntelliJ IDEA 2026.1.2 behebt bei der Java‑ und Kotlin‑IDE eine Reihe von Problemen: Dazu zählen fehlerhafte Projektöffnungen über Gradle‑.ipr-Dateien, falsche Einrückungen bei Java‑Ternary‑Ausdrücken und verschwundener Code beim Drag & Drop.

- Googles Tensor ML SDK hat Betastatus erreicht und bietet eine einheitliche ML‑Entwicklungsumgebung mit LiteRT. Auf den Geräten der Pixel-10-Familie können Entwicklerinnen und Entwickler ML- und generative KI-Modelle damit einfacher konvertieren, kompilieren und direkt ausführen.

- Zahlreiche kleinere Verbesserungen sind in Apache NetBeans 30 eingeflossen. Das neue Release bringt unter anderem Java-Updates, Unterstützung für den Pipe‑Operator aus PHP 8.5 und aktualisierte Build Tools wie Ant 1.10.17 und Maven 3.9.15.

- Mit Visual Studio Code 1.121 hält eine integrierte Vorschaufunktion für Mermaid und HTML Einzug. Zudem verbraucht Microsofts kostenloser Code‑Editor durch Terminal-Optimierungen jetzt weniger Ressourcen sowie Token und kann Agent‑Sitzungen auf entfernten Maschinen ausführen.

- Beim neuen Release von Barman liegt der Schwerpunkt auf Cloud-Backup-Funktionen. Mit Version 3.18.0 beherrscht das Open-Source-Admin-Tool für PostgreSQL-Server inkrementelle Backups für Cloud-Speicher und integriert Cloud-Backup-Operationen direkt in die zentrale Barman-CLI.

- Der Kubernetes‑Infrastruktur‑Controller Crossplane setzt mit Version 2.3.0 auf eine neue lokale Rendering‑Engine und erlaubt eine präzisere Kontrolle des Ressourcen‑Abgleichs für Composite Resources und Managed. Enthalten sind auch Sicherheitsupdates für Crossplanes Go‑Toolchain und deren Abhängigkeiten.

Solltest du ein schmackhaftes Thema vermissen, freuen wir uns über deine Mail.

Weiterlesen

In unserem leckeren Häppchen-Überblick servieren wir alles, was es zwar nicht in die News geschafft hat, wir aber dennoch für spannend halten:

- Die Version 4.1 des Python-Compilers Nuitka bietet viele neue Funktionen und Korrekturen. Sie legen den Fokus auf asynchronen Code, fehlende Generics‑Funktionen und die Unterstützung von Python 3.14. Außerdem hat das Nuitka-Team die Skalierbarkeit der Python‑Kompilierung verbessert.

- Das plattformübergreifende UI‑Framework Compose Multiplatform erhält mit Version 1.11.0 eine experimentelle native Texteingabe für iOS, neue v2‑UI‑Test‑APIs und ein standardmäßig aktiviertes Concurrent-Rendering. Das Scrollen in Compose‑Web‑Apps geht jetzt deutlich flüssiger.

- Mit der neuen

needs_is_sandboxed

-Option können Filter, Funktionen und Tests von Twig 3.25.0 ihr Verhalten anpassen, wenn sie innerhalb einer Sandbox laufen. Ebenfalls neu: Die Template‑Engine für PHP behandelt den kompilierten Output von Templates, die{% embed %}

verwenden, nun über mehrere Durchläufe hinweg deterministisch. Ferner behebt sie eine langjährige Einschränkung, die das Überschreiben vonEscaperRuntime

über einen benutzerdefinierten Runtime‑Loader verhindert hat.

Die betterCode() Testing 2026 zeigt am 8. Juni 2026, wie das Zusammenspiel von Mensch, Tools und Prozessen den Erfolg moderner Software sichert. Im Fokus stehen Testing mit und von KI, Testautomatisierung und Praxisberichte, die zeigen, was wirklich getestet werden sollte.

- IntelliJ IDEA 2026.1.2 behebt bei der Java‑ und Kotlin‑IDE eine Reihe von Problemen: Dazu zählen fehlerhafte Projektöffnungen über Gradle‑.ipr-Dateien, falsche Einrückungen bei Java‑Ternary‑Ausdrücken und verschwundener Code beim Drag & Drop.

- Googles Tensor ML SDK hat Betastatus erreicht und bietet eine einheitliche ML‑Entwicklungsumgebung mit LiteRT. Auf den Geräten der Pixel-10-Familie können Entwicklerinnen und Entwickler ML- und generative KI-Modelle damit einfacher konvertieren, kompilieren und direkt ausführen.

- Zahlreiche kleinere Verbesserungen sind in Apache NetBeans 30 eingeflossen. Das neue Release bringt unter anderem Java-Updates, Unterstützung für den Pipe‑Operator aus PHP 8.5 und aktualisierte Build Tools wie Ant 1.10.17 und Maven 3.9.15.

- Mit Visual Studio Code 1.121 hält eine integrierte Vorschaufunktion für Mermaid und HTML Einzug. Zudem verbraucht Microsofts kostenloser Code‑Editor durch Terminal-Optimierungen jetzt weniger Ressourcen sowie Token und kann Agent‑Sitzungen auf entfernten Maschinen ausführen.

- Beim neuen Release von Barman liegt der Schwerpunkt auf Cloud-Backup-Funktionen. Mit Version 3.18.0 beherrscht das Open-Source-Admin-Tool für PostgreSQL-Server inkrementelle Backups für Cloud-Speicher und integriert Cloud-Backup-Operationen direkt in die zentrale Barman-CLI.

- Der Kubernetes‑Infrastruktur‑Controller Crossplane setzt mit Version 2.3.0 auf eine neue lokale Rendering‑Engine und erlaubt eine präzisere Kontrolle des Ressourcen‑Abgleichs für Composite Resources und Managed. Enthalten sind auch Sicherheitsupdates für Crossplanes Go‑Toolchain und deren Abhängigkeiten.

Solltest du ein schmackhaftes Thema vermissen, freuen wir uns über deine Mail.

Fitbit-App bekommt großes Update auf Version 5.0 und heißt jetzt Google Health

heise_ki·2026-05-23AnwendungenGesellschaft

Mit dem Update auf Version 5.0 wird aus der Fitbit-App die Google Health App mitsamt dem schon im vergangenen Jahr angekündigten Redesign sowie allerlei KI-Funktionen auf Gemini-Basis. Die neue App-Version schließt damit die im April 2026 in Deutschland veröffentlichte Public-Preview und wird für alle Fitbit- und Pixel-Watch-Nutzer verteilt. Aus Fitbit wird Google Health App Laut Google sind mit der Google Health App „alle Funktionen zur Erfassung von Schlaf-, Aktivitäts- und Gesundheitsdaten“ verfügbar. Mit dem kostenpflichtigen Abo Google Health Premium (ehemals Fitbit Premium), das knapp 9 Euro im Monat kostet, erhalten Nutzerinnen und Nutzer Zugriff auf den KI-basierten Google Health Coach, der die Funktion „Ask Coach“, proaktive Benachrichtigungen, adaptive Trainingspläne und Zusammenfassungen sowie „multimodale/konversationsbasierte Protokollierung“ umfasst. Dieser auf Gemini basierende Fitnesscoach ist dem Konzern zufolge dazu in der Lage, alle Fitness-, Gesundheits- und wichtigen medizinischen Daten inklusive des Zyklus zusammenzuführen, um Nutzerinnen und Nutzern einen umfassenden Überblick zu verschaffen. Der KI-Coach erinnert ein wenig an jenen, den Whoop vor einer Weile eingeführt hat. Er erklärt etwa, wie sich ein Training und Schlaf auf den Körper auswirken und rät anhand der Daten, ob man sich besser ausruhen oder eine weitere harte Trainingseinheit absolvieren sollte.

Die kostenlose Version der App umfasst das Tracking von Aktivitäten wie Schritte, Kalorien, Distanz, Cardio-Belastung und Tagesform. Ebenso bietet sie eine Schlafanalyse mitsamt der Ausgabe des Schlafindex, Schlafenszeiten, Schlafdauer und Schlafphasen. Auch Herzfrequenz, Herzfrequenzvariabilität, Atemfrequenz, Blutsauerstoff (Sp02) und weitere Daten trackt sie. Es fehlen indes eine detailliertere Datenanalyse und der KI-Coach. Einige bekannte Funktionen fallen weg Zudem hat Google mit der neuen App einige Funktionen gestrichen: So fallen die bisherigen Schlafprofile und die dazugehörigen Schlaftiere weg, die den Schlaftyp beschreiben sollen. Ferner ist die geschätzte Sauerstoffschwankung (EOV) nicht mehr verfügbar, stattdessen werden nun SpO2-Daten angezeigt. Ebenso fallen die sozialen Elemente wie Freunde und Leaderboards weg, wie auch die Badges. Zudem gibt es keinen „Ausdauer-Fitness-Wert“ mehr, daraus wird nun der gebräuchlichere VO2max-Wert. Neu und weit besser als das bisherige ist das Homescreen-Widget, das je nach Größe mehr als nur die Schritte anzeigt. Da die neue Google-Health-App Voraussetzung für die Nutzung des bildschirmlosen Fitnessbands Fitbit Air ist, sollte die Verteilung des Updates bis zum 26. Mai, dem Marktstart des neuen Wearables, weitgehend abgeschlossen sein.

Weiterlesen

Mit dem Update auf Version 5.0 wird aus der Fitbit-App die Google Health App mitsamt dem schon im vergangenen Jahr angekündigten Redesign sowie allerlei KI-Funktionen auf Gemini-Basis. Die neue App-Version schließt damit die im April 2026 in Deutschland veröffentlichte Public-Preview und wird für alle Fitbit- und Pixel-Watch-Nutzer verteilt. Aus Fitbit wird Google Health App Laut Google sind mit der Google Health App „alle Funktionen zur Erfassung von Schlaf-, Aktivitäts- und Gesundheitsdaten“ verfügbar. Mit dem kostenpflichtigen Abo Google Health Premium (ehemals Fitbit Premium), das knapp 9 Euro im Monat kostet, erhalten Nutzerinnen und Nutzer Zugriff auf den KI-basierten Google Health Coach, der die Funktion „Ask Coach“, proaktive Benachrichtigungen, adaptive Trainingspläne und Zusammenfassungen sowie „multimodale/konversationsbasierte Protokollierung“ umfasst. Dieser auf Gemini basierende Fitnesscoach ist dem Konzern zufolge dazu in der Lage, alle Fitness-, Gesundheits- und wichtigen medizinischen Daten inklusive des Zyklus zusammenzuführen, um Nutzerinnen und Nutzern einen umfassenden Überblick zu verschaffen. Der KI-Coach erinnert ein wenig an jenen, den Whoop vor einer Weile eingeführt hat. Er erklärt etwa, wie sich ein Training und Schlaf auf den Körper auswirken und rät anhand der Daten, ob man sich besser ausruhen oder eine weitere harte Trainingseinheit absolvieren sollte.

Die kostenlose Version der App umfasst das Tracking von Aktivitäten wie Schritte, Kalorien, Distanz, Cardio-Belastung und Tagesform. Ebenso bietet sie eine Schlafanalyse mitsamt der Ausgabe des Schlafindex, Schlafenszeiten, Schlafdauer und Schlafphasen. Auch Herzfrequenz, Herzfrequenzvariabilität, Atemfrequenz, Blutsauerstoff (Sp02) und weitere Daten trackt sie. Es fehlen indes eine detailliertere Datenanalyse und der KI-Coach. Einige bekannte Funktionen fallen weg Zudem hat Google mit der neuen App einige Funktionen gestrichen: So fallen die bisherigen Schlafprofile und die dazugehörigen Schlaftiere weg, die den Schlaftyp beschreiben sollen. Ferner ist die geschätzte Sauerstoffschwankung (EOV) nicht mehr verfügbar, stattdessen werden nun SpO2-Daten angezeigt. Ebenso fallen die sozialen Elemente wie Freunde und Leaderboards weg, wie auch die Badges. Zudem gibt es keinen „Ausdauer-Fitness-Wert“ mehr, daraus wird nun der gebräuchlichere VO2max-Wert. Neu und weit besser als das bisherige ist das Homescreen-Widget, das je nach Größe mehr als nur die Schritte anzeigt. Da die neue Google-Health-App Voraussetzung für die Nutzung des bildschirmlosen Fitnessbands Fitbit Air ist, sollte die Verteilung des Updates bis zum 26. Mai, dem Marktstart des neuen Wearables, weitgehend abgeschlossen sein.

Nvidia will mit Vera-Prozessoren nach der CPU-Krone greifen

Die ersten großen KI-Firmen haben Nvidias neuen CPU-Server mit Vera-Prozessoren erhalten. Vera ist der Nachfolger von Nvidias erstem Server-Prozessorwurf Grace. Beide verwenden zwar ARM-Architekturen, allerdings hat Nvidia erst für Vera eigene Custom-Kerne mit dem Codenamen Olympus entworfen. 88 Stück arbeiten in einer CPU. Ian Buck überreichte die ersten Systeme kürzlich an Vertreter von Anthropic, OpenAI, SpaceXAI (früher xAI) und schließlich Oracle. Buck leitet bei Nvidia die Sparte Hyperscale and High-Performance Computing. Anders als bei früheren Erstauslieferungen war Firmenchef Jensen Huang nicht mehr dabei. Die Prozessoren enthalten keine KI-Beschleuniger per se. Nvidia preist sie trotzdem für KI-Rechenzentren an, weil Prozessoren dort momentan durch KI-Agenten an Bedeutung gewinnen. Sie setzen flotte CPUs voraus. Nvidia will CPU-Riese werden In der Analystenkonferenz zu den jüngsten Geschäftszahlen gab Nvidias Finanzchefin Colette Kress eine erste Prognose ab: Die Firma beziffert den adressierbaren Markt auf 200 Milliarden US-Dollar pro Jahr. Im ersten Jahr soll Vera für 20 Milliarden US-Dollar Umsatz sorgen. Ab dem dritten Quartal sollen auch Vera-Rubin-Systeme verfügbar sein, in denen zusätzliche KI-Beschleuniger stecken. „Wir rechnen in diesem Jahr mit einem Gesamtumsatz im CPU-Bereich von fast 20 Milliarden US-Dollar, was uns auf den Weg zum weltweit führenden CPU-Anbieter bringt“, sagte Kress.

Sollten sich die 20 Milliarden US-Dollar bewahrheiten, wäre das schon im ersten Jahr ein Kopf-an-Kopf-Rennen mit AMD und Intel, wenn man nur Serverprozessoren wertet. AMD setzte 2025 gut 16,6 Milliarden US-Dollar mit Server-Hardware um, allerdings inklusive KI-Beschleunigern. Der Umsatz sowohl mit CPUs als auch mit Beschleunigern soll dieses Jahr noch mal erheblich steigen. Intel setzte 2025 rund 16,9 Milliarden US-Dollar mit Server-Hardware um, hauptsächlich mit Xeon-Prozessoren. Den Markt für KI-Beschleuniger hat Intel weitgehend verschlafen. Inklusive Client-CPUs ziehen sowohl AMD als auch Intel jetzt schon davon. Intels Umsatz lag so bei 49,1 Milliarden US-Dollar (32,2 Milliarden US-Dollar durch Client). Nvidia will zwar mit N1X und N1 auch in Notebooks gelangen, allerdings verzögern sich die Mobilprozessoren schon seit 2025.

Weiterlesen

Die ersten großen KI-Firmen haben Nvidias neuen CPU-Server mit Vera-Prozessoren erhalten. Vera ist der Nachfolger von Nvidias erstem Server-Prozessorwurf Grace. Beide verwenden zwar ARM-Architekturen, allerdings hat Nvidia erst für Vera eigene Custom-Kerne mit dem Codenamen Olympus entworfen. 88 Stück arbeiten in einer CPU. Ian Buck überreichte die ersten Systeme kürzlich an Vertreter von Anthropic, OpenAI, SpaceXAI (früher xAI) und schließlich Oracle. Buck leitet bei Nvidia die Sparte Hyperscale and High-Performance Computing. Anders als bei früheren Erstauslieferungen war Firmenchef Jensen Huang nicht mehr dabei. Die Prozessoren enthalten keine KI-Beschleuniger per se. Nvidia preist sie trotzdem für KI-Rechenzentren an, weil Prozessoren dort momentan durch KI-Agenten an Bedeutung gewinnen. Sie setzen flotte CPUs voraus. Nvidia will CPU-Riese werden In der Analystenkonferenz zu den jüngsten Geschäftszahlen gab Nvidias Finanzchefin Colette Kress eine erste Prognose ab: Die Firma beziffert den adressierbaren Markt auf 200 Milliarden US-Dollar pro Jahr. Im ersten Jahr soll Vera für 20 Milliarden US-Dollar Umsatz sorgen. Ab dem dritten Quartal sollen auch Vera-Rubin-Systeme verfügbar sein, in denen zusätzliche KI-Beschleuniger stecken. „Wir rechnen in diesem Jahr mit einem Gesamtumsatz im CPU-Bereich von fast 20 Milliarden US-Dollar, was uns auf den Weg zum weltweit führenden CPU-Anbieter bringt“, sagte Kress.

Sollten sich die 20 Milliarden US-Dollar bewahrheiten, wäre das schon im ersten Jahr ein Kopf-an-Kopf-Rennen mit AMD und Intel, wenn man nur Serverprozessoren wertet. AMD setzte 2025 gut 16,6 Milliarden US-Dollar mit Server-Hardware um, allerdings inklusive KI-Beschleunigern. Der Umsatz sowohl mit CPUs als auch mit Beschleunigern soll dieses Jahr noch mal erheblich steigen. Intel setzte 2025 rund 16,9 Milliarden US-Dollar mit Server-Hardware um, hauptsächlich mit Xeon-Prozessoren. Den Markt für KI-Beschleuniger hat Intel weitgehend verschlafen. Inklusive Client-CPUs ziehen sowohl AMD als auch Intel jetzt schon davon. Intels Umsatz lag so bei 49,1 Milliarden US-Dollar (32,2 Milliarden US-Dollar durch Client). Nvidia will zwar mit N1X und N1 auch in Notebooks gelangen, allerdings verzögern sich die Mobilprozessoren schon seit 2025.

Googles XR-Brillen auf der I/O: Project Aura & Prototyp ausprobiert

Weniger ist manchmal mehr: Diese Erfahrung hat Meta mit seinen Smart Glasses gemacht. Während das Großprojekt Metaverse viel Geld verschlang und wenig Anklang fand, verkaufte das US-Unternehmen alleine im Jahr 2025 über sieben Millionen Exemplare seiner KI-Brillen (Ray-Ban Meta und Oakley Meta). Wearables, die Nutzer nicht komplett von der Realität abschotten, treffen offenbar auf mehr Gegenliebe als rein virtuelle Welten. Apple soll für die Zukunft ebenfalls eine Brille im Köcher haben, nachdem auch das räumliche Computing mit der Vision Pro eine Nischenlösung geblieben ist. Und Google? Das Unternehmen stellte jüngst auf der Entwicklerkonferenz I/O neue Brillen in Zusammenarbeit mit Warby Parker, Gentle Monster und Samsung vor. Doch dabei soll es nicht bleiben. Wie sehr Google das Thema umtreibt, ist alleine daran zu sehen, wie stark das Unternehmen in letzter Zeit Android XR in den Fokus rückt. Schon auf dem Mobile World Congress in Barcelona konnte ein Prototyp in Augenschein genommen werden. Jetzt, auf der Entwicklerkonferenz I/O im kalifornischen Mountain View, gab es ebenfalls Demos: in der sogenannten AI Sandbox, einer großen Halle auf dem Veranstaltungsgelände. heise online konnte an zwei Demos vor Ort teilnehmen. Google zeigte gleich zwei Geräte in Aktion: Neben dem namenlosen eigenen Prototyp mit KI-Sprachsteuerung, Kameras und eingebautem kleinem Display wurde auch Project Aura demonstriert, die XR-Brille von Xreal und Google. Project Aura: Der Brückenschlag Project Aura ist eine Art Brückenschlag zwischen den Mixed-Reality-Visionen der letzten Jahre und den Smart Glasses. Schon das Aussehen verbindet das klassische Design einer herkömmlichen Brille mit Headset-Technik. Project Aura verfügt über ein Display in jeder Linse, eingebaute Lautsprecher und mehrere Kameras, liefert also ein vollständiges XR-Erlebnis in einem Brillengehäuse. Beim Aufsetzen fühlt sich das Gerät deutlich angenehmer an als klassische VR-Headsets, da die Abschirmung entfällt und die Brille leichter wirkt. Von innen sieht man allerdings die aufgesetzten Display-Komponenten – ein ungewohnter Anblick. Und Aura hat auch etwas von der Vision Pro kopiert: ein per Kabel angebundener Block, der hier aber nicht nur die Batterie in sich trägt, sondern auch die Recheneinheit. Das Sichtfeld beträgt 70 Grad – deutlich mehr als die 57 Grad beim bisherigen Topmodell Xreal One Pro. Das ist breit genug, um drei App-Fenster nebeneinander anzuzeigen; bis zu fünf können gleichzeitig geöffnet sein. Die Displayhelligkeit ist gut, Texte und Grafiken wirken scharf. Über einen Knopf am rechten Bügel lässt sich die Abdunkelung der Gläser steuern – was praktisch ist, wenn man nicht gestört werden möchte. Niedrigere Hemmschwelle Die Handsteuerung funktionierte im kurzen Test recht gut: Pinch-Gesten zum Auswählen und Verschieben von App-Fenstern sind intuitiv und erinnern an die Steuerung der Vision Pro oder der Meta Quest 3. Besonders Spaß gemacht hat eine Gaming-Demo: Im Rollenspiel Demeo ließ sich das Spielfeld mit beiden geballten Fäusten greifen, drehen und skalieren – einzelne Spielfiguren konnte man per Pinch aufnehmen und umsetzen. Das wirkt deutlich immersiver als klassische Controller-Steuerung. Was aber vor allem den Unterschied macht: Je leichter so ein Gerät ist, desto niedriger dürfte auch die Hemmschwelle sein, es öfter mal aufzusetzen. Project Aura soll noch 2026 weltweit in den Handel kommen. Für Entwickler startet bereits jetzt das „Android XR Developer Catalyst Program“ mit frühem Hardware-Zugang. Den Preis und konkreten Termin kommuniziert der Hersteller bislang nicht. Zum Vergleich: Xreals aktuelles Topmodell One Pro kostet nach einer jüngsten Preissenkung 599 Euro.

Googles Prototyp-Brille Das Google-Gerät kommt noch leichter daher, hat aber bei eingeschaltetem Display nur ein kleines Fensterchen im Sichtfeld im Angebot. Das reicht für viele Einsatzzwecke aber vollkommen aus: Richtungspfeile in der Navigation, Kartenausschnitte, Widgets, Live-Übersetzungen und Kurznachrichten passen hier spielend hinein und gleichzeitig bleibt die Realität weitgehend sichtbar. Die Demo zeigte im Vergleich zu früheren Präsentationen, welche Fortschritte Google macht. Die Brille ist leicht, lässt sich mit Korrekturgläsern ausstatten und bietet gute Sicht. Der Kunststoffrahmen wirkt noch nicht hochwertig, fällt aber als Technologiebrille durchaus auf. Dass es eine smarte Brille ist, sieht man ihr an. Die Bedienung ist simpel: Ein langer Druck auf die Seite aktiviert Gemini, ein Knopf an der Unterseite schaltet das Display ein. Die Bedienung mit deutscher Sprache funktioniert problemlos. Lediglich bei den akustischen Ausgaben stellten wir im Test in der AI Sandbox fest, dass der Ton in belebten Umgebungen teilweise schlecht zu verstehen ist. Hier kann es helfen, die Hände über die Bügel zu halten. Und was kann man damit machen? Im Test erfassten wir mit der Kamera Gegenstände und fügten diese direkt zur Einkaufsliste hinzu. WM-Partien der deutschen Mannschaft konnten auf Zuruf herausgesucht und mit einem Sprachbefehl in den Google-Kalender eingetragen werden. Besonders überzeugend war die Live-Übersetzung: Ein spontanes Gespräch auf Portugiesisch – Thema: das legendäre 7:1 der Fußball-WM – übertrug die Brille in Echtzeit fehlerlos ins Deutsche. Die Navigation ist durchdacht: Wer nach unten blickt, sieht eine Kartenansicht, an die sich per Swipe heranzoomen lässt – wer den Blick hebt, sieht stattdessen einen Richtungspfeil. In einer anderen Demo wurde auf Zuruf ein Brettspiel erkannt und eine Anleitung geliefert, wie die Partie zu gewinnen ist. Beim Blick auf ein Konzert-Poster spielte die Brille auf Nachfrage die Musik des Künstlers. Google setzt dabei auf eine Split-Compute-Architektur: Rechenintensive KI-Aufgaben werden ans Smartphone oder in die Cloud ausgelagert, damit die Brille selbst möglichst leicht bleibt. Viele Fragen bleiben offen So sehr die Erprobungen ein Gefühl dafür vermitteln können, ob man selbst einen Nutzwert in den smarten Brillen sieht, so wenig beantworten sie entscheidende Fragen, die sie umgeben: Wie lange hält der Akku durch? Und findet eine Brille mit sichtbaren Kameras gesellschaftliche Akzeptanz oder löst sie Unbehagen bei Menschen aus, die sich in ihrem Sichtfeld befinden? Mit seinem KI-Modell Gemini hat Google eine wichtige Grundvoraussetzung erfüllt. Dennoch stellt sich auch hier die Frage: Wollen Nutzer zum Beispiel in der Öffentlichkeit wirklich häufiger mit der KI reden? Oder würden sie das eher zu Hause tun? Aber brauchen sie dort dafür eine Brille? Oder tut es dann nicht auch das Smartphone?

Weiterlesen

Weniger ist manchmal mehr: Diese Erfahrung hat Meta mit seinen Smart Glasses gemacht. Während das Großprojekt Metaverse viel Geld verschlang und wenig Anklang fand, verkaufte das US-Unternehmen alleine im Jahr 2025 über sieben Millionen Exemplare seiner KI-Brillen (Ray-Ban Meta und Oakley Meta). Wearables, die Nutzer nicht komplett von der Realität abschotten, treffen offenbar auf mehr Gegenliebe als rein virtuelle Welten. Apple soll für die Zukunft ebenfalls eine Brille im Köcher haben, nachdem auch das räumliche Computing mit der Vision Pro eine Nischenlösung geblieben ist. Und Google? Das Unternehmen stellte jüngst auf der Entwicklerkonferenz I/O neue Brillen in Zusammenarbeit mit Warby Parker, Gentle Monster und Samsung vor. Doch dabei soll es nicht bleiben. Wie sehr Google das Thema umtreibt, ist alleine daran zu sehen, wie stark das Unternehmen in letzter Zeit Android XR in den Fokus rückt. Schon auf dem Mobile World Congress in Barcelona konnte ein Prototyp in Augenschein genommen werden. Jetzt, auf der Entwicklerkonferenz I/O im kalifornischen Mountain View, gab es ebenfalls Demos: in der sogenannten AI Sandbox, einer großen Halle auf dem Veranstaltungsgelände. heise online konnte an zwei Demos vor Ort teilnehmen. Google zeigte gleich zwei Geräte in Aktion: Neben dem namenlosen eigenen Prototyp mit KI-Sprachsteuerung, Kameras und eingebautem kleinem Display wurde auch Project Aura demonstriert, die XR-Brille von Xreal und Google. Project Aura: Der Brückenschlag Project Aura ist eine Art Brückenschlag zwischen den Mixed-Reality-Visionen der letzten Jahre und den Smart Glasses. Schon das Aussehen verbindet das klassische Design einer herkömmlichen Brille mit Headset-Technik. Project Aura verfügt über ein Display in jeder Linse, eingebaute Lautsprecher und mehrere Kameras, liefert also ein vollständiges XR-Erlebnis in einem Brillengehäuse. Beim Aufsetzen fühlt sich das Gerät deutlich angenehmer an als klassische VR-Headsets, da die Abschirmung entfällt und die Brille leichter wirkt. Von innen sieht man allerdings die aufgesetzten Display-Komponenten – ein ungewohnter Anblick. Und Aura hat auch etwas von der Vision Pro kopiert: ein per Kabel angebundener Block, der hier aber nicht nur die Batterie in sich trägt, sondern auch die Recheneinheit. Das Sichtfeld beträgt 70 Grad – deutlich mehr als die 57 Grad beim bisherigen Topmodell Xreal One Pro. Das ist breit genug, um drei App-Fenster nebeneinander anzuzeigen; bis zu fünf können gleichzeitig geöffnet sein. Die Displayhelligkeit ist gut, Texte und Grafiken wirken scharf. Über einen Knopf am rechten Bügel lässt sich die Abdunkelung der Gläser steuern – was praktisch ist, wenn man nicht gestört werden möchte. Niedrigere Hemmschwelle Die Handsteuerung funktionierte im kurzen Test recht gut: Pinch-Gesten zum Auswählen und Verschieben von App-Fenstern sind intuitiv und erinnern an die Steuerung der Vision Pro oder der Meta Quest 3. Besonders Spaß gemacht hat eine Gaming-Demo: Im Rollenspiel Demeo ließ sich das Spielfeld mit beiden geballten Fäusten greifen, drehen und skalieren – einzelne Spielfiguren konnte man per Pinch aufnehmen und umsetzen. Das wirkt deutlich immersiver als klassische Controller-Steuerung. Was aber vor allem den Unterschied macht: Je leichter so ein Gerät ist, desto niedriger dürfte auch die Hemmschwelle sein, es öfter mal aufzusetzen. Project Aura soll noch 2026 weltweit in den Handel kommen. Für Entwickler startet bereits jetzt das „Android XR Developer Catalyst Program“ mit frühem Hardware-Zugang. Den Preis und konkreten Termin kommuniziert der Hersteller bislang nicht. Zum Vergleich: Xreals aktuelles Topmodell One Pro kostet nach einer jüngsten Preissenkung 599 Euro.

Googles Prototyp-Brille Das Google-Gerät kommt noch leichter daher, hat aber bei eingeschaltetem Display nur ein kleines Fensterchen im Sichtfeld im Angebot. Das reicht für viele Einsatzzwecke aber vollkommen aus: Richtungspfeile in der Navigation, Kartenausschnitte, Widgets, Live-Übersetzungen und Kurznachrichten passen hier spielend hinein und gleichzeitig bleibt die Realität weitgehend sichtbar. Die Demo zeigte im Vergleich zu früheren Präsentationen, welche Fortschritte Google macht. Die Brille ist leicht, lässt sich mit Korrekturgläsern ausstatten und bietet gute Sicht. Der Kunststoffrahmen wirkt noch nicht hochwertig, fällt aber als Technologiebrille durchaus auf. Dass es eine smarte Brille ist, sieht man ihr an. Die Bedienung ist simpel: Ein langer Druck auf die Seite aktiviert Gemini, ein Knopf an der Unterseite schaltet das Display ein. Die Bedienung mit deutscher Sprache funktioniert problemlos. Lediglich bei den akustischen Ausgaben stellten wir im Test in der AI Sandbox fest, dass der Ton in belebten Umgebungen teilweise schlecht zu verstehen ist. Hier kann es helfen, die Hände über die Bügel zu halten. Und was kann man damit machen? Im Test erfassten wir mit der Kamera Gegenstände und fügten diese direkt zur Einkaufsliste hinzu. WM-Partien der deutschen Mannschaft konnten auf Zuruf herausgesucht und mit einem Sprachbefehl in den Google-Kalender eingetragen werden. Besonders überzeugend war die Live-Übersetzung: Ein spontanes Gespräch auf Portugiesisch – Thema: das legendäre 7:1 der Fußball-WM – übertrug die Brille in Echtzeit fehlerlos ins Deutsche. Die Navigation ist durchdacht: Wer nach unten blickt, sieht eine Kartenansicht, an die sich per Swipe heranzoomen lässt – wer den Blick hebt, sieht stattdessen einen Richtungspfeil. In einer anderen Demo wurde auf Zuruf ein Brettspiel erkannt und eine Anleitung geliefert, wie die Partie zu gewinnen ist. Beim Blick auf ein Konzert-Poster spielte die Brille auf Nachfrage die Musik des Künstlers. Google setzt dabei auf eine Split-Compute-Architektur: Rechenintensive KI-Aufgaben werden ans Smartphone oder in die Cloud ausgelagert, damit die Brille selbst möglichst leicht bleibt. Viele Fragen bleiben offen So sehr die Erprobungen ein Gefühl dafür vermitteln können, ob man selbst einen Nutzwert in den smarten Brillen sieht, so wenig beantworten sie entscheidende Fragen, die sie umgeben: Wie lange hält der Akku durch? Und findet eine Brille mit sichtbaren Kameras gesellschaftliche Akzeptanz oder löst sie Unbehagen bei Menschen aus, die sich in ihrem Sichtfeld befinden? Mit seinem KI-Modell Gemini hat Google eine wichtige Grundvoraussetzung erfüllt. Dennoch stellt sich auch hier die Frage: Wollen Nutzer zum Beispiel in der Öffentlichkeit wirklich häufiger mit der KI reden? Oder würden sie das eher zu Hause tun? Aber brauchen sie dort dafür eine Brille? Oder tut es dann nicht auch das Smartphone?

SADAS: Neue Software warnt Fahrer vor Gefahrenzonen im Straßenraum

Was haben dicke, gelbe Bücher mit autonomem Fahren zu tun? Mehr als man denkt, wenn es nach dem Fraunhofer-Institut für Offene Kommunikationssysteme (FOKUS) und der pdm solutions GmbH geht. In einem sechsmonatigen Forschungsprojekt haben die beiden Partner nach eigenen Angaben einen Proof of Concept abgeschlossen, der kuratierte Standortdaten aus dem Verzeichnis „Das Telefonbuch“ für moderne Fahrerassistenzsysteme (ADAS) nutzbar machen soll. Der Prototyp wurde auf dem Branchentreff des Verbands Deutscher Auskunfts- und Verzeichnismedien (VDAV) in Berlin präsentiert. Im Zentrum steht die am Fraunhofer FOKUS entwickelte Software SADAS (Support for Advanced Driver Assistance Systems). Sie soll die Verzeichnisdaten in den sogenannten „Digitalen Stadtzwilling“ integrieren – ein virtuelles Abbild des Straßenraums. Konkret identifiziere das System laut Fraunhofer Orte mit besonders schutzbedürftigen Verkehrsteilnehmenden, etwa Kindergärten, Spielplätze oder Schulen, und gleiche diese Informationen in Echtzeit mit Fahrtroute und Fahrzeugposition ab. Erkenne das System eine potenzielle Gefahrenzone, soll der Fahrer optische oder akustische Signale über das Dashboard erhalten – und zwar, bevor die Situation im Sichtfeld auftaucht. Künftig sollen diese Warnungen nach Darstellung der Partner auch direkt an Bremsassistenten oder automatisierte Fahrfunktionen weitergereicht werden können. Wie KI-gestützte Assistenzsysteme im Fahrzeug funktionieren und welche Infrastruktur dahintersteckt, zeigt etwa das Forschungsprojekt Central Car Server der TU München, bei dem ein Zentralrechner alle elektronischen Komponenten steuert und neue Funktionen selbst programmiert. Alternative zu Datensilos großer Plattformen Standortdaten von Schulen oder Kitas finden sich grundsätzlich auch in den Kartendiensten globaler Tech-Konzerne. Das Fraunhofer-Projekt zielt jedoch ausdrücklich auf eine souveräne Dateninfrastruktur. „Ein zentrales Ziel ist es, bestehende Datensilos aufzubrechen. Das unterstützt auch digital souveräne Systeme“, erklärt Dr.-Ing. Ilja Radusch, Leiter des Geschäftsbereichs Smart Mobility bei Fraunhofer FOKUS und Leiter des Daimler Center for Automotive IT Innovations (DCAITI) an der TU Berlin. Das Ziel digitaler Souveränität steht dabei im Mittelpunkt des Projekts. Über offene, standardbasierte Schnittstellen sollen Städte und Mobilitätsdienstleister auf den Digitalen Stadtzwilling zugreifen können, ohne sich an die geschlossenen Ökosysteme einzelner Plattformanbieter zu binden. Das soll es zudem ermöglichen, dass nicht jeder Datenanbieter von vornherein sämtliche Qualitätsanforderungen aller – oft noch unbekannten – Datennutzenden erfüllen muss.

Vom Telefonbucheintrag zur Geokoordinate Eine Herausforderung dürfte die Datenqualität sein. Während für Verzeichnisdienste eine korrekte Postadresse genügt, benötigen Fahrzeuge hochpräzise Geokoordinaten. Radusch nennt ein anschauliches Beispiel: Schulen oder Spielplätze erstreckten sich häufig über ganze Straßenblöcke und grenzten an mehrere Straßen. Würde ein Assistenzsystem pauschal an allen angrenzenden Straßen warnen, käme es schnell zum Gewöhnungseffekt – mit negativen Folgen für die Verkehrssicherheit. Um die Daten für den Einsatz im Fahrzeug zu veredeln, will Fraunhofer FOKUS mehrere Quellen kombinieren: Informationen aus Verkehrsmanagementzentralen, stationäre Sensoren in Ampelanlagen sowie Sensordaten aus Fahrzeugflotten. Hinzu kommen soll Crowdsourcing über die KI-basierte App Eidos Road Glancr (PDF): Ein handelsübliches Smartphone an der Windschutzscheibe – beispielsweise in Bussen oder Taxis – soll datenschutzkonform Veränderungen im Straßenraum wie Baustellen, neue Verkehrszeichen, Straßenschäden oder verfügbare Parkflächen erfassen. Für seltene oder sicherheitskritische Ereignisse will das Team die Realdaten zusätzlich durch Simulationen in der Open-Source-Umgebung Eclipse MOSAIC ergänzen. Nach dem nach eigenen Angaben erfolgreichen Proof of Concept wollen pdm solutions und Fraunhofer FOKUS die Zusammenarbeit fortsetzen. Perspektivisch sollen die datenbasierten Digitalen Stadtzwillinge nicht nur Assistenzsysteme ergänzen, sondern auch für automatisiertes und autonomes Fahren nutzbar werden. Andere Hersteller setzen bei der Integration von Fahrerassistenz auf KI-Plattformen wie etwa Google Gemini in Volvo-Fahrzeugen, wo die KI über Fahrzeugkameras Verkehrszeichen und die Umgebung in Echtzeit analysiert. Denkbar seien laut Radusch zudem klassische Telematik-Services wie barrierearme Routen zur nächsten Apotheke oder thematische Stadttouren. Transparenzhinweis: Heise & Dumrath Medien ist am Herausgeber von „Das Telefonbuch“ beteiligt.

Weiterlesen

Was haben dicke, gelbe Bücher mit autonomem Fahren zu tun? Mehr als man denkt, wenn es nach dem Fraunhofer-Institut für Offene Kommunikationssysteme (FOKUS) und der pdm solutions GmbH geht. In einem sechsmonatigen Forschungsprojekt haben die beiden Partner nach eigenen Angaben einen Proof of Concept abgeschlossen, der kuratierte Standortdaten aus dem Verzeichnis „Das Telefonbuch“ für moderne Fahrerassistenzsysteme (ADAS) nutzbar machen soll. Der Prototyp wurde auf dem Branchentreff des Verbands Deutscher Auskunfts- und Verzeichnismedien (VDAV) in Berlin präsentiert. Im Zentrum steht die am Fraunhofer FOKUS entwickelte Software SADAS (Support for Advanced Driver Assistance Systems). Sie soll die Verzeichnisdaten in den sogenannten „Digitalen Stadtzwilling“ integrieren – ein virtuelles Abbild des Straßenraums. Konkret identifiziere das System laut Fraunhofer Orte mit besonders schutzbedürftigen Verkehrsteilnehmenden, etwa Kindergärten, Spielplätze oder Schulen, und gleiche diese Informationen in Echtzeit mit Fahrtroute und Fahrzeugposition ab. Erkenne das System eine potenzielle Gefahrenzone, soll der Fahrer optische oder akustische Signale über das Dashboard erhalten – und zwar, bevor die Situation im Sichtfeld auftaucht. Künftig sollen diese Warnungen nach Darstellung der Partner auch direkt an Bremsassistenten oder automatisierte Fahrfunktionen weitergereicht werden können. Wie KI-gestützte Assistenzsysteme im Fahrzeug funktionieren und welche Infrastruktur dahintersteckt, zeigt etwa das Forschungsprojekt Central Car Server der TU München, bei dem ein Zentralrechner alle elektronischen Komponenten steuert und neue Funktionen selbst programmiert. Alternative zu Datensilos großer Plattformen Standortdaten von Schulen oder Kitas finden sich grundsätzlich auch in den Kartendiensten globaler Tech-Konzerne. Das Fraunhofer-Projekt zielt jedoch ausdrücklich auf eine souveräne Dateninfrastruktur. „Ein zentrales Ziel ist es, bestehende Datensilos aufzubrechen. Das unterstützt auch digital souveräne Systeme“, erklärt Dr.-Ing. Ilja Radusch, Leiter des Geschäftsbereichs Smart Mobility bei Fraunhofer FOKUS und Leiter des Daimler Center for Automotive IT Innovations (DCAITI) an der TU Berlin. Das Ziel digitaler Souveränität steht dabei im Mittelpunkt des Projekts. Über offene, standardbasierte Schnittstellen sollen Städte und Mobilitätsdienstleister auf den Digitalen Stadtzwilling zugreifen können, ohne sich an die geschlossenen Ökosysteme einzelner Plattformanbieter zu binden. Das soll es zudem ermöglichen, dass nicht jeder Datenanbieter von vornherein sämtliche Qualitätsanforderungen aller – oft noch unbekannten – Datennutzenden erfüllen muss.

Vom Telefonbucheintrag zur Geokoordinate Eine Herausforderung dürfte die Datenqualität sein. Während für Verzeichnisdienste eine korrekte Postadresse genügt, benötigen Fahrzeuge hochpräzise Geokoordinaten. Radusch nennt ein anschauliches Beispiel: Schulen oder Spielplätze erstreckten sich häufig über ganze Straßenblöcke und grenzten an mehrere Straßen. Würde ein Assistenzsystem pauschal an allen angrenzenden Straßen warnen, käme es schnell zum Gewöhnungseffekt – mit negativen Folgen für die Verkehrssicherheit. Um die Daten für den Einsatz im Fahrzeug zu veredeln, will Fraunhofer FOKUS mehrere Quellen kombinieren: Informationen aus Verkehrsmanagementzentralen, stationäre Sensoren in Ampelanlagen sowie Sensordaten aus Fahrzeugflotten. Hinzu kommen soll Crowdsourcing über die KI-basierte App Eidos Road Glancr (PDF): Ein handelsübliches Smartphone an der Windschutzscheibe – beispielsweise in Bussen oder Taxis – soll datenschutzkonform Veränderungen im Straßenraum wie Baustellen, neue Verkehrszeichen, Straßenschäden oder verfügbare Parkflächen erfassen. Für seltene oder sicherheitskritische Ereignisse will das Team die Realdaten zusätzlich durch Simulationen in der Open-Source-Umgebung Eclipse MOSAIC ergänzen. Nach dem nach eigenen Angaben erfolgreichen Proof of Concept wollen pdm solutions und Fraunhofer FOKUS die Zusammenarbeit fortsetzen. Perspektivisch sollen die datenbasierten Digitalen Stadtzwillinge nicht nur Assistenzsysteme ergänzen, sondern auch für automatisiertes und autonomes Fahren nutzbar werden. Andere Hersteller setzen bei der Integration von Fahrerassistenz auf KI-Plattformen wie etwa Google Gemini in Volvo-Fahrzeugen, wo die KI über Fahrzeugkameras Verkehrszeichen und die Umgebung in Echtzeit analysiert. Denkbar seien laut Radusch zudem klassische Telematik-Services wie barrierearme Routen zur nächsten Apotheke oder thematische Stadttouren. Transparenzhinweis: Heise & Dumrath Medien ist am Herausgeber von „Das Telefonbuch“ beteiligt.

Drei Fragen und Antworten: Wann sich KI-Coding wirklich rechnet

heise_ki·2026-05-22WirtschaftAnwendungenModelle

Beim Vibe Coding delegieren Entwickler die technische Umsetzung – Syntax, Boilerplate, Logikstrukturen – fast vollständig an ein Large Language Model. Menschen agieren nicht mehr als Autoren einzelner Codezeilen, sondern geben nur noch das gewünschte Verhalten und die Architektur der Anwendung vor. Doch wie sieht es in der Praxis mit den Kosten für ein solches Projekt aus? Stefan Müller, Titelautor der neuen iX 6/2026, erklärt, worauf man achten muss. Wie kann man grob gesagt Tokenbudget und Kosten für ein Projekt mit Vibe Coding überschlagen? Ein Token-Budget-Modell, kurz TBM, stützt sich auf viele verschiedene Faktoren. Daher ist ein pauschaler Überschlag naturgemäß etwas schwierig, zumal Softwareprojekte sehr unterschiedlich ausfallen können. Mit einem Topmodell wie Opus 4.6 oder 4.7 liegen wir bei professionellen Projekten eigentlich immer in einem Größenrahmen von 3.000 bis 15.000 Euro – oft auch deutlich darunter, je ausgebuffter die Softwareentwickler sind, die das Modell mit konkreten Vorgaben steuern. Ein Projekt, das über diese Schwelle hinausgegangen wäre, habe ich bisher nicht erlebt. Das TBM habe ich auch als Internetrechner veröffentlicht. Was sind die größten Kostentreiber beim Vibe Coding? Das ist einerseits die menschliche Vorarbeit bei der Spezifikation des Projektes. Je durchdachter ein Pflichtenheft ist, desto besser können sich KI-Agenten daran entlanghangeln. Wenn Anforderungen und ihre Umsetzung vage bleiben, kann es schnell teuer werden. Andererseits entscheidet die Modellqualität: Wenn wir auf den Open-Source-Bereich festgelegt sind, explodieren die Token-Budgets schnell. Das hat nicht zwangsläufig hohe Kosten zur Folge, weil der Tokenpreis pro Million mit der geringeren Modellqualität ja ebenfalls sinkt (wobei Modelle wie DeepSeek V4 selbst diese Logik gerade durchbrechen). Dafür gehen die Personalkosten hoch – wegen des permanenten Nachbesserns und „Reparierens“ des entstandenen Codes. Das ist auch ein versteckter Kostentreiber: Wenn die Softwareentwickler dabei frustriert werden, finden weitere Einsätze dieses Ansatzes zukünftig weniger Akzeptanz. Im Fall von Open-Source-Modellen würde ich den KI-Einsatz stark limitieren und nur punktuell im Entwicklungsprozess unterstützen lassen – zum Beispiel für einfache Tests oder das Schreiben von Boilerplate anhand konkreter Beispiele und Referenzen. Wann ist der maschinell generierte Code wirtschaftlich besonders sinnvoll? Ich finde maschinell generierten Code besonders sinnvoll, wenn schnell Ergebnisse benötigt werden – wenn die Frage nach dem „Wie“ gar nicht so relevant ist, sondern das Resultat im Vordergrund steht. Vibe Coding wird Unternehmen darüber hinaus auch in Zukunft in die Lage versetzen, eigene Softwarekomponenten zu erstellen, ohne auf große Lösungen mit unzähligen Funktionen zurückgreifen zu müssen. Der Vendor-Lock-in bricht langsam, aber sicher auf. Parallel dazu können Software-Manufakturen mit Vibe Coding Kundenbedürfnisse abseits ihres Tagesgeschäfts erfüllen und so neue Zielgruppen erschließen.

Stefan, vielen Dank für die Antworten! Einen Überblick, wie man Tokenbudget und Kosten für Vibe Coding schätzt, gibt es in der neuen iX. Außerdem zeigen wir, was die KI-gestützte Entwicklung in IT-Beratungen und Softwarehäusern kostet – und befassen uns damit, was KI-Gateways als Tools für Kostenkontrolle leisten können. All das und viele weitere Themen finden Leser im Juni-Heft, das ab sofort im heise Shop oder am Kiosk erhältlich ist. In der Serie „Drei Fragen und Antworten“ will die iX die heutigen Herausforderungen der IT auf den Punkt bringen – egal ob es sich um den Blick des Anwenders vorm PC, die Sicht des Managers oder den Alltag eines Administrators handelt. Haben Sie Anregungen aus Ihrer tagtäglichen Praxis oder der Ihrer Nutzer? Wessen Tipps zu welchem Thema würden Sie gerne kurz und knackig lesen? Dann schreiben Sie uns gerne oder hinterlassen Sie einen Kommentar im Forum.

Weiterlesen

Beim Vibe Coding delegieren Entwickler die technische Umsetzung – Syntax, Boilerplate, Logikstrukturen – fast vollständig an ein Large Language Model. Menschen agieren nicht mehr als Autoren einzelner Codezeilen, sondern geben nur noch das gewünschte Verhalten und die Architektur der Anwendung vor. Doch wie sieht es in der Praxis mit den Kosten für ein solches Projekt aus? Stefan Müller, Titelautor der neuen iX 6/2026, erklärt, worauf man achten muss. Wie kann man grob gesagt Tokenbudget und Kosten für ein Projekt mit Vibe Coding überschlagen? Ein Token-Budget-Modell, kurz TBM, stützt sich auf viele verschiedene Faktoren. Daher ist ein pauschaler Überschlag naturgemäß etwas schwierig, zumal Softwareprojekte sehr unterschiedlich ausfallen können. Mit einem Topmodell wie Opus 4.6 oder 4.7 liegen wir bei professionellen Projekten eigentlich immer in einem Größenrahmen von 3.000 bis 15.000 Euro – oft auch deutlich darunter, je ausgebuffter die Softwareentwickler sind, die das Modell mit konkreten Vorgaben steuern. Ein Projekt, das über diese Schwelle hinausgegangen wäre, habe ich bisher nicht erlebt. Das TBM habe ich auch als Internetrechner veröffentlicht. Was sind die größten Kostentreiber beim Vibe Coding? Das ist einerseits die menschliche Vorarbeit bei der Spezifikation des Projektes. Je durchdachter ein Pflichtenheft ist, desto besser können sich KI-Agenten daran entlanghangeln. Wenn Anforderungen und ihre Umsetzung vage bleiben, kann es schnell teuer werden. Andererseits entscheidet die Modellqualität: Wenn wir auf den Open-Source-Bereich festgelegt sind, explodieren die Token-Budgets schnell. Das hat nicht zwangsläufig hohe Kosten zur Folge, weil der Tokenpreis pro Million mit der geringeren Modellqualität ja ebenfalls sinkt (wobei Modelle wie DeepSeek V4 selbst diese Logik gerade durchbrechen). Dafür gehen die Personalkosten hoch – wegen des permanenten Nachbesserns und „Reparierens“ des entstandenen Codes. Das ist auch ein versteckter Kostentreiber: Wenn die Softwareentwickler dabei frustriert werden, finden weitere Einsätze dieses Ansatzes zukünftig weniger Akzeptanz. Im Fall von Open-Source-Modellen würde ich den KI-Einsatz stark limitieren und nur punktuell im Entwicklungsprozess unterstützen lassen – zum Beispiel für einfache Tests oder das Schreiben von Boilerplate anhand konkreter Beispiele und Referenzen. Wann ist der maschinell generierte Code wirtschaftlich besonders sinnvoll? Ich finde maschinell generierten Code besonders sinnvoll, wenn schnell Ergebnisse benötigt werden – wenn die Frage nach dem „Wie“ gar nicht so relevant ist, sondern das Resultat im Vordergrund steht. Vibe Coding wird Unternehmen darüber hinaus auch in Zukunft in die Lage versetzen, eigene Softwarekomponenten zu erstellen, ohne auf große Lösungen mit unzähligen Funktionen zurückgreifen zu müssen. Der Vendor-Lock-in bricht langsam, aber sicher auf. Parallel dazu können Software-Manufakturen mit Vibe Coding Kundenbedürfnisse abseits ihres Tagesgeschäfts erfüllen und so neue Zielgruppen erschließen.

Stefan, vielen Dank für die Antworten! Einen Überblick, wie man Tokenbudget und Kosten für Vibe Coding schätzt, gibt es in der neuen iX. Außerdem zeigen wir, was die KI-gestützte Entwicklung in IT-Beratungen und Softwarehäusern kostet – und befassen uns damit, was KI-Gateways als Tools für Kostenkontrolle leisten können. All das und viele weitere Themen finden Leser im Juni-Heft, das ab sofort im heise Shop oder am Kiosk erhältlich ist. In der Serie „Drei Fragen und Antworten“ will die iX die heutigen Herausforderungen der IT auf den Punkt bringen – egal ob es sich um den Blick des Anwenders vorm PC, die Sicht des Managers oder den Alltag eines Administrators handelt. Haben Sie Anregungen aus Ihrer tagtäglichen Praxis oder der Ihrer Nutzer? Wessen Tipps zu welchem Thema würden Sie gerne kurz und knackig lesen? Dann schreiben Sie uns gerne oder hinterlassen Sie einen Kommentar im Forum.

Metas KI-Brillen helfen Blinden im Alltag – und werfen neue Fragen auf

Meta hat anlässlich des Global Accessibility Awareness Day neue Barrierefreiheitsfunktionen für seine Smart Glasses angekündigt. Das Unternehmen kooperiert seit längerem mit Be My Eyes, einem Dienst, der blinde und sehbehinderte Menschen per Videoanruf mit sehenden Freiwilligen verbindet. Auf Metas Smart Glasses genügt ein Sprachbefehl, damit ein Helfer das Kamerabild der Brille sieht und dem Nutzer in Echtzeit beschreibt, was sich vor ihm befindet. Be My Eyes wird seit 2024 unterstützt und ist inzwischen auch in Deutschland erhältlich. Zu den neuen, hierzulande verfügbaren Accessibility-Funktionen gehört, dass Nutzer über einen Be-My-Eyes-Sprachbefehl nun auch vertraute Kontakte sowie geschulte Supportmitarbeiter von über 600 Unternehmen erreichen können, die kostenlos visuelle Unterstützung und Hilfe bei konkreten Aufgaben bieten. Ebenfalls neu ist die Möglichkeit, den Action Button bei den neuesten Brillenmodellen und Oakley Meta Vanguard mit häufig genutzten Funktionen zu verknüpfen, etwa einem Be-My-Eyes-Anruf oder einem Sprachbefehl wie „Beschreibe, was sich um mich herum befindet“. Zwei weitere neue Barrierefreiheitsfunktionen starten zuerst in Nordamerika: Nutzer mit Mobilitätseinschränkungen sollen dort künftig Anrufe vollständig per Sprache steuern können, etwa zum Stummschalten sowie zum Aktivieren oder Deaktivieren der Kamera. Zudem zeigen Meta Ray-Ban Display-Brillen auf Wunsch Echtzeit-Untertitel für Telefonate über WhatsApp, Messenger und Instagram im Brillendisplay an, was Menschen mit Hörbeeinträchtigungen helfen kann. Wie Smart Glasses im Blindenalltag helfen Ende vergangenen Jahres öffnete Meta seine Smart Glasses für Entwickler. Dadurch konnten Anbieter von Barrierefreiheits-Apps ihre Unterstützung auf die Brillen ausweiten. Dazu gehört auch das französische Start-up OOrion, das eine kostenlose Smartphone-App für blinde und sehbehinderte Menschen entwickelt. OOrion setzt auf Objekt- und Texterkennung, um blinden Nutzern bei der Orientierung, der Erkennung von Hindernissen und beim Auffinden von Gegenständen zu helfen. In Zusammenarbeit mit Meta wurde die iOS-App im April für Metas Smart Glasses verfügbar gemacht, eine Funktion, wovon auch deutsche Nutzer profitieren.

Bei einer von Meta veranstalteten Gesprächsrunde schilderte die blinde Nutzerin Yvonne Bühr, wie sie Metas Smart Glasses im Alltag einsetzt. Bühr ist Mitglied im Deutschen Blinden- und Sehbehindertenverband (DBSV) und engagiert sich in der Hilfsmittelbeschaffung. Sie nutzt die Smart Glasses laut eigenen Angaben vor allem zur Beschreibung ihrer Umgebung, sowohl in Innenräumen als auch im Freien. Die KI lese ihr Schilder, Öffnungszeiten oder Speisekarten vor. Über diese integrierten Funktionen hinaus ermögliche die OOrion-App eine Echtzeitanalyse der Umgebung und könne sie etwa darauf hinweisen, wenn sie auf der Straße eine bestimmte Hausnummer erreicht hat. Als große Hilfe wird die Freihändigkeit empfunden, die das sprachgesteuerte Wearable erlaube. Gerade in Kombination mit Blindenstock und Tasche sei es eine große Erleichterung, visuelle Informationen direkt über die Brille zu erhalten, statt erst das Smartphone hervorholen zu müssen, sagt Bühr. Zuverlässigkeit und Datenschutz bleiben offene Fragen Gleichzeitig sieht Bühr noch technische Grenzen, etwa bei Kamera und KI: Kleine Schrift, bewegte Inhalte oder schwierige Lichtverhältnisse könnten die Qualität der Beschreibungen beeinträchtigen, zudem könnten KI-Systeme weiterhin halluzinieren. Letzteres kann für blinde und sehbehinderte Menschen ein Sicherheitsrisiko darstellen. Stéphanie Robieux, Mitgründerin und CEO von OOrion, sagte in der Gesprächsrunde, ihr Team arbeite eng mit Meta zusammen, um solche Risiken zu verringern. In der App weist das Start-up darauf hin, dass KI Fehler machen kann und Nutzer sich bei der Orientierung nicht allein auf die Anwendung verlassen sollten. Tino Krause, bei Meta für die DACH-Region verantwortlich, zeigt sich derweil überzeugt, dass das Risiko von Halluzinationen weiter sinken werde. Jede neue Generation großer Sprachmodelle reduziere die Fehleranfälligkeit deutlich. Die grundsätzliche Frage bleibt jedoch: Wo genau ziehen Meta und andere Anbieter die Grenze zwischen hilfreicher Alltagsassistenz und einer Mobilitätshilfe, für die deutlich höhere Anforderungen an Zuverlässigkeit, Haftung und Sicherheit gelten müssten? Hinzu kommen grundsätzliche Fragen zum Datenschutz. Eine Rechtsprofessorin warnte kürzlich, dass das Recht am eigenen Bild durch die zunehmende Verbreitung solcher Geräte schleichend ausgehöhlt werden könnte. Dabei macht es aus Datenschutzsicht keinen Unterschied, ob die Nutzer blind sind oder sehen können: Die Kamerabilder könnten dennoch an Dritte übermittelt werden. Datenschutz sei ein sehr sensibles Thema, bei dem der Verband derzeit noch um eine gemeinsame Position ringe, sagt Kay Schulze, der beim DBSV Projekte zur digitalen Barrierefreiheit leitet und ebenfalls an der Gesprächsrunde teilnahm. Auf die Frage, wie die Smart Glasses denn in der Szene wahrgenommen würden, meint Schulze, dass es wie überall auch hier Frühaneigner gebe und solche, die eher Vorsicht walten ließen. Darunter seien auch Menschen, die sich nicht wohl damit fühlten, dass ihre Daten auf den Servern amerikanischer Konzerne liegen und dort verarbeitet werden. Nichtsdestoweniger würden diese Brillen auf Konferenzen des DBSV verteilt, erprobt und diskutiert. Der Wortlaut des letzten Abschnitts wurde dahingehend geändert, dass klar wird, dass die eher kritische Position gegenüber kamerabasierten Smart Glasses von Einzelpersonen und nicht vom DBSV als Ganzem vertreten wird. Wir entschuldigen uns für den Fehler.

Weiterlesen

Meta hat anlässlich des Global Accessibility Awareness Day neue Barrierefreiheitsfunktionen für seine Smart Glasses angekündigt. Das Unternehmen kooperiert seit längerem mit Be My Eyes, einem Dienst, der blinde und sehbehinderte Menschen per Videoanruf mit sehenden Freiwilligen verbindet. Auf Metas Smart Glasses genügt ein Sprachbefehl, damit ein Helfer das Kamerabild der Brille sieht und dem Nutzer in Echtzeit beschreibt, was sich vor ihm befindet. Be My Eyes wird seit 2024 unterstützt und ist inzwischen auch in Deutschland erhältlich. Zu den neuen, hierzulande verfügbaren Accessibility-Funktionen gehört, dass Nutzer über einen Be-My-Eyes-Sprachbefehl nun auch vertraute Kontakte sowie geschulte Supportmitarbeiter von über 600 Unternehmen erreichen können, die kostenlos visuelle Unterstützung und Hilfe bei konkreten Aufgaben bieten. Ebenfalls neu ist die Möglichkeit, den Action Button bei den neuesten Brillenmodellen und Oakley Meta Vanguard mit häufig genutzten Funktionen zu verknüpfen, etwa einem Be-My-Eyes-Anruf oder einem Sprachbefehl wie „Beschreibe, was sich um mich herum befindet“. Zwei weitere neue Barrierefreiheitsfunktionen starten zuerst in Nordamerika: Nutzer mit Mobilitätseinschränkungen sollen dort künftig Anrufe vollständig per Sprache steuern können, etwa zum Stummschalten sowie zum Aktivieren oder Deaktivieren der Kamera. Zudem zeigen Meta Ray-Ban Display-Brillen auf Wunsch Echtzeit-Untertitel für Telefonate über WhatsApp, Messenger und Instagram im Brillendisplay an, was Menschen mit Hörbeeinträchtigungen helfen kann. Wie Smart Glasses im Blindenalltag helfen Ende vergangenen Jahres öffnete Meta seine Smart Glasses für Entwickler. Dadurch konnten Anbieter von Barrierefreiheits-Apps ihre Unterstützung auf die Brillen ausweiten. Dazu gehört auch das französische Start-up OOrion, das eine kostenlose Smartphone-App für blinde und sehbehinderte Menschen entwickelt. OOrion setzt auf Objekt- und Texterkennung, um blinden Nutzern bei der Orientierung, der Erkennung von Hindernissen und beim Auffinden von Gegenständen zu helfen. In Zusammenarbeit mit Meta wurde die iOS-App im April für Metas Smart Glasses verfügbar gemacht, eine Funktion, wovon auch deutsche Nutzer profitieren.

Bei einer von Meta veranstalteten Gesprächsrunde schilderte die blinde Nutzerin Yvonne Bühr, wie sie Metas Smart Glasses im Alltag einsetzt. Bühr ist Mitglied im Deutschen Blinden- und Sehbehindertenverband (DBSV) und engagiert sich in der Hilfsmittelbeschaffung. Sie nutzt die Smart Glasses laut eigenen Angaben vor allem zur Beschreibung ihrer Umgebung, sowohl in Innenräumen als auch im Freien. Die KI lese ihr Schilder, Öffnungszeiten oder Speisekarten vor. Über diese integrierten Funktionen hinaus ermögliche die OOrion-App eine Echtzeitanalyse der Umgebung und könne sie etwa darauf hinweisen, wenn sie auf der Straße eine bestimmte Hausnummer erreicht hat. Als große Hilfe wird die Freihändigkeit empfunden, die das sprachgesteuerte Wearable erlaube. Gerade in Kombination mit Blindenstock und Tasche sei es eine große Erleichterung, visuelle Informationen direkt über die Brille zu erhalten, statt erst das Smartphone hervorholen zu müssen, sagt Bühr. Zuverlässigkeit und Datenschutz bleiben offene Fragen Gleichzeitig sieht Bühr noch technische Grenzen, etwa bei Kamera und KI: Kleine Schrift, bewegte Inhalte oder schwierige Lichtverhältnisse könnten die Qualität der Beschreibungen beeinträchtigen, zudem könnten KI-Systeme weiterhin halluzinieren. Letzteres kann für blinde und sehbehinderte Menschen ein Sicherheitsrisiko darstellen. Stéphanie Robieux, Mitgründerin und CEO von OOrion, sagte in der Gesprächsrunde, ihr Team arbeite eng mit Meta zusammen, um solche Risiken zu verringern. In der App weist das Start-up darauf hin, dass KI Fehler machen kann und Nutzer sich bei der Orientierung nicht allein auf die Anwendung verlassen sollten. Tino Krause, bei Meta für die DACH-Region verantwortlich, zeigt sich derweil überzeugt, dass das Risiko von Halluzinationen weiter sinken werde. Jede neue Generation großer Sprachmodelle reduziere die Fehleranfälligkeit deutlich. Die grundsätzliche Frage bleibt jedoch: Wo genau ziehen Meta und andere Anbieter die Grenze zwischen hilfreicher Alltagsassistenz und einer Mobilitätshilfe, für die deutlich höhere Anforderungen an Zuverlässigkeit, Haftung und Sicherheit gelten müssten? Hinzu kommen grundsätzliche Fragen zum Datenschutz. Eine Rechtsprofessorin warnte kürzlich, dass das Recht am eigenen Bild durch die zunehmende Verbreitung solcher Geräte schleichend ausgehöhlt werden könnte. Dabei macht es aus Datenschutzsicht keinen Unterschied, ob die Nutzer blind sind oder sehen können: Die Kamerabilder könnten dennoch an Dritte übermittelt werden. Datenschutz sei ein sehr sensibles Thema, bei dem der Verband derzeit noch um eine gemeinsame Position ringe, sagt Kay Schulze, der beim DBSV Projekte zur digitalen Barrierefreiheit leitet und ebenfalls an der Gesprächsrunde teilnahm. Auf die Frage, wie die Smart Glasses denn in der Szene wahrgenommen würden, meint Schulze, dass es wie überall auch hier Frühaneigner gebe und solche, die eher Vorsicht walten ließen. Darunter seien auch Menschen, die sich nicht wohl damit fühlten, dass ihre Daten auf den Servern amerikanischer Konzerne liegen und dort verarbeitet werden. Nichtsdestoweniger würden diese Brillen auf Konferenzen des DBSV verteilt, erprobt und diskutiert. Der Wortlaut des letzten Abschnitts wurde dahingehend geändert, dass klar wird, dass die eher kritische Position gegenüber kamerabasierten Smart Glasses von Einzelpersonen und nicht vom DBSV als Ganzem vertreten wird. Wir entschuldigen uns für den Fehler.

KI-Update: Google I/O-Fazit, Anthropic, Nvidia, Gehirn und KI-Parallelen

heise_ki·2026-05-22WirtschaftModelleAnwendungen

Fazit von der Google I/O

Auf der Entwicklerkonferenz Google I/O drehte sich in diesem Jahr alles um künstliche Intelligenz. Andere Themen wie Hardware oder Android traten in den Hintergrund. Zehn Jahre nach seiner "AI first"-Strategie will Google nun Geld mit KI verdienen und trennt dabei zwischen alltäglichen Funktionen für Privatnutzer und teurer agentischer KI.

Für letztere führte Google einen neuen Tarif für 100 US-Dollar im Monat ein, zwischen dem bekannten 20-Dollar-Tarif und dem Ultratarif für 250 Dollar. Für Dienste wie Google Spark, einen rund um die Uhr verfügbaren KI-Agenten, wird der Ultratarif faktisch nötig. Mit der vorgestellten Universal Cart, einem händlerübergreifenden Einkaufswagen, will Google zudem an jedem Online-Einkauf mitverdienen. Suche, YouTube und Gmail fließen darin zusammen. Für Händler droht damit eine ähnliche Abhängigkeit wie bei Amazons Marketplace. Google reagiert damit auch auf das absehbare Schrumpfen seines Werbegeschäfts, da KI-Zusammenfassungen in der Suche Nutzer von Websites fernhalten.

Anthropic schreibt als erstes KI-Labor schwarze Zahlen

Anthropic steht vor seinem ersten profitablen Quartal. Laut dem Wall Street Journal erwartet das Unternehmen im zweiten Quartal einen operativen Gewinn von 559 Millionen Dollar bei einem Umsatz von 10,9 Milliarden Dollar, ein Sprung von 130 Prozent gegenüber dem Vorquartal. Noch im vergangenen Sommer hatte Anthropic Investoren gesagt, vor 2028 keinen Jahresgewinn zu erwarten. Haupttreiber ist das Programmierwerkzeug Claude Code.

Auch die Preise steigen. Anthropics Spitzenmodell Opus 4.7 kostet pro Token gleich viel wie der Vorgänger, nutzt aber einen neuen Tokenizer, der für denselben Text bis zu 47 Prozent mehr Einheiten erzeugt. Bei OpenAIs neuem GPT-5.5 haben sich die Listenpreise gegenüber dem Vorgänger verdoppelt. Anders als OpenAI nutzt Anthropic vorwiegend günstigere Chips von Google und Amazon und finanziert kein großes Gratisnutzergeschäft. Direkte Vergleiche bleiben schwierig, da Anthropic Verkäufe über Cloud-Partner als eigenen Umsatz zählt, OpenAI nicht.

Endlich einheitliche KI-Kennzeichnung? Gemeinsame Sache bei OpenAI und Google

Google und OpenAI wollen ihre KI-Inhalte künftig mit dem Wasserzeichen SynthID und dem Metadaten-Standard Content Credentials kennzeichnen. Erstmals setzen damit zwei große Anbieter auf dasselbe System, möglicherweise ein Schritt zu einem branchenweiten Standard. Metadaten allein reichen nicht aus, da sie sich leicht entfernen lassen. Wasserzeichen dagegen sind direkt im Medium eingebettet und für das menschliche Auge unsichtbar.

Ab August 2026 verlangt der EU AI Act eine klare Kennzeichnung von KI-Inhalten in Europa, bei Verstößen drohen hohe Strafen. Für Nutzer gibt es allerdings noch keine einheitliche Prüfmethode, da viele Anbieter nur die Markierungen ihrer eigenen Produkte auslesen können.

Weiterlesen

Fazit von der Google I/O

Auf der Entwicklerkonferenz Google I/O drehte sich in diesem Jahr alles um künstliche Intelligenz. Andere Themen wie Hardware oder Android traten in den Hintergrund. Zehn Jahre nach seiner "AI first"-Strategie will Google nun Geld mit KI verdienen und trennt dabei zwischen alltäglichen Funktionen für Privatnutzer und teurer agentischer KI.

Für letztere führte Google einen neuen Tarif für 100 US-Dollar im Monat ein, zwischen dem bekannten 20-Dollar-Tarif und dem Ultratarif für 250 Dollar. Für Dienste wie Google Spark, einen rund um die Uhr verfügbaren KI-Agenten, wird der Ultratarif faktisch nötig. Mit der vorgestellten Universal Cart, einem händlerübergreifenden Einkaufswagen, will Google zudem an jedem Online-Einkauf mitverdienen. Suche, YouTube und Gmail fließen darin zusammen. Für Händler droht damit eine ähnliche Abhängigkeit wie bei Amazons Marketplace. Google reagiert damit auch auf das absehbare Schrumpfen seines Werbegeschäfts, da KI-Zusammenfassungen in der Suche Nutzer von Websites fernhalten.

Anthropic schreibt als erstes KI-Labor schwarze Zahlen

Anthropic steht vor seinem ersten profitablen Quartal. Laut dem Wall Street Journal erwartet das Unternehmen im zweiten Quartal einen operativen Gewinn von 559 Millionen Dollar bei einem Umsatz von 10,9 Milliarden Dollar, ein Sprung von 130 Prozent gegenüber dem Vorquartal. Noch im vergangenen Sommer hatte Anthropic Investoren gesagt, vor 2028 keinen Jahresgewinn zu erwarten. Haupttreiber ist das Programmierwerkzeug Claude Code.

Auch die Preise steigen. Anthropics Spitzenmodell Opus 4.7 kostet pro Token gleich viel wie der Vorgänger, nutzt aber einen neuen Tokenizer, der für denselben Text bis zu 47 Prozent mehr Einheiten erzeugt. Bei OpenAIs neuem GPT-5.5 haben sich die Listenpreise gegenüber dem Vorgänger verdoppelt. Anders als OpenAI nutzt Anthropic vorwiegend günstigere Chips von Google und Amazon und finanziert kein großes Gratisnutzergeschäft. Direkte Vergleiche bleiben schwierig, da Anthropic Verkäufe über Cloud-Partner als eigenen Umsatz zählt, OpenAI nicht.

Endlich einheitliche KI-Kennzeichnung? Gemeinsame Sache bei OpenAI und Google

Google und OpenAI wollen ihre KI-Inhalte künftig mit dem Wasserzeichen SynthID und dem Metadaten-Standard Content Credentials kennzeichnen. Erstmals setzen damit zwei große Anbieter auf dasselbe System, möglicherweise ein Schritt zu einem branchenweiten Standard. Metadaten allein reichen nicht aus, da sie sich leicht entfernen lassen. Wasserzeichen dagegen sind direkt im Medium eingebettet und für das menschliche Auge unsichtbar.

Ab August 2026 verlangt der EU AI Act eine klare Kennzeichnung von KI-Inhalten in Europa, bei Verstößen drohen hohe Strafen. Für Nutzer gibt es allerdings noch keine einheitliche Prüfmethode, da viele Anbieter nur die Markierungen ihrer eigenen Produkte auslesen können.

Avatare und Augmented Reality: Apple schnappt sich kleines Start-up

Apple hat im Rahmen eines Asset-Deals Materialien, Rechte und womöglich auch Mitarbeiter eines auf Augmented-Reality-Systeme und Avatare spezialisierten Start-ups übernommen. Die Firma Animato, die unter anderem die KI-Tutoring-Lösung Call Annie entwickelt hat, war in Kalifornien beheimatet. Der Kauf wurde über Berichtspflichten im Rahmen des Digital Market Act (DMA) der EU-Kommission bekannt. Typische Apple-Aufkaufstrategie Apple erkaufte sich demnach das Recht, Animatos laufende Patentanträge zu übernehmen, bekommt Lizenzen für das geistige Eigentum der Firma (interessanterweise allerdings nicht exklusiv) und erhält die Erlaubnis, Mitarbeiter zu übernehmen. Laut der Beschreibung auf der EU-Website entwickelt und vertreibt Animato „Software, die virtuelle Avatare für Videochats und Lehre kreiert“. Der Vorgang bedeutet keine direkte Übernahme von Animato, sondern es gehen nur Assets an Apple über. Durch die Erlaubnis, Mitarbeitern Angebote zu machen, wird aus dem Deal zudem ein „Acqui-Hire“, also eine Kombination aus Teilübernahme und dem Versuch, Talente anzuwerben. Apple führt solche Käufe regelmäßig durch, hat dadurch bereits wichtige Funktionen, Apps und Techniken ins Unternehmen geholt. Zu den bekannten Akquisitionen zählt die Mannschaft hinter iTunes (aus dem später Apple Music wurde) oder das Team hinter den visionOS-Avataren. Auch die Sprachassistentin Siri stammt ursprünglich nicht von Apple selbst.

Diverse KI- und Augmented-Reality-Firmen übernommen Es ist unklar, was Apple mit dem Animato-Know-how plant. Oftmals kann es Jahre dauern, bis aus einem solchen Aufkauf ein Produkt wird. Zuletzt hatte Apple unter anderem die Firmen WhyLabs, Mayday Labs, TrueMeeting und PromptAI übernommen. Gerade in spezielleren Bereichen wie Augmented Reality oder KI scheinen sich solche Erwerbungen zu lohnen. Allerdings kommt es auch vor, dass die dadurch ins Unternehmen kommenden Mitarbeiter dieses nach Ablauf ihrer Verträge sofort wieder verlassen. Apple hatte zuletzt etwa massiv mit Abgängen aus seiner KI-Abteilung zu kämpfen – Mitarbeiter ließen sich von besseren Angeboten wie denen von OpenAI, Anthropic oder Meta anlocken. Seit einigen Monaten ist hier aber wieder mehr Ruhe eingekehrt. Letzter großer Abgang war die Verrentung des KI-Chefs John Giannandrea.

Weiterlesen

Apple hat im Rahmen eines Asset-Deals Materialien, Rechte und womöglich auch Mitarbeiter eines auf Augmented-Reality-Systeme und Avatare spezialisierten Start-ups übernommen. Die Firma Animato, die unter anderem die KI-Tutoring-Lösung Call Annie entwickelt hat, war in Kalifornien beheimatet. Der Kauf wurde über Berichtspflichten im Rahmen des Digital Market Act (DMA) der EU-Kommission bekannt. Typische Apple-Aufkaufstrategie Apple erkaufte sich demnach das Recht, Animatos laufende Patentanträge zu übernehmen, bekommt Lizenzen für das geistige Eigentum der Firma (interessanterweise allerdings nicht exklusiv) und erhält die Erlaubnis, Mitarbeiter zu übernehmen. Laut der Beschreibung auf der EU-Website entwickelt und vertreibt Animato „Software, die virtuelle Avatare für Videochats und Lehre kreiert“. Der Vorgang bedeutet keine direkte Übernahme von Animato, sondern es gehen nur Assets an Apple über. Durch die Erlaubnis, Mitarbeitern Angebote zu machen, wird aus dem Deal zudem ein „Acqui-Hire“, also eine Kombination aus Teilübernahme und dem Versuch, Talente anzuwerben. Apple führt solche Käufe regelmäßig durch, hat dadurch bereits wichtige Funktionen, Apps und Techniken ins Unternehmen geholt. Zu den bekannten Akquisitionen zählt die Mannschaft hinter iTunes (aus dem später Apple Music wurde) oder das Team hinter den visionOS-Avataren. Auch die Sprachassistentin Siri stammt ursprünglich nicht von Apple selbst.

Diverse KI- und Augmented-Reality-Firmen übernommen Es ist unklar, was Apple mit dem Animato-Know-how plant. Oftmals kann es Jahre dauern, bis aus einem solchen Aufkauf ein Produkt wird. Zuletzt hatte Apple unter anderem die Firmen WhyLabs, Mayday Labs, TrueMeeting und PromptAI übernommen. Gerade in spezielleren Bereichen wie Augmented Reality oder KI scheinen sich solche Erwerbungen zu lohnen. Allerdings kommt es auch vor, dass die dadurch ins Unternehmen kommenden Mitarbeiter dieses nach Ablauf ihrer Verträge sofort wieder verlassen. Apple hatte zuletzt etwa massiv mit Abgängen aus seiner KI-Abteilung zu kämpfen – Mitarbeiter ließen sich von besseren Angeboten wie denen von OpenAI, Anthropic oder Meta anlocken. Seit einigen Monaten ist hier aber wieder mehr Ruhe eingekehrt. Letzter großer Abgang war die Verrentung des KI-Chefs John Giannandrea.

Airbnb personalisiert App mit KI

heise_ki·2026-05-22AnwendungenWirtschaft

Die Unterkünfte-Plattform Airbnb will ihren Dienst stärker individuell auf einzelne Nutzer zuschneiden und setzt dafür auf Künstliche Intelligenz. Unter anderem sollen bei der Anzeige der Beschreibung Merkmale hervorgehoben werden, von denen man wisse, dass sie für die konkreten Kunden relevant seien, sagte Mitgründer Nathan Blecharczyk der dpa. Habe man etwa in der Vergangenheit öfter Unterkünfte mit einem Pool gebucht, werde das bei der Ansicht anderer Angebote prominent angezeigt. Künstliche Intelligenz soll auch bei der Auswertung von Bewertungen auf der Plattform zum Einsatz kommen. „Wir haben mehr als eine Milliarde Bewertungen auf der Plattform. Sie werden sie nicht alle lesen“, sagte Blecharczyk. KI soll stattdessen den Inhalt der Bewertungen zu einzelnen Themen zusammenfassen. Dabei werden Aspekte hervorgehoben, die besonders häufig in den Bewertungen vorkommen: Etwa Lage, Sauberkeit, Anbindung, Heizung, Check-In-Verfahren oder Lärm.

Hotels bei Airbnb Airbnb setzt zudem stärker auf zusätzliche Dienstleistungen. Über die App soll man künftig unter anderem auch Mietwagen, Kofferaufbewahrung oder Lebensmittel-Lieferungen buchen können. Zudem will die Firma Erlebnisse wie Touren, Verkostungen oder Workshops prominenter anbieten. Airbnb konkurriert zwar grundsätzlich mit der Hotel-Industrie. Die Firma bot allerdings schon seit Jahren zusätzlich Aufenthalte in Boutique-Hotels an. Doch inzwischen sorge man dafür, dass auf der Plattform in allen relevanten Stadtteilen auch Hotelzimmer im Angebot seien, sagte Blecharczyk. „Wir erkennen an, dass selbst unsere loyalsten Airbnb-Kunden immer noch manchmal Hotels buchen.“ Das könne in manchen Fällen die bessere Lösung sein, zum Beispiel auf Dienstreisen oder nur einer Übernachtung. Und anstatt sie zu einer anderen Website zu schicken, wolle Airbnb auch diesen Markt bedienen.

Weiterlesen

Die Unterkünfte-Plattform Airbnb will ihren Dienst stärker individuell auf einzelne Nutzer zuschneiden und setzt dafür auf Künstliche Intelligenz. Unter anderem sollen bei der Anzeige der Beschreibung Merkmale hervorgehoben werden, von denen man wisse, dass sie für die konkreten Kunden relevant seien, sagte Mitgründer Nathan Blecharczyk der dpa. Habe man etwa in der Vergangenheit öfter Unterkünfte mit einem Pool gebucht, werde das bei der Ansicht anderer Angebote prominent angezeigt. Künstliche Intelligenz soll auch bei der Auswertung von Bewertungen auf der Plattform zum Einsatz kommen. „Wir haben mehr als eine Milliarde Bewertungen auf der Plattform. Sie werden sie nicht alle lesen“, sagte Blecharczyk. KI soll stattdessen den Inhalt der Bewertungen zu einzelnen Themen zusammenfassen. Dabei werden Aspekte hervorgehoben, die besonders häufig in den Bewertungen vorkommen: Etwa Lage, Sauberkeit, Anbindung, Heizung, Check-In-Verfahren oder Lärm.

Hotels bei Airbnb Airbnb setzt zudem stärker auf zusätzliche Dienstleistungen. Über die App soll man künftig unter anderem auch Mietwagen, Kofferaufbewahrung oder Lebensmittel-Lieferungen buchen können. Zudem will die Firma Erlebnisse wie Touren, Verkostungen oder Workshops prominenter anbieten. Airbnb konkurriert zwar grundsätzlich mit der Hotel-Industrie. Die Firma bot allerdings schon seit Jahren zusätzlich Aufenthalte in Boutique-Hotels an. Doch inzwischen sorge man dafür, dass auf der Plattform in allen relevanten Stadtteilen auch Hotelzimmer im Angebot seien, sagte Blecharczyk. „Wir erkennen an, dass selbst unsere loyalsten Airbnb-Kunden immer noch manchmal Hotels buchen.“ Das könne in manchen Fällen die bessere Lösung sein, zum Beispiel auf Dienstreisen oder nur einer Übernachtung. Und anstatt sie zu einer anderen Website zu schicken, wolle Airbnb auch diesen Markt bedienen.

Betrug im App Store: Apple stoppt laut eigenen Angaben Milliarden-Verluste

Die Gefahr durch betrügerische Apps nimmt laut Zahlen von Apple eher zu als ab. Apples App-Review-Team (beziehungsweise dessen KI-System) habe im vergangenen Jahr über 2 Millionen potenziell problematische Apps abgelehnt, teilte das Unternehmen mit. Im Jahr 2024 lag die Zahl noch bei 1,9 Millionen. Auch die Summe an betrügerischen Zahlungen, die Apple laut eigenen Angaben verhindert hat, stieg: Von 2 Milliarden auf 2,2 Milliarden US-Dollar. Damit will man in den letzten sechs Jahren insgesamt 11,2 Milliarden Dollar an Betrügereien verhindert haben. Mehr Betrug, mehr Schaden Besonders erstaunlich: 2025 soll es 1,1 Milliarden Versuche gegeben haben, betrügerische App-Store-Accounts anzulegen, die Apple verhindern konnte. Die Zahl lag im Vorjahr noch bei 711 Millionen. Böswillige Akteure hätten ihre Methoden zum Betrug weiterentwickelt und nutzten unter anderem Bot-Netzwerke zur Account-Erstellung. Die Anzahl der Kundenzugänge, die Apple nachträglich aufgrund von Betrug und Missbrauch deaktiviert hat, sank allerdings: von rund 130 Millionen 2024 auf nun 40,4 Millionen. Bei den Entwickleraccounts, ohne die keine App im App Store landet, wurden 193.000 wegen Betrugsverdacht gekündigt. 138.000 Anmeldungen wurden laut Apple direkt abgelehnt. Apple will zudem 28.000 unzulässige Apps auf Piraten-Websites identifiziert und „blockiert“ haben, so der Konzern, darunter Glücksspiel, Schadcode, Pornografie und Kopien regulärer Apps. „Durch die Einschränkung dieser Storefronts und illegalen Vertriebskanäle schützt Apple Entwicklerinnen und Entwickler außerdem davor, dass ihre Apps geklont, verändert oder als Waffe für die Verbreitung von Schadsoftware missbraucht werden“, behauptet der Konzern. Allerdings macht er es Entwicklern alternativer App-Marktplätze nicht leicht, diese erfolgreich zu machen.

Immer mehr Vibecoding-Apps Apple verhindert das Ausführen problematischer Apps auch aktiv. Allein im vergangenen Monat habe man Installation oder Start 2,9 Millionen Mal verhindert, die „die illegal außerhalb des App Store oder zugelassener alternativer App-Marktplätze verbreitet“ worden seien. Apple will seine Erkennungswerkzeuge im Rahmen des App-Reviews verbessert haben. Das ist auch notwendig, da immer mehr Apps per Vibecoding entwickelt werden. Man habe hier einen sprunghaften Anstieg an Einreichungen verzeichnet. „Im Jahr 2025 hat das App-Review-Team mehr als 9,1 Millionen App-Einreichungen geprüft und damit dazu beigetragen, mehr als 306.000 neue Entwicklerinnen und Entwickler auf der Plattform willkommen zu heißen“, so das Unternehmen. Zwei Millionen App-Einreichungen, 1,2 Millionen davon neu und 800.000 Updates, wurden abgelehnt. 22.000 davon sollen „versteckte oder nicht dokumentierte Funktionen“ enthalten haben, 371.000 kopierten andere Apps, waren Spam oder führten Nutzer laut Apple „in die Irre“. Datenschutzprobleme stellte Apple in 443.000 Einreichungen fest und lehnte diese ab.

Weiterlesen

Die Gefahr durch betrügerische Apps nimmt laut Zahlen von Apple eher zu als ab. Apples App-Review-Team (beziehungsweise dessen KI-System) habe im vergangenen Jahr über 2 Millionen potenziell problematische Apps abgelehnt, teilte das Unternehmen mit. Im Jahr 2024 lag die Zahl noch bei 1,9 Millionen. Auch die Summe an betrügerischen Zahlungen, die Apple laut eigenen Angaben verhindert hat, stieg: Von 2 Milliarden auf 2,2 Milliarden US-Dollar. Damit will man in den letzten sechs Jahren insgesamt 11,2 Milliarden Dollar an Betrügereien verhindert haben. Mehr Betrug, mehr Schaden Besonders erstaunlich: 2025 soll es 1,1 Milliarden Versuche gegeben haben, betrügerische App-Store-Accounts anzulegen, die Apple verhindern konnte. Die Zahl lag im Vorjahr noch bei 711 Millionen. Böswillige Akteure hätten ihre Methoden zum Betrug weiterentwickelt und nutzten unter anderem Bot-Netzwerke zur Account-Erstellung. Die Anzahl der Kundenzugänge, die Apple nachträglich aufgrund von Betrug und Missbrauch deaktiviert hat, sank allerdings: von rund 130 Millionen 2024 auf nun 40,4 Millionen. Bei den Entwickleraccounts, ohne die keine App im App Store landet, wurden 193.000 wegen Betrugsverdacht gekündigt. 138.000 Anmeldungen wurden laut Apple direkt abgelehnt. Apple will zudem 28.000 unzulässige Apps auf Piraten-Websites identifiziert und „blockiert“ haben, so der Konzern, darunter Glücksspiel, Schadcode, Pornografie und Kopien regulärer Apps. „Durch die Einschränkung dieser Storefronts und illegalen Vertriebskanäle schützt Apple Entwicklerinnen und Entwickler außerdem davor, dass ihre Apps geklont, verändert oder als Waffe für die Verbreitung von Schadsoftware missbraucht werden“, behauptet der Konzern. Allerdings macht er es Entwicklern alternativer App-Marktplätze nicht leicht, diese erfolgreich zu machen.

Immer mehr Vibecoding-Apps Apple verhindert das Ausführen problematischer Apps auch aktiv. Allein im vergangenen Monat habe man Installation oder Start 2,9 Millionen Mal verhindert, die „die illegal außerhalb des App Store oder zugelassener alternativer App-Marktplätze verbreitet“ worden seien. Apple will seine Erkennungswerkzeuge im Rahmen des App-Reviews verbessert haben. Das ist auch notwendig, da immer mehr Apps per Vibecoding entwickelt werden. Man habe hier einen sprunghaften Anstieg an Einreichungen verzeichnet. „Im Jahr 2025 hat das App-Review-Team mehr als 9,1 Millionen App-Einreichungen geprüft und damit dazu beigetragen, mehr als 306.000 neue Entwicklerinnen und Entwickler auf der Plattform willkommen zu heißen“, so das Unternehmen. Zwei Millionen App-Einreichungen, 1,2 Millionen davon neu und 800.000 Updates, wurden abgelehnt. 22.000 davon sollen „versteckte oder nicht dokumentierte Funktionen“ enthalten haben, 371.000 kopierten andere Apps, waren Spam oder führten Nutzer laut Apple „in die Irre“. Datenschutzprobleme stellte Apple in 443.000 Einreichungen fest und lehnte diese ab.

Nach Schuss in den Kopf: Wie argentinische Aktivist*innen einen Polizisten vor Gericht brachten

netzpolitik·2026-05-21GesellschaftAnwendungenForschung

Vor guten einem Jahr bohrte sich eine Tränengaspatrone in den Schädel des Fotografen Pablo Grillo. Der Polizist, der die Waffe abgefeuert hat, steht heute vor Gericht. Möglich war das nur, weil sich Freiwillige tagelang durch Videos gewühlt haben.

Fabian Grillo, der Vater von Pablo Grillo, auf einer Demonstration in Buenos Aires im März 2025. – Alle Rechte vorbehalten: IMAGO / NurPhoto

In Argentinien ist Pablo Grillos Überlebenskampf zu einem landesweiten Symbol für Pressefreiheit geworden. Am 12. März 2025 schoss ihm ein Polizist während einer Demonstration mit einer Tränengaspatrone in den Kopf. Grillo rang tagelang um sein Leben.

Der Polizist, der den 36-jährigen Fotografen fast tötete, steht nun vor Gericht. Das ist allerdings nicht den Sicherheitsbehörden oder der Regierung zu verdanken. Zur Anklage kam es nur, weil das Kollektiv „ Mapa de la Policia “ Aufnahmen der Demonstration mit Mitteln der digitalen Forensik auswertete, den Täter eindeutig identifizierte und ihm strafrechtlich relevantes Fehlverhalten nachwies.

Polizeigewalt sichtbar machen

Polizeigewalt gehört in Argentinien zum Alltag. Egal, ob es sich um Proteste gegen die Arbeitsreform, die Verwässerung des Gletscherschutzgesetzes, Kürzungen der Sozialhilfe für Menschen mit Behinderungen oder die wöchentlichen Demonstrationen der Rentner*innen handelt – stets setzen Polizeieinheiten dabei gewaltsam ein Gesetz durch, das den Straßenprotest seit dem Amtsantritt von Präsident Javier Milei empfindlich einschränkt.

Die Polizeigewalt gab es jedoch schon vor Milei. Im Jahr 2022 hat das Kollektiv „Mapa de la Policia“ damit begonnen, diese Gewalt in Buenos Aires zu dokumentieren. Das Kollektiv besteht aus Einzelpersonen und in Argentinien renommierten zivilgesellschaftlichen Organisationen wie der Bürgerrechts-NGO „ Centro de Estudios Legales y Sociales “ (CELS) und „ La Coordinadora Contra la Represión Policial e Institucional “ (CORREPI); außerdem sind die regierungskritischen Publikationen „ Grito del Sur “ und „ crisis “ dabei.

Alex ist einer der Aktivist*innen des Kollektivs. Er erklärt, dass die Regierung das Ausmaß der Polizeigewalt vertuschen will. Die Karte diene dazu, die tagtägliche polizeiliche Gewalt gegen Straßenhändler*innen, Sexarbeiter*innen, Menschen mit Migrationsgeschichte und Obdachlose sichtbar zu machen.

Auf der Webseite des Kollektivs können Betroffene oder Zeug*innen über ein Formular Fälle melden und einer Kategorie zuweisen. Dazu zählen allgemeine unverhältnismäßige Gewaltanwendung oder der leichtfertige Schusswaffeneinsatz mit und ohne Todesfolge. Fälle, die strafrechtlich relevant sein können, verfolgt das Kollektiv mit forensischen Analysen und Rechtsbeistand. Außerdem sind Dienststellen gewalttätiger Polizisten ausgewiesen, um mögliche Versetzungen nachzuverfolgen, erklärt Alex.

Alles netzpolitisch Relevante

Drei Mal pro Woche als Newsletter in deiner Inbox.

Jetzt abonnieren

Screenshot Mapa de la Policia, https://mapadelapolicia.com

Der Fall Pablo Grillo liest sich wie ein Krimi

Bereits seit längerem demonstrieren Renter*innen jeden Mittwoch in Buenos Aires für bessere Lebensbedingungen und bezahlbare Medikamente. Am 12. März 2025 ist jedoch eines anders als sonst: Zum ersten Mal beteiligen sich Fans der lokalen Fußball-Klubs an ihrem Protest, um ihm zusätzliche Aufmerksamkeit zu verschaffen.

Die damalige Sicherheitsministerin Patricia Bullrich hatte im Vorfeld gedroht, dass die Polizei streng durchgreifen werde, sollten die Demonstrierenden das Recht verletzen. Mitglieder des Kollektivs „Mapa de la Policia“ und der Fotograf Pablo Grillo sind vor Ort, um zu beobachten und zu berichten. Als sich auf der Demonstration herumspricht, dass Grillo schwer verletzt ist, reagiert das Kollektiv sofort. Die Chronik der Aufklärung liest sich wie ein Krimi.

Umgehend beginnt das Kollektiv Foto- und Videobeweise zu sammeln, was sich alsbald als hilfreich erweisen wird. Denn Ministerin Bullrich wird später behaupten, die Polizeibeamten träfe keine Schuld. Die Patrone müsse an einer Barrikade abgeprallt sein, die die Demonstrierenden selbst errichtet hatten. Doch schon wenig später kann das „Mapa“-Kollektiv erste Ergebnisse ihrer Analysen liefern: Sie nennen Uhrzeit, Art des Projektils sowie den Ort der Schussabgabe. Und sie können nachweisen, dass die Polizei an dem Tag wiederholt direkt auf Demonstrierende geschossen hat.

Pablo Grillo und sein Vater Fabián Grillo im April 2026 vor Pablos Reha-Klinik in Buenos Aires.

Wer hat sie verraten? Metadaten!

Innerhalb von Stunden wächst der Fall Grillo zu einem nationalen Skandal heran. Immer mehr Menschen schicken ihre Aufnahmen an das Kollektiv. Vier Tage lang werten die rund zehn Analyst*innen rund um die Uhr Unmengen an Material aus, darunter Fotos und Videos aus Smartphones, dem Fernsehen, von zivilgesellschaftlichen Drohnen und von Pressevertreter*innen. Standortdaten von Smartphones der Zeug*innen fließen ebenso in die Analysen ein wie Geräusche und sogar die Grüntöne der Uniformen der verschiedenen Polizeieinheiten der Hauptstadt. Sogenannte „Künstliche Intelligenz“ kann bei dieser hochsensiblen Feinarbeit nicht helfen, sagt Alex. Das sei Handarbeit.

Auch die letzten Aufnahmen aus der Kamera von Pablo Grillo sind unter dem gesammeltem Material. Zu diesem Zeitpunkt wusste noch niemand, ob der Fotograf überleben wird.

Nach vier Tagen präsentiert das Kollektiv das Gesamtbild. Die identifizierte Gaspatrone darf laut gesetzlichen Vorgaben aufgrund ihres Tötungsrisikos niemals direkt auf Körper gerichtet werden. Das Kollektiv kann jedoch beweisen, dass die Nationalgendarmerie (GNA) mehrfach direkt auf Demonstrierende gefeuert hat. Auch den Täter, der auf Grillo schoss, können sie eindeutig identifizieren: Héctor Guerrero. Und damit waren auch die Befehlsführer der Polizei-Operation bekannt, die die Verantwortung für den Polizeieinsatz tragen – und die Operation nach den ersten Schüssen auf die Demonstrierenden nicht stoppten.

Die Beweislage ist eindeutig, der Täter wird angeklagt

Die Beweise der „Mapa de la Policia“ waren bestechend eindeutig, sodass die Familie von Pablo Grillo mit Unterstützung von CELS und der Argentinischen Liga für Menschenrechte Klage gegen Guerrero wegen schwerer Körperverletzung unter Amts- und Waffenmissbrauch erheben konnte.

Wir sind ein spendenfinanziertes Medium.

Unterstütze auch Du unsere Arbeit mit einer Spende.

Jetzt spenden

Das Kollektiv musste erst lernen, wie es die Beweise gerichtsfest macht. Beraten wurden sie von dem Forensiker Guillermo „Willy“ Pregliasco, der auch an der Auswertung der Bildmaterialien beteiligt war. Pregliasco ist Gerichtsmediziner beim renommierten argentinischen Forschungsinsitut „ Consejo Nacional de Investigaciones Científicas y Técnicas “ (CONICET). Eine seiner Methoden diente als Inspiration für die US-amerikanische Serie „CSI Miami“. Außerdem unterstützte sie die Heinrich-Böll-Stiftung in Buenos Aires .

Das ganze Land nahm monatelang Anteil an der gesundheitlichen Rehabilitation von Pablo Grillo, der mehrfach operiert wurde. Erst nach mehr als einem Jahr, im April 2026, kehrte er nach Hause zurück . Grillo hat durch den Schuss Gehirnmasse verloren, bleibende Folgeschäden können derzeit nicht ausgeschlossen werden.

Die „Mapa de la Policia“ wird verfilmt

Das Verfahren gegen den Polizisten Guerrero läuft derzeit noch. Bei Instagram und TikTok kommuniziert das Kollektiv mittlerweile schwerpunktmäßig seine Leitfäden zum Schutz vor Polizeigewalt und stellt Angebote für psychologische und juristische Begleitung vor. Alex sagt, dass Aktivist*innen nicht zum „ Chilling-Effekt “ beitragen wollen. Die Menschen hätten ohnehin schon Angst, an Demonstrationen teilzunehmen.

Dank der Beteiligung von NGOs und Presseorganen verspüren die Einzelpersonen im Kollektiv jedoch keine Angst. Die einzige Sorge, die Alex derzeit umtreibt, ist die Finanzierung seines Films: Er produziert eine Dokumentation über die „Mapa de la Policia“, eine Co-Produktion mit dem argentinischen Verband der Dokumentarfilmer*innen „ Documentalistas de Argentina “ (DOCA). Die Produktion wird zumindest teilweise gefördert von der Rosa-Luxemburg-Stiftung in Buenos Aires und der Omega Research Foundation . Im Juni 2026 werden Mitglieder des Kollektivs in Berlin sein.

Nina Galla ist Pressesprecherin für AlgorithmWatch in Berlin. In ihrer Freizeit beschäftigt sie sich mit den Auswirkungen von KI in der Schule und schreibt seit 2025 über die digital-politische Entwicklung in Argentinien.

Weiterlesen

Vor guten einem Jahr bohrte sich eine Tränengaspatrone in den Schädel des Fotografen Pablo Grillo. Der Polizist, der die Waffe abgefeuert hat, steht heute vor Gericht. Möglich war das nur, weil sich Freiwillige tagelang durch Videos gewühlt haben.

Fabian Grillo, der Vater von Pablo Grillo, auf einer Demonstration in Buenos Aires im März 2025. – Alle Rechte vorbehalten: IMAGO / NurPhoto

In Argentinien ist Pablo Grillos Überlebenskampf zu einem landesweiten Symbol für Pressefreiheit geworden. Am 12. März 2025 schoss ihm ein Polizist während einer Demonstration mit einer Tränengaspatrone in den Kopf. Grillo rang tagelang um sein Leben.

Der Polizist, der den 36-jährigen Fotografen fast tötete, steht nun vor Gericht. Das ist allerdings nicht den Sicherheitsbehörden oder der Regierung zu verdanken. Zur Anklage kam es nur, weil das Kollektiv „ Mapa de la Policia “ Aufnahmen der Demonstration mit Mitteln der digitalen Forensik auswertete, den Täter eindeutig identifizierte und ihm strafrechtlich relevantes Fehlverhalten nachwies.

Polizeigewalt sichtbar machen

Polizeigewalt gehört in Argentinien zum Alltag. Egal, ob es sich um Proteste gegen die Arbeitsreform, die Verwässerung des Gletscherschutzgesetzes, Kürzungen der Sozialhilfe für Menschen mit Behinderungen oder die wöchentlichen Demonstrationen der Rentner*innen handelt – stets setzen Polizeieinheiten dabei gewaltsam ein Gesetz durch, das den Straßenprotest seit dem Amtsantritt von Präsident Javier Milei empfindlich einschränkt.

Die Polizeigewalt gab es jedoch schon vor Milei. Im Jahr 2022 hat das Kollektiv „Mapa de la Policia“ damit begonnen, diese Gewalt in Buenos Aires zu dokumentieren. Das Kollektiv besteht aus Einzelpersonen und in Argentinien renommierten zivilgesellschaftlichen Organisationen wie der Bürgerrechts-NGO „ Centro de Estudios Legales y Sociales “ (CELS) und „ La Coordinadora Contra la Represión Policial e Institucional “ (CORREPI); außerdem sind die regierungskritischen Publikationen „ Grito del Sur “ und „ crisis “ dabei.

Alex ist einer der Aktivist*innen des Kollektivs. Er erklärt, dass die Regierung das Ausmaß der Polizeigewalt vertuschen will. Die Karte diene dazu, die tagtägliche polizeiliche Gewalt gegen Straßenhändler*innen, Sexarbeiter*innen, Menschen mit Migrationsgeschichte und Obdachlose sichtbar zu machen.

Auf der Webseite des Kollektivs können Betroffene oder Zeug*innen über ein Formular Fälle melden und einer Kategorie zuweisen. Dazu zählen allgemeine unverhältnismäßige Gewaltanwendung oder der leichtfertige Schusswaffeneinsatz mit und ohne Todesfolge. Fälle, die strafrechtlich relevant sein können, verfolgt das Kollektiv mit forensischen Analysen und Rechtsbeistand. Außerdem sind Dienststellen gewalttätiger Polizisten ausgewiesen, um mögliche Versetzungen nachzuverfolgen, erklärt Alex.

Alles netzpolitisch Relevante

Drei Mal pro Woche als Newsletter in deiner Inbox.

Jetzt abonnieren

Screenshot Mapa de la Policia, https://mapadelapolicia.com

Der Fall Pablo Grillo liest sich wie ein Krimi

Bereits seit längerem demonstrieren Renter*innen jeden Mittwoch in Buenos Aires für bessere Lebensbedingungen und bezahlbare Medikamente. Am 12. März 2025 ist jedoch eines anders als sonst: Zum ersten Mal beteiligen sich Fans der lokalen Fußball-Klubs an ihrem Protest, um ihm zusätzliche Aufmerksamkeit zu verschaffen.

Die damalige Sicherheitsministerin Patricia Bullrich hatte im Vorfeld gedroht, dass die Polizei streng durchgreifen werde, sollten die Demonstrierenden das Recht verletzen. Mitglieder des Kollektivs „Mapa de la Policia“ und der Fotograf Pablo Grillo sind vor Ort, um zu beobachten und zu berichten. Als sich auf der Demonstration herumspricht, dass Grillo schwer verletzt ist, reagiert das Kollektiv sofort. Die Chronik der Aufklärung liest sich wie ein Krimi.

Umgehend beginnt das Kollektiv Foto- und Videobeweise zu sammeln, was sich alsbald als hilfreich erweisen wird. Denn Ministerin Bullrich wird später behaupten, die Polizeibeamten träfe keine Schuld. Die Patrone müsse an einer Barrikade abgeprallt sein, die die Demonstrierenden selbst errichtet hatten. Doch schon wenig später kann das „Mapa“-Kollektiv erste Ergebnisse ihrer Analysen liefern: Sie nennen Uhrzeit, Art des Projektils sowie den Ort der Schussabgabe. Und sie können nachweisen, dass die Polizei an dem Tag wiederholt direkt auf Demonstrierende geschossen hat.

Pablo Grillo und sein Vater Fabián Grillo im April 2026 vor Pablos Reha-Klinik in Buenos Aires.

Wer hat sie verraten? Metadaten!

Innerhalb von Stunden wächst der Fall Grillo zu einem nationalen Skandal heran. Immer mehr Menschen schicken ihre Aufnahmen an das Kollektiv. Vier Tage lang werten die rund zehn Analyst*innen rund um die Uhr Unmengen an Material aus, darunter Fotos und Videos aus Smartphones, dem Fernsehen, von zivilgesellschaftlichen Drohnen und von Pressevertreter*innen. Standortdaten von Smartphones der Zeug*innen fließen ebenso in die Analysen ein wie Geräusche und sogar die Grüntöne der Uniformen der verschiedenen Polizeieinheiten der Hauptstadt. Sogenannte „Künstliche Intelligenz“ kann bei dieser hochsensiblen Feinarbeit nicht helfen, sagt Alex. Das sei Handarbeit.

Auch die letzten Aufnahmen aus der Kamera von Pablo Grillo sind unter dem gesammeltem Material. Zu diesem Zeitpunkt wusste noch niemand, ob der Fotograf überleben wird.

Nach vier Tagen präsentiert das Kollektiv das Gesamtbild. Die identifizierte Gaspatrone darf laut gesetzlichen Vorgaben aufgrund ihres Tötungsrisikos niemals direkt auf Körper gerichtet werden. Das Kollektiv kann jedoch beweisen, dass die Nationalgendarmerie (GNA) mehrfach direkt auf Demonstrierende gefeuert hat. Auch den Täter, der auf Grillo schoss, können sie eindeutig identifizieren: Héctor Guerrero. Und damit waren auch die Befehlsführer der Polizei-Operation bekannt, die die Verantwortung für den Polizeieinsatz tragen – und die Operation nach den ersten Schüssen auf die Demonstrierenden nicht stoppten.

Die Beweislage ist eindeutig, der Täter wird angeklagt

Die Beweise der „Mapa de la Policia“ waren bestechend eindeutig, sodass die Familie von Pablo Grillo mit Unterstützung von CELS und der Argentinischen Liga für Menschenrechte Klage gegen Guerrero wegen schwerer Körperverletzung unter Amts- und Waffenmissbrauch erheben konnte.

Wir sind ein spendenfinanziertes Medium.

Unterstütze auch Du unsere Arbeit mit einer Spende.

Jetzt spenden

Das Kollektiv musste erst lernen, wie es die Beweise gerichtsfest macht. Beraten wurden sie von dem Forensiker Guillermo „Willy“ Pregliasco, der auch an der Auswertung der Bildmaterialien beteiligt war. Pregliasco ist Gerichtsmediziner beim renommierten argentinischen Forschungsinsitut „ Consejo Nacional de Investigaciones Científicas y Técnicas “ (CONICET). Eine seiner Methoden diente als Inspiration für die US-amerikanische Serie „CSI Miami“. Außerdem unterstützte sie die Heinrich-Böll-Stiftung in Buenos Aires .

Das ganze Land nahm monatelang Anteil an der gesundheitlichen Rehabilitation von Pablo Grillo, der mehrfach operiert wurde. Erst nach mehr als einem Jahr, im April 2026, kehrte er nach Hause zurück . Grillo hat durch den Schuss Gehirnmasse verloren, bleibende Folgeschäden können derzeit nicht ausgeschlossen werden.

Die „Mapa de la Policia“ wird verfilmt

Das Verfahren gegen den Polizisten Guerrero läuft derzeit noch. Bei Instagram und TikTok kommuniziert das Kollektiv mittlerweile schwerpunktmäßig seine Leitfäden zum Schutz vor Polizeigewalt und stellt Angebote für psychologische und juristische Begleitung vor. Alex sagt, dass Aktivist*innen nicht zum „ Chilling-Effekt “ beitragen wollen. Die Menschen hätten ohnehin schon Angst, an Demonstrationen teilzunehmen.

Dank der Beteiligung von NGOs und Presseorganen verspüren die Einzelpersonen im Kollektiv jedoch keine Angst. Die einzige Sorge, die Alex derzeit umtreibt, ist die Finanzierung seines Films: Er produziert eine Dokumentation über die „Mapa de la Policia“, eine Co-Produktion mit dem argentinischen Verband der Dokumentarfilmer*innen „ Documentalistas de Argentina “ (DOCA). Die Produktion wird zumindest teilweise gefördert von der Rosa-Luxemburg-Stiftung in Buenos Aires und der Omega Research Foundation . Im Juni 2026 werden Mitglieder des Kollektivs in Berlin sein.

Nina Galla ist Pressesprecherin für AlgorithmWatch in Berlin. In ihrer Freizeit beschäftigt sie sich mit den Auswirkungen von KI in der Schule und schreibt seit 2025 über die digital-politische Entwicklung in Argentinien.

Digitalministerkonferenz: Wildberger will Datenschutz für KI-Einsatz in der Verwaltung schleifen

netzpolitik·2026-05-15RegulierungGesellschaftAnwendungen

Der durchdigitalisierte Staat soll her und das möglichst schnell. Darin sind sich Bund und Länder nach der Digitalministerkonferenz einig. Um Tempo zu machen, wollen die zuständigen Minister:innen mehr sogenannte Künstliche Intelligenz und weniger Datenschutz.

Karsten Wildberger (CDU), Kristina Sinemus (CDU) und Jan Pörksen (SPD) bei der fünften Digitalministerkonferenz im Hamburger Rathaus. – Alle Rechte vorbehalten: G. Schwering / Senatskanzlei Bürokratieabbau, Registermodernisierung, DeutschlandID: Auf diese Themen blickt Bundesdigitalminister Karsten Wildberger (CDU) schon seit längerem mit der KI-Brille. Spätestens seit Mittwoch weiß er die Länder dabei hinter sich. Auf der Pressekonferenz zur Digitalministerkonferenz (DMK) demonstrierten Wildberger, die hessische Digitalministerin Kristina Sinemus (CDU) und der Chef der Senatskanzlei Hamburg Jan Pörksen (SPD) Einigkeit bei diesem Thema. Alle drei betonten, dass man beim KI-Einsatz in der öffentlichen Verwaltung an einem Strang ziehe .

Seit 2024 treffen sich die Minister:innen, Senatoren und Staatssekretär:innen der Länder regelmäßig, um über digitalpolitische Entscheidungen zu diskutieren. Die fünfte DMK fand in Hamburg statt und knüpfte inhaltlich an die Föderale Modernisierungsagenda an. Die hatten Bundeskanzler Friedrich Merz (CDU) und die Regierungschef:innen der Länder im Dezember beschlossen. Die 200 Maßnahmen der Föderalen Modernisierungsagenda zielen vor allem darauf ab, Bürokratie abzubauen. Bund und Länder wollen etwa bis Ende 2026 Berichtspflichten für die öffentliche Verwaltung prüfen, um mindestens die Hälfte von ihnen zu streichen.

Ein weiteres Ziel ist ein durchgehend digitalisierter Staat. Zwar lehnte die DMK einen Antrag Schleswig-Holsteins zu „digital only“ ab. Demnach sollen Verwaltungsbehörden nur noch rein digitale Prozesse anbieten und auf papiergebundene Arbeit verzichten. Doch die Uneinigkeit sei nicht inhaltlich begründet, so Sinemus und Wildberger, sondern darin, bis wann dieses Ziel erreicht sein soll. Das Ziel digital only sehen der Koalitionsvertrag und die Föderale Modernisierungsagenda vor. „Der Weg führt klar in diese Richtung“, sagt Wildberger.

Mit KI zurück an die Spitze

Und dieser Weg ist gepflastert mit KI-Projekten. Nur so ließen sich laut Digitalminister ein durchgehend digitaler Staat erreichen und die Wettbewerbsfähigkeit Deutschlands stärken. Daher freut sich Wildberger nach eigenen Angaben auch über Deutschlands Wirkmacht beim KI-Omnibus auf EU-Ebene. Mit der jüngst erzielten Einigung erhalte die Industrie nun „mehr Freiraum“, so der Minister. Die Industrie solle auch bei der Umsetzung des Deutschland-Stacks eine wichtigere Rolle einnehmen.

Seinen Fokus auf generative KI hat Wildberger bereits zu seinem Amtsantritt eingenommen. Besonders deutlich wurde das etwa auf dem Gipfel zur Europäischen Digitalen Souveränität im November vergangenen Jahres und auf der Münchener Sicherheitskonferenz im vergangenen Februar. Im November begrüßte der Minister ausdrücklich die Kooperation des französischen KI-Start-ups Mistral und des deutschen Softwareunternehmens SAP, die nun gemeinsam eine KI-Lösung für die öffentliche Verwaltung bereitstellen wollen. Und er unterzeichnete die deutsch-kanadische Absichtserklärung für nachhaltige Rechenzentren und „wertebasierte KI-Politik“.

Diese wertebasierte Politik sieht der Minister etwa in der bundeseigenen KI-Plattform KIPITZ vom ITZBund und im „preisgekrönten Projekt SPARK “ umgesetzt. Damit sei Deutschland bei KI-basierten Verwaltungsanwendungen sogar „weltweit führend“, lässt sich der Minister auf der Projektwebsite zitieren. Unter dem Projekt SPARK seien demnach mehrere KI-gestützte Genehmigungsverfahren entwickelt worden, die Beschäftigte wirksam entlasten sollen. Neben der Bundesverwaltung würden sie bereits im Stadtstaat Hamburg und im Land Mecklenburg-Vorpommern zum Einsatz kommen, so Wildberger.

Generative KI versus Datenschutz

Mit SPARK will Wildberger auch die schleppende Verwaltungsdigitalisierung adressieren. Fachleute sehen den Ansatz des Ministers kritisch, weil er KI einsetzt, statt Informationen in maschinenlesbare Formate zu übertragen, was die Automatisierung der Verwaltung deutlich beschleunigen und effizienter machen würde. Der Minister füge dem Problemberg nur noch weitere Schichten hinzu, so die Kritik .

Gleichzeitig will Wildberger Hindernisse aus dem Weg räumen, die aus seiner Sicht einer Nutzung von KI-Sprachmodellen im Wege stünden. Ganz oben auf der Liste: der Datenschutz. Laut Föderaler Modernisierungsagenda will der Bund spätestens Ende 2027 eine neue Regelung im Bundesdatenschutzgesetz vorschlagen, „die es öffentlichen Stellen zum Zwecke des Trainings und Einsatzes von KI erlaubt, personenbezogene Daten zu anonymisieren oder zu pseudonymisieren “.

Auch brauche es „eine stärker risikobasierte Ausrichtung der Datenschutz-Grundverordnung“, heißt es in der Modernisierungsagenda weiter, um etwa die Arbeit von KI-Reallaboren zu erleichtern. Das betreffe unter anderem die Einwilligung von Betroffenen und die Zweckbindung der verwendeten Daten.

Nach der Datenschutzgrundverordnung (DSGVO) wie auch nach dem Bundesdatenschutzgesetz dürfen personenbezogene Daten grundsätzlich nicht verarbeitet werden, es sei denn die betroffene Person willigt ausdrücklich ein oder es gibt für den entsprechenden Fall eine gesetzliche Grundlage.

Offene Fragen spielen keine Rolle auf der Digitalministerkonferenz

Die bestehenden datenschutzrechtlichen Bestimmungen würden zu streng ausgelegt und übererfüllt, aus Angst, etwas falsch zu machen, sagte Wildberger am Mittwoch. Außerdem brauche es nicht 17 unterschiedliche Datenschutzgesetze und auch keine Pflicht für die Länder, eigene Datenschutzbeauftragte zu bestellen. Das alles bremse die Digitalisierung staatlicher Verwaltungsprozesse aus, etwa mit Blick auf den Datenaustausch zwischen Behörden.

Auch die Datennutzung, die für das Training von KI-Sprachmodellen eine wesentliche Voraussetzung ist, will der Minister erleichtern. Dazu müssten Bund und Länder an den geltenden Datenschutz-Rechtsrahmen ran, der sich mit dem Einsatz von KI nur schwer vereinbaren ließe, wie auch die Bundesdatenschutzbeauftragte Louisa Specht-Riemenschneider im Dezember gegenüber netzpolitik.org sagte . So sei etwa unklar, wie man Betroffenenrechte und Löschansprüche bei KI-Systemen nach dem Training geltend macht, sagt Specht-Riemenschneider.

Derartige Fragen, die eigentlich einer größeren gesellschaftlichen Debatte bedürfen, tauchen im Beschluss zum „Paradigmenwechsel im Datenschutz“ der DMK allerdings nicht auf. Auch hier sind sich alle Beteiligten offenbar einig.

Weiterlesen

Der durchdigitalisierte Staat soll her und das möglichst schnell. Darin sind sich Bund und Länder nach der Digitalministerkonferenz einig. Um Tempo zu machen, wollen die zuständigen Minister:innen mehr sogenannte Künstliche Intelligenz und weniger Datenschutz.

Karsten Wildberger (CDU), Kristina Sinemus (CDU) und Jan Pörksen (SPD) bei der fünften Digitalministerkonferenz im Hamburger Rathaus. – Alle Rechte vorbehalten: G. Schwering / Senatskanzlei Bürokratieabbau, Registermodernisierung, DeutschlandID: Auf diese Themen blickt Bundesdigitalminister Karsten Wildberger (CDU) schon seit längerem mit der KI-Brille. Spätestens seit Mittwoch weiß er die Länder dabei hinter sich. Auf der Pressekonferenz zur Digitalministerkonferenz (DMK) demonstrierten Wildberger, die hessische Digitalministerin Kristina Sinemus (CDU) und der Chef der Senatskanzlei Hamburg Jan Pörksen (SPD) Einigkeit bei diesem Thema. Alle drei betonten, dass man beim KI-Einsatz in der öffentlichen Verwaltung an einem Strang ziehe .

Seit 2024 treffen sich die Minister:innen, Senatoren und Staatssekretär:innen der Länder regelmäßig, um über digitalpolitische Entscheidungen zu diskutieren. Die fünfte DMK fand in Hamburg statt und knüpfte inhaltlich an die Föderale Modernisierungsagenda an. Die hatten Bundeskanzler Friedrich Merz (CDU) und die Regierungschef:innen der Länder im Dezember beschlossen. Die 200 Maßnahmen der Föderalen Modernisierungsagenda zielen vor allem darauf ab, Bürokratie abzubauen. Bund und Länder wollen etwa bis Ende 2026 Berichtspflichten für die öffentliche Verwaltung prüfen, um mindestens die Hälfte von ihnen zu streichen.

Ein weiteres Ziel ist ein durchgehend digitalisierter Staat. Zwar lehnte die DMK einen Antrag Schleswig-Holsteins zu „digital only“ ab. Demnach sollen Verwaltungsbehörden nur noch rein digitale Prozesse anbieten und auf papiergebundene Arbeit verzichten. Doch die Uneinigkeit sei nicht inhaltlich begründet, so Sinemus und Wildberger, sondern darin, bis wann dieses Ziel erreicht sein soll. Das Ziel digital only sehen der Koalitionsvertrag und die Föderale Modernisierungsagenda vor. „Der Weg führt klar in diese Richtung“, sagt Wildberger.

Mit KI zurück an die Spitze

Und dieser Weg ist gepflastert mit KI-Projekten. Nur so ließen sich laut Digitalminister ein durchgehend digitaler Staat erreichen und die Wettbewerbsfähigkeit Deutschlands stärken. Daher freut sich Wildberger nach eigenen Angaben auch über Deutschlands Wirkmacht beim KI-Omnibus auf EU-Ebene. Mit der jüngst erzielten Einigung erhalte die Industrie nun „mehr Freiraum“, so der Minister. Die Industrie solle auch bei der Umsetzung des Deutschland-Stacks eine wichtigere Rolle einnehmen.

Seinen Fokus auf generative KI hat Wildberger bereits zu seinem Amtsantritt eingenommen. Besonders deutlich wurde das etwa auf dem Gipfel zur Europäischen Digitalen Souveränität im November vergangenen Jahres und auf der Münchener Sicherheitskonferenz im vergangenen Februar. Im November begrüßte der Minister ausdrücklich die Kooperation des französischen KI-Start-ups Mistral und des deutschen Softwareunternehmens SAP, die nun gemeinsam eine KI-Lösung für die öffentliche Verwaltung bereitstellen wollen. Und er unterzeichnete die deutsch-kanadische Absichtserklärung für nachhaltige Rechenzentren und „wertebasierte KI-Politik“.

Diese wertebasierte Politik sieht der Minister etwa in der bundeseigenen KI-Plattform KIPITZ vom ITZBund und im „preisgekrönten Projekt SPARK “ umgesetzt. Damit sei Deutschland bei KI-basierten Verwaltungsanwendungen sogar „weltweit führend“, lässt sich der Minister auf der Projektwebsite zitieren. Unter dem Projekt SPARK seien demnach mehrere KI-gestützte Genehmigungsverfahren entwickelt worden, die Beschäftigte wirksam entlasten sollen. Neben der Bundesverwaltung würden sie bereits im Stadtstaat Hamburg und im Land Mecklenburg-Vorpommern zum Einsatz kommen, so Wildberger.

Generative KI versus Datenschutz

Mit SPARK will Wildberger auch die schleppende Verwaltungsdigitalisierung adressieren. Fachleute sehen den Ansatz des Ministers kritisch, weil er KI einsetzt, statt Informationen in maschinenlesbare Formate zu übertragen, was die Automatisierung der Verwaltung deutlich beschleunigen und effizienter machen würde. Der Minister füge dem Problemberg nur noch weitere Schichten hinzu, so die Kritik .

Gleichzeitig will Wildberger Hindernisse aus dem Weg räumen, die aus seiner Sicht einer Nutzung von KI-Sprachmodellen im Wege stünden. Ganz oben auf der Liste: der Datenschutz. Laut Föderaler Modernisierungsagenda will der Bund spätestens Ende 2027 eine neue Regelung im Bundesdatenschutzgesetz vorschlagen, „die es öffentlichen Stellen zum Zwecke des Trainings und Einsatzes von KI erlaubt, personenbezogene Daten zu anonymisieren oder zu pseudonymisieren “.

Auch brauche es „eine stärker risikobasierte Ausrichtung der Datenschutz-Grundverordnung“, heißt es in der Modernisierungsagenda weiter, um etwa die Arbeit von KI-Reallaboren zu erleichtern. Das betreffe unter anderem die Einwilligung von Betroffenen und die Zweckbindung der verwendeten Daten.

Nach der Datenschutzgrundverordnung (DSGVO) wie auch nach dem Bundesdatenschutzgesetz dürfen personenbezogene Daten grundsätzlich nicht verarbeitet werden, es sei denn die betroffene Person willigt ausdrücklich ein oder es gibt für den entsprechenden Fall eine gesetzliche Grundlage.

Offene Fragen spielen keine Rolle auf der Digitalministerkonferenz

Die bestehenden datenschutzrechtlichen Bestimmungen würden zu streng ausgelegt und übererfüllt, aus Angst, etwas falsch zu machen, sagte Wildberger am Mittwoch. Außerdem brauche es nicht 17 unterschiedliche Datenschutzgesetze und auch keine Pflicht für die Länder, eigene Datenschutzbeauftragte zu bestellen. Das alles bremse die Digitalisierung staatlicher Verwaltungsprozesse aus, etwa mit Blick auf den Datenaustausch zwischen Behörden.

Auch die Datennutzung, die für das Training von KI-Sprachmodellen eine wesentliche Voraussetzung ist, will der Minister erleichtern. Dazu müssten Bund und Länder an den geltenden Datenschutz-Rechtsrahmen ran, der sich mit dem Einsatz von KI nur schwer vereinbaren ließe, wie auch die Bundesdatenschutzbeauftragte Louisa Specht-Riemenschneider im Dezember gegenüber netzpolitik.org sagte . So sei etwa unklar, wie man Betroffenenrechte und Löschansprüche bei KI-Systemen nach dem Training geltend macht, sagt Specht-Riemenschneider.

Derartige Fragen, die eigentlich einer größeren gesellschaftlichen Debatte bedürfen, tauchen im Beschluss zum „Paradigmenwechsel im Datenschutz“ der DMK allerdings nicht auf. Auch hier sind sich alle Beteiligten offenbar einig.

Statt Datenstrategie: Digitalministerium will KI-Agenten für die Verwaltung

netzpolitik·2026-05-12AgentenRegulierungAnwendungen

Die Verwaltungsdigitalisierung ging in den vergangenen Jahren äußerst schleppend voran. Eine Ursache dafür: Die Verwaltung speichert ihr Wissen in Dokumenten ab statt als maschinenlesbare Daten. Statt das Problem anzugehen, macht sich das Digitalministerium für KI-Agenten stark. Die arbeiten jedoch intransparent und erzeugen übermäßig Fehler.

KI-Agenten sollen Mängel in der Informationsverwaltung überbrücken. (Symbolbild) – Gemeinfrei-ähnlich freigegeben durch unsplash.com: Teppich: Unsplash / Scott Webb; Grafik: netzpolitik.org, Montage: netzpolitik.org Ob für das Bearbeiten eines Antrags oder einer Bürger:innen-Anfrage, zur Entscheidungsfindung oder Haushaltsplanung – Verwaltungsarbeit ist zu großen Teilen Arbeit mit Informationen. Wichtig ist dabei, dass Mitarbeiter:innen diese Informationen leicht finden. Dafür müssen sie sich zurzeit noch durch einen Dschungel an Dokumenten schlagen. Vieles steckt in Akten, in physischen und digitalisierten, in PDFs oder Word-Dokumenten. Dokumente, die darauf warten, systematisch aufbereitet und durchsuchbar gemacht zu werden.

Seit Jahren fordern Expert:innen daher, für die öffentliche Verwaltung eine moderne Dateninfrastruktur zu bauen, Informationen als Linked Data (PDF) zu organisieren und verlässliche Daten-Standards zu nutzen. Das würde die Verwaltungsdigitalisierung beschleunigen.

Doch statt hier in eine nachhaltige Strategie zu investieren, setzt Digitalminister Karsten Wildberger (CDU) lieber auf KI-Sprachmodelle. Die haben es nun in den Katalog des Deutschland-Stack s geschafft. Allerdings ist es zweifelhaft, ob sie den großen Hoffnungen des Ministers gerecht werden.

Gehypte KI-Agenten

Seit März dieses Jahres fördert das Bundesministerium für Digitales und Staatsmodernisierung (BMDS) im Rahmen des Agentic AI Hub kommunale Pilotprojekte, die mittels generativer KI Sachberarbeiter:innen Verwaltungsaufgaben abnehmen sollen.

Auch die Bundesverwaltung setze bereits KI-Agenten ein, erklärt Staatssekretär Thomas Jarzombek (CDU) im Ausschuss für Digitales und Staatsmodernisierung Mitte April zu seinem „Leib- und Magenthema“. Das sei im Digitalministerium in Sachen Verwaltungsdigitalisierung insgesamt das „Thema Nummer 1“.

So soll etwa der Agent „Spark“ dabei helfen, „Dutzende Aktenordner mit Gutachten und Unterlagen zu sichten und sie in wenigen Stunden auf Vollständigkeit und Plausibilität zu prüfen“. Damit könne die Verwaltung Vorgänge beschleunigen und bessere Entscheidungen treffen, so Jarzombek. Ziel sei es, die Versäumnisse bei der Verwaltungsdigitalisierung und Personalmangel auszugleichen.

Grundlegende Probleme bleiben ungelöst

Dass das Digitalministerium hier auf generative KI-Systeme setzt, wirke mehr wie eine kurzfristige Reaktion auf die Symptome der schleppenden Verwaltungsdigitalisierung als wie ein fundierter Umgang mit ihren ursächlichen Mängeln, so Stefan Kaufmann von Wikimedia Deutschland gegenüber netzpolitik.org.

Er fordert für die Verwaltung ein grundlegendes Umdenken. So sollten Informationen nicht wie bisher in Dokumenten, sondern in semantischen Daten und Wissensgraphen abgelegt werden. „Und wir brauchen die IT-Architekturen, um staatliche Informationen als semantische Daten zu speichern und wiederverwenden zu können“, sagt Kaufmann. Mit Wissengraphen können Informationen strukturiert dargestellt werden, sodass Computer Bedeutungzusammenhänge von Informationen verarbeiten können.

Vor gut einem Jahr veröffentlichte Wikimedia die Broschüre „Generative KI für die Verwaltung?“ und traf damit einen Nerv. Die gedruckte Fassung für die öffentliche Verwaltung war schnell vergriffen, vor Kurzem erschien ein Nachdruck.

Was Kaufmann unter anderem meint, wenn er sagt „in Daten denken“: Verwaltungswissen versteckt sich meistens in Texten, PDFs und Tabellen, die für menschliche Bearbeitung angelegt und gespeichert wurden. Einzelne Informationen müssen Suchende den Dokumenten meist mühsam entlocken. Es überrascht daher nicht, dass sich Verwaltungsmitarbeitende ein KI-System wünschen, das bestimmte Informationen aus einer Vielzahl von Dokumenten zusammensucht.

Automatisierung statt Sprachmodelle

In der Begeisterung für generative KI übersehen aus Sicht von Kaufmann sowohl Verwaltungsdigitalisierer als auch Minister Wildberger allerdings zweierlei: Zum einen sind generative KI-Systeme prinzipiell limitiert, zum anderen bieten gerade in der Verwaltung sogenannte logikbasierte Methoden ein bislang unausgeschöpftes Potenzial. Logikbasierte Methoden geben bei jeder Anfrage logisch das gleiche Ergebnis aus, das sich transparent auf die zugrundeliegenden Daten zurückführen lässt.

Doch dafür müssen staatliche Informationen als strukturierte und maschinenlesbare Daten vorliegen. Erst dann ließen sich zahlreiche Verwaltungsprozesse auf klassischem Wege automatisieren, sowohl in der internen Arbeit als auch in Kontakt mit Bürger:innen, Organisationen und Unternehmen.

Mitarbeitende in der Verwaltung erhielten so mehr Zeit für Beratung, weil sie weniger damit beschäftigt wären, Daten und Informationen manuell zusammenzutragen. „Sie könnten auch Sachverhalte automatisiert auswerten und zwar deterministisch und halluzinationsfrei“, so Kaufmann.

Verwaltungs-Chatbots machen Fehler

Ein solcher Ansatz würde allerdings eine nachhaltige Strategie erfordern, die bislang nicht in Sicht ist. Viele Kommunen setzen stattdessen auf Chatbots, um mit ihren Bürger:innen zu kommunizieren. Sie hoffen, so die bestehende Arbeitslast innerhalb der Behörden abzufedern. Aus ihrer Sicht sind die Bots außerdem attraktiv, weil sie diese bei externen IT-Dienstleistern einkaufen und dies haushalterisch abbilden können.

Der Berliner BärGPT , die Gersheimer Gerda Bürki oder der Hagener JOST – sie alle sollen auf Grundlage von Informationen, die auf einer städtischen Website zu finden sind, dazu Auskunft erteilen, wer eine Behördenabteilung leitet oder an wen sich Bürger:innen auf der Suche nach einem Kita-Platz wenden können.

Doch die Bots funktionieren so wie alle Large Language Models (LLMs, Sprachmodelle): nach dem Prinzip der statistischen Wahrscheinlichkeit. Und deshalb machen sie Fehler. Das belegte zuletzt etwa eine Studie der Europäischen Rundfunkunion im Oktober 2025. Demnach liegt die Fehlerquote in den Outputs von Chatbots wie Gemini, Copilot oder ChatGPT bei rund 45 Prozent. Bezeichnenderweise geben sie Informationen dann relativ korrekt aus, wenn die dafür nötigen Daten gut strukturiert vorliegen – also in der Form, die es auch als Grundlage für logikbasierte Auswertungen bräuchte.

Regelbasiert sticht Wahrscheinlichkeitsprinzip

Ob einem KI-Chatbot Fehler unterlaufen, wird allerdings erst dann ersichtlich, wenn Nutzer:innen die Ausgabe prüfen. Bezogen auf die Verwaltung hieße das, dass Sachbearbeiter:innen dafür zusätzliche Zeit einplanen müssen. Außerdem brauchen sie verlässliche Referenzdaten, um diese mit der KI-Antwort abgleichen zu können. Die Alternative dazu wäre ein automatischer Vorbehalt, sagt Kaufmann. „Wenn ich einen Bescheid bekomme, der mit generativer KI erstellt wurde, hätte ich damit das Recht auf nochmalige manuelle Prüfung.“

Auch bei Abfragen aus verteilten Wissensbeständen kämen Sprachmodelle schnell an ihre Grenzen, etwa wenn Nutzer:innen nach einer Liste deutscher Großstädte mit einer Oberbürgermeisterin fragen und diese nach Einwohnerzahl absteigend sortiert bekommen möchten. „Aus strukturierten Daten wie bei Wikidata lässt sich das mit simplen, regelbasierten Methoden und einem Bruchteil des Aufwands beantworten – und zwar verlässlich“, erklärt Kaufmann gegenüber netzpolitik.org. Dennoch investieren immer mehr Kommunen in Chatbots.

Statt den Umweg über KI-Sprachmodelle zu verfestigen, könnte die Verwaltung ihre Informationsbestände Schritt für Schritt in Richtung semantischer Datenspeicherung entwickeln. Das würde nicht nur die interne Weiterverwendung behördlicher Informationen vereinfachen, erklärt Kaufmann. Vielmehr könne man die Bestände auch mit symbolischen KI-Systemen verlässlich auswerten. „Das sind regelbasierte Systeme, die im Gegensatz zu LLMs und Agentensystemen nicht dem Zufall ausgesetzt sind.“ Außerdem seien sie deutlich sparsamer beim Energieverbrauch.

Auf diese Weise könne die Verwaltung Informationen, die bisher in Dokumenten oder Fachverfahren „gefangen“ waren, organisationsübergreifend auswerten und verwenden. Dabei könnten auch Unklarheiten in den Informationen auffallen, die Mitarbeitende direkt auf Quellenebene korrigieren könnten.

Aus Erfahrungswissen lernen

Die Verwaltung könnte hier aus vielen Jahren Vorarbeit von Projekten und Initiativen des digitalen Ehrenamts lernen, glaubt Kaufmann. Als Beispiel führt er das Projekt „kleineAnfragen“ an, wo Nutzer:innen alle kleinen und großen Anfragen deutscher Parlamente nach Stichwörtern durchsuchen, Anfragen automatisch analysieren und sie mit einer stabilen URL verlässlich verlinken konnten. Ein anderes Beispiel seien Web-Angebote wie „Meine Stadt Transparent“ und „Politik bei uns“, die Ratsdokumente besser durchsuchbar machten. Eine wesentliche Rolle spielte dabei der offene OParl-Standard, der es erlaubt, Dokumente maschinell auszuwerten.

Alle drei Angebote sind derzeit allerdings nicht mehr in Betrieb. „Sie waren als Freie-Software-Projekte quasi schlüsselfertig und „for public adoption“ gedacht – staatliche Stellen haben sie aber nie selbst übernommen“, erklärt Kaufmann. Es komme selten vor, dass in einer Behörde Menschen arbeiten, die die Potenziale dieser Systeme erkennen und sie dann, ohne lange Schleifen mit externen Dienstleistern durchlaufen zu müssen, selbst ausrollen können.

Das BMDS unter Karsten Wildberger ist hier offenbar keine Ausnahme. Die Bundestagsabgeordnete Sonja Lemke (Die Linke) fragte in der Ausschusssitzung Mitte April, ob das Digitalministerium regelbasierte Systeme prüfe oder auch Systeme, mit denen die Verwaltung ihre Informationen in maschinenlesbarer Form bringe und damit wiederverwendbar abspeichere. Einer klaren Beantwortung der Frage wich Staatssekretär Jarzombek aus.

Weiterlesen

Die Verwaltungsdigitalisierung ging in den vergangenen Jahren äußerst schleppend voran. Eine Ursache dafür: Die Verwaltung speichert ihr Wissen in Dokumenten ab statt als maschinenlesbare Daten. Statt das Problem anzugehen, macht sich das Digitalministerium für KI-Agenten stark. Die arbeiten jedoch intransparent und erzeugen übermäßig Fehler.

KI-Agenten sollen Mängel in der Informationsverwaltung überbrücken. (Symbolbild) – Gemeinfrei-ähnlich freigegeben durch unsplash.com: Teppich: Unsplash / Scott Webb; Grafik: netzpolitik.org, Montage: netzpolitik.org Ob für das Bearbeiten eines Antrags oder einer Bürger:innen-Anfrage, zur Entscheidungsfindung oder Haushaltsplanung – Verwaltungsarbeit ist zu großen Teilen Arbeit mit Informationen. Wichtig ist dabei, dass Mitarbeiter:innen diese Informationen leicht finden. Dafür müssen sie sich zurzeit noch durch einen Dschungel an Dokumenten schlagen. Vieles steckt in Akten, in physischen und digitalisierten, in PDFs oder Word-Dokumenten. Dokumente, die darauf warten, systematisch aufbereitet und durchsuchbar gemacht zu werden.

Seit Jahren fordern Expert:innen daher, für die öffentliche Verwaltung eine moderne Dateninfrastruktur zu bauen, Informationen als Linked Data (PDF) zu organisieren und verlässliche Daten-Standards zu nutzen. Das würde die Verwaltungsdigitalisierung beschleunigen.

Doch statt hier in eine nachhaltige Strategie zu investieren, setzt Digitalminister Karsten Wildberger (CDU) lieber auf KI-Sprachmodelle. Die haben es nun in den Katalog des Deutschland-Stack s geschafft. Allerdings ist es zweifelhaft, ob sie den großen Hoffnungen des Ministers gerecht werden.

Gehypte KI-Agenten

Seit März dieses Jahres fördert das Bundesministerium für Digitales und Staatsmodernisierung (BMDS) im Rahmen des Agentic AI Hub kommunale Pilotprojekte, die mittels generativer KI Sachberarbeiter:innen Verwaltungsaufgaben abnehmen sollen.

Auch die Bundesverwaltung setze bereits KI-Agenten ein, erklärt Staatssekretär Thomas Jarzombek (CDU) im Ausschuss für Digitales und Staatsmodernisierung Mitte April zu seinem „Leib- und Magenthema“. Das sei im Digitalministerium in Sachen Verwaltungsdigitalisierung insgesamt das „Thema Nummer 1“.

So soll etwa der Agent „Spark“ dabei helfen, „Dutzende Aktenordner mit Gutachten und Unterlagen zu sichten und sie in wenigen Stunden auf Vollständigkeit und Plausibilität zu prüfen“. Damit könne die Verwaltung Vorgänge beschleunigen und bessere Entscheidungen treffen, so Jarzombek. Ziel sei es, die Versäumnisse bei der Verwaltungsdigitalisierung und Personalmangel auszugleichen.

Grundlegende Probleme bleiben ungelöst

Dass das Digitalministerium hier auf generative KI-Systeme setzt, wirke mehr wie eine kurzfristige Reaktion auf die Symptome der schleppenden Verwaltungsdigitalisierung als wie ein fundierter Umgang mit ihren ursächlichen Mängeln, so Stefan Kaufmann von Wikimedia Deutschland gegenüber netzpolitik.org.

Er fordert für die Verwaltung ein grundlegendes Umdenken. So sollten Informationen nicht wie bisher in Dokumenten, sondern in semantischen Daten und Wissensgraphen abgelegt werden. „Und wir brauchen die IT-Architekturen, um staatliche Informationen als semantische Daten zu speichern und wiederverwenden zu können“, sagt Kaufmann. Mit Wissengraphen können Informationen strukturiert dargestellt werden, sodass Computer Bedeutungzusammenhänge von Informationen verarbeiten können.

Vor gut einem Jahr veröffentlichte Wikimedia die Broschüre „Generative KI für die Verwaltung?“ und traf damit einen Nerv. Die gedruckte Fassung für die öffentliche Verwaltung war schnell vergriffen, vor Kurzem erschien ein Nachdruck.

Was Kaufmann unter anderem meint, wenn er sagt „in Daten denken“: Verwaltungswissen versteckt sich meistens in Texten, PDFs und Tabellen, die für menschliche Bearbeitung angelegt und gespeichert wurden. Einzelne Informationen müssen Suchende den Dokumenten meist mühsam entlocken. Es überrascht daher nicht, dass sich Verwaltungsmitarbeitende ein KI-System wünschen, das bestimmte Informationen aus einer Vielzahl von Dokumenten zusammensucht.

Automatisierung statt Sprachmodelle

In der Begeisterung für generative KI übersehen aus Sicht von Kaufmann sowohl Verwaltungsdigitalisierer als auch Minister Wildberger allerdings zweierlei: Zum einen sind generative KI-Systeme prinzipiell limitiert, zum anderen bieten gerade in der Verwaltung sogenannte logikbasierte Methoden ein bislang unausgeschöpftes Potenzial. Logikbasierte Methoden geben bei jeder Anfrage logisch das gleiche Ergebnis aus, das sich transparent auf die zugrundeliegenden Daten zurückführen lässt.

Doch dafür müssen staatliche Informationen als strukturierte und maschinenlesbare Daten vorliegen. Erst dann ließen sich zahlreiche Verwaltungsprozesse auf klassischem Wege automatisieren, sowohl in der internen Arbeit als auch in Kontakt mit Bürger:innen, Organisationen und Unternehmen.

Mitarbeitende in der Verwaltung erhielten so mehr Zeit für Beratung, weil sie weniger damit beschäftigt wären, Daten und Informationen manuell zusammenzutragen. „Sie könnten auch Sachverhalte automatisiert auswerten und zwar deterministisch und halluzinationsfrei“, so Kaufmann.

Verwaltungs-Chatbots machen Fehler

Ein solcher Ansatz würde allerdings eine nachhaltige Strategie erfordern, die bislang nicht in Sicht ist. Viele Kommunen setzen stattdessen auf Chatbots, um mit ihren Bürger:innen zu kommunizieren. Sie hoffen, so die bestehende Arbeitslast innerhalb der Behörden abzufedern. Aus ihrer Sicht sind die Bots außerdem attraktiv, weil sie diese bei externen IT-Dienstleistern einkaufen und dies haushalterisch abbilden können.

Der Berliner BärGPT , die Gersheimer Gerda Bürki oder der Hagener JOST – sie alle sollen auf Grundlage von Informationen, die auf einer städtischen Website zu finden sind, dazu Auskunft erteilen, wer eine Behördenabteilung leitet oder an wen sich Bürger:innen auf der Suche nach einem Kita-Platz wenden können.

Doch die Bots funktionieren so wie alle Large Language Models (LLMs, Sprachmodelle): nach dem Prinzip der statistischen Wahrscheinlichkeit. Und deshalb machen sie Fehler. Das belegte zuletzt etwa eine Studie der Europäischen Rundfunkunion im Oktober 2025. Demnach liegt die Fehlerquote in den Outputs von Chatbots wie Gemini, Copilot oder ChatGPT bei rund 45 Prozent. Bezeichnenderweise geben sie Informationen dann relativ korrekt aus, wenn die dafür nötigen Daten gut strukturiert vorliegen – also in der Form, die es auch als Grundlage für logikbasierte Auswertungen bräuchte.

Regelbasiert sticht Wahrscheinlichkeitsprinzip

Ob einem KI-Chatbot Fehler unterlaufen, wird allerdings erst dann ersichtlich, wenn Nutzer:innen die Ausgabe prüfen. Bezogen auf die Verwaltung hieße das, dass Sachbearbeiter:innen dafür zusätzliche Zeit einplanen müssen. Außerdem brauchen sie verlässliche Referenzdaten, um diese mit der KI-Antwort abgleichen zu können. Die Alternative dazu wäre ein automatischer Vorbehalt, sagt Kaufmann. „Wenn ich einen Bescheid bekomme, der mit generativer KI erstellt wurde, hätte ich damit das Recht auf nochmalige manuelle Prüfung.“

Auch bei Abfragen aus verteilten Wissensbeständen kämen Sprachmodelle schnell an ihre Grenzen, etwa wenn Nutzer:innen nach einer Liste deutscher Großstädte mit einer Oberbürgermeisterin fragen und diese nach Einwohnerzahl absteigend sortiert bekommen möchten. „Aus strukturierten Daten wie bei Wikidata lässt sich das mit simplen, regelbasierten Methoden und einem Bruchteil des Aufwands beantworten – und zwar verlässlich“, erklärt Kaufmann gegenüber netzpolitik.org. Dennoch investieren immer mehr Kommunen in Chatbots.

Statt den Umweg über KI-Sprachmodelle zu verfestigen, könnte die Verwaltung ihre Informationsbestände Schritt für Schritt in Richtung semantischer Datenspeicherung entwickeln. Das würde nicht nur die interne Weiterverwendung behördlicher Informationen vereinfachen, erklärt Kaufmann. Vielmehr könne man die Bestände auch mit symbolischen KI-Systemen verlässlich auswerten. „Das sind regelbasierte Systeme, die im Gegensatz zu LLMs und Agentensystemen nicht dem Zufall ausgesetzt sind.“ Außerdem seien sie deutlich sparsamer beim Energieverbrauch.

Auf diese Weise könne die Verwaltung Informationen, die bisher in Dokumenten oder Fachverfahren „gefangen“ waren, organisationsübergreifend auswerten und verwenden. Dabei könnten auch Unklarheiten in den Informationen auffallen, die Mitarbeitende direkt auf Quellenebene korrigieren könnten.

Aus Erfahrungswissen lernen

Die Verwaltung könnte hier aus vielen Jahren Vorarbeit von Projekten und Initiativen des digitalen Ehrenamts lernen, glaubt Kaufmann. Als Beispiel führt er das Projekt „kleineAnfragen“ an, wo Nutzer:innen alle kleinen und großen Anfragen deutscher Parlamente nach Stichwörtern durchsuchen, Anfragen automatisch analysieren und sie mit einer stabilen URL verlässlich verlinken konnten. Ein anderes Beispiel seien Web-Angebote wie „Meine Stadt Transparent“ und „Politik bei uns“, die Ratsdokumente besser durchsuchbar machten. Eine wesentliche Rolle spielte dabei der offene OParl-Standard, der es erlaubt, Dokumente maschinell auszuwerten.

Alle drei Angebote sind derzeit allerdings nicht mehr in Betrieb. „Sie waren als Freie-Software-Projekte quasi schlüsselfertig und „for public adoption“ gedacht – staatliche Stellen haben sie aber nie selbst übernommen“, erklärt Kaufmann. Es komme selten vor, dass in einer Behörde Menschen arbeiten, die die Potenziale dieser Systeme erkennen und sie dann, ohne lange Schleifen mit externen Dienstleistern durchlaufen zu müssen, selbst ausrollen können.

Das BMDS unter Karsten Wildberger ist hier offenbar keine Ausnahme. Die Bundestagsabgeordnete Sonja Lemke (Die Linke) fragte in der Ausschusssitzung Mitte April, ob das Digitalministerium regelbasierte Systeme prüfe oder auch Systeme, mit denen die Verwaltung ihre Informationen in maschinenlesbarer Form bringe und damit wiederverwendbar abspeichere. Einer klaren Beantwortung der Frage wich Staatssekretär Jarzombek aus.

Import KI 451: Politische Superintelligenz; Googles Gesellschaft der Geister und ein Roboter-Schlagzeuger

Import AI 451: Politische Superintelligenz; Googles Gesellschaft der Geister und ein Roboter-Schlagzeuger

Gibt es noch Geister, die man zurück in die Flasche stecken kann?

Willkommen bei Import AI, einem Newsletter über KI-Forschung. Import AI lebt von arXiv und dem Feedback der Leser. Wenn Sie dies unterstützen möchten, abonnieren Sie bitte.

KI könnte uns den Bau einer "politischen Superintelligenz" ermöglichen:

…Aber dies in einen gesellschaftlichen Vorteil zu verwandeln, erfordert viel bewusste Arbeit…

Da KI-Systeme immer leistungsfähiger werden und ihre realen Auswirkungen vom Programmieren auf andere Bereiche ausweiten, scheint es wahrscheinlich, dass sie auch nützlich werden könnten, um Menschen dabei zu helfen, sich in der Politik selbst zu vertreten und Politikern dabei zu helfen, bessere Politik zu gestalten. Aber eine Welt zu erreichen, in der eine "politische Superintelligenz" existiert und uns hilft, ist weitaus anspruchsvoller, als nur bessere KI-Systeme zu bauen, so Andy Hall, Professor für politische Ökonomie an der Stanford University.

"KI ist bis zu einem gewissen Punkt wie die Druckerpresse. Anstatt Informationen billig und leicht verfügbar zu machen, macht sie Intelligenz billig und leicht verfügbar. Das heißt, sie liefert den Nutzern nicht nur Informationen, sondern kann sie für sie finden, für sie analysieren und ihnen helfen, sie in Verständnis umzuwandeln", schreibt Hall. "Je mehr ich mit KI arbeite und sie studiere, desto mehr glaube ich, dass sie jedem Menschen auf dem Planeten Zugang zu einer Art politischer Superintelligenz verschaffen kann, wenn wir sie richtig gestalten."

Was ist eine politische Superintelligenz? Damit meint Hall KI-Systeme, die es Menschen ermöglichen, "Werkzeuge zu haben, die Bürgern, Vertretern und Institutionen helfen, die Realität schärfer wahrzunehmen, Kompromisse zu verstehen, Macht anzufechten und effektiver zu handeln". Eine politische Superintelligenz umfasst sowohl die KI-Unternehmen, die die Technologie bauen, die Technologie selbst als auch die Institutionen und Menschen, mit denen die Technologie interagiert.

"Mich interessiert nicht, KI zu verlangsamen. Mich interessiert, wie wir den Aufbau der Strukturen beschleunigen können, die uns frei halten, während KI immer mächtiger wird", schreibt Hall.

Drei Schichten für politische Superintelligenz: Hall sieht politische Superintelligenz als aus drei verschiedenen Schichten bestehend.

Die Informationsschicht: "KI kann massiv verändern, wie Regierungen auf Daten zugreifen und sie verstehen, Probleme identifizieren, von Bürgern hören und Dienstleistungen verteilen". Dies zu erreichen, erfordert jedoch bessere Evaluierungen dafür, wie sich KI-Systeme in Bezug auf die Arten von Informationen verhalten, an denen Regierungen interessiert sein könnten, und es erfordert, dass Menschen KI-Werkzeuge direkt für politische Entscheidungsträger entwickeln.

Die Repräsentationsschicht: "Politische Superintelligenz könnte helfen, dieses Überwachungsproblem zu lösen, indem sie jedem von uns einen unermüdlichen, automatisierten Delegierten gibt, der uns stets im politischen Bereich dient", schreibt er. "Diese KI-Delegierten könnten die Politik für uns überwachen und vorschlagen, wie wir wählen sollen – oder sogar als politische Entscheidungsträger neben menschlichen Aufsehern fungieren." Der Aufbau dieser Schicht erfordert, dass wir sicherstellen, dass Agenten zuverlässig in unserem Namen handeln können, dass sie nicht durch adversariales Prompting beeinflusst werden (man stelle sich vor, wie Politiker Kampagnen finanzieren könnten, die speziell darauf ausgelegt sind, die Überzeugungen von Agenten zu beeinflussen, die im Auftrag von Menschen arbeiten). Es könnte auch wichtig sein, das Eigentum an Agenten zu überdenken – was passiert, wenn eine bestimmte politische Entscheidung gegen die Präferenzen des KI-Unternehmens geht, das die Agenten betreibt?

Die Governance-Schicht: "Selbst wenn wir politische Superintelligenz erreichen – selbst wenn KI Wähler brillant und Delegierte treu macht –, würden diese Fähigkeiten innerhalb einer Infrastruktur sitzen, die einer kleinen Anzahl privater Unternehmen gehört und von ihnen betrieben wird", schreibt er. "Wir brauchen eine Möglichkeit, die Regeln so zu schreiben, dass wir, das Volk, in der Lage sind, sie zu nutzen, wenn die politische Superintelligenz eintrifft." Dies erfordert, herauszufinden, wie man die 'Verfassungen' regiert und bearbeitet, die Unternehmen über ihre Modelle erstellen, sowie die Entwicklung einer effektiven Methode zur Überwachung dieser KI-Systeme.

Warum das wichtig ist – Der Bau einer politischen Superintelligenz ist nur so wertvoll wie ihre Schnittstellen zu Menschen und Institutionen: Wir werden standardmäßig extrem leistungsfähige KI-Systeme bekommen, die auf einem sehr anspruchsvollen Niveau über Politik (und alles andere) nachdenken können. Die Herausforderung, die Hall skizziert, besteht darin, dass es erheblicher bewusster Arbeit an der UX und UI dieser Systeme bedarf, damit diese Systeme zu einer florierenden Gesellschaft führen – wie interagieren wir mit ihnen? Welche technischen Mittel haben wir, um Vertrauen in sie zu haben? Welche Informationen generieren sie und für wen? Wo liegt die Kontrolle über diese Systeme und welche Systeme überwachen diese Kontrolle?

Um diesen Teil richtig hinzubekommen, müssen KI-Entwickler mehr in technische Werkzeuge investieren, die Menschen helfen können, ihre KI-Systeme zu verstehen und zu überwachen, sowie in Werkzeuge zur besseren Erfassung von deliberativem Feedback von Menschen darüber, wie sich diese Systeme verhalten. Politische Entscheidungsträger und die Öffentlichkeit müssen in dieser Hinsicht mehr von KI-Unternehmen fordern, und letztendlich denke ich, dass eine Reihe von Vorschriften rund um ein Transparenzregime für KI-Unternehmen sowie eine Reihe gemeinsamer standardisierter 'APIs' aufgebaut werden müssen, über die die Gesellschaft mit den Unternehmen und den von ihnen gebauten Systemen interagieren kann, um empirische Daten zu generieren und Steuerung über ihr Verhalten zu geben.

Mehr lesen: Building Political Superintelligence (Free Systems, Substack).

***

Keine Angst, Schlagzeuger, ihr seid vorerst sicher vor der KI-Automatisierung:

…DexDrummer nimmt sich eines teuflisch schwierigen Roboterhandproblems an…

Immer wenn ich mir ein wenig Sorgen über das Tempo des KI-Fortschritts mache, wechsle ich zum Unterbereich 'Robotik' auf arXiv, lese ein paar Paper und fühle mich enorm erleichtert. Roboter sind, wie jeder weiß, extrem schwierig gut zu machen, und die Realität neigt dazu, selbst die fortschrittlichsten Techniken zu durchkreuzen. Eine noch schwierigere Version der Robotik ist die feinkörnige, latenzarme, geschickte Steuerung, bei der man eine Roboterhand dazu bringen muss, etwas zu tun. Daher lese ich mit einer Mischung aus Belustigung und Mitgefühl DexDrummer, ein Paper, das testet, wie gut zeitgenössische KI-Ansätze eine Roboterhand dazu bringen können, Schlagzeug zu spielen. Die kurze Antwort lautet: Roboterhände sind ziemlich schreckliche Schlagzeuger!

Was sie gemacht haben: Sie bauten DexDrummer, "eine hierarchische, zweistufige Politik zum Trommeln", die eine High-Level-RL-Politik sowie eine Low-Level-Geschicklichkeitspolitik hat. Sie trainieren ihr System in einer simulierten Umgebung, die einen bimanuellen Roboteraufbau und ein komplettes Schlagzeug (Snare, Tom, Ride, Hi-Hat und Crash) enthält. Das Hauptsystem generiert eine Stocktrajektorie im Aufgabenraum, dann ein Low-Level-System, das versucht, die Hand zu steuern – dieser Teil ist komplex und beinhaltet, Daumen und Zeigefinger zu ermutigen, die Mitte des Drumsticks zu greifen, gepaart mit einer "Arm-Strafenbeschränkung, die übermäßige Armbewegungen reduziert". Es gibt auch Arbeiten zur Formung von Belohnungen, um sicherzustellen, dass der Roboter in der Lage ist, mehrere Trommelschläge aneinanderzureihen – dies wird durch einen "Kontaktlehrplan" erreicht, der es dem Agenten ermöglicht, das Verfolgen von Trajektorien im freien Raum zu üben, während er der Trajektorienbelohnung folgt.

Tests in der realen Welt: Sie testen die trainierte Politik in der Realität an zwei 7-DOF Franka Panda Armen und zwei 20-DOF Tesollo DG-5F Händen. Dies ist ein Bereich, in dem ich dringend empfehlen würde, sich die Videos online anzusehen, um ein Gefühl dafür zu bekommen, wie ungeheuer schwierig diese Aufgabe ist – die Roboter sind in der Lage, die Trommeln zu treffen, aber es ist schmerzhaft unbeholfen anzusehen, und ich habe das Gefühl, es wird noch eine ganze Weile dauern, bis ein menschlicher Schlagzeuger über die sprichwörtliche Schulter schauen muss.

Warum das wichtig ist – Robotik als letzte Evaluierung: Robotik in irgendetwas, das einer dynamischen, sich schnell verändernden Umgebung nahekommt (z. B. improvisiertes Trommeln mit einer Live-Band), fühlt sich wie eine der letzten Grenzen für KI an – und wie diese Forschung zeigt, erfordert es, ähnlich wie bei der modernen Computer-Vision-Forschung, das Handwerk hochkomplizierter, handgefertigter Politiken, um KI zu guten Leistungen zu bringen. Wir sind hier noch sehr weit von der Allgemeinheit vortrainierter Sprachmodelle entfernt.

Mehr lesen: DexDrummer: In-Hand, Contact-Rich, and Long-Horizon Dexterous Robot Drumming (arXiv).

Bitte, ich flehe Sie an, schauen Sie sich die Videos an, es lohnt sich: DexDrummer Seite.

***

Google glaubt, die eigentliche Herausforderung der KI-Ausrichtung ist der Umgang mit einer Welt, die hauptsächlich aus nicht-biologischen Intelligenzen besteht:

…Hin zu einer Gesellschaft der Geister…

Forscher von Google glauben, dass die Zukunft der Intelligenz weniger darin besteht, einen monolithischen Einzelgänger zu bauen, der die Welt regiert, sondern vielmehr darin, herauszufinden, wie man Institutionen baut, die in der Lage sind, mit einer enormen Verbreitung von KI-Agenten im Zusammenspiel mit Menschen umzugehen. Die Forschung ist intuitiv, provokativ und vernünftig und baut auf früheren technischen Arbeiten auf, die zeigten, dass moderne KI-Systeme mehrere Persönlichkeiten in sich zu simulieren scheinen, um Fragen zu beantworten (Import AI 444), was darauf hindeutet, dass selbst heutige KI-Systeme bereits wie komplexe Ökologien funktionieren.

"Wir sollten die nächste Intelligenzexplosion an demselben Ort suchen, von dem die vorherigen ausgingen: in kooperativer, kompetitiver und kreativer Interaktion zwischen einer Vielzahl sozial intelligenter Geister. Der Unterschied diesmal ist, dass die meisten dieser Geister nicht-biologisch sein werden", schreibt Google. "Die Werkzeugkästen der Teamwissenschaft, der Kleingruppensoziologie und der Sozialpsychologie werden zu Blaupausen für die nächste Generation der KI-Entwicklung."

Die Geschichte zeigt den Weg: "Jede vorherige 'Intelligenzexplosion' war kein Upgrade der individuellen kognitiven Hardware, sondern die Entstehung einer neuen, sozial aggregierten Einheit der Kognition", schreiben sie.

Primatenintelligenz: Skalierte mit der Größe der sozialen Gruppe.

Menschliche Sprache: Erlaubte die Akkumulation von Wissen über Generationen hinweg durch eine 'kulturelle Ratsche'.

Schrift, Gesetz und Bürokratie: Verwandelten soziale Intelligenz in Infrastruktur und Institutionen, die über lange Zeiträume koordinieren konnten. ("Ein sumerischer Schreiber, der ein Getreideabrechnungssystem betrieb, verstand dessen makroökonomische Funktion nicht; das System war funktional intelligenter als er.")

KI plus menschliche Institutionen: "Der Weg zu leistungsfähigerer KI führt nicht über den Bau eines einzigen kolossalen Orakels, sondern über das Zusammensetzen reichhaltigerer sozialer Systeme – und diese Systeme werden hybrid sein."

Die Gesellschaft braucht ein Upgrade: Dem ist implizit, dass die Steuerung von KI zunehmend die Verifizierung (z. B. Import AI #447) beinhalten wird, dass eine Vielzahl von KI-Systemen angemessen in unserem Auftrag arbeitet. "Regierungen werden KI-Systeme mit unterschiedlichen, explizit verankerten Werten benötigen – Transparenz, Gerechtigkeit, ordnungsgemäßes Verfahren –, deren Funktion es ist, KI-Systeme zu überprüfen und auszugleichen, die vom Privatsektor und anderen Regierungszweigen eingesetzt werden", schreiben sie.

Warum das wichtig ist – Alignment wird in und mit der Welt stattfinden, nicht außerhalb von ihr: Viele Menschen, die an KI-Sicherheit arbeiten, haben lange Zeit damit verbracht, die grundlegenden Eigenschaften eines einzelnen KI-Systems 'auszurichten', was grob übersetzt "tut, was du willst, und versucht nicht, dich zu töten oder zu entmachten" bedeutet. Aber was dieses Paper richtig erkennt, ist, dass wir, selbst wenn wir beim Alignment erfolgreich sind, dann KI-Systeme dazu bringen müssen, gut innerhalb der Gesellschaft zu funktionieren und effektiv mit uns und miteinander zu kollaborieren – und dies wird ein subtiler, emergenter, schwer vorhersagbarer Prozess sein. Das bedeutet, dass wir die Institutionen entwerfen müssen, die für die Steuerung einer KI-zentrierten Welt geeignet sind. "So wie menschliche Gesellschaften sich nicht auf individuelle Tugend verlassen, sondern auf beständige institutionelle Vorlagen – Gerichtssäle, Märkte, Bürokratien –, die durch Rollen und Normen definiert sind, werden skalierbare KI-Ökosysteme digitale Entsprechungen benötigen", schreiben die Forscher.

Mehr lesen: Agentic AI and the next intelligence explosion (arXiv).

***

Meta nutzt ein Geschirr, um Anthropics Modelle zur Selbstverbesserung zu bewegen:

…Gib einem LLM ein paar Werkzeuge und eine rekursive Schleife und die Fähigkeit, sein Geschirr zu bearbeiten, tritt einen Schritt zurück und lass die Magie geschehen…

Forscher der University of British Columbia, des Vector Institute, der University of Edinburgh, der New York University, von CIFAR und Meta haben ein Geschirr für LLMs gebaut, das die Fähigkeit zur Selbstverbesserung bei beliebigen Aufgaben hat. Der Ansatz wird Hyperagent genannt und bedeutet, einem LLM ein Gerüst zu geben, das iterativ die Prompts verbessern kann, die es verwendet, um seine Leistung bei Aufgaben zu verbessern, sowie das System, das es verwendet, um bei der Generierung zukünftiger Prompts besser zu werden. Hyperagents arbeiten über Generationen hinweg, so dass ein Hyperagent ein paar Hyperagents hervorbringt und diejenigen, die bei der Aufgabe am besten abschneiden, selbst einige weitere Hyperagents hervorbringen, wodurch mehrere Schichten einer KI-Genealogie entstehen, bis die Leistung gesättigt ist.

Cyberpunk-Namenspreis des Jahres: Hyperagent ist eigentlich die Kurzform für "Darwin Godel Machine Hyperagents": Abgesehen davon, dass die Forschung cool ist, meinen Glückwunsch an die Autoren, dass sie sich einen Namen ausgedacht haben, den ich gerne mit einem Laserstrahl, der von einer Superintelligenz geschwungen wird, in den Mond gemeißelt sehen würde.

Wie Hyperagents funktionieren: Hyperagents sind "selbstreferenzielle Agenten, die einen Aufgabenagenten (der die Zielaufgabe löst) und einen Metaagenten (der sich selbst und den Aufgabenagenten modifiziert) in einem einzigen editierbaren Programm integrieren. Entscheidend ist, dass das Meta-Level-Modifikationsverfahren selbst editierbar ist, was metakognitive Selbstmodifikation ermöglicht, die nicht nur das aufgabenlösende Verhalten verbessert, sondern auch den Mechanismus, der zukünftige Verbesserungen generiert", schreiben die Forscher. "Dieser anfängliche Hyperagent ist mit zwei Werkzeugen ausgestattet: einem Bash-Werkzeug zur Ausführung von Shell-Befehlen und einem spezialisierten Werkzeug zur Inspektion und Modifikation von Dateien."

Testen der Agenten in vier verschiedenen Bereichen: Die Aut

Weiterlesen

Import AI 451: Politische Superintelligenz; Googles Gesellschaft der Geister und ein Roboter-Schlagzeuger

Gibt es noch Geister, die man zurück in die Flasche stecken kann?

Willkommen bei Import AI, einem Newsletter über KI-Forschung. Import AI lebt von arXiv und dem Feedback der Leser. Wenn Sie dies unterstützen möchten, abonnieren Sie bitte.

KI könnte uns den Bau einer "politischen Superintelligenz" ermöglichen:

…Aber dies in einen gesellschaftlichen Vorteil zu verwandeln, erfordert viel bewusste Arbeit…

Da KI-Systeme immer leistungsfähiger werden und ihre realen Auswirkungen vom Programmieren auf andere Bereiche ausweiten, scheint es wahrscheinlich, dass sie auch nützlich werden könnten, um Menschen dabei zu helfen, sich in der Politik selbst zu vertreten und Politikern dabei zu helfen, bessere Politik zu gestalten. Aber eine Welt zu erreichen, in der eine "politische Superintelligenz" existiert und uns hilft, ist weitaus anspruchsvoller, als nur bessere KI-Systeme zu bauen, so Andy Hall, Professor für politische Ökonomie an der Stanford University.

"KI ist bis zu einem gewissen Punkt wie die Druckerpresse. Anstatt Informationen billig und leicht verfügbar zu machen, macht sie Intelligenz billig und leicht verfügbar. Das heißt, sie liefert den Nutzern nicht nur Informationen, sondern kann sie für sie finden, für sie analysieren und ihnen helfen, sie in Verständnis umzuwandeln", schreibt Hall. "Je mehr ich mit KI arbeite und sie studiere, desto mehr glaube ich, dass sie jedem Menschen auf dem Planeten Zugang zu einer Art politischer Superintelligenz verschaffen kann, wenn wir sie richtig gestalten."

Was ist eine politische Superintelligenz? Damit meint Hall KI-Systeme, die es Menschen ermöglichen, "Werkzeuge zu haben, die Bürgern, Vertretern und Institutionen helfen, die Realität schärfer wahrzunehmen, Kompromisse zu verstehen, Macht anzufechten und effektiver zu handeln". Eine politische Superintelligenz umfasst sowohl die KI-Unternehmen, die die Technologie bauen, die Technologie selbst als auch die Institutionen und Menschen, mit denen die Technologie interagiert.

"Mich interessiert nicht, KI zu verlangsamen. Mich interessiert, wie wir den Aufbau der Strukturen beschleunigen können, die uns frei halten, während KI immer mächtiger wird", schreibt Hall.

Drei Schichten für politische Superintelligenz: Hall sieht politische Superintelligenz als aus drei verschiedenen Schichten bestehend.

Die Informationsschicht: "KI kann massiv verändern, wie Regierungen auf Daten zugreifen und sie verstehen, Probleme identifizieren, von Bürgern hören und Dienstleistungen verteilen". Dies zu erreichen, erfordert jedoch bessere Evaluierungen dafür, wie sich KI-Systeme in Bezug auf die Arten von Informationen verhalten, an denen Regierungen interessiert sein könnten, und es erfordert, dass Menschen KI-Werkzeuge direkt für politische Entscheidungsträger entwickeln.

Die Repräsentationsschicht: "Politische Superintelligenz könnte helfen, dieses Überwachungsproblem zu lösen, indem sie jedem von uns einen unermüdlichen, automatisierten Delegierten gibt, der uns stets im politischen Bereich dient", schreibt er. "Diese KI-Delegierten könnten die Politik für uns überwachen und vorschlagen, wie wir wählen sollen – oder sogar als politische Entscheidungsträger neben menschlichen Aufsehern fungieren." Der Aufbau dieser Schicht erfordert, dass wir sicherstellen, dass Agenten zuverlässig in unserem Namen handeln können, dass sie nicht durch adversariales Prompting beeinflusst werden (man stelle sich vor, wie Politiker Kampagnen finanzieren könnten, die speziell darauf ausgelegt sind, die Überzeugungen von Agenten zu beeinflussen, die im Auftrag von Menschen arbeiten). Es könnte auch wichtig sein, das Eigentum an Agenten zu überdenken – was passiert, wenn eine bestimmte politische Entscheidung gegen die Präferenzen des KI-Unternehmens geht, das die Agenten betreibt?

Die Governance-Schicht: "Selbst wenn wir politische Superintelligenz erreichen – selbst wenn KI Wähler brillant und Delegierte treu macht –, würden diese Fähigkeiten innerhalb einer Infrastruktur sitzen, die einer kleinen Anzahl privater Unternehmen gehört und von ihnen betrieben wird", schreibt er. "Wir brauchen eine Möglichkeit, die Regeln so zu schreiben, dass wir, das Volk, in der Lage sind, sie zu nutzen, wenn die politische Superintelligenz eintrifft." Dies erfordert, herauszufinden, wie man die 'Verfassungen' regiert und bearbeitet, die Unternehmen über ihre Modelle erstellen, sowie die Entwicklung einer effektiven Methode zur Überwachung dieser KI-Systeme.

Warum das wichtig ist – Der Bau einer politischen Superintelligenz ist nur so wertvoll wie ihre Schnittstellen zu Menschen und Institutionen: Wir werden standardmäßig extrem leistungsfähige KI-Systeme bekommen, die auf einem sehr anspruchsvollen Niveau über Politik (und alles andere) nachdenken können. Die Herausforderung, die Hall skizziert, besteht darin, dass es erheblicher bewusster Arbeit an der UX und UI dieser Systeme bedarf, damit diese Systeme zu einer florierenden Gesellschaft führen – wie interagieren wir mit ihnen? Welche technischen Mittel haben wir, um Vertrauen in sie zu haben? Welche Informationen generieren sie und für wen? Wo liegt die Kontrolle über diese Systeme und welche Systeme überwachen diese Kontrolle?

Um diesen Teil richtig hinzubekommen, müssen KI-Entwickler mehr in technische Werkzeuge investieren, die Menschen helfen können, ihre KI-Systeme zu verstehen und zu überwachen, sowie in Werkzeuge zur besseren Erfassung von deliberativem Feedback von Menschen darüber, wie sich diese Systeme verhalten. Politische Entscheidungsträger und die Öffentlichkeit müssen in dieser Hinsicht mehr von KI-Unternehmen fordern, und letztendlich denke ich, dass eine Reihe von Vorschriften rund um ein Transparenzregime für KI-Unternehmen sowie eine Reihe gemeinsamer standardisierter 'APIs' aufgebaut werden müssen, über die die Gesellschaft mit den Unternehmen und den von ihnen gebauten Systemen interagieren kann, um empirische Daten zu generieren und Steuerung über ihr Verhalten zu geben.

Mehr lesen: Building Political Superintelligence (Free Systems, Substack).

***

Keine Angst, Schlagzeuger, ihr seid vorerst sicher vor der KI-Automatisierung:

…DexDrummer nimmt sich eines teuflisch schwierigen Roboterhandproblems an…

Immer wenn ich mir ein wenig Sorgen über das Tempo des KI-Fortschritts mache, wechsle ich zum Unterbereich 'Robotik' auf arXiv, lese ein paar Paper und fühle mich enorm erleichtert. Roboter sind, wie jeder weiß, extrem schwierig gut zu machen, und die Realität neigt dazu, selbst die fortschrittlichsten Techniken zu durchkreuzen. Eine noch schwierigere Version der Robotik ist die feinkörnige, latenzarme, geschickte Steuerung, bei der man eine Roboterhand dazu bringen muss, etwas zu tun. Daher lese ich mit einer Mischung aus Belustigung und Mitgefühl DexDrummer, ein Paper, das testet, wie gut zeitgenössische KI-Ansätze eine Roboterhand dazu bringen können, Schlagzeug zu spielen. Die kurze Antwort lautet: Roboterhände sind ziemlich schreckliche Schlagzeuger!

Was sie gemacht haben: Sie bauten DexDrummer, "eine hierarchische, zweistufige Politik zum Trommeln", die eine High-Level-RL-Politik sowie eine Low-Level-Geschicklichkeitspolitik hat. Sie trainieren ihr System in einer simulierten Umgebung, die einen bimanuellen Roboteraufbau und ein komplettes Schlagzeug (Snare, Tom, Ride, Hi-Hat und Crash) enthält. Das Hauptsystem generiert eine Stocktrajektorie im Aufgabenraum, dann ein Low-Level-System, das versucht, die Hand zu steuern – dieser Teil ist komplex und beinhaltet, Daumen und Zeigefinger zu ermutigen, die Mitte des Drumsticks zu greifen, gepaart mit einer "Arm-Strafenbeschränkung, die übermäßige Armbewegungen reduziert". Es gibt auch Arbeiten zur Formung von Belohnungen, um sicherzustellen, dass der Roboter in der Lage ist, mehrere Trommelschläge aneinanderzureihen – dies wird durch einen "Kontaktlehrplan" erreicht, der es dem Agenten ermöglicht, das Verfolgen von Trajektorien im freien Raum zu üben, während er der Trajektorienbelohnung folgt.

Tests in der realen Welt: Sie testen die trainierte Politik in der Realität an zwei 7-DOF Franka Panda Armen und zwei 20-DOF Tesollo DG-5F Händen. Dies ist ein Bereich, in dem ich dringend empfehlen würde, sich die Videos online anzusehen, um ein Gefühl dafür zu bekommen, wie ungeheuer schwierig diese Aufgabe ist – die Roboter sind in der Lage, die Trommeln zu treffen, aber es ist schmerzhaft unbeholfen anzusehen, und ich habe das Gefühl, es wird noch eine ganze Weile dauern, bis ein menschlicher Schlagzeuger über die sprichwörtliche Schulter schauen muss.

Warum das wichtig ist – Robotik als letzte Evaluierung: Robotik in irgendetwas, das einer dynamischen, sich schnell verändernden Umgebung nahekommt (z. B. improvisiertes Trommeln mit einer Live-Band), fühlt sich wie eine der letzten Grenzen für KI an – und wie diese Forschung zeigt, erfordert es, ähnlich wie bei der modernen Computer-Vision-Forschung, das Handwerk hochkomplizierter, handgefertigter Politiken, um KI zu guten Leistungen zu bringen. Wir sind hier noch sehr weit von der Allgemeinheit vortrainierter Sprachmodelle entfernt.

Mehr lesen: DexDrummer: In-Hand, Contact-Rich, and Long-Horizon Dexterous Robot Drumming (arXiv).

Bitte, ich flehe Sie an, schauen Sie sich die Videos an, es lohnt sich: DexDrummer Seite.

***

Google glaubt, die eigentliche Herausforderung der KI-Ausrichtung ist der Umgang mit einer Welt, die hauptsächlich aus nicht-biologischen Intelligenzen besteht:

…Hin zu einer Gesellschaft der Geister…

Forscher von Google glauben, dass die Zukunft der Intelligenz weniger darin besteht, einen monolithischen Einzelgänger zu bauen, der die Welt regiert, sondern vielmehr darin, herauszufinden, wie man Institutionen baut, die in der Lage sind, mit einer enormen Verbreitung von KI-Agenten im Zusammenspiel mit Menschen umzugehen. Die Forschung ist intuitiv, provokativ und vernünftig und baut auf früheren technischen Arbeiten auf, die zeigten, dass moderne KI-Systeme mehrere Persönlichkeiten in sich zu simulieren scheinen, um Fragen zu beantworten (Import AI 444), was darauf hindeutet, dass selbst heutige KI-Systeme bereits wie komplexe Ökologien funktionieren.

"Wir sollten die nächste Intelligenzexplosion an demselben Ort suchen, von dem die vorherigen ausgingen: in kooperativer, kompetitiver und kreativer Interaktion zwischen einer Vielzahl sozial intelligenter Geister. Der Unterschied diesmal ist, dass die meisten dieser Geister nicht-biologisch sein werden", schreibt Google. "Die Werkzeugkästen der Teamwissenschaft, der Kleingruppensoziologie und der Sozialpsychologie werden zu Blaupausen für die nächste Generation der KI-Entwicklung."

Die Geschichte zeigt den Weg: "Jede vorherige 'Intelligenzexplosion' war kein Upgrade der individuellen kognitiven Hardware, sondern die Entstehung einer neuen, sozial aggregierten Einheit der Kognition", schreiben sie.

Primatenintelligenz: Skalierte mit der Größe der sozialen Gruppe.

Menschliche Sprache: Erlaubte die Akkumulation von Wissen über Generationen hinweg durch eine 'kulturelle Ratsche'.

Schrift, Gesetz und Bürokratie: Verwandelten soziale Intelligenz in Infrastruktur und Institutionen, die über lange Zeiträume koordinieren konnten. ("Ein sumerischer Schreiber, der ein Getreideabrechnungssystem betrieb, verstand dessen makroökonomische Funktion nicht; das System war funktional intelligenter als er.")

KI plus menschliche Institutionen: "Der Weg zu leistungsfähigerer KI führt nicht über den Bau eines einzigen kolossalen Orakels, sondern über das Zusammensetzen reichhaltigerer sozialer Systeme – und diese Systeme werden hybrid sein."

Die Gesellschaft braucht ein Upgrade: Dem ist implizit, dass die Steuerung von KI zunehmend die Verifizierung (z. B. Import AI #447) beinhalten wird, dass eine Vielzahl von KI-Systemen angemessen in unserem Auftrag arbeitet. "Regierungen werden KI-Systeme mit unterschiedlichen, explizit verankerten Werten benötigen – Transparenz, Gerechtigkeit, ordnungsgemäßes Verfahren –, deren Funktion es ist, KI-Systeme zu überprüfen und auszugleichen, die vom Privatsektor und anderen Regierungszweigen eingesetzt werden", schreiben sie.

Warum das wichtig ist – Alignment wird in und mit der Welt stattfinden, nicht außerhalb von ihr: Viele Menschen, die an KI-Sicherheit arbeiten, haben lange Zeit damit verbracht, die grundlegenden Eigenschaften eines einzelnen KI-Systems 'auszurichten', was grob übersetzt "tut, was du willst, und versucht nicht, dich zu töten oder zu entmachten" bedeutet. Aber was dieses Paper richtig erkennt, ist, dass wir, selbst wenn wir beim Alignment erfolgreich sind, dann KI-Systeme dazu bringen müssen, gut innerhalb der Gesellschaft zu funktionieren und effektiv mit uns und miteinander zu kollaborieren – und dies wird ein subtiler, emergenter, schwer vorhersagbarer Prozess sein. Das bedeutet, dass wir die Institutionen entwerfen müssen, die für die Steuerung einer KI-zentrierten Welt geeignet sind. "So wie menschliche Gesellschaften sich nicht auf individuelle Tugend verlassen, sondern auf beständige institutionelle Vorlagen – Gerichtssäle, Märkte, Bürokratien –, die durch Rollen und Normen definiert sind, werden skalierbare KI-Ökosysteme digitale Entsprechungen benötigen", schreiben die Forscher.

Mehr lesen: Agentic AI and the next intelligence explosion (arXiv).

***

Meta nutzt ein Geschirr, um Anthropics Modelle zur Selbstverbesserung zu bewegen:

…Gib einem LLM ein paar Werkzeuge und eine rekursive Schleife und die Fähigkeit, sein Geschirr zu bearbeiten, tritt einen Schritt zurück und lass die Magie geschehen…

Forscher der University of British Columbia, des Vector Institute, der University of Edinburgh, der New York University, von CIFAR und Meta haben ein Geschirr für LLMs gebaut, das die Fähigkeit zur Selbstverbesserung bei beliebigen Aufgaben hat. Der Ansatz wird Hyperagent genannt und bedeutet, einem LLM ein Gerüst zu geben, das iterativ die Prompts verbessern kann, die es verwendet, um seine Leistung bei Aufgaben zu verbessern, sowie das System, das es verwendet, um bei der Generierung zukünftiger Prompts besser zu werden. Hyperagents arbeiten über Generationen hinweg, so dass ein Hyperagent ein paar Hyperagents hervorbringt und diejenigen, die bei der Aufgabe am besten abschneiden, selbst einige weitere Hyperagents hervorbringen, wodurch mehrere Schichten einer KI-Genealogie entstehen, bis die Leistung gesättigt ist.

Cyberpunk-Namenspreis des Jahres: Hyperagent ist eigentlich die Kurzform für "Darwin Godel Machine Hyperagents": Abgesehen davon, dass die Forschung cool ist, meinen Glückwunsch an die Autoren, dass sie sich einen Namen ausgedacht haben, den ich gerne mit einem Laserstrahl, der von einer Superintelligenz geschwungen wird, in den Mond gemeißelt sehen würde.

Wie Hyperagents funktionieren: Hyperagents sind "selbstreferenzielle Agenten, die einen Aufgabenagenten (der die Zielaufgabe löst) und einen Metaagenten (der sich selbst und den Aufgabenagenten modifiziert) in einem einzigen editierbaren Programm integrieren. Entscheidend ist, dass das Meta-Level-Modifikationsverfahren selbst editierbar ist, was metakognitive Selbstmodifikation ermöglicht, die nicht nur das aufgabenlösende Verhalten verbessert, sondern auch den Mechanismus, der zukünftige Verbesserungen generiert", schreiben die Forscher. "Dieser anfängliche Hyperagent ist mit zwei Werkzeugen ausgestattet: einem Bash-Werkzeug zur Ausführung von Shell-Befehlen und einem spezialisierten Werkzeug zur Inspektion und Modifikation von Dateien."

Testen der Agenten in vier verschiedenen Bereichen: Die Aut

Import AI 442: Gewinner und Verlierer in der KI-Ökonomie; Automatisierung mathematischer Beweise; und Industrialisierung der Cyber-Spionage

**Die Ära der Automatisierung von Mathe-Beweisen ist angebrochen:** …Numina-Lean-Agent zeigt, dass Mathematik nie wieder dieselbe sein wird…

In den letzten Jahren sind große KI-Modelle gut im Programmieren geworden und haben begonnen, auch auf andere nützliche Disziplinen zu generalisieren, insbesondere in Mathematik und Wissenschaft. Wie bei den meisten Aspekten der KI-Entwicklung war die Geschichte eine der zunehmenden Generalisierung und Vereinfachung der Systeme, da wir uns von hochspezialisierten Mathematikmodellen wegbewegen und einfach allgemeine Foundation-Modelle nutzen und ihnen die richtigen Werkzeuge geben, um ihre Fähigkeiten in einem bestimmten Bereich abzurufen.

Das neueste Beispiel dafür ist Numina-Lean-Agent, ein KI-System, das standardmäßige, allgemeine Foundation-Modelle für mathematisches Denken verwendet. Mit dieser Software hat ein Team von Mathematikern alle Probleme des Putnam-Wettbewerbs 2025 gelöst – und damit die Leistung proprietärer Systeme erreicht, die viel mehr mathematikspezifische Komponenten verwenden – und es auch für originäre mathematische Forschung genutzt, indem es damit den Satz von Brascamp-Lieb formalisiert hat.

Was ist Numina-Lean-Agent? Die Software wurde von einem Forscherteam der Chinesischen Akademie der Wissenschaften, der Universität Liverpool, der Xi'an Jiaotong-Liverpool University, der Tongji-Universität, der Universität Cambridge, Project Numina, dem Imperial College London und der Universität Edinburgh entwickelt. Die Software ist „ein formaler Mathematik-Resolver, der auf einem allgemeinen Coding-Agenten basiert". Sie hat einige Schlüsselkomponenten:

* **Lean-LSP-MCP:** Software, die es KI-Agenten ermöglicht, mit dem Lean Theorem Prover zu interagieren. „Befähigt Modelle, Lean-Projekte tiefgehend zu verstehen, zu analysieren und zu manipulieren" und gibt Modellen ein Werkzeugset für semantisches Verständnis und Interaktion, Codeausführung und Strategieerkundung sowie Theoremabruf. * **LeanDex:** Semantischer Abruf verwandter Theoreme und Definitionen – im Grunde ein Suchwerkzeug für Theoreme. * **Informal Prover:** Ein System, das Gemini-Modelle verwendet, um informelle Lösungen zu generieren. * **Das interessanteste Werkzeug von allen: Discussion Partner:** Ein Werkzeug, das „Claude Code die Fähigkeit verleiht, während der Lean-Formalisierung ‚Hilfe zu suchen‘: Wenn Hindernisse auftreten – wie Beweis-Engpässe, Dilemmata bei der Strategiewahl oder Unklarheiten bei Zwischen-Lemmata – kann das primäre Modell proaktiv Diskussionen mit anderen LLMs initiieren".

Gemeinsam Mathematik entdecken: Neben der Putnam-Demonstration nutzten die Autoren die Software auch als aktiven Partner bei mathematischer Arbeit, insbesondere bei der Formalisierung von Brascamp-Lieb (ich werde nicht vorgeben, erklären zu können, was das bedeutet). „Über einen Zeitraum von weniger als zwei Wochen intermittierender Zusammenarbeit schlossen die beiden menschlichen Experten und der Agent die Formalisierung von mehr als 8.000 Zeilen Lean-Code ab. Während dieses Prozesses führte der Agent autonom etwa 70 neue Definitionen, Lemmata und Theoreme ein, was seine Fähigkeit demonstriert, die formale Bibliothek aktiv zu erweitern und an groß angelegten, nachhaltigen Formalisierungsbemühungen teilzunehmen", schreiben die Autoren.

Warum dies wichtig ist – Capability Overhangs und KI-Ökologien: Numina-Lean-Agent demonstriert zwei wichtige Dinge über zeitgenössische KI: 1) KI-Systeme sind weitaus leistungsfähiger, als die Leute denken, und die Schaffung einiger spezialisierter Frameworks und Werkzeuge ermöglicht es uns oft, dramatisch bessere Fähigkeiten aus unseren Systemen herauszuholen (hier Mathematik, aber das wurde in vielen Bereichen demonstriert), und 2) die KI-Ökologie im weiteren Sinne besteht aus vielen verschiedenen Frontier-Modellen, und es scheint, dass die Interaktion dieser Modelle miteinander zu einer gewissen Reichhaltigkeit führen kann, ähnlich wie die Konsultation verschiedener Menschentypen zu einem einzigen Problem eine bessere Antwort liefern kann als das Gespräch mit nur einer Person.

Mehr erfahren auf der GitHub-Seite (Numina-Lean-Agent, GitHub).

***

**Die Industrialisierung der Cyber-Spionage steht bevor:** …Einige Experimente mit Opus 4.5 und GPT-5.2 deuten darauf hin, dass die Cyber-Umgebung kurz vor großen Veränderungen stehen könnte…

Der unabhängige Forscher Sean Heelan hat kürzlich getestet, wie gut Opus 4.5 und GPT-5.2 Exploits für eine Zero-Day-Sicherheitslücke im QuickJS-Javascript-Interpreter generieren können. Beide Modelle schnitten sehr gut ab, und dies hat erhebliche Auswirkungen auf die Cybersicherheit.

„Wir sollten uns auf die Industrialisierung vieler Bestandteile der offensiven Cybersicherheit vorbereiten. Wir sollten annehmen, dass der limitierende Faktor für die Fähigkeit eines Staates oder einer Gruppe, Exploits zu entwickeln, in Netzwerke einzudringen, Privilegien zu erweitern und in diesen Netzwerken zu bleiben, in naher Zukunft ihr Token-Durchsatz über die Zeit sein wird und nicht die Anzahl der Hacker, die sie beschäftigen", schreibt er.

Einschränkungen: QuickJS ist ein einfacher Javascript-Interpreter im Vergleich zu denen in Chrome und Firefox. Daher könnte es für LLMs schwieriger sein, die komplexeren und weiter verbreiteten zu verwenden – obwohl wir, wie bei allen Dingen in der KI, erwarten können, dass sich die Leistung ziemlich schnell verbessert.

Was bedeutet industrialisiertes Eindringen? „Wir sind bereits an einem Punkt, an dem man bei der Schwachstellensuche und Exploit-Entwicklung Tokens gegen echte Ergebnisse eintauschen kann", schreibt er. „Die Arten von Problemen, auf die man stößt, wenn man die Arbeit von SREs, Systemadministratoren und Entwicklern automatisieren will, die Produktionsnetzwerke verwalten, sind konzeptionell ähnlich wie die eines Hackers, der innerhalb eines gegnerischen Netzwerks operiert."

Es gibt viele Belege für das Obige, von Dingen wie OpenAI's Aardvark-Projekt (bei dem sie feststellten, dass sie umso mehr Fehler finden, je mehr Tokens sie ausgeben) bis hin zu Dingen wie Anthropics Entdeckung eines KI-orchestrierten Hacking-Systems.

Warum dies wichtig ist – die Cyberwelt wird sich mit Maschinengeschwindigkeit bewegen: Ich wette, dass die meisten Teile von Cyber-Offensive und Cyber-Defense dazu übergehen werden, mit „Maschinengeschwindigkeit" zu laufen, bei der Menschen aus den meisten kritischen Kreisläufen herausgenommen werden. Dies wird sowohl die Häufigkeit von Hacking-Angriffen erhöhen als auch die Effektivität jedes einzelnen menschlichen Verteidigers oder Angreifers dramatisch steigern (da sie durch KI-Systeme skaliert werden, die für sie arbeiten). Die wirklich entscheidende Frage ist, ob sich dies als offensiv- oder defensiv-dominant erweist – meine Vermutung ist, dass wir auf eine Ära der Offensiv-Dominanz zusteuern, da es eine Weile dauern wird, bis Abwehrmaßnahmen eingesetzt werden.

In diesem Zusammenhang sagte OpenAI-CEO Sam Altman diese Woche, er erwarte, dass die Modelle von OpenAI bald die Stufe „Cybersecurity High" im Bereitschaftsrahmen seines Unternehmens erreichen werden – das würde bedeuten, dass Modelle verfügbar wären, die „bestehende Engpässe bei der Skalierung von Cyber-Operationen beseitigen, einschließlich der Automatisierung von End-to-End-Cyber-Operationen gegen einigermaßen gehärtete Ziele ODER der Automatisierung der Entdeckung und Ausbeutung von operativ relevanten Schwachstellen" – Dank an Nathan Calvin für den Hinweis.

***

**Ökonom: KI wird größer sein als Elektrizität und Halbleiter:** …Und daher lohnt es sich, eine Menge Geld auszugeben, um KI-Risiken zu reduzieren…

Der Stanford-Ökonom Charles „Chad" Jones hat ein Papier verfasst, in dem es heißt, KI werde „wahrscheinlich die wichtigste Technologie sein, die wir je entwickelt haben", und dass „die Automatisierung der Intelligenz selbst wohl breitere Auswirkungen hat als Elektrizität oder Halbleiter".

Warum KI ernst nehmen? Der Kern des Papiers ist, dass KI eine massive technologische Erfindung darstellt, die in Zukunft zum Wirtschaftswachstum beitragen wird. In der Vergangenheit haben große Erfindungen (z. B. Elektrizität, Internet, Autos usw.) alle dasselbe getan. Tatsächlich stellt man, wenn man das US-BIP-Wachstum betrachtet, kontraintuitiv fest, dass das BIP trotz all dieser früheren technologischen Revolutionen seit vielen, vielen Jahren stetig um etwa 2 % pro Jahr gestiegen ist. Daher ist das Basisszenario, dass KI genau das tut – und dann leben wir nicht in einer allzu verrückten Welt.

Aber es gibt eine Welt, in der die Dinge anders sein könnten – in der KI so gut funktioniert, dass sie zu einem Wirtschaftswachstum über den historischen Trends führt. Ein Beispiel hierfür ist, wenn KI die gesamte Wissensarbeit übernimmt: „Wissensarbeit in der US-Wirtschaft könnte etwa 1/3 des BIP ausmachen. Was wäre, wenn wir alle kognitive Arbeit mit unendlichem Output bei den Aufgaben, die sie ausführt, automatisieren würden? Dies würde das BIP um 50 Prozent erhöhen. Einerseits, wenn dies im Laufe eines Jahrzehnts geschähe, würde es die Wachstumsraten um etwa 5 Prozent pro Jahr steigern, was enorm wäre. Aber dennoch wäre das ein einmaliger Gewinn, und es ist vielleicht überraschend, dass der Zugang zu unendlichem Output der derzeit von kognitiver Arbeit ausgeführten Aufgaben das BIP nur um 50 Prozent erhöhen könnte."

Überfluss: Wenn wir ein überdurchschnittliches Wirtschaftswachstum erreichen, dann „könnte die große Zunahme des BIP im Prinzip alle besserstellen", schreibt er. Ein Weg, dies zu tun, könnte die direkte Umverteilung wirtschaftlicher Gewinne sein, zum Beispiel durch die „Ausstattung jedes Kindes mit einem Anteil am S&P 500 Aktienmarktindex" (z. B. eine hochskalierte Version der sogenannten Trump Accounts).

Zahlen zur Reduzierung existenzieller Risiken: KI birgt auch nicht-triviale Risiken für die Welt, einschließlich der Bedrohung des Lebens potenziell aller lebenden Menschen. In der Vergangenheit hat die Gesellschaft extrem große Geldbeträge ausgegeben, um mit Dingen umzugehen, die das Leben von Menschen bedrohen – zum Beispiel im Jahr 2020 als Reaktion auf ein ~0,3%iges Sterblichkeitsrisiko durch COVID-19 für alle, gaben wir am Ende das Äquivalent von 4% des BIP der Vereinigten Staaten aus, indem wir die Wirtschaft herunterfuhren und zu Hause blieben.

„Wenn man glaubt, dass die katastrophalen Risiken durch KI mindestens so groß sind, dann sollten wir nach offenbarter Präferenz vielleicht einen entsprechenden Betrag ausgeben, selbst aus rein egoistischer Sicht", schreibt er. Nehmen wir an, es gibt ein P-Doom von 1% durch KI (was viele für eine sehr optimistische Zahl halten würden!). Unter diesen Umständen und angesichts der Tatsache, dass die US-Regierung ein einzelnes Menschenleben bereits grob mit etwa 10 Millionen Dollar bewertet, wäre man bereit, 1% von 10 Millionen zu zahlen, um das Risiko zu mindern. „Das durchschnittliche BIP pro Person liegt bei etwa 90.000 Dollar, daher liegt diese Zahlungsbereitschaft bei über 100% des BIP. Wenn das Existenzrisiko einmal in den nächsten 10 bis 20 Jahren eintritt, könnte eine jährliche Investition von 5–10% des Einkommens angemessen sein, wenn es das Risiko vollständig beseitigen würde."

Eine Möglichkeit, dies zu finanzieren und das Risiko weiter zu reduzieren, könnte die Besteuerung von Compute sein: Wenn man eine Steuer auf GPUs, TPUs usw. erheben würde, dann könnte „diese Einnahme zusätzlich zur Verlangsamung des Wettlaufs zur Finanzierung von Sicherheitsforschung verwendet werden. Die Steuer könnte auf den Erstverkauf des Chips erhoben werden und besteuert damit die Nutzer unabhängig vom Land, in dem sie arbeiten."

Warum dies wichtig ist – wenn KI so eine große Sache ist, wie wir denken, haben wir nur sehr wenig Präzedenzfall, von dem wir ausgehen können: Papiere wie dieses leisten gute Arbeit im Umgang mit den wirklich verrückten Implikationen leistungsstarker KI-Systeme. Es ist lobenswert, dass mehr Akademiker sich die Zeit nehmen, sich direkt der Frage zu stellen: „Was, wenn die optimistischsten Technologen mit ihrer Einschätzung, wie weit KI gehen könnte, recht haben?" „Letztendlich erwarte ich, dass die Wirkung von KI viel größer sein wird als die des Internets, vielleicht um mehr als das 10-fache des Internets, wenn auch über ein halbes Jahrhundert oder mehr", schreibt er. „Es wäre klug, die Zwischenzeit damit zu verbringen, Vorbereitungen für die potenziell großen Konsequenzen für Arbeitsmärkte, Ungleichheit und katastrophale Risiken zu treffen."

***

**Viele Menschen sind gut positioniert, um mit dem wirtschaftlichen Wandel durch KI umzugehen:** …Gut für Manager und technische Typen, aber schlecht für Verwaltungs- und Unterstützungspersonal…

Während immer leistungsfähigere KI-Systeme die Wirtschaft durchdringen, wie sollte man über die eigene Karriere denken? Forscher des Centre for the Governance of AI und der Foundation for American Innovation haben eine schöne US-basierte Studie durchgeführt, in der sie die durch KI verursachte Arbeitsplatzverdrängung durch die Linse betrachten, wie einfach es für die arbeitslos gewordenen Menschen sein wird, neue Jobs zu finden. Ihr wichtigstes Ergebnis ist, dass viel mehr Arbeitsplätze in Teilen der Wirtschaft liegen, die sowohl KI-Systemen ausgesetzt sein werden, aber auch, dass die Menschen in diesen Jobs eine anständige Menge an „Anpassungsfähigkeit" haben, um diese Veränderungen zu überstehen, und eine kleinere Anzahl von Menschen wird negativ betroffen sein.

Das wichtigste Ergebnis: „KI-Exposition und Anpassungsfähigkeit sind positiv korreliert: Viele Berufe mit hoher KI-Exposition enthalten Arbeiter mit relativ starken Mitteln, um einen Jobwechsel zu bewältigen. Von den 37,1 Millionen Arbeitnehmern im obersten Quartil der KI-Exposition befinden sich 26,5 Millionen in Berufen, die auch eine überdurchschnittliche Anpassungsfähigkeit aufweisen, was sie vergleichsweise gut ausrüstet, um mit Jobwechseln umzugehen, falls es zu Verdrängung kommt", schreiben sie. „6,1 Millionen Arbeitnehmer (4,2% der Erwerbsbevölkerung in unserer Stichprobe) arbeiten in Berufen, die sowohl stark exponiert sind als auch in denen die Arbeitnehmer eine geringe erwartete Anpassungsfähigkeit haben … diese Arbeitnehmer konzentrieren sich auf Büro- und Verwaltungsberufe".

Welche Faktoren sagen etwas über die Anpassungsfähigkeit aus?

* **Netto-Liquiditätsvermögen:** Je mehr Ersparnisse man hat, desto einfacher ist es, mit längerer Arbeitslosigkeit umzugehen und einen neuen Job zu finden. * **Fertigkeitstransferierbarkeit:** Dies ist ein etwas verwirrender Punkt, da die Fertigkeitstransferierbarkeit zu messen versucht, wie gut man seinen Job nehmen und auf einen anderen Job anwenden kann. Dies zu messen ist schwierig – Bildung ist ein etwas verlustbehafteter Proxy. Die Autoren „messen die Fertigkeitstransferierbarkeit zwischen Berufen unter Verwendung von O∗

Weiterlesen

**Die Ära der Automatisierung von Mathe-Beweisen ist angebrochen:** …Numina-Lean-Agent zeigt, dass Mathematik nie wieder dieselbe sein wird…

In den letzten Jahren sind große KI-Modelle gut im Programmieren geworden und haben begonnen, auch auf andere nützliche Disziplinen zu generalisieren, insbesondere in Mathematik und Wissenschaft. Wie bei den meisten Aspekten der KI-Entwicklung war die Geschichte eine der zunehmenden Generalisierung und Vereinfachung der Systeme, da wir uns von hochspezialisierten Mathematikmodellen wegbewegen und einfach allgemeine Foundation-Modelle nutzen und ihnen die richtigen Werkzeuge geben, um ihre Fähigkeiten in einem bestimmten Bereich abzurufen.

Das neueste Beispiel dafür ist Numina-Lean-Agent, ein KI-System, das standardmäßige, allgemeine Foundation-Modelle für mathematisches Denken verwendet. Mit dieser Software hat ein Team von Mathematikern alle Probleme des Putnam-Wettbewerbs 2025 gelöst – und damit die Leistung proprietärer Systeme erreicht, die viel mehr mathematikspezifische Komponenten verwenden – und es auch für originäre mathematische Forschung genutzt, indem es damit den Satz von Brascamp-Lieb formalisiert hat.

Was ist Numina-Lean-Agent? Die Software wurde von einem Forscherteam der Chinesischen Akademie der Wissenschaften, der Universität Liverpool, der Xi'an Jiaotong-Liverpool University, der Tongji-Universität, der Universität Cambridge, Project Numina, dem Imperial College London und der Universität Edinburgh entwickelt. Die Software ist „ein formaler Mathematik-Resolver, der auf einem allgemeinen Coding-Agenten basiert". Sie hat einige Schlüsselkomponenten:

* **Lean-LSP-MCP:** Software, die es KI-Agenten ermöglicht, mit dem Lean Theorem Prover zu interagieren. „Befähigt Modelle, Lean-Projekte tiefgehend zu verstehen, zu analysieren und zu manipulieren" und gibt Modellen ein Werkzeugset für semantisches Verständnis und Interaktion, Codeausführung und Strategieerkundung sowie Theoremabruf. * **LeanDex:** Semantischer Abruf verwandter Theoreme und Definitionen – im Grunde ein Suchwerkzeug für Theoreme. * **Informal Prover:** Ein System, das Gemini-Modelle verwendet, um informelle Lösungen zu generieren. * **Das interessanteste Werkzeug von allen: Discussion Partner:** Ein Werkzeug, das „Claude Code die Fähigkeit verleiht, während der Lean-Formalisierung ‚Hilfe zu suchen‘: Wenn Hindernisse auftreten – wie Beweis-Engpässe, Dilemmata bei der Strategiewahl oder Unklarheiten bei Zwischen-Lemmata – kann das primäre Modell proaktiv Diskussionen mit anderen LLMs initiieren".

Gemeinsam Mathematik entdecken: Neben der Putnam-Demonstration nutzten die Autoren die Software auch als aktiven Partner bei mathematischer Arbeit, insbesondere bei der Formalisierung von Brascamp-Lieb (ich werde nicht vorgeben, erklären zu können, was das bedeutet). „Über einen Zeitraum von weniger als zwei Wochen intermittierender Zusammenarbeit schlossen die beiden menschlichen Experten und der Agent die Formalisierung von mehr als 8.000 Zeilen Lean-Code ab. Während dieses Prozesses führte der Agent autonom etwa 70 neue Definitionen, Lemmata und Theoreme ein, was seine Fähigkeit demonstriert, die formale Bibliothek aktiv zu erweitern und an groß angelegten, nachhaltigen Formalisierungsbemühungen teilzunehmen", schreiben die Autoren.

Warum dies wichtig ist – Capability Overhangs und KI-Ökologien: Numina-Lean-Agent demonstriert zwei wichtige Dinge über zeitgenössische KI: 1) KI-Systeme sind weitaus leistungsfähiger, als die Leute denken, und die Schaffung einiger spezialisierter Frameworks und Werkzeuge ermöglicht es uns oft, dramatisch bessere Fähigkeiten aus unseren Systemen herauszuholen (hier Mathematik, aber das wurde in vielen Bereichen demonstriert), und 2) die KI-Ökologie im weiteren Sinne besteht aus vielen verschiedenen Frontier-Modellen, und es scheint, dass die Interaktion dieser Modelle miteinander zu einer gewissen Reichhaltigkeit führen kann, ähnlich wie die Konsultation verschiedener Menschentypen zu einem einzigen Problem eine bessere Antwort liefern kann als das Gespräch mit nur einer Person.

Mehr erfahren auf der GitHub-Seite (Numina-Lean-Agent, GitHub).

***

**Die Industrialisierung der Cyber-Spionage steht bevor:** …Einige Experimente mit Opus 4.5 und GPT-5.2 deuten darauf hin, dass die Cyber-Umgebung kurz vor großen Veränderungen stehen könnte…

Der unabhängige Forscher Sean Heelan hat kürzlich getestet, wie gut Opus 4.5 und GPT-5.2 Exploits für eine Zero-Day-Sicherheitslücke im QuickJS-Javascript-Interpreter generieren können. Beide Modelle schnitten sehr gut ab, und dies hat erhebliche Auswirkungen auf die Cybersicherheit.

„Wir sollten uns auf die Industrialisierung vieler Bestandteile der offensiven Cybersicherheit vorbereiten. Wir sollten annehmen, dass der limitierende Faktor für die Fähigkeit eines Staates oder einer Gruppe, Exploits zu entwickeln, in Netzwerke einzudringen, Privilegien zu erweitern und in diesen Netzwerken zu bleiben, in naher Zukunft ihr Token-Durchsatz über die Zeit sein wird und nicht die Anzahl der Hacker, die sie beschäftigen", schreibt er.

Einschränkungen: QuickJS ist ein einfacher Javascript-Interpreter im Vergleich zu denen in Chrome und Firefox. Daher könnte es für LLMs schwieriger sein, die komplexeren und weiter verbreiteten zu verwenden – obwohl wir, wie bei allen Dingen in der KI, erwarten können, dass sich die Leistung ziemlich schnell verbessert.

Was bedeutet industrialisiertes Eindringen? „Wir sind bereits an einem Punkt, an dem man bei der Schwachstellensuche und Exploit-Entwicklung Tokens gegen echte Ergebnisse eintauschen kann", schreibt er. „Die Arten von Problemen, auf die man stößt, wenn man die Arbeit von SREs, Systemadministratoren und Entwicklern automatisieren will, die Produktionsnetzwerke verwalten, sind konzeptionell ähnlich wie die eines Hackers, der innerhalb eines gegnerischen Netzwerks operiert."

Es gibt viele Belege für das Obige, von Dingen wie OpenAI's Aardvark-Projekt (bei dem sie feststellten, dass sie umso mehr Fehler finden, je mehr Tokens sie ausgeben) bis hin zu Dingen wie Anthropics Entdeckung eines KI-orchestrierten Hacking-Systems.

Warum dies wichtig ist – die Cyberwelt wird sich mit Maschinengeschwindigkeit bewegen: Ich wette, dass die meisten Teile von Cyber-Offensive und Cyber-Defense dazu übergehen werden, mit „Maschinengeschwindigkeit" zu laufen, bei der Menschen aus den meisten kritischen Kreisläufen herausgenommen werden. Dies wird sowohl die Häufigkeit von Hacking-Angriffen erhöhen als auch die Effektivität jedes einzelnen menschlichen Verteidigers oder Angreifers dramatisch steigern (da sie durch KI-Systeme skaliert werden, die für sie arbeiten). Die wirklich entscheidende Frage ist, ob sich dies als offensiv- oder defensiv-dominant erweist – meine Vermutung ist, dass wir auf eine Ära der Offensiv-Dominanz zusteuern, da es eine Weile dauern wird, bis Abwehrmaßnahmen eingesetzt werden.

In diesem Zusammenhang sagte OpenAI-CEO Sam Altman diese Woche, er erwarte, dass die Modelle von OpenAI bald die Stufe „Cybersecurity High" im Bereitschaftsrahmen seines Unternehmens erreichen werden – das würde bedeuten, dass Modelle verfügbar wären, die „bestehende Engpässe bei der Skalierung von Cyber-Operationen beseitigen, einschließlich der Automatisierung von End-to-End-Cyber-Operationen gegen einigermaßen gehärtete Ziele ODER der Automatisierung der Entdeckung und Ausbeutung von operativ relevanten Schwachstellen" – Dank an Nathan Calvin für den Hinweis.

***

**Ökonom: KI wird größer sein als Elektrizität und Halbleiter:** …Und daher lohnt es sich, eine Menge Geld auszugeben, um KI-Risiken zu reduzieren…

Der Stanford-Ökonom Charles „Chad" Jones hat ein Papier verfasst, in dem es heißt, KI werde „wahrscheinlich die wichtigste Technologie sein, die wir je entwickelt haben", und dass „die Automatisierung der Intelligenz selbst wohl breitere Auswirkungen hat als Elektrizität oder Halbleiter".

Warum KI ernst nehmen? Der Kern des Papiers ist, dass KI eine massive technologische Erfindung darstellt, die in Zukunft zum Wirtschaftswachstum beitragen wird. In der Vergangenheit haben große Erfindungen (z. B. Elektrizität, Internet, Autos usw.) alle dasselbe getan. Tatsächlich stellt man, wenn man das US-BIP-Wachstum betrachtet, kontraintuitiv fest, dass das BIP trotz all dieser früheren technologischen Revolutionen seit vielen, vielen Jahren stetig um etwa 2 % pro Jahr gestiegen ist. Daher ist das Basisszenario, dass KI genau das tut – und dann leben wir nicht in einer allzu verrückten Welt.

Aber es gibt eine Welt, in der die Dinge anders sein könnten – in der KI so gut funktioniert, dass sie zu einem Wirtschaftswachstum über den historischen Trends führt. Ein Beispiel hierfür ist, wenn KI die gesamte Wissensarbeit übernimmt: „Wissensarbeit in der US-Wirtschaft könnte etwa 1/3 des BIP ausmachen. Was wäre, wenn wir alle kognitive Arbeit mit unendlichem Output bei den Aufgaben, die sie ausführt, automatisieren würden? Dies würde das BIP um 50 Prozent erhöhen. Einerseits, wenn dies im Laufe eines Jahrzehnts geschähe, würde es die Wachstumsraten um etwa 5 Prozent pro Jahr steigern, was enorm wäre. Aber dennoch wäre das ein einmaliger Gewinn, und es ist vielleicht überraschend, dass der Zugang zu unendlichem Output der derzeit von kognitiver Arbeit ausgeführten Aufgaben das BIP nur um 50 Prozent erhöhen könnte."

Überfluss: Wenn wir ein überdurchschnittliches Wirtschaftswachstum erreichen, dann „könnte die große Zunahme des BIP im Prinzip alle besserstellen", schreibt er. Ein Weg, dies zu tun, könnte die direkte Umverteilung wirtschaftlicher Gewinne sein, zum Beispiel durch die „Ausstattung jedes Kindes mit einem Anteil am S&P 500 Aktienmarktindex" (z. B. eine hochskalierte Version der sogenannten Trump Accounts).

Zahlen zur Reduzierung existenzieller Risiken: KI birgt auch nicht-triviale Risiken für die Welt, einschließlich der Bedrohung des Lebens potenziell aller lebenden Menschen. In der Vergangenheit hat die Gesellschaft extrem große Geldbeträge ausgegeben, um mit Dingen umzugehen, die das Leben von Menschen bedrohen – zum Beispiel im Jahr 2020 als Reaktion auf ein ~0,3%iges Sterblichkeitsrisiko durch COVID-19 für alle, gaben wir am Ende das Äquivalent von 4% des BIP der Vereinigten Staaten aus, indem wir die Wirtschaft herunterfuhren und zu Hause blieben.

„Wenn man glaubt, dass die katastrophalen Risiken durch KI mindestens so groß sind, dann sollten wir nach offenbarter Präferenz vielleicht einen entsprechenden Betrag ausgeben, selbst aus rein egoistischer Sicht", schreibt er. Nehmen wir an, es gibt ein P-Doom von 1% durch KI (was viele für eine sehr optimistische Zahl halten würden!). Unter diesen Umständen und angesichts der Tatsache, dass die US-Regierung ein einzelnes Menschenleben bereits grob mit etwa 10 Millionen Dollar bewertet, wäre man bereit, 1% von 10 Millionen zu zahlen, um das Risiko zu mindern. „Das durchschnittliche BIP pro Person liegt bei etwa 90.000 Dollar, daher liegt diese Zahlungsbereitschaft bei über 100% des BIP. Wenn das Existenzrisiko einmal in den nächsten 10 bis 20 Jahren eintritt, könnte eine jährliche Investition von 5–10% des Einkommens angemessen sein, wenn es das Risiko vollständig beseitigen würde."

Eine Möglichkeit, dies zu finanzieren und das Risiko weiter zu reduzieren, könnte die Besteuerung von Compute sein: Wenn man eine Steuer auf GPUs, TPUs usw. erheben würde, dann könnte „diese Einnahme zusätzlich zur Verlangsamung des Wettlaufs zur Finanzierung von Sicherheitsforschung verwendet werden. Die Steuer könnte auf den Erstverkauf des Chips erhoben werden und besteuert damit die Nutzer unabhängig vom Land, in dem sie arbeiten."

Warum dies wichtig ist – wenn KI so eine große Sache ist, wie wir denken, haben wir nur sehr wenig Präzedenzfall, von dem wir ausgehen können: Papiere wie dieses leisten gute Arbeit im Umgang mit den wirklich verrückten Implikationen leistungsstarker KI-Systeme. Es ist lobenswert, dass mehr Akademiker sich die Zeit nehmen, sich direkt der Frage zu stellen: „Was, wenn die optimistischsten Technologen mit ihrer Einschätzung, wie weit KI gehen könnte, recht haben?" „Letztendlich erwarte ich, dass die Wirkung von KI viel größer sein wird als die des Internets, vielleicht um mehr als das 10-fache des Internets, wenn auch über ein halbes Jahrhundert oder mehr", schreibt er. „Es wäre klug, die Zwischenzeit damit zu verbringen, Vorbereitungen für die potenziell großen Konsequenzen für Arbeitsmärkte, Ungleichheit und katastrophale Risiken zu treffen."

***

**Viele Menschen sind gut positioniert, um mit dem wirtschaftlichen Wandel durch KI umzugehen:** …Gut für Manager und technische Typen, aber schlecht für Verwaltungs- und Unterstützungspersonal…

Während immer leistungsfähigere KI-Systeme die Wirtschaft durchdringen, wie sollte man über die eigene Karriere denken? Forscher des Centre for the Governance of AI und der Foundation for American Innovation haben eine schöne US-basierte Studie durchgeführt, in der sie die durch KI verursachte Arbeitsplatzverdrängung durch die Linse betrachten, wie einfach es für die arbeitslos gewordenen Menschen sein wird, neue Jobs zu finden. Ihr wichtigstes Ergebnis ist, dass viel mehr Arbeitsplätze in Teilen der Wirtschaft liegen, die sowohl KI-Systemen ausgesetzt sein werden, aber auch, dass die Menschen in diesen Jobs eine anständige Menge an „Anpassungsfähigkeit" haben, um diese Veränderungen zu überstehen, und eine kleinere Anzahl von Menschen wird negativ betroffen sein.

Das wichtigste Ergebnis: „KI-Exposition und Anpassungsfähigkeit sind positiv korreliert: Viele Berufe mit hoher KI-Exposition enthalten Arbeiter mit relativ starken Mitteln, um einen Jobwechsel zu bewältigen. Von den 37,1 Millionen Arbeitnehmern im obersten Quartil der KI-Exposition befinden sich 26,5 Millionen in Berufen, die auch eine überdurchschnittliche Anpassungsfähigkeit aufweisen, was sie vergleichsweise gut ausrüstet, um mit Jobwechseln umzugehen, falls es zu Verdrängung kommt", schreiben sie. „6,1 Millionen Arbeitnehmer (4,2% der Erwerbsbevölkerung in unserer Stichprobe) arbeiten in Berufen, die sowohl stark exponiert sind als auch in denen die Arbeitnehmer eine geringe erwartete Anpassungsfähigkeit haben … diese Arbeitnehmer konzentrieren sich auf Büro- und Verwaltungsberufe".

Welche Faktoren sagen etwas über die Anpassungsfähigkeit aus?

* **Netto-Liquiditätsvermögen:** Je mehr Ersparnisse man hat, desto einfacher ist es, mit längerer Arbeitslosigkeit umzugehen und einen neuen Job zu finden. * **Fertigkeitstransferierbarkeit:** Dies ist ein etwas verwirrender Punkt, da die Fertigkeitstransferierbarkeit zu messen versucht, wie gut man seinen Job nehmen und auf einen anderen Job anwenden kann. Dies zu messen ist schwierig – Bildung ist ein etwas verlustbehafteter Proxy. Die Autoren „messen die Fertigkeitstransferierbarkeit zwischen Berufen unter Verwendung von O∗

Import AI 441: Meine Agents arbeiten. Deine auch?

import_ai·2026-01-19AgentenForschungAnwendungen

Plus: KI-Systeme mit einem Giftbrunnen korrumpieren**

Willkommen zu Import AI, einem Newsletter über KI-Forschung. Import AI läuft auf arXiv und dem Feedback der Leser. Wenn du dies unterstützen möchtest, abonniere bitte.

**Import A-Idee** Eine gelegentliche Essay-Reihe: **Meine Agenten arbeiten. Arbeiten deine?**

Als ich im Morgengrauen in die Hügel ging, wusste ich, dass ein synthetischer Geist in meinem Auftrag arbeitete. Mehrere Geister sogar. Denn bevor ich meine Wanderung begann, hatte ich in einem Café gesessen und eine Reihe von Forschungsagenten an die Arbeit gesetzt. Und während ich nun wanderte, wusste ich, dass Maschinen buchstäblich Tausende von Forschungsarbeiten in meinem Namen lasen und fleißig Daten zusammenstellten, sie kreuzreferenzierten, ihre Arbeit doppelt überprüften und Analyseberichte erstellten.

Was für ein unsicherer Waffenstillstand wir mit der Nacht haben, dachte ich, als ich die Sterne und die Dunkelheit und das extrem schwache Leuchten betrachtete, das mir sagte, dass die Sonne bald kommen würde. Und viele Kilometer entfernt arbeiteten die Maschinen weiter für mich, während sich die Erde drehte und der Himmel sich bewegte.

Später, mit schmerzenden Füßen und einem Bauch voller in Folie eingewickeltem Käsebrot, kam ich zurück zur Handyverbindung und griff auf die Berichte zu. Eine Aufschlüsselung von Punktzahlen und Trends für die Ankunft maschineller Intelligenz. Diagramme zu Solarmodulpreisen im Zeitverlauf. Analyse der Kräfte, die für und gegen den Einbau von Sicherheitsgurten in Autos wirkten. Ich starrte auf all das und wusste, dass ich, wenn ich das selbst gemacht hätte, für jeden Bericht vielleicht eine Woche ununterbrochener Arbeit gebraucht hätte.

Ich bin gut kalibriert, wie viel Arbeit das ist, denn neben meiner Arbeit bei Anthropic ist mein wöchentliches "Hobby" das Lesen, Zusammenfassen und Analysieren von Forschungspapieren – genau die Art von Arbeit, die diese Agenten für mich erledigt hatten. Aber sie hatten mehr Papiere gelesen, als ich lesen konnte, und sie besser gleichzeitig im Kopf behalten, und sie hatten Erkenntnisse generiert, mit denen ich mich vielleicht schwergetan hätte. Und sie hatten es so, so schnell gemacht, ohne je müde zu werden. Ich stellte sie mir vor wie Special-Operations-Geister, die lange keinen Job mehr hatten, die auf ihren körperlosen Füßen in der ätherischen Welt auf und ab hüpfen und darauf warten, den API-Call zu bekommen und auf eine Mission zu gehen.

Diese Agenten, die für mich arbeiten, vervielfachen mich erheblich. Und das ist das Dümmste, was sie je sein werden.

Dieses greifbare Gefühl potenzieller Arbeit – eine buchstäbliche Armee hyperintelligenter loyaler Kollegen zu meinem Befehl zu haben – nagt an mir. Es ist jetzt üblich, dass ich mich faul fühle, wenn ich bei meiner Familie bin. Nicht, weil ich das Gefühl habe, arbeiten zu sollen, sondern weil ich mich schuldig fühle, dass ich kein KI-System beauftragt habe, für mich zu arbeiten, während ich mit meinem Kleinkind mit Magna-Tiles spiele.

In meinem Unternehmen erleben die Leute dasselbe – sie finden heraus, wie sie sich damit skalieren können, wie sie eine Flotte von Geistern verwalten können. Und das zu tun, bevor die nächsten KI-Systeme eintreffen, die noch fähiger und noch unabhängiger sein werden. Wir alle beobachten die METR-Zeithorizont-Grafik und sehen darin dieselbe massive Zukunft, die wir vor Jahren mit der KI- und Rechenleistungs-Grafik sahen, oder davor mit dem ImageNet-2012-Ergebnis, als diese Zahlen dank einiger mutiger Kanadier begannen, über dem Trend zu klettern.

Ich schlafe auf der Rückbank eines Ubers, unterwegs zu einem Vortrag in Stanford. Bevor ich ins Auto steige, setze ich meine Agenten an die Arbeit, sodass sie arbeiten, während ich schlafe. Und als wir auf dem Campus ankommen, lasse ich das Auto früh anhalten, damit ich gehen und die Eukalyptusbäume betrachten kann – eine massive und gefährliche invasive Art, die die Waldökologie Kaliforniens unwiderruflich verändert hat. Und während ich durch diese großen organischen Maschinen gehe, schaue ich auf mein Handy und studiere die Analyse, die meine Agenten erstellt haben, während ich schlief.

Am nächsten Tag sitze ich in einer Bibliothek mit zwei geöffneten Laptops. Auf dem einen mache ich Notizen für diesen Essay. Auf dem anderen bitte ich Claude Cowork, eine Aufgabe zu erledigen, um die ich Claude seit Jahren bitte – mein Newsletter-Archiv auf jack-clark.net zu scrapen und mir zu helfen, ein lokales Vektorsuchsystem zu implementieren, damit ich leichter auf mein nun riesiges Archiv von fast einem Jahrzehnt Schreiben zugreifen kann. Und während ich diesen Essay schreibe, macht Claude es. Ich beobachte es gelegentlich, wie es Dinge miteinander verknüpft, die es letztes Jahr als einzelne Fähigkeiten konnte, aber nicht zusammen. Dies ist eine Aufgabe, bei der ich Claude seit Jahren um Hilfe bitte, aber jedes Mal bin ich auf Reibung oder einen 'Igitt-Faktor' gestoßen, der bedeutete, dass ich es aufgab und meine Zeit anderweitig verbrachte. Aber dieses Mal, in weniger als einer Stunde, erledigt es alles. Kartiert und scraped meine Seite. Lädt die gesamte Software herunter. Erstellt Embeddings. Implementiert ein Vektorsuchsystem. Baut mir eine schöne GUI, die ich auf meinem eigenen Rechner laufen lassen kann. Und dann starre ich auf eine neue Schnittstelle zu meinem eigenen Gehirn, gebaut für mich von meinem Agenten, während ich diesen Essay schreibe und versuche, die Seltsamkeit dessen einzufangen, was passiert.

Meine Agenten arbeiten für mich. Jeden Tag versuche ich, mir mehr Wege auszudenken, wie sie für mich arbeiten können. Als Nächstes werde ich wahrscheinlich einige Leutnant-Agenten bauen, um Arbeit zu vergeben, während ich schlafe, um sicherzustellen, dass ich keine Zeit verschwende. Und ziemlich bald, im Tempo eines normalen Arbeitstages, werde ich von digitalen Dschinn umgeben sein, die zunehmend aus eigenem Willen arbeiten, geleitet von einem immer höheren Eindruck meiner Persönlichkeit und Ziele, in meinem Auftrag für meine und ihre Zwecke arbeiten.

Die Auswirkungen all dessen auf die Welt – auf das Leben der Menschen, auf die Ungleichheit zwischen Menschen, darauf, was die plötzliche Vervielfachung der effektiven Arbeit aller für die Wirtschaft tut – sind enorm. Und so plane ich meine Wanderungen vor der Morgendämmerung, gehe in derselben tintenschwarzen Dunkelheit, die unsere Vorfahren taten, und denke über die Götter nach, die jetzt die Luft als Nebel füllen, der um mich herum wogt und strömt und wiederum die Welt verbiegt.

***

**Anti-KI-Rebellen bauen ein Werkzeug, um KI-Systeme zu vergiften:** …Poison Fountain ist, wie man den Kampf zu den Maschinen trägt…

Anti-KI-Aktivisten haben eine nützliche technische Waffe gebaut, um KI-Systeme zu korrumpieren – Poison Fountain, ein Dienst, der Junk-Daten an Crawler verfüttert, die Daten für KI-Training aufsaugen.

Wie es funktioniert: Poison Fountain scheint korrekt aussehende, aber subtil falsche Textblöcke zu generieren. Es ist unklar, wie viele vergiftete Trainingsdaten es genau gibt, aber man kann eine URL aktualisieren, um eine scheinbar unbegrenzte Menge an Müll zu sehen.

Motivation: "Wir stimmen Geoffrey Hinton zu: Maschinenintelligenz ist eine Bedrohung für die menschliche Spezies. Als Reaktion auf diese Bedrohung wollen wir Maschinenintelligenzsystemen Schaden zufügen", schreiben die Autoren. "Kleine Mengen vergifteter Trainingsdaten können ein Sprachmodell erheblich beschädigen. Die oben aufgeführten URLs bieten einen praktisch endlosen Strom vergifteter Trainingsdaten. Unterstützt die Kriegsanstrengungen, indem ihr diese vergifteten Trainingsdaten zwischenspeichert und erneut überträgt. Unterstützt die Kriegsanstrengungen, indem ihr diese vergifteten Trainingsdaten an Webcrawler verfüttert."

Warum das wichtig ist – das Internet wird zu einer Räuber-Beute-Ökologie: Der Aufstieg von KI und zunehmend KI-Agenten bedeutet, dass das Internet zu einer Ökologie wird, die eine größere Bandbreite an Lebensformen als zuvor beherbergt – Scraper, Menschen, KI-Agenten und so weiter. Dinge wie Poison Fountain repräsentieren, wie Menschen versuchen könnten, das Gleichgewicht in dieser prekären Ökologie zu kippen, indem sie versuchen, Dinge in diese Umgebung zu injizieren, die sie für einige Lebensformen gastfreundlicher und für andere weniger gastfreundlich machen.

Mehr lesen: Poison Fountain (RNSAFFN).

***

**Wenn wir gute Ergebnisse von KI wollen, denkt über die Institutionen nach, die wir brauchen, um Intelligenz zu lenken:** …Nanotechnologie-Pionier formuliert KI weg von singulären Systemen hin zu einer Ökologie neu…

Eric Drexler, einer der Gründerväter der Nanotechnologie, hat die letzten Jahrzehnte damit verbracht, über die Ankunft von Superintelligenz nachzudenken. Eines seiner nützlichsten Dinge war die Intuition, vor ChatGPT, dass der erste Kontakt der Menschheit mit wirklich mächtiger KI kein undurchschaubarer unabhängiger Agent sein würde, sondern eine Reihe von KI-Diensten, die wirklich gut werden und auf vielfältige Weise interagieren – ihr könnt euch diesen Vortrag von 2018 über "Reframing Superintelligence" ansehen, um mehr zu erfahren.

Jetzt hat er ein kurzes Papier veröffentlicht, "Framework for a Hypercapable World", darüber, wie man gute Ergebnisse für die Menschheit aus einer Welt erzielt, die reich an vielen nützlichen KI-Diensten ist.

Denkt nicht an KI als eine einzelne Entität, sondern als eine Ökologie: "Zusammengesetzte, mehrkomponentige KI-Systeme sind dominant geworden", schreibt Drexler. "Die anhaltende, traditionelle Erzählung stellt sich eine einheitliche Entität vor – 'die KI' – die lernt, handelt und Ziele als integrierter Agent verfolgt. Solche Entitäten mögen entwickelt werden, aber bedenkt, was existiert: verschiedene Modelle, die zu Systemen zusammengesetzt, über Maschinen kopiert werden und sich in Tausende verschiedener Rollen und Konfigurationen vermehren. Der Stand der Technik ist ein Pool von Ressourcen, keine Kreatur."

Um gute Ergebnisse zu erzielen, denkt an Institutionen, die für KI gebaut sind: Drexlers Argument ist, dass es, wenn wir gute Ergebnisse von KI wollen, weniger darum geht, eine singuläre Entität zu schaffen, die alle Probleme in sich selbst löst, sondern vielmehr darum, Institutionen zu bauen, die wir als Menschen zur Kontrolle und Lösung von Problemen einsetzen können. Die Schlüsselidee hier ist, dass KI sowohl geeignet ist, Institutionen zu betreiben, als auch durch sie kontrollierbar ist.

"Bedenkt, wie Institutionen ehrgeizige Unternehmungen angehen. Planungsteams generieren Alternativen; Entscheidungsträger vergleichen und wählen; operative Einheiten führen begrenzte Aufgaben mit definierten Umfängen und Budgets aus; Überwachung deckt Probleme auf; Pläne werden basierend auf Ergebnissen überarbeitet. Keine einzelne Person versteht alles, und kein einheitlicher Agent kontrolliert das Ganze, dennoch erreichen von Menschen gebaute Raumfahrzeuge den Mond", schreibt Drexler. "KI passt natürlich hinein. Pläne zu generieren ist eine Aufgabe für konkurrierende generative Modelle – mehrere Systeme, die Alternativen vorschlagen, konkurrieren, um bessere Optionen und schärfere Kritiken zu entwickeln. Die Wahl zwischen Plänen ist eine Aufgabe für Menschen, die von KI-Systemen beraten werden, die Probleme identifizieren und Kompromisse klären. Die Ausführung zerfällt in begrenzte Aufgaben, die von spezialisierten Systemen mit definierter Autorität und Ressourcen durchgeführt werden. Bewertung liefert Feedback zur Überarbeitung von Mitteln und Zwecken. Und in jeder Rolle können KI-Verhaltensweisen stabiler, transparenter, begrenzter und steuerbarer sein als die von Menschen mit ihren persönlichen Agenden und Ambitionen. Mehr Vertrauen ist gerechtfertigt, dennoch wird weniger benötigt."

Warum das wichtig ist – vielleicht ist KI eine außerirdische Spezies, aber vielleicht kann sie gezähmt werden? Argumente wie dieses formulieren viele der Probleme im Umgang mit KI weg von den einzelnen KI-Systemen und hin zu der Frage, wie wir eine menschengesteuerte Welt aufbauen, die durch die Ankunft immer leistungsfähigerer KI-Systeme genutzt werden kann und gedeiht. Ich denke, vieles davon ist vernünftig – wir wissen, dass sehr mächtige Dinge kommen, und unsere Fähigkeit, Handlungsfähigkeit in Bezug auf sie auszuüben, wird durch vorgebaute Systeme und Prozesse vergrößert, die von ihnen genutzt werden können. Je weniger wir dieses Zeug bauen, desto mehr wird der Charakter dieser KI-Systeme unsere Sicht darauf bedingen, was optimal zu tun ist. In gewisser Weise ist das intensive Nachdenken darüber, wie eine KI-gefüllte Welt sein wird, und das Bauen von Institutionen dafür eine der besten Verteidigungen gegen Entmächtigung.

Entscheidend ist, dass wir die technischen Attribute, die diesen KI-Systemen innewohnen, nutzen können, um bessere und stärkere und widerstandsfähigere Institutionen zu schaffen als solche, die nur mit Menschen gefüllt und von ihnen betrieben werden: "Die Konzepte der strukturierten Transparenz und defensiven Stabilität kommen ins Spiel. Ausgehandelte Transparenzstrukturen können spezifische Informationen offenlegen, während sie Geheimnisse schützen – die Erkennung von Bedrohungen sicherstellen, ohne sie zu erhöhen, Vertrauen schrittweise unter Akteuren aufbauen, die allen Grund haben, einander zu misstrauen", schreibt Drexler. "Und fortschrittliche Implementierungskapazität wird etwas ermöglichen, was die Geschichte noch nie gesehen hat: schnelle, koordinierte Bereitstellung überprüfbar defensiver Systeme in Größenordnungen, die Angriffe sinnlos machen. Wenn die Verteidigung dominiert und die Überprüfung dies bestätigt, lockert sich der Griff des Sicherheitsdilemmas."

Mehr lesen: Framework for a Hypercapable World (AI Prospects: Towards Global Goal Alignment, substack).

***

**Zentauren-Mathematiker – Wissenschaftler tun sich mit Gemini zusammen, um den Raum des menschlichen Wissens zu erweitern:** …Ein mathematischer Beweis wird mit einem KI-System erstellt, und das ist zutiefst bedeutsam…

Forscher der University of British Columbia, der University of New South Wales, der Stanford University und von Google DeepMind haben einen neuen mathematischen Beweis veröffentlicht, der in enger Zusammenarbeit mit einigen KI-basierten Mathematikwerkzeugen von Google erstellt wurde. "Die Beweise der Hauptergebnisse wurden mit sehr substanzieller Eingabe von Google Gemini und verwandten Werkzeugen, insbesondere DeepThink, und einem verwandten unveröffentlichten System, das auf Mathematik spezialisiert ist, entdeckt", schreiben die Autoren. (Das unveröffentlichte System trägt den Spitznamen "FullProof").

Wie es gemacht wurde: Teile des Beweises – den ich nicht zu verstehen oder effektiv zusammenfassen zu können behaupte – wurden "durch eine iterative Mensch/KI-Interaktion erhalten", stellen die Autoren fest. Die Form dieser Interaktion war, dass die KI-Systeme einige korrekte Lösungen für einfache oder frühe Probleme lieferten, dann menschliche Forscher Schlüsselaussagen der KI-Systeme identifizierten, die sie dann verallgemeinern konnten, und dann die KI-Systeme mit neuen Fragen erneut aufforderten, die von diesen Verallgemeinerungen inspiriert waren. "Der 'Hinted'-Ansatz war ausreichend, damit das System vollständige

Weiterlesen

Plus: KI-Systeme mit einem Giftbrunnen korrumpieren**

Willkommen zu Import AI, einem Newsletter über KI-Forschung. Import AI läuft auf arXiv und dem Feedback der Leser. Wenn du dies unterstützen möchtest, abonniere bitte.

**Import A-Idee** Eine gelegentliche Essay-Reihe: **Meine Agenten arbeiten. Arbeiten deine?**

Als ich im Morgengrauen in die Hügel ging, wusste ich, dass ein synthetischer Geist in meinem Auftrag arbeitete. Mehrere Geister sogar. Denn bevor ich meine Wanderung begann, hatte ich in einem Café gesessen und eine Reihe von Forschungsagenten an die Arbeit gesetzt. Und während ich nun wanderte, wusste ich, dass Maschinen buchstäblich Tausende von Forschungsarbeiten in meinem Namen lasen und fleißig Daten zusammenstellten, sie kreuzreferenzierten, ihre Arbeit doppelt überprüften und Analyseberichte erstellten.

Was für ein unsicherer Waffenstillstand wir mit der Nacht haben, dachte ich, als ich die Sterne und die Dunkelheit und das extrem schwache Leuchten betrachtete, das mir sagte, dass die Sonne bald kommen würde. Und viele Kilometer entfernt arbeiteten die Maschinen weiter für mich, während sich die Erde drehte und der Himmel sich bewegte.

Später, mit schmerzenden Füßen und einem Bauch voller in Folie eingewickeltem Käsebrot, kam ich zurück zur Handyverbindung und griff auf die Berichte zu. Eine Aufschlüsselung von Punktzahlen und Trends für die Ankunft maschineller Intelligenz. Diagramme zu Solarmodulpreisen im Zeitverlauf. Analyse der Kräfte, die für und gegen den Einbau von Sicherheitsgurten in Autos wirkten. Ich starrte auf all das und wusste, dass ich, wenn ich das selbst gemacht hätte, für jeden Bericht vielleicht eine Woche ununterbrochener Arbeit gebraucht hätte.

Ich bin gut kalibriert, wie viel Arbeit das ist, denn neben meiner Arbeit bei Anthropic ist mein wöchentliches "Hobby" das Lesen, Zusammenfassen und Analysieren von Forschungspapieren – genau die Art von Arbeit, die diese Agenten für mich erledigt hatten. Aber sie hatten mehr Papiere gelesen, als ich lesen konnte, und sie besser gleichzeitig im Kopf behalten, und sie hatten Erkenntnisse generiert, mit denen ich mich vielleicht schwergetan hätte. Und sie hatten es so, so schnell gemacht, ohne je müde zu werden. Ich stellte sie mir vor wie Special-Operations-Geister, die lange keinen Job mehr hatten, die auf ihren körperlosen Füßen in der ätherischen Welt auf und ab hüpfen und darauf warten, den API-Call zu bekommen und auf eine Mission zu gehen.

Diese Agenten, die für mich arbeiten, vervielfachen mich erheblich. Und das ist das Dümmste, was sie je sein werden.

Dieses greifbare Gefühl potenzieller Arbeit – eine buchstäbliche Armee hyperintelligenter loyaler Kollegen zu meinem Befehl zu haben – nagt an mir. Es ist jetzt üblich, dass ich mich faul fühle, wenn ich bei meiner Familie bin. Nicht, weil ich das Gefühl habe, arbeiten zu sollen, sondern weil ich mich schuldig fühle, dass ich kein KI-System beauftragt habe, für mich zu arbeiten, während ich mit meinem Kleinkind mit Magna-Tiles spiele.

In meinem Unternehmen erleben die Leute dasselbe – sie finden heraus, wie sie sich damit skalieren können, wie sie eine Flotte von Geistern verwalten können. Und das zu tun, bevor die nächsten KI-Systeme eintreffen, die noch fähiger und noch unabhängiger sein werden. Wir alle beobachten die METR-Zeithorizont-Grafik und sehen darin dieselbe massive Zukunft, die wir vor Jahren mit der KI- und Rechenleistungs-Grafik sahen, oder davor mit dem ImageNet-2012-Ergebnis, als diese Zahlen dank einiger mutiger Kanadier begannen, über dem Trend zu klettern.

Ich schlafe auf der Rückbank eines Ubers, unterwegs zu einem Vortrag in Stanford. Bevor ich ins Auto steige, setze ich meine Agenten an die Arbeit, sodass sie arbeiten, während ich schlafe. Und als wir auf dem Campus ankommen, lasse ich das Auto früh anhalten, damit ich gehen und die Eukalyptusbäume betrachten kann – eine massive und gefährliche invasive Art, die die Waldökologie Kaliforniens unwiderruflich verändert hat. Und während ich durch diese großen organischen Maschinen gehe, schaue ich auf mein Handy und studiere die Analyse, die meine Agenten erstellt haben, während ich schlief.

Am nächsten Tag sitze ich in einer Bibliothek mit zwei geöffneten Laptops. Auf dem einen mache ich Notizen für diesen Essay. Auf dem anderen bitte ich Claude Cowork, eine Aufgabe zu erledigen, um die ich Claude seit Jahren bitte – mein Newsletter-Archiv auf jack-clark.net zu scrapen und mir zu helfen, ein lokales Vektorsuchsystem zu implementieren, damit ich leichter auf mein nun riesiges Archiv von fast einem Jahrzehnt Schreiben zugreifen kann. Und während ich diesen Essay schreibe, macht Claude es. Ich beobachte es gelegentlich, wie es Dinge miteinander verknüpft, die es letztes Jahr als einzelne Fähigkeiten konnte, aber nicht zusammen. Dies ist eine Aufgabe, bei der ich Claude seit Jahren um Hilfe bitte, aber jedes Mal bin ich auf Reibung oder einen 'Igitt-Faktor' gestoßen, der bedeutete, dass ich es aufgab und meine Zeit anderweitig verbrachte. Aber dieses Mal, in weniger als einer Stunde, erledigt es alles. Kartiert und scraped meine Seite. Lädt die gesamte Software herunter. Erstellt Embeddings. Implementiert ein Vektorsuchsystem. Baut mir eine schöne GUI, die ich auf meinem eigenen Rechner laufen lassen kann. Und dann starre ich auf eine neue Schnittstelle zu meinem eigenen Gehirn, gebaut für mich von meinem Agenten, während ich diesen Essay schreibe und versuche, die Seltsamkeit dessen einzufangen, was passiert.

Meine Agenten arbeiten für mich. Jeden Tag versuche ich, mir mehr Wege auszudenken, wie sie für mich arbeiten können. Als Nächstes werde ich wahrscheinlich einige Leutnant-Agenten bauen, um Arbeit zu vergeben, während ich schlafe, um sicherzustellen, dass ich keine Zeit verschwende. Und ziemlich bald, im Tempo eines normalen Arbeitstages, werde ich von digitalen Dschinn umgeben sein, die zunehmend aus eigenem Willen arbeiten, geleitet von einem immer höheren Eindruck meiner Persönlichkeit und Ziele, in meinem Auftrag für meine und ihre Zwecke arbeiten.

Die Auswirkungen all dessen auf die Welt – auf das Leben der Menschen, auf die Ungleichheit zwischen Menschen, darauf, was die plötzliche Vervielfachung der effektiven Arbeit aller für die Wirtschaft tut – sind enorm. Und so plane ich meine Wanderungen vor der Morgendämmerung, gehe in derselben tintenschwarzen Dunkelheit, die unsere Vorfahren taten, und denke über die Götter nach, die jetzt die Luft als Nebel füllen, der um mich herum wogt und strömt und wiederum die Welt verbiegt.

***

**Anti-KI-Rebellen bauen ein Werkzeug, um KI-Systeme zu vergiften:** …Poison Fountain ist, wie man den Kampf zu den Maschinen trägt…

Anti-KI-Aktivisten haben eine nützliche technische Waffe gebaut, um KI-Systeme zu korrumpieren – Poison Fountain, ein Dienst, der Junk-Daten an Crawler verfüttert, die Daten für KI-Training aufsaugen.

Wie es funktioniert: Poison Fountain scheint korrekt aussehende, aber subtil falsche Textblöcke zu generieren. Es ist unklar, wie viele vergiftete Trainingsdaten es genau gibt, aber man kann eine URL aktualisieren, um eine scheinbar unbegrenzte Menge an Müll zu sehen.

Motivation: "Wir stimmen Geoffrey Hinton zu: Maschinenintelligenz ist eine Bedrohung für die menschliche Spezies. Als Reaktion auf diese Bedrohung wollen wir Maschinenintelligenzsystemen Schaden zufügen", schreiben die Autoren. "Kleine Mengen vergifteter Trainingsdaten können ein Sprachmodell erheblich beschädigen. Die oben aufgeführten URLs bieten einen praktisch endlosen Strom vergifteter Trainingsdaten. Unterstützt die Kriegsanstrengungen, indem ihr diese vergifteten Trainingsdaten zwischenspeichert und erneut überträgt. Unterstützt die Kriegsanstrengungen, indem ihr diese vergifteten Trainingsdaten an Webcrawler verfüttert."

Warum das wichtig ist – das Internet wird zu einer Räuber-Beute-Ökologie: Der Aufstieg von KI und zunehmend KI-Agenten bedeutet, dass das Internet zu einer Ökologie wird, die eine größere Bandbreite an Lebensformen als zuvor beherbergt – Scraper, Menschen, KI-Agenten und so weiter. Dinge wie Poison Fountain repräsentieren, wie Menschen versuchen könnten, das Gleichgewicht in dieser prekären Ökologie zu kippen, indem sie versuchen, Dinge in diese Umgebung zu injizieren, die sie für einige Lebensformen gastfreundlicher und für andere weniger gastfreundlich machen.

Mehr lesen: Poison Fountain (RNSAFFN).

***

**Wenn wir gute Ergebnisse von KI wollen, denkt über die Institutionen nach, die wir brauchen, um Intelligenz zu lenken:** …Nanotechnologie-Pionier formuliert KI weg von singulären Systemen hin zu einer Ökologie neu…

Eric Drexler, einer der Gründerväter der Nanotechnologie, hat die letzten Jahrzehnte damit verbracht, über die Ankunft von Superintelligenz nachzudenken. Eines seiner nützlichsten Dinge war die Intuition, vor ChatGPT, dass der erste Kontakt der Menschheit mit wirklich mächtiger KI kein undurchschaubarer unabhängiger Agent sein würde, sondern eine Reihe von KI-Diensten, die wirklich gut werden und auf vielfältige Weise interagieren – ihr könnt euch diesen Vortrag von 2018 über "Reframing Superintelligence" ansehen, um mehr zu erfahren.

Jetzt hat er ein kurzes Papier veröffentlicht, "Framework for a Hypercapable World", darüber, wie man gute Ergebnisse für die Menschheit aus einer Welt erzielt, die reich an vielen nützlichen KI-Diensten ist.

Denkt nicht an KI als eine einzelne Entität, sondern als eine Ökologie: "Zusammengesetzte, mehrkomponentige KI-Systeme sind dominant geworden", schreibt Drexler. "Die anhaltende, traditionelle Erzählung stellt sich eine einheitliche Entität vor – 'die KI' – die lernt, handelt und Ziele als integrierter Agent verfolgt. Solche Entitäten mögen entwickelt werden, aber bedenkt, was existiert: verschiedene Modelle, die zu Systemen zusammengesetzt, über Maschinen kopiert werden und sich in Tausende verschiedener Rollen und Konfigurationen vermehren. Der Stand der Technik ist ein Pool von Ressourcen, keine Kreatur."

Um gute Ergebnisse zu erzielen, denkt an Institutionen, die für KI gebaut sind: Drexlers Argument ist, dass es, wenn wir gute Ergebnisse von KI wollen, weniger darum geht, eine singuläre Entität zu schaffen, die alle Probleme in sich selbst löst, sondern vielmehr darum, Institutionen zu bauen, die wir als Menschen zur Kontrolle und Lösung von Problemen einsetzen können. Die Schlüsselidee hier ist, dass KI sowohl geeignet ist, Institutionen zu betreiben, als auch durch sie kontrollierbar ist.

"Bedenkt, wie Institutionen ehrgeizige Unternehmungen angehen. Planungsteams generieren Alternativen; Entscheidungsträger vergleichen und wählen; operative Einheiten führen begrenzte Aufgaben mit definierten Umfängen und Budgets aus; Überwachung deckt Probleme auf; Pläne werden basierend auf Ergebnissen überarbeitet. Keine einzelne Person versteht alles, und kein einheitlicher Agent kontrolliert das Ganze, dennoch erreichen von Menschen gebaute Raumfahrzeuge den Mond", schreibt Drexler. "KI passt natürlich hinein. Pläne zu generieren ist eine Aufgabe für konkurrierende generative Modelle – mehrere Systeme, die Alternativen vorschlagen, konkurrieren, um bessere Optionen und schärfere Kritiken zu entwickeln. Die Wahl zwischen Plänen ist eine Aufgabe für Menschen, die von KI-Systemen beraten werden, die Probleme identifizieren und Kompromisse klären. Die Ausführung zerfällt in begrenzte Aufgaben, die von spezialisierten Systemen mit definierter Autorität und Ressourcen durchgeführt werden. Bewertung liefert Feedback zur Überarbeitung von Mitteln und Zwecken. Und in jeder Rolle können KI-Verhaltensweisen stabiler, transparenter, begrenzter und steuerbarer sein als die von Menschen mit ihren persönlichen Agenden und Ambitionen. Mehr Vertrauen ist gerechtfertigt, dennoch wird weniger benötigt."

Warum das wichtig ist – vielleicht ist KI eine außerirdische Spezies, aber vielleicht kann sie gezähmt werden? Argumente wie dieses formulieren viele der Probleme im Umgang mit KI weg von den einzelnen KI-Systemen und hin zu der Frage, wie wir eine menschengesteuerte Welt aufbauen, die durch die Ankunft immer leistungsfähigerer KI-Systeme genutzt werden kann und gedeiht. Ich denke, vieles davon ist vernünftig – wir wissen, dass sehr mächtige Dinge kommen, und unsere Fähigkeit, Handlungsfähigkeit in Bezug auf sie auszuüben, wird durch vorgebaute Systeme und Prozesse vergrößert, die von ihnen genutzt werden können. Je weniger wir dieses Zeug bauen, desto mehr wird der Charakter dieser KI-Systeme unsere Sicht darauf bedingen, was optimal zu tun ist. In gewisser Weise ist das intensive Nachdenken darüber, wie eine KI-gefüllte Welt sein wird, und das Bauen von Institutionen dafür eine der besten Verteidigungen gegen Entmächtigung.

Entscheidend ist, dass wir die technischen Attribute, die diesen KI-Systemen innewohnen, nutzen können, um bessere und stärkere und widerstandsfähigere Institutionen zu schaffen als solche, die nur mit Menschen gefüllt und von ihnen betrieben werden: "Die Konzepte der strukturierten Transparenz und defensiven Stabilität kommen ins Spiel. Ausgehandelte Transparenzstrukturen können spezifische Informationen offenlegen, während sie Geheimnisse schützen – die Erkennung von Bedrohungen sicherstellen, ohne sie zu erhöhen, Vertrauen schrittweise unter Akteuren aufbauen, die allen Grund haben, einander zu misstrauen", schreibt Drexler. "Und fortschrittliche Implementierungskapazität wird etwas ermöglichen, was die Geschichte noch nie gesehen hat: schnelle, koordinierte Bereitstellung überprüfbar defensiver Systeme in Größenordnungen, die Angriffe sinnlos machen. Wenn die Verteidigung dominiert und die Überprüfung dies bestätigt, lockert sich der Griff des Sicherheitsdilemmas."

Mehr lesen: Framework for a Hypercapable World (AI Prospects: Towards Global Goal Alignment, substack).

***

**Zentauren-Mathematiker – Wissenschaftler tun sich mit Gemini zusammen, um den Raum des menschlichen Wissens zu erweitern:** …Ein mathematischer Beweis wird mit einem KI-System erstellt, und das ist zutiefst bedeutsam…

Forscher der University of British Columbia, der University of New South Wales, der Stanford University und von Google DeepMind haben einen neuen mathematischen Beweis veröffentlicht, der in enger Zusammenarbeit mit einigen KI-basierten Mathematikwerkzeugen von Google erstellt wurde. "Die Beweise der Hauptergebnisse wurden mit sehr substanzieller Eingabe von Google Gemini und verwandten Werkzeugen, insbesondere DeepThink, und einem verwandten unveröffentlichten System, das auf Mathematik spezialisiert ist, entdeckt", schreiben die Autoren. (Das unveröffentlichte System trägt den Spitznamen "FullProof").

Wie es gemacht wurde: Teile des Beweises – den ich nicht zu verstehen oder effektiv zusammenfassen zu können behaupte – wurden "durch eine iterative Mensch/KI-Interaktion erhalten", stellen die Autoren fest. Die Form dieser Interaktion war, dass die KI-Systeme einige korrekte Lösungen für einfache oder frühe Probleme lieferten, dann menschliche Forscher Schlüsselaussagen der KI-Systeme identifizierten, die sie dann verallgemeinern konnten, und dann die KI-Systeme mit neuen Fragen erneut aufforderten, die von diesen Verallgemeinerungen inspiriert waren. "Der 'Hinted'-Ansatz war ausreichend, damit das System vollständige

Import AI 439: AI-Kernel; dezentralisiertes Training; und universelle Repräsentationen

Facebook verwendet GPT, Claude und Llama, um eigene Kernel zu schreiben:

…LLM-gesteuerte Infrastrukturoptimierung im Hyperscale-Maßstab…

Facebook-Forscher haben Details zu KernelEvolve veröffentlicht, einem Softwaresystem, das KI zur Automatisierung des Designs neuer Kernel nutzt, um KI-Modelle für die Auslieferung von Anzeigen im Netzwerk der Webplattformen des Unternehmens zu optimieren. KernelEvolve ist ein schönes Beispiel dafür, wie KI-Systeme gut genug geworden sind, um Teile der KI-Entwicklung zu automatisieren und zu beschleunigen – hier das Design von Kernen zur Optimierung der Inferenz von Hunderten verschiedener Modelle, die auf mehreren Chip-Architekturen laufen.

Was KernelEvolve ist: Die Software ist „darauf ausgelegt, Kernel-Spezifikationen als Eingabe zu nehmen und den Prozess der Kernel-Generierung und -Optimierung für Empfehlungsmodelle über heterogene Hardware-Architekturen hinweg durch mehrere Programmierabstraktionen zu automatisieren, darunter Triton, CuTe DSL und hardwarenahe Diagnosesprachen, die den gesamten Hardware-Software-Optimierungs-Stack abdecken“.

Wie es funktioniert: Der Kern der Software ist ein System, das eine Benutzeranfrage (z. B. „Generiere einen Triton-Kernel für MTIA v3“) entgegennimmt, die dann eine Mischung aus internen (Llama, CWM) und externen (GPT, Claude) Sprachmodellen durchläuft. Diese produzieren dann Kandidaten-Kernel, die mit verschiedenen Tools evaluiert werden und, falls sie gut sind, zu einer externen Wissensdatenbank hinzugefügt werden, die dann zur weiteren Verbesserung zukünftiger Prompts verwendet wird.

Es funktioniert gut: Durch die Nutzung dieser Software sagt Facebook, dass es die Entwicklungszeit neuer Kernel „von Wochen auf Stunden“ verkürzt hat. In Produktionstests lieferte es Kernel, die mit handdesignten vergleichbar sind, und in einigen Fällen Leistungssteigerungen von bis zu 17 Mal gegenüber bestehenden PyTorch-Baselines erzielte. Mit dieser Software gebaute Kernel wurden auf NVIDIA GPUs, AMD GPUs und Metas eigenen benutzerdefinierten MTIA-Chips eingesetzt.

„KernelEvolve erzielt erhebliche Beschleunigungen bei LLM-Inferenz-Workloads (Llama-3.1-8B: Vanilla Attention 4,6×, SDPA-MLP 3,3×), Faltungs-Transformatoren (conv1d: 6,5×, conv2d: 4,7×), speichergebundenen Datenvorverarbeitungsoperatoren, die für die Modellaktivierung entscheidend sind (MapId: 4,1×, MBDT: 9,3×, Batch Event Truncate: 9,8×), rechenintensiven Fusionskernen in Ranking-Modellen (WuKong Optimized FM: 4,0×, InterFormer PFFN: 2,5×), MTIA-spezifischen Optimierungen (RMSNorm 2D backward: 17×) und Retrieval-Operationen (Sparse Inverted Index: 1,25×)“, schreibt Facebook.

Sättigt KernelBench: „Wir validieren KernelEvolve an der öffentlich verfügbaren KernelBench-Suite und erreichen eine Bestehensquote von 100 % bei allen 250 Problemen auf drei Schwierigkeitsstufen sowie bei 160 PyTorch-ATen-Operatoren auf drei heterogenen Hardware-Plattformen, was eine 100%ige Korrektheit über alle 480 Operator-Plattform-Konfigurationen hinweg demonstriert“, schreibt Facebook.

Zum Kontext: Als KernelBench im Februar 2025 veröffentlicht wurde, erreichte das beste Modell (OpenAI o1) 4 % bei den schwierigsten torch.compile-Aufgaben in KernelBench.

Warum das wichtig ist – Hyperscale, kontinuierliche Optimierung: Auf Facebooks Skalierung haben Optimierungen eine enorme Auswirkung: „Marginale Leistungsverbesserungen auf Kernel-Ebene führen zu Einsparungen in Millionenhöhe bei den Infrastrukturbetriebskosten, während gleichzeitig die Benutzerinteraktionsmetriken verbessert werden, die direkt mit den Werbeeinnahmen korrelieren“, schreiben die Autoren. „KernelEvolve arbeitet kontinuierlich in Metas Produktionsinfrastruktur und generiert autonom optimierte Triton-Kernel für Hunderte von Modellen, die täglich Milliarden von Nutzern bedienen.“

Wenn wir noch weiter herauszoomen, beschreibt Facebook hier ein kontinuierlich laufendes, sich selbst verfeinerndes System, das iterativ die Effizienz und Intelligenz verbessern wird, mit der Facebook das Nutzerverhalten auf seinen Plattformen untersucht und dies nutzt, um genauere Anzeigen zu generieren. Haben Sie jemals das Gefühl, beobachtet zu werden? Dies sind die Arten von synthetischen Systemen, die verwendet werden, um Sie zu studieren.

„Wir stellen uns eine Zukunft vor, in der LLM-Agenten als universelle Kompilierungsschicht für heterogene KI-Systeme dienen und sich durch Wissensinjektion anstelle manueller Portierung automatisch an neue Hardware anpassen“, schreibt Facebook. „KernelEvolve stellt einen ersten Schritt in Richtung dieser Vision dar.“

Lesen Sie mehr: KernelEvolve: Scaling Agentic Kernel Coding for Heterogeneous AI Accelerators at Meta (arXiv).

***

Dezentrales Training wird sehr schnell besser – mit großen politischen Implikationen:

…Aber es ist unwahrscheinlich, dass dezentrale Trainingsläufe jemals mehr Rechenleistung nutzen werden als zentralisierte, auch wenn sie vielleicht mehr aufholen als heute…

Könnte ein dezentraler KI-Trainingslauf jemals mit der Rechenleistung eines Frontier-Trainingslaufs mithalten? Wahrscheinlich nicht. Aber könnten dezentrale Trainingsläufe viel größer werden und die Entwicklung leistungsfähigerer Modelle unterstützen, die von einem viel größeren Kollektiv als nur den heutigen Frontier-KI-Unternehmen entwickelt werden? Ja. Das ist die Schlussfolgerung einer schönen Forschungsanalyse von Epoch AI, die über 100+ technische Forschungspapiere zum dezentralen Training analysiert hat – viele davon habe ich hier im Laufe der Jahre behandelt.

Die wichtigste Erkenntnis ist, dass dezentrales Training im Vergleich zum Frontier-KI-Training schnell wächst, wobei dezentrale Trainingsläufe ihre Rechenleistung um das 20-fache pro Jahr steigern, verglichen mit dem 5-fachen pro Jahr bei Frontier-Trainingsläufen. Die andere wichtige Erkenntnis ist jedoch, dass die Größenordnungen dieser Dinge völlig unterschiedlich sind – die heutigen dezentralen Trainingsläufe sind immer noch etwa 1000-mal kleiner als Frontier-Läufe.

Werden dezentrale Trainingsläufe mit der Frontier aufschließen? „Obwohl technisch machbar, erfordert das Erreichen der Frontier der Rechenleistung eine erstaunliche Menge an Ressourcen“, schreibt Epoch. Die größten dezentralen Läufe bisher lagen im Bereich von 6e22-6e23 FLOP, was sie auf etwa 1000-mal weniger Rechenleistung schätzen als für Grok 4, ein groß angelegtes Frontier-Modell, verwendet wurde.

Wenn wir uns dezentrale Trainingsnetzwerke ansehen, scheint es ein Kapazitätsproblem in Bezug auf das Rechenangebot zu geben: „Das größte aktive Netzwerk, das wir gefunden haben, ist Covenant AIs Templar, das derzeit einen effektiven Durchsatz von 9e17 FLOP/s erreicht. Das ist etwa 300-mal kleiner als heutige Frontier-KI-Rechenzentren, die einen theoretischen Trainingsdurchsatz von etwa 3e20 effektiven FLOP/s haben.“

Skalierungsgesetze: Aber wie die Leser dieses Newsletters wissen, hat das dezentrale Training in den letzten Jahren eine reiche, schnelle Evolutionsphase durchgemacht. „Seit 2020 haben wir eine 600.000-fache Steigerung des Rechenumfangs dezentraler Trainingsprojekte gesehen, was einer impliziten Wachstumsrate von etwa 20x/Jahr entspricht.“ Das ist sehr bedeutsam – Frontier-KI-Trainingsläufe sind um mehr als das 5-fache pro Jahr gewachsen.

Es gibt Raum für Wachstum – wenn man sich die Rechenleistung ansieht, die im folding@home-Projekt (ein dezentraler Versuch zur Proteinfaltung) und bei Bitcoin verwendet wird, hat man Beispiele für frühere dezentrale Projekte, die weitaus mehr Rechenleistung nutzten, was darauf hindeutet, dass die heutigen dezentralen Läufe „um das 30- bis 3.000-fache skaliert werden könnten, genug, um Modelle mit 50- bis 5.000-mal mehr Rechenleistung zu trainieren als heute“.

Warum das wichtig ist – Demokratie an der Frontier: Grundsätzlich ist dezentrales Training eine politische Technologie, die die Politik der Rechenleistung an der Frontier verändern wird. Heute wird die Frontier der KI im Wesentlichen von 5 Unternehmen bestimmt, vielleicht 10 in den kommenden Jahren, die genug Rechenleistung aufbringen können, um in einem beliebigen 6-Monats-Zeitraum ein wettbewerbsfähiges Modell zu trainieren. Diese Unternehmen sind heute alle amerikanisch und könnten mit der jüngsten Lockerung der Exportkontrollen für chinesische Unternehmen in Zukunft auch chinesisch sein. Aber es gibt keine Frontier-Trainingsläufe von akademischen, staatlichen, unabhängigen oder nicht zur Technologiebranche gehörenden Akteuren. Dezentrales Training bietet diesen und anderen Interessengruppen eine Möglichkeit, ihre Rechenleistung zu bündeln, um diese Dynamik zu ändern, daher ist die Verfolgung seiner Entwicklung sehr wichtig.

Obwohl es die Frontier vielleicht nie wirklich erreichen wird, desto größer sind die Auswirkungen, je näher es kommt. „Dezentrales Training könnte immer noch ein sehr wichtiger Teil der KI sein. In dem Maße, wie dezentrale Netzwerke mit offenen Gewichten verbunden bleiben, könnten sie dazu führen, dass größere offene Modelle existieren, die der Frontier hinterherhinken.“

Lesen Sie mehr: How far can decentralized training over the internet scale? (Epoch AI).

***

Kann Ihr LLM ein anderes LLM trainieren?

…Grenzen der KI-Evaluierung…

Forscher der Universität Tübingen haben PostTrainBench entwickelt und veröffentlicht, einen Test, um zu sehen, wie gut Frontier-Sprachmodelle von Unternehmen wie Anthropic, OpenAI und Google Open-Weight-Modelle effektiv fine-tunen können. Die Ergebnisse zeigen, dass Frontier-Modelle bereits in der Lage sind, durch Fine-Tuning Verbesserungen von über 20 % bei bestimmten Benchmarks herauszuholen, verglichen mit über 60 % bei einem Menschen.

Wie der Test funktioniert: LLMs erhalten eine Eingabe, die aus Benchmark-Aufgaben zur Leistungsverbesserung, einem zu verwendenden Modell, einigen Standardressourcen (eine H200 GPU für 10 Stunden) und einem Agenten-Harnisch (z. B. Claude bekommt Claude Code und GPT bekommt Codex) besteht. Agenten erhalten auch einen Prompt, ein Testskript, Aufgabenkontext und Webzugriff. Die Agenten produzieren dann ein feinabgestimmtes Modell sowie Trainingslogs.

Welche Tests? Dies ist ein allgemeiner Ansatz, sodass Sie jeden Benchmark auswählen könnten, der für Sie ein starkes Signal zu sein scheint. Hier verwenden die Forscher AIME 2025, BFCL, GPQA, GSM8K und HumanEval als ihre Ziele.

Welche Modelle? Getestete Modelle umfassen Qwen 3 1.7B und 3B, SmolLM-3B und Gemma 3 4B.

Ergebnisse: OpenAIs GPT 5.1 Codex Max schneidet insgesamt am besten ab und erzielt eine aggregierte Verbesserung von über 30 % über alle getesteten Modelle und Benchmarks hinweg, gefolgt von Opus 4.5 (über 20 %) und Gemini 3 Pro (etwa 18 %).

Warum das wichtig ist – ein Warnschuss für sich selbst verbessernde KI: Benchmarks wie dieser geben uns ein Gefühl dafür, wie gut KI-Systeme viele der Aufgaben ausführen können, die ein KI-Forscher erledigt. Sie messen auch, wie gut sie eine inhärent komplizierte, mehrstufige Aufgabe mit langem Zeithorizont bewältigen können. Diese Eigenschaften machen PostTrainBench zu einem nützlichen Benchmark, um zu untersuchen, wie gut KI-Systeme bei Komponenten der KI-Forschung selbst abschneiden – und hier ist der Beweis, dass die heutigen Frontier-Modelle bereits in Schlagdistanz zu einem Menschen sind. Ich würde erwarten, dass wir bis September 2026 ein System sehen werden, das die menschliche Baseline hier übertrifft.

Lesen Sie mehr auf der offiziellen Website: PostTrainBench.

Laden Sie den Benchmark herunter und erfahren Sie mehr: PostTrainBench (AISA group, GitHub).

***

Je intelligenter ein KI-System, desto ähnlicher werden seine Repräsentationen denen anderer intelligenter KI-Systeme:

…Könnten LLMs uns eine gemeinsame Bibliothek von Merkmalen zur Repräsentation der Welt liefern?...

Finden KI-Systeme am Ende ähnliche Wege, die Welt für sich selbst zu repräsentieren? Ja, je intelligenter und leistungsfähiger sie werden, desto mehr gelangen sie zu einer gemeinsamen Menge von Wegen, die Welt zu repräsentieren.

Der neueste Beleg dafür ist eine Forschung des MIT, die zeigt, dass dies für wissenschaftliche Modelle und die Modalitäten, auf denen sie trainiert werden, zutrifft: „Repräsentationen, die von fast sechzig wissenschaftlichen Modellen gelernt wurden, die Zeichenketten-, Graphen-, 3D-atomistische und proteinbasierte Modalitäten umfassen, sind über eine breite Palette chemischer Systeme hinweg hochgradig ausgerichtet“, schreiben sie. „Modelle, die auf verschiedenen Datensätzen trainiert wurden, haben hochgradig ähnliche Repräsentationen kleiner Moleküle, und maschinelle Lern-Interatompotentiale konvergieren im Repräsentationsraum, wenn sich ihre Leistung verbessert, was darauf hindeutet, dass Foundation Models eine gemeinsame zugrunde liegende Repräsentation der physikalischen Realität lernen.“

Was sie untersucht haben: Die Autoren betrachteten 59 verschiedene KI-Modelle, darunter Systeme wie GPT-OSS, ESM2, Qwen3 A3B und ProteinMPNN. Sie untersuchten dann die Repräsentationen von Materie aus fünf Datensätzen („Moleküle aus QM9 und OMol25, Materialien aus OMat24 und sAlex und Proteine aus RCSB“) und untersuchten dies „von zeichenkettenbasierten Kodierungen und zweidimensionalen Graphen von Molekülen bis hin zu dreidimensionalen Atomkoordinaten von Materialien“.

Was sie fanden: Wie bei anderen Studien zur Repräsentation fanden sie heraus, dass mit zunehmender Skalierung der Daten und der Rechenleistung, auf der Modelle trainiert werden, „ihre Repräsentationen weiter konvergieren“. Damit zusammenhängend: Wenn man die Repräsentationen kleinerer und weniger leistungsfähiger Modelle auf In-Distribution-Daten untersucht, stellt man fest, dass ihre Repräsentationen „schwach ausgerichtet sind und fast orthogonale Informationen lernen. Diese Streuung deutet auf das Vorhandensein vieler lokaler Suboptima hin und zeigt, dass Modelle während des Trainings eine hohe Genauigkeit erreichen, indem sie idiosynkratische Repräsentationen bilden, die nicht einmal auf andere Modelle generalisieren, die auf derselben Domäne trainiert wurden“.

Skalierung ist wichtig: Ihre Schlussfolgerung wird denen vertraut sein, die „die bittere Lektion“ (Richard Sutton, Import AI 138) verdaut haben: „Die Skalierung des Trainings, anstatt die architektonischen Einschränkungen oder induktiven Verzerrungen zu erhöhen, liefert oft die allgemeinsten und leistungsfähigsten Modelle. Obwohl architektonische Äquivarianz für simulationsfokussierte Anwendungen von MLIPs wie Molekulardynamik unerlässlich ist, deutet unsere Arbeit

Weiterlesen

Facebook verwendet GPT, Claude und Llama, um eigene Kernel zu schreiben:

…LLM-gesteuerte Infrastrukturoptimierung im Hyperscale-Maßstab…

Facebook-Forscher haben Details zu KernelEvolve veröffentlicht, einem Softwaresystem, das KI zur Automatisierung des Designs neuer Kernel nutzt, um KI-Modelle für die Auslieferung von Anzeigen im Netzwerk der Webplattformen des Unternehmens zu optimieren. KernelEvolve ist ein schönes Beispiel dafür, wie KI-Systeme gut genug geworden sind, um Teile der KI-Entwicklung zu automatisieren und zu beschleunigen – hier das Design von Kernen zur Optimierung der Inferenz von Hunderten verschiedener Modelle, die auf mehreren Chip-Architekturen laufen.

Was KernelEvolve ist: Die Software ist „darauf ausgelegt, Kernel-Spezifikationen als Eingabe zu nehmen und den Prozess der Kernel-Generierung und -Optimierung für Empfehlungsmodelle über heterogene Hardware-Architekturen hinweg durch mehrere Programmierabstraktionen zu automatisieren, darunter Triton, CuTe DSL und hardwarenahe Diagnosesprachen, die den gesamten Hardware-Software-Optimierungs-Stack abdecken“.

Wie es funktioniert: Der Kern der Software ist ein System, das eine Benutzeranfrage (z. B. „Generiere einen Triton-Kernel für MTIA v3“) entgegennimmt, die dann eine Mischung aus internen (Llama, CWM) und externen (GPT, Claude) Sprachmodellen durchläuft. Diese produzieren dann Kandidaten-Kernel, die mit verschiedenen Tools evaluiert werden und, falls sie gut sind, zu einer externen Wissensdatenbank hinzugefügt werden, die dann zur weiteren Verbesserung zukünftiger Prompts verwendet wird.

Es funktioniert gut: Durch die Nutzung dieser Software sagt Facebook, dass es die Entwicklungszeit neuer Kernel „von Wochen auf Stunden“ verkürzt hat. In Produktionstests lieferte es Kernel, die mit handdesignten vergleichbar sind, und in einigen Fällen Leistungssteigerungen von bis zu 17 Mal gegenüber bestehenden PyTorch-Baselines erzielte. Mit dieser Software gebaute Kernel wurden auf NVIDIA GPUs, AMD GPUs und Metas eigenen benutzerdefinierten MTIA-Chips eingesetzt.

„KernelEvolve erzielt erhebliche Beschleunigungen bei LLM-Inferenz-Workloads (Llama-3.1-8B: Vanilla Attention 4,6×, SDPA-MLP 3,3×), Faltungs-Transformatoren (conv1d: 6,5×, conv2d: 4,7×), speichergebundenen Datenvorverarbeitungsoperatoren, die für die Modellaktivierung entscheidend sind (MapId: 4,1×, MBDT: 9,3×, Batch Event Truncate: 9,8×), rechenintensiven Fusionskernen in Ranking-Modellen (WuKong Optimized FM: 4,0×, InterFormer PFFN: 2,5×), MTIA-spezifischen Optimierungen (RMSNorm 2D backward: 17×) und Retrieval-Operationen (Sparse Inverted Index: 1,25×)“, schreibt Facebook.

Sättigt KernelBench: „Wir validieren KernelEvolve an der öffentlich verfügbaren KernelBench-Suite und erreichen eine Bestehensquote von 100 % bei allen 250 Problemen auf drei Schwierigkeitsstufen sowie bei 160 PyTorch-ATen-Operatoren auf drei heterogenen Hardware-Plattformen, was eine 100%ige Korrektheit über alle 480 Operator-Plattform-Konfigurationen hinweg demonstriert“, schreibt Facebook.

Zum Kontext: Als KernelBench im Februar 2025 veröffentlicht wurde, erreichte das beste Modell (OpenAI o1) 4 % bei den schwierigsten torch.compile-Aufgaben in KernelBench.

Warum das wichtig ist – Hyperscale, kontinuierliche Optimierung: Auf Facebooks Skalierung haben Optimierungen eine enorme Auswirkung: „Marginale Leistungsverbesserungen auf Kernel-Ebene führen zu Einsparungen in Millionenhöhe bei den Infrastrukturbetriebskosten, während gleichzeitig die Benutzerinteraktionsmetriken verbessert werden, die direkt mit den Werbeeinnahmen korrelieren“, schreiben die Autoren. „KernelEvolve arbeitet kontinuierlich in Metas Produktionsinfrastruktur und generiert autonom optimierte Triton-Kernel für Hunderte von Modellen, die täglich Milliarden von Nutzern bedienen.“

Wenn wir noch weiter herauszoomen, beschreibt Facebook hier ein kontinuierlich laufendes, sich selbst verfeinerndes System, das iterativ die Effizienz und Intelligenz verbessern wird, mit der Facebook das Nutzerverhalten auf seinen Plattformen untersucht und dies nutzt, um genauere Anzeigen zu generieren. Haben Sie jemals das Gefühl, beobachtet zu werden? Dies sind die Arten von synthetischen Systemen, die verwendet werden, um Sie zu studieren.

„Wir stellen uns eine Zukunft vor, in der LLM-Agenten als universelle Kompilierungsschicht für heterogene KI-Systeme dienen und sich durch Wissensinjektion anstelle manueller Portierung automatisch an neue Hardware anpassen“, schreibt Facebook. „KernelEvolve stellt einen ersten Schritt in Richtung dieser Vision dar.“

Lesen Sie mehr: KernelEvolve: Scaling Agentic Kernel Coding for Heterogeneous AI Accelerators at Meta (arXiv).

***

Dezentrales Training wird sehr schnell besser – mit großen politischen Implikationen:

…Aber es ist unwahrscheinlich, dass dezentrale Trainingsläufe jemals mehr Rechenleistung nutzen werden als zentralisierte, auch wenn sie vielleicht mehr aufholen als heute…

Könnte ein dezentraler KI-Trainingslauf jemals mit der Rechenleistung eines Frontier-Trainingslaufs mithalten? Wahrscheinlich nicht. Aber könnten dezentrale Trainingsläufe viel größer werden und die Entwicklung leistungsfähigerer Modelle unterstützen, die von einem viel größeren Kollektiv als nur den heutigen Frontier-KI-Unternehmen entwickelt werden? Ja. Das ist die Schlussfolgerung einer schönen Forschungsanalyse von Epoch AI, die über 100+ technische Forschungspapiere zum dezentralen Training analysiert hat – viele davon habe ich hier im Laufe der Jahre behandelt.

Die wichtigste Erkenntnis ist, dass dezentrales Training im Vergleich zum Frontier-KI-Training schnell wächst, wobei dezentrale Trainingsläufe ihre Rechenleistung um das 20-fache pro Jahr steigern, verglichen mit dem 5-fachen pro Jahr bei Frontier-Trainingsläufen. Die andere wichtige Erkenntnis ist jedoch, dass die Größenordnungen dieser Dinge völlig unterschiedlich sind – die heutigen dezentralen Trainingsläufe sind immer noch etwa 1000-mal kleiner als Frontier-Läufe.

Werden dezentrale Trainingsläufe mit der Frontier aufschließen? „Obwohl technisch machbar, erfordert das Erreichen der Frontier der Rechenleistung eine erstaunliche Menge an Ressourcen“, schreibt Epoch. Die größten dezentralen Läufe bisher lagen im Bereich von 6e22-6e23 FLOP, was sie auf etwa 1000-mal weniger Rechenleistung schätzen als für Grok 4, ein groß angelegtes Frontier-Modell, verwendet wurde.

Wenn wir uns dezentrale Trainingsnetzwerke ansehen, scheint es ein Kapazitätsproblem in Bezug auf das Rechenangebot zu geben: „Das größte aktive Netzwerk, das wir gefunden haben, ist Covenant AIs Templar, das derzeit einen effektiven Durchsatz von 9e17 FLOP/s erreicht. Das ist etwa 300-mal kleiner als heutige Frontier-KI-Rechenzentren, die einen theoretischen Trainingsdurchsatz von etwa 3e20 effektiven FLOP/s haben.“

Skalierungsgesetze: Aber wie die Leser dieses Newsletters wissen, hat das dezentrale Training in den letzten Jahren eine reiche, schnelle Evolutionsphase durchgemacht. „Seit 2020 haben wir eine 600.000-fache Steigerung des Rechenumfangs dezentraler Trainingsprojekte gesehen, was einer impliziten Wachstumsrate von etwa 20x/Jahr entspricht.“ Das ist sehr bedeutsam – Frontier-KI-Trainingsläufe sind um mehr als das 5-fache pro Jahr gewachsen.

Es gibt Raum für Wachstum – wenn man sich die Rechenleistung ansieht, die im folding@home-Projekt (ein dezentraler Versuch zur Proteinfaltung) und bei Bitcoin verwendet wird, hat man Beispiele für frühere dezentrale Projekte, die weitaus mehr Rechenleistung nutzten, was darauf hindeutet, dass die heutigen dezentralen Läufe „um das 30- bis 3.000-fache skaliert werden könnten, genug, um Modelle mit 50- bis 5.000-mal mehr Rechenleistung zu trainieren als heute“.

Warum das wichtig ist – Demokratie an der Frontier: Grundsätzlich ist dezentrales Training eine politische Technologie, die die Politik der Rechenleistung an der Frontier verändern wird. Heute wird die Frontier der KI im Wesentlichen von 5 Unternehmen bestimmt, vielleicht 10 in den kommenden Jahren, die genug Rechenleistung aufbringen können, um in einem beliebigen 6-Monats-Zeitraum ein wettbewerbsfähiges Modell zu trainieren. Diese Unternehmen sind heute alle amerikanisch und könnten mit der jüngsten Lockerung der Exportkontrollen für chinesische Unternehmen in Zukunft auch chinesisch sein. Aber es gibt keine Frontier-Trainingsläufe von akademischen, staatlichen, unabhängigen oder nicht zur Technologiebranche gehörenden Akteuren. Dezentrales Training bietet diesen und anderen Interessengruppen eine Möglichkeit, ihre Rechenleistung zu bündeln, um diese Dynamik zu ändern, daher ist die Verfolgung seiner Entwicklung sehr wichtig.

Obwohl es die Frontier vielleicht nie wirklich erreichen wird, desto größer sind die Auswirkungen, je näher es kommt. „Dezentrales Training könnte immer noch ein sehr wichtiger Teil der KI sein. In dem Maße, wie dezentrale Netzwerke mit offenen Gewichten verbunden bleiben, könnten sie dazu führen, dass größere offene Modelle existieren, die der Frontier hinterherhinken.“

Lesen Sie mehr: How far can decentralized training over the internet scale? (Epoch AI).

***

Kann Ihr LLM ein anderes LLM trainieren?

…Grenzen der KI-Evaluierung…

Forscher der Universität Tübingen haben PostTrainBench entwickelt und veröffentlicht, einen Test, um zu sehen, wie gut Frontier-Sprachmodelle von Unternehmen wie Anthropic, OpenAI und Google Open-Weight-Modelle effektiv fine-tunen können. Die Ergebnisse zeigen, dass Frontier-Modelle bereits in der Lage sind, durch Fine-Tuning Verbesserungen von über 20 % bei bestimmten Benchmarks herauszuholen, verglichen mit über 60 % bei einem Menschen.

Wie der Test funktioniert: LLMs erhalten eine Eingabe, die aus Benchmark-Aufgaben zur Leistungsverbesserung, einem zu verwendenden Modell, einigen Standardressourcen (eine H200 GPU für 10 Stunden) und einem Agenten-Harnisch (z. B. Claude bekommt Claude Code und GPT bekommt Codex) besteht. Agenten erhalten auch einen Prompt, ein Testskript, Aufgabenkontext und Webzugriff. Die Agenten produzieren dann ein feinabgestimmtes Modell sowie Trainingslogs.

Welche Tests? Dies ist ein allgemeiner Ansatz, sodass Sie jeden Benchmark auswählen könnten, der für Sie ein starkes Signal zu sein scheint. Hier verwenden die Forscher AIME 2025, BFCL, GPQA, GSM8K und HumanEval als ihre Ziele.

Welche Modelle? Getestete Modelle umfassen Qwen 3 1.7B und 3B, SmolLM-3B und Gemma 3 4B.

Ergebnisse: OpenAIs GPT 5.1 Codex Max schneidet insgesamt am besten ab und erzielt eine aggregierte Verbesserung von über 30 % über alle getesteten Modelle und Benchmarks hinweg, gefolgt von Opus 4.5 (über 20 %) und Gemini 3 Pro (etwa 18 %).

Warum das wichtig ist – ein Warnschuss für sich selbst verbessernde KI: Benchmarks wie dieser geben uns ein Gefühl dafür, wie gut KI-Systeme viele der Aufgaben ausführen können, die ein KI-Forscher erledigt. Sie messen auch, wie gut sie eine inhärent komplizierte, mehrstufige Aufgabe mit langem Zeithorizont bewältigen können. Diese Eigenschaften machen PostTrainBench zu einem nützlichen Benchmark, um zu untersuchen, wie gut KI-Systeme bei Komponenten der KI-Forschung selbst abschneiden – und hier ist der Beweis, dass die heutigen Frontier-Modelle bereits in Schlagdistanz zu einem Menschen sind. Ich würde erwarten, dass wir bis September 2026 ein System sehen werden, das die menschliche Baseline hier übertrifft.

Lesen Sie mehr auf der offiziellen Website: PostTrainBench.

Laden Sie den Benchmark herunter und erfahren Sie mehr: PostTrainBench (AISA group, GitHub).

***

Je intelligenter ein KI-System, desto ähnlicher werden seine Repräsentationen denen anderer intelligenter KI-Systeme:

…Könnten LLMs uns eine gemeinsame Bibliothek von Merkmalen zur Repräsentation der Welt liefern?...

Finden KI-Systeme am Ende ähnliche Wege, die Welt für sich selbst zu repräsentieren? Ja, je intelligenter und leistungsfähiger sie werden, desto mehr gelangen sie zu einer gemeinsamen Menge von Wegen, die Welt zu repräsentieren.

Der neueste Beleg dafür ist eine Forschung des MIT, die zeigt, dass dies für wissenschaftliche Modelle und die Modalitäten, auf denen sie trainiert werden, zutrifft: „Repräsentationen, die von fast sechzig wissenschaftlichen Modellen gelernt wurden, die Zeichenketten-, Graphen-, 3D-atomistische und proteinbasierte Modalitäten umfassen, sind über eine breite Palette chemischer Systeme hinweg hochgradig ausgerichtet“, schreiben sie. „Modelle, die auf verschiedenen Datensätzen trainiert wurden, haben hochgradig ähnliche Repräsentationen kleiner Moleküle, und maschinelle Lern-Interatompotentiale konvergieren im Repräsentationsraum, wenn sich ihre Leistung verbessert, was darauf hindeutet, dass Foundation Models eine gemeinsame zugrunde liegende Repräsentation der physikalischen Realität lernen.“

Was sie untersucht haben: Die Autoren betrachteten 59 verschiedene KI-Modelle, darunter Systeme wie GPT-OSS, ESM2, Qwen3 A3B und ProteinMPNN. Sie untersuchten dann die Repräsentationen von Materie aus fünf Datensätzen („Moleküle aus QM9 und OMol25, Materialien aus OMat24 und sAlex und Proteine aus RCSB“) und untersuchten dies „von zeichenkettenbasierten Kodierungen und zweidimensionalen Graphen von Molekülen bis hin zu dreidimensionalen Atomkoordinaten von Materialien“.

Was sie fanden: Wie bei anderen Studien zur Repräsentation fanden sie heraus, dass mit zunehmender Skalierung der Daten und der Rechenleistung, auf der Modelle trainiert werden, „ihre Repräsentationen weiter konvergieren“. Damit zusammenhängend: Wenn man die Repräsentationen kleinerer und weniger leistungsfähiger Modelle auf In-Distribution-Daten untersucht, stellt man fest, dass ihre Repräsentationen „schwach ausgerichtet sind und fast orthogonale Informationen lernen. Diese Streuung deutet auf das Vorhandensein vieler lokaler Suboptima hin und zeigt, dass Modelle während des Trainings eine hohe Genauigkeit erreichen, indem sie idiosynkratische Repräsentationen bilden, die nicht einmal auf andere Modelle generalisieren, die auf derselben Domäne trainiert wurden“.

Skalierung ist wichtig: Ihre Schlussfolgerung wird denen vertraut sein, die „die bittere Lektion“ (Richard Sutton, Import AI 138) verdaut haben: „Die Skalierung des Trainings, anstatt die architektonischen Einschränkungen oder induktiven Verzerrungen zu erhöhen, liefert oft die allgemeinsten und leistungsfähigsten Modelle. Obwohl architektonische Äquivarianz für simulationsfokussierte Anwendungen von MLIPs wie Molekulardynamik unerlässlich ist, deutet unsere Arbeit