OpenWAI News

OpenWAI News

kuratierte KI-Nachrichten, übersetzt und thematisch geordnet

Dell AI Factory 2.0: Neue Server mit Nvidia B300 und eigenes Dateisystem

Auf seiner Hausmesse hat Dell neue und erweiterte Integrationen mit Nvidia, Intel, Google, Cohere, Hugging Face, Palantir und ServiceNow vorgestellt. Hinzu kamen Erweiterungen der Dell AI Data Platform, das Dell Data Lakehouse und das neue parallele Dateisystem Project Lightning. Damit soll die KI näher an die Unternehmensdaten gebracht werden. Laut Michael Dell planen 85 Prozent der Firmen, generative KI-Workloads innerhalb der nächsten 24 Monate on-premises auszuführen. Mehr On-Prem-Modelle und Partnerstacks Zentraler Baustein bleibt die Dell AI Factory mit Nvidia. Dell hat dazu Version 2.0 angekündigt. Sie kombiniert neue KI-Server, Netzwerk, Storage, Kühlung, Managed Services und Softwarekomponenten für Training, Inferenz und agentische KI. Dazu gehören unter anderem die PowerEdge-Systeme XE9780L und XE9785L mit jeweils acht Nvidia-B300-Beschleunigern sowie Support für Nvidia RTX Pro 6000. Daneben erweitert Dell die AI Factory um Intel-Gaudi-3-Beschleuniger und den PowerEdge XE9680. Dell positioniert die Plattform als validierte Komplettlösung mit PowerEdge-Servern, PowerScale-Storage, PowerSwitch-Netzwerk, Services und einem Open-Source-Softwarestack, beispielsweise PyTorch, Kubernetes, Grafana und Prometheus. Auch bei Modellen und Agentenplattformen baut Dell das Angebot aus. Gemeinsam mit Google Cloud sollen Gemini-Modelle on-premises bereitgestellt werden. Die Lösung steht exklusiv für Dell-Kunden zur Verfügung und soll mehr Kontrolle über Daten und Infrastruktur ermöglichen. Mit Cohere bringt Dell außerdem die Agentenplattform Cohere North auf die eigene Infrastruktur. North soll sich mit Dell-Storage und allen Datenquellen verbinden lassen. Als validierte On-Prem-Lösungen nennt Dell unter anderem Hugging Face, Palantir, Reflection, ServiceNow und SpaceXAI. Hinzu kommen validierte KI-Lösungen mit Mistral, Fogsphere, Ipsotek, UneeQ Digital Humans und Poolside, die über den Katalog der Dell Automation Platform bereitgestellt werden können. Damit deckt Dell ein breites Spektrum ab: Modelle, Agentenplattformen, Entwicklungswerkzeuge, Workflow-Automation, Computer Vision und verschiedene Formen des Datenzugriffs.

On-Prem-Modelle allein lösen das zentrale Problem allerdings nicht: Agenten, RAG-Anwendungen und domänenspezifische Modelle benötigen Zugriff auf bereinigte, auffindbare und schnell verfügbare Daten. Diese liegen häufig verteilt in File- und Object-Stores, Datenbanken, ERP- und CRM-Systemen oder an Edge-Standorten. Hier setzt Dell mit der erweiterten AI Data Platform an. Sie soll Datenquellen erschließen, Datenflüsse beschleunigen und Unternehmensdaten für KI-Anwendungen besser nutzbar machen. In der Keynote beschrieb Dell-COO Jeff Clarke die Plattform als neues Element der AI Factory. Sie soll helfen, Daten für KI-Workflows vorzubereiten, zu organisieren, zu verarbeiten und zu schützen. Lakehouse, PowerScale und ObjectScale Ein Baustein der AI Data Platform ist das Dell Data Lakehouse. Es kombiniert die Skalierbarkeit und Kosteneffizienz eines Data Lake mit der Struktur und Zuverlässigkeit eines Data Warehouse. Eine föderierte Query Engine soll Daten über verschiedene Umgebungen hinweg auffindbar, analysierbar und verarbeitbar machen. Zudem soll sie helfen, die Orchestrierung für Agenten zu automatisieren. Als Storage-Grundlage nennt Dell PowerScale und ObjectScale. PowerScale ist für File- und Object-Storage für unstrukturierte Daten und KI-Analysen zuständig, ObjectScale S3-kompatible Object-Workloads. Dell hatte bereits kurz vor der Veranstaltung angekündigt, PowerFlex in Dell Exascale Storage einzubinden. Damit deckt die Architektur Blockzugriffe über PowerFlex, File-Workloads über PowerScale und Lightning sowie Object-Storage über ObjectScale ab. Für KI-Anwendungen ist diese Trennung relevant, weil Trainings-, Inferenz- und RAG-Workloads häufig andere Datenpfade benötigen als klassische Unternehmensanwendungen. Während ERP- und Datenbankdaten oft blockbasiert verarbeitet werden, dominieren bei vielen KI-Workloads unstrukturierte Daten, File- und Object-Zugriffe, Vektorindizes, Metadaten und Kontextinformationen. Lightning File System für GPU-Workloads Mit Project Lightning kündigte Dell ein neues paralleles Dateisystem für KI- und HPC-Workloads an. Es ist für hohen Durchsatz, niedrige Latenz und parallele Zugriffe vieler GPU-Knoten ausgelegt. Dell nennt als Einsatzfelder unter anderem Training, Inferenz, Checkpointing, Key-Value-Caching und Metadatenanalysen. Pro Node verspricht Dell 97 GByte/s Random-Read-Durchsatz und 97 Prozent Bandbreiteneffizienz. Die Architektur nutzt RDMA-Netzwerke und unterstützt Nvidia GPUDirect Storage. Damit soll Lightning einen 67 Prozent schnelleren Datenzugriff und einen doppelt so hohen Durchsatz gegenüber dem Wettbewerb erreichen. Zusätzlich arbeitet Dell mit Nvidia an einer hochskalierbaren Caching-Lösung für beschleunigte Inferenz. Sie integriert sich mit Nvidias NIXL-Bibliothek und zielt auf agentische Workloads sowie Reasoning-Modelle mit langen Denk- und Kontextphasen. Dell nennt dafür bis zu 100-mal mehr Tokens pro Sekunde und 80 Prozent geringere Latenz. Eine On-Prem-Plattform für die ganze KI Dell entwickelt seine AI Factory von einer reinen GPU- und Infrastrukturplattform zu einer umfassenden Umgebung für Enterprise-KI. Die Partnerstacks liefern Modelle, Agenten und Integrationen; die AI Data Platform organisiert und beschleunigt den Zugriff auf Unternehmensdaten. Das passt zum On-Prem-Trend: KI soll dort laufen, wo Daten, Latenzanforderungen, Zugriffsrechte und Governance-Vorgaben liegen. Doch ob das in heterogenen Umgebungen funktioniert, hängt weniger vom Modellkatalog als von Datenqualität, Governance, Zugriffsrechten und den tatsächlichen Datenpfaden ab. Dell liefert dafür zwar mehr Bausteine, die eigentliche Arbeit bleibt jedoch die gleiche: Unternehmen müssen wissen, welche Daten sie haben, wie relevant sie im Einzelfall sind und ob sie für KI überhaupt brauchbar sind.

Weiterlesen

Auf seiner Hausmesse hat Dell neue und erweiterte Integrationen mit Nvidia, Intel, Google, Cohere, Hugging Face, Palantir und ServiceNow vorgestellt. Hinzu kamen Erweiterungen der Dell AI Data Platform, das Dell Data Lakehouse und das neue parallele Dateisystem Project Lightning. Damit soll die KI näher an die Unternehmensdaten gebracht werden. Laut Michael Dell planen 85 Prozent der Firmen, generative KI-Workloads innerhalb der nächsten 24 Monate on-premises auszuführen. Mehr On-Prem-Modelle und Partnerstacks Zentraler Baustein bleibt die Dell AI Factory mit Nvidia. Dell hat dazu Version 2.0 angekündigt. Sie kombiniert neue KI-Server, Netzwerk, Storage, Kühlung, Managed Services und Softwarekomponenten für Training, Inferenz und agentische KI. Dazu gehören unter anderem die PowerEdge-Systeme XE9780L und XE9785L mit jeweils acht Nvidia-B300-Beschleunigern sowie Support für Nvidia RTX Pro 6000. Daneben erweitert Dell die AI Factory um Intel-Gaudi-3-Beschleuniger und den PowerEdge XE9680. Dell positioniert die Plattform als validierte Komplettlösung mit PowerEdge-Servern, PowerScale-Storage, PowerSwitch-Netzwerk, Services und einem Open-Source-Softwarestack, beispielsweise PyTorch, Kubernetes, Grafana und Prometheus. Auch bei Modellen und Agentenplattformen baut Dell das Angebot aus. Gemeinsam mit Google Cloud sollen Gemini-Modelle on-premises bereitgestellt werden. Die Lösung steht exklusiv für Dell-Kunden zur Verfügung und soll mehr Kontrolle über Daten und Infrastruktur ermöglichen. Mit Cohere bringt Dell außerdem die Agentenplattform Cohere North auf die eigene Infrastruktur. North soll sich mit Dell-Storage und allen Datenquellen verbinden lassen. Als validierte On-Prem-Lösungen nennt Dell unter anderem Hugging Face, Palantir, Reflection, ServiceNow und SpaceXAI. Hinzu kommen validierte KI-Lösungen mit Mistral, Fogsphere, Ipsotek, UneeQ Digital Humans und Poolside, die über den Katalog der Dell Automation Platform bereitgestellt werden können. Damit deckt Dell ein breites Spektrum ab: Modelle, Agentenplattformen, Entwicklungswerkzeuge, Workflow-Automation, Computer Vision und verschiedene Formen des Datenzugriffs.

On-Prem-Modelle allein lösen das zentrale Problem allerdings nicht: Agenten, RAG-Anwendungen und domänenspezifische Modelle benötigen Zugriff auf bereinigte, auffindbare und schnell verfügbare Daten. Diese liegen häufig verteilt in File- und Object-Stores, Datenbanken, ERP- und CRM-Systemen oder an Edge-Standorten. Hier setzt Dell mit der erweiterten AI Data Platform an. Sie soll Datenquellen erschließen, Datenflüsse beschleunigen und Unternehmensdaten für KI-Anwendungen besser nutzbar machen. In der Keynote beschrieb Dell-COO Jeff Clarke die Plattform als neues Element der AI Factory. Sie soll helfen, Daten für KI-Workflows vorzubereiten, zu organisieren, zu verarbeiten und zu schützen. Lakehouse, PowerScale und ObjectScale Ein Baustein der AI Data Platform ist das Dell Data Lakehouse. Es kombiniert die Skalierbarkeit und Kosteneffizienz eines Data Lake mit der Struktur und Zuverlässigkeit eines Data Warehouse. Eine föderierte Query Engine soll Daten über verschiedene Umgebungen hinweg auffindbar, analysierbar und verarbeitbar machen. Zudem soll sie helfen, die Orchestrierung für Agenten zu automatisieren. Als Storage-Grundlage nennt Dell PowerScale und ObjectScale. PowerScale ist für File- und Object-Storage für unstrukturierte Daten und KI-Analysen zuständig, ObjectScale S3-kompatible Object-Workloads. Dell hatte bereits kurz vor der Veranstaltung angekündigt, PowerFlex in Dell Exascale Storage einzubinden. Damit deckt die Architektur Blockzugriffe über PowerFlex, File-Workloads über PowerScale und Lightning sowie Object-Storage über ObjectScale ab. Für KI-Anwendungen ist diese Trennung relevant, weil Trainings-, Inferenz- und RAG-Workloads häufig andere Datenpfade benötigen als klassische Unternehmensanwendungen. Während ERP- und Datenbankdaten oft blockbasiert verarbeitet werden, dominieren bei vielen KI-Workloads unstrukturierte Daten, File- und Object-Zugriffe, Vektorindizes, Metadaten und Kontextinformationen. Lightning File System für GPU-Workloads Mit Project Lightning kündigte Dell ein neues paralleles Dateisystem für KI- und HPC-Workloads an. Es ist für hohen Durchsatz, niedrige Latenz und parallele Zugriffe vieler GPU-Knoten ausgelegt. Dell nennt als Einsatzfelder unter anderem Training, Inferenz, Checkpointing, Key-Value-Caching und Metadatenanalysen. Pro Node verspricht Dell 97 GByte/s Random-Read-Durchsatz und 97 Prozent Bandbreiteneffizienz. Die Architektur nutzt RDMA-Netzwerke und unterstützt Nvidia GPUDirect Storage. Damit soll Lightning einen 67 Prozent schnelleren Datenzugriff und einen doppelt so hohen Durchsatz gegenüber dem Wettbewerb erreichen. Zusätzlich arbeitet Dell mit Nvidia an einer hochskalierbaren Caching-Lösung für beschleunigte Inferenz. Sie integriert sich mit Nvidias NIXL-Bibliothek und zielt auf agentische Workloads sowie Reasoning-Modelle mit langen Denk- und Kontextphasen. Dell nennt dafür bis zu 100-mal mehr Tokens pro Sekunde und 80 Prozent geringere Latenz. Eine On-Prem-Plattform für die ganze KI Dell entwickelt seine AI Factory von einer reinen GPU- und Infrastrukturplattform zu einer umfassenden Umgebung für Enterprise-KI. Die Partnerstacks liefern Modelle, Agenten und Integrationen; die AI Data Platform organisiert und beschleunigt den Zugriff auf Unternehmensdaten. Das passt zum On-Prem-Trend: KI soll dort laufen, wo Daten, Latenzanforderungen, Zugriffsrechte und Governance-Vorgaben liegen. Doch ob das in heterogenen Umgebungen funktioniert, hängt weniger vom Modellkatalog als von Datenqualität, Governance, Zugriffsrechten und den tatsächlichen Datenpfaden ab. Dell liefert dafür zwar mehr Bausteine, die eigentliche Arbeit bleibt jedoch die gleiche: Unternehmen müssen wissen, welche Daten sie haben, wie relevant sie im Einzelfall sind und ob sie für KI überhaupt brauchbar sind.

KI-Boom treibt Nvidias Taiwan-Ausgaben in drei Jahren von 15 auf 150 Milliarden Dollar

the_decoder·2026-05-27WirtschaftInfrastruktur

Nvidia gibt mittlerweile bis zu 150 Milliarden US-Dollar pro Jahr für seine Zulieferer wie TSMC in Taiwan aus. Vor drei oder vier Jahren seien es nur 10 bis 15 Milliarden Dollar jährlich gewesen. Das sagte CEO Jensen Huang bei einem Firmentreffen in Taipei, laut Nikkei Asia.

Nvidia plant zudem, die Belegschaft in Taiwan von derzeit 1.000 auf 4.000 Mitarbeiter zu vervierfachen. Dafür entsteht in Taipei ein neuer Firmenkomplex namens Constellation, dessen Bau Ende 2026 starten und 2030 fertig sein soll. Das Konzept soll später am neuen kalifornischen Hauptsitz wiederholt werden.

Konkurrent AMD will ebenfalls stärker in Taiwan investieren. AMD-Chefin Lisa Su kündigte mehr als 10 Milliarden Dollar für Taiwans Chip-Ökosystem an, vor allem um Kapazität für fortschrittliches Packaging zu sichern.

Die Summe ist jedoch nicht direkt mit Nvidias Ausgaben vergleichbar: AMD nennt eine mehrjährige Investition in zusätzliche Kapazität, während Huang über Nvidias laufende jährliche Ausgaben bei taiwanischen Zulieferern sprach.

Weiterlesen

Nvidia gibt mittlerweile bis zu 150 Milliarden US-Dollar pro Jahr für seine Zulieferer wie TSMC in Taiwan aus. Vor drei oder vier Jahren seien es nur 10 bis 15 Milliarden Dollar jährlich gewesen. Das sagte CEO Jensen Huang bei einem Firmentreffen in Taipei, laut Nikkei Asia.

Nvidia plant zudem, die Belegschaft in Taiwan von derzeit 1.000 auf 4.000 Mitarbeiter zu vervierfachen. Dafür entsteht in Taipei ein neuer Firmenkomplex namens Constellation, dessen Bau Ende 2026 starten und 2030 fertig sein soll. Das Konzept soll später am neuen kalifornischen Hauptsitz wiederholt werden.

Konkurrent AMD will ebenfalls stärker in Taiwan investieren. AMD-Chefin Lisa Su kündigte mehr als 10 Milliarden Dollar für Taiwans Chip-Ökosystem an, vor allem um Kapazität für fortschrittliches Packaging zu sichern.

Die Summe ist jedoch nicht direkt mit Nvidias Ausgaben vergleichbar: AMD nennt eine mehrjährige Investition in zusätzliche Kapazität, während Huang über Nvidias laufende jährliche Ausgaben bei taiwanischen Zulieferern sprach.

Vom Job-Killer zum Produktivitäts-Booster: OpenAI- und Anthropic-Chefs kassieren ihre KI-Apokalypse-Warnungen ein

the_decoder·2026-05-27WirtschaftGesellschaftForschung

Sam Altman und Dario Amodei rudern bei ihren Prophezeiungen zur KI-Jobapokalypse zurück, pünktlich zu milliardenschweren Börsengängen.

Das Wirtschaftsmagazin Fortune zeichnet nach, wie sich der Ton der beiden CEOs in den vergangenen Wochen verschoben hat. In einem Interview mit Commonwealth-Bank-Chef Matt Comyn sagt OpenAI-CEO Sam Altman: "Ich bin entzückt, dass ich damit falsch lag. Ich dachte, es gäbe inzwischen mehr Auswirkungen auf Einstiegspositionen im Bürobereich, als tatsächlich passiert ist."

Noch im Juni 2025 hatte Altman vor dem Wegfall ganzer Berufsgruppen gewarnt, Anthropic-CEO Dario Amodei sogar die Hälfte aller White-Collar-Jobs als gefährdet bezeichnet. Inzwischen formuliert Amodei Automatisierung als Produktivitäts-Multiplikator: "Wenn man 90 Prozent der Arbeit automatisiert, machen alle die restlichen 10 Prozent", die sich dann auf 100 Prozent ausweiteten.

Beide Firmen bereiten Börsengänge mit jeweils einer Billion Dollar Bewertung vor. Das Yale Budget Lab fand bislang keine signifikanten Veränderungen bei stark KI-exponierten Berufen. Zur Arbeitsmarktfrage passt auch eine Studie, laut der die Jobkrise bei Codern, Textern und anderen KI-exponierten Berufen schon vor ChatGPT begann, ein Hinweis darauf, dass einfache Erzählungen von der direkten KI-Jobapokalypse bislang zu kurz greifen.

Weiterlesen

Sam Altman und Dario Amodei rudern bei ihren Prophezeiungen zur KI-Jobapokalypse zurück, pünktlich zu milliardenschweren Börsengängen.

Das Wirtschaftsmagazin Fortune zeichnet nach, wie sich der Ton der beiden CEOs in den vergangenen Wochen verschoben hat. In einem Interview mit Commonwealth-Bank-Chef Matt Comyn sagt OpenAI-CEO Sam Altman: "Ich bin entzückt, dass ich damit falsch lag. Ich dachte, es gäbe inzwischen mehr Auswirkungen auf Einstiegspositionen im Bürobereich, als tatsächlich passiert ist."

Noch im Juni 2025 hatte Altman vor dem Wegfall ganzer Berufsgruppen gewarnt, Anthropic-CEO Dario Amodei sogar die Hälfte aller White-Collar-Jobs als gefährdet bezeichnet. Inzwischen formuliert Amodei Automatisierung als Produktivitäts-Multiplikator: "Wenn man 90 Prozent der Arbeit automatisiert, machen alle die restlichen 10 Prozent", die sich dann auf 100 Prozent ausweiteten.

Beide Firmen bereiten Börsengänge mit jeweils einer Billion Dollar Bewertung vor. Das Yale Budget Lab fand bislang keine signifikanten Veränderungen bei stark KI-exponierten Berufen. Zur Arbeitsmarktfrage passt auch eine Studie, laut der die Jobkrise bei Codern, Textern und anderen KI-exponierten Berufen schon vor ChatGPT begann, ein Hinweis darauf, dass einfache Erzählungen von der direkten KI-Jobapokalypse bislang zu kurz greifen.

Für 250 Millionen Euro: Bund schafft neue Abhängigkeiten von IT-Konzernen

netzpolitik·2026-05-27InfrastrukturWirtschaftRegulierung

Für eine dreistellige Millionensumme sollen SAP und Telekom eine „KI-Cloud“ für die öffentliche Verwaltung bauen. Digitalminister Karsten Wildberger nennt das souverän. Unabhängig wird Deutschlands Verwaltung damit nicht, warnen Opposition und Fachleute.

Karsten Wildberger freut sich auf die KI-Cloud für die Verwaltung. (Symbolbild) – Alle Rechte vorbehalten: IMAGO / dts Nachrichtenagentur Für 250 Millionen Euro sollen deutsche Konzerne IT-Infrastruktur für die öffentliche Verwaltung aufbauen. Im Mittelpunkt steht eine „KI-Cloud“. Das sind Server, auf denen KI-Software laufen soll.

Damit setzt Digitalminister Karsten Wildberger (CDU) seinen KI-freundlichen Kurs fort. Zuletzt hatte er den Agentic AI Hub gestartet. Sogenannte KI-Agenten sollen Beamt*innen zum Beispiel dabei helfen, Dokumente auf Vollständigkeit zu prüfen. Im Gegensatz zu Sprachmodellen wie ChatGPT geben KI-Agenten nicht nur Antworten, sondern erfüllen Aufgaben mit digitalen Werkzeugen.

Die neue „KI-Cloud“ soll nun „zur zentralen Schaltstelle für die öffentliche Verwaltung werden“, erklärt das Digitalministerium. Zunächst soll die KI-Plattform KIPITZ dorthin umziehen. Die Cloud sei das „Rückgrat einer souveränen, digitalen und KI-fähigen Verwaltung“, sagt der Digitalminister. Die dafür veranschlagten 250 Millionen Euro will sein Ministerium an zwei Konsortien verteilen: 70 Prozent erhalten die Telekom-Tochter T‑Systems und SAP; weitere 30 Prozent ein Konsortium um den Wiesbadener IT-Dienstleister SVA .

Wie die Deutsche Presse-Agentur berichtet, sei der Auftrag „bewusst zweigeteilt“ worden, um die Abhängigkeit von nur einem Anbieter zu umgehen. Wildberger sprach von einer „Infrastruktur, die wir selbst kontrollieren“. Telekom-Chef Tim Höttges sagte: „Zusammen sorgen wir dafür, dass Deutschland und Europa die digitale Zukunft selbst in der Hand haben.“ Das soll unter anderem mit SAPs „Business AI Platform“ geschehen. SAP-Chef Christian Klein zeigte sich zufrieden, dass seine KI-Cloud „Teil des Deutschland-Stack s“ werden soll.

Bund zahlt hunderte Millionen für Lizenzen

SAP profitiert bereits in großem Stil von Steuergeldern: Allein im Haushaltsjahr 2025 überwies der Bund an das deutsche Softwareunternehmen 110 Millionen Euro für Lizenzen und weitere 71 Millionen Euro für Produkte und Dienstleistungen. Das zeigt die Antwort der Bundesregierung auf eine Schriftliche Frage von Sonja Lemke von der Linksfraktion, die netzpolitik.org vorliegt.

Zum Vergleich: Im selben Jahr hat der Bund 481 Millionen Euro für Microsoft-Lizenzen ausgegeben. Die Kosten sind im Vergleich zu den beiden Vorjahren stetig gestiegen: 2023 waren es noch rund 274 Millionen Euro, ein Jahr später bereits rund 348 Millionen.

Nicht nur Lizenzen großer US-Unternehmen sind „ein wahnsinniger Kostenfaktor“, kommentiert die Abgeordnete gegenüber netzpolitik.org.

Wir sind ein spendenfinanziertes Medium.

Unterstütze auch Du unsere Arbeit mit einer Spende.

Jetzt spenden

Warnung vor Lock-in-Effekt

Die Projekte aus dem Digitalministerium zeigen: Künftig könnte vermehrt Geld an deutsche oder europäische Konzerne fließen. Das entspricht dem Tenor aus dem Gipfel zur europäischen digitalen Souveränität im November: „ buy european “, kauft in Europa ein. Kritik daran gibt es von der Opposition und von Fachleuten. Sie warnen vor neuen Abhängigkeiten durch andere Konzerne.

So kritisiert Linken-Abgeordnete Lemke: US-Konzerne hätten kein Patent darauf, Kunden von sich abhängig zu machen. Sie warnt vor dem Lock-in-Effekt – also davor, dass die Verwaltung von einem einmal gewählten Anbieter nicht mehr loskommt. Dieser Effekt richtet sich nicht danach, wo ein Unternehmen sitzt, sondern danach, wie das IT-Produkt gestaltet ist. „Wer einmal SAP nutzt, kann die eigenen Daten nicht mehr einfach zu einem anderen Anbieter umziehen“, warnt Lemke.

Deshalb fordert sie ein Umdenken: „Digitalisierung muss endlich heißen, eigene Infrastrukturen aufzubauen.“ Dafür brauche es eigene Rechenzentren sowie eigene Betriebssysteme und Software, über die die öffentliche Hand selbst verfügen kann. Die Verwaltung brauche mehr IT-Kompetenz, um weniger von externen Beraterfirmen abhängig zu sein.

Ähnlich argumentiert die Free Software Foundation Europe. Mit Blick auf die Debatte um digitale Souveränität in Deutschland pocht der gemeinnützige Verein auf das Credo „Public Money, Public Code“.

Dahinter steht der Gedanke: Wenn Bürger*innen mit ihren Steuern eine Software zahlen, dann sollte sie allen gehören und öffentlich einsehbar sein. „Nur so lässt sich die strukturelle Abhängigkeit öffentlicher Verwaltungen von proprietärer Software und ihren Herstellern beenden und technologische Souveränität erreichen.“

Weiterlesen

Für eine dreistellige Millionensumme sollen SAP und Telekom eine „KI-Cloud“ für die öffentliche Verwaltung bauen. Digitalminister Karsten Wildberger nennt das souverän. Unabhängig wird Deutschlands Verwaltung damit nicht, warnen Opposition und Fachleute.

Karsten Wildberger freut sich auf die KI-Cloud für die Verwaltung. (Symbolbild) – Alle Rechte vorbehalten: IMAGO / dts Nachrichtenagentur Für 250 Millionen Euro sollen deutsche Konzerne IT-Infrastruktur für die öffentliche Verwaltung aufbauen. Im Mittelpunkt steht eine „KI-Cloud“. Das sind Server, auf denen KI-Software laufen soll.

Damit setzt Digitalminister Karsten Wildberger (CDU) seinen KI-freundlichen Kurs fort. Zuletzt hatte er den Agentic AI Hub gestartet. Sogenannte KI-Agenten sollen Beamt*innen zum Beispiel dabei helfen, Dokumente auf Vollständigkeit zu prüfen. Im Gegensatz zu Sprachmodellen wie ChatGPT geben KI-Agenten nicht nur Antworten, sondern erfüllen Aufgaben mit digitalen Werkzeugen.

Die neue „KI-Cloud“ soll nun „zur zentralen Schaltstelle für die öffentliche Verwaltung werden“, erklärt das Digitalministerium. Zunächst soll die KI-Plattform KIPITZ dorthin umziehen. Die Cloud sei das „Rückgrat einer souveränen, digitalen und KI-fähigen Verwaltung“, sagt der Digitalminister. Die dafür veranschlagten 250 Millionen Euro will sein Ministerium an zwei Konsortien verteilen: 70 Prozent erhalten die Telekom-Tochter T‑Systems und SAP; weitere 30 Prozent ein Konsortium um den Wiesbadener IT-Dienstleister SVA .

Wie die Deutsche Presse-Agentur berichtet, sei der Auftrag „bewusst zweigeteilt“ worden, um die Abhängigkeit von nur einem Anbieter zu umgehen. Wildberger sprach von einer „Infrastruktur, die wir selbst kontrollieren“. Telekom-Chef Tim Höttges sagte: „Zusammen sorgen wir dafür, dass Deutschland und Europa die digitale Zukunft selbst in der Hand haben.“ Das soll unter anderem mit SAPs „Business AI Platform“ geschehen. SAP-Chef Christian Klein zeigte sich zufrieden, dass seine KI-Cloud „Teil des Deutschland-Stack s“ werden soll.

Bund zahlt hunderte Millionen für Lizenzen

SAP profitiert bereits in großem Stil von Steuergeldern: Allein im Haushaltsjahr 2025 überwies der Bund an das deutsche Softwareunternehmen 110 Millionen Euro für Lizenzen und weitere 71 Millionen Euro für Produkte und Dienstleistungen. Das zeigt die Antwort der Bundesregierung auf eine Schriftliche Frage von Sonja Lemke von der Linksfraktion, die netzpolitik.org vorliegt.

Zum Vergleich: Im selben Jahr hat der Bund 481 Millionen Euro für Microsoft-Lizenzen ausgegeben. Die Kosten sind im Vergleich zu den beiden Vorjahren stetig gestiegen: 2023 waren es noch rund 274 Millionen Euro, ein Jahr später bereits rund 348 Millionen.

Nicht nur Lizenzen großer US-Unternehmen sind „ein wahnsinniger Kostenfaktor“, kommentiert die Abgeordnete gegenüber netzpolitik.org.

Wir sind ein spendenfinanziertes Medium.

Unterstütze auch Du unsere Arbeit mit einer Spende.

Jetzt spenden

Warnung vor Lock-in-Effekt

Die Projekte aus dem Digitalministerium zeigen: Künftig könnte vermehrt Geld an deutsche oder europäische Konzerne fließen. Das entspricht dem Tenor aus dem Gipfel zur europäischen digitalen Souveränität im November: „ buy european “, kauft in Europa ein. Kritik daran gibt es von der Opposition und von Fachleuten. Sie warnen vor neuen Abhängigkeiten durch andere Konzerne.

So kritisiert Linken-Abgeordnete Lemke: US-Konzerne hätten kein Patent darauf, Kunden von sich abhängig zu machen. Sie warnt vor dem Lock-in-Effekt – also davor, dass die Verwaltung von einem einmal gewählten Anbieter nicht mehr loskommt. Dieser Effekt richtet sich nicht danach, wo ein Unternehmen sitzt, sondern danach, wie das IT-Produkt gestaltet ist. „Wer einmal SAP nutzt, kann die eigenen Daten nicht mehr einfach zu einem anderen Anbieter umziehen“, warnt Lemke.

Deshalb fordert sie ein Umdenken: „Digitalisierung muss endlich heißen, eigene Infrastrukturen aufzubauen.“ Dafür brauche es eigene Rechenzentren sowie eigene Betriebssysteme und Software, über die die öffentliche Hand selbst verfügen kann. Die Verwaltung brauche mehr IT-Kompetenz, um weniger von externen Beraterfirmen abhängig zu sein.

Ähnlich argumentiert die Free Software Foundation Europe. Mit Blick auf die Debatte um digitale Souveränität in Deutschland pocht der gemeinnützige Verein auf das Credo „Public Money, Public Code“.

Dahinter steht der Gedanke: Wenn Bürger*innen mit ihren Steuern eine Software zahlen, dann sollte sie allen gehören und öffentlich einsehbar sein. „Nur so lässt sich die strukturelle Abhängigkeit öffentlicher Verwaltungen von proprietärer Software und ihren Herstellern beenden und technologische Souveränität erreichen.“

Mittwoch: Starlink-Verteuerung für Drohnen, Spotify liest aus Zeitschriften vor

25.000 US-Dollar für einige Minuten Starlink-Anbindung kassiert SpaceX neuerdings vom US-Militär. Es hat keine Alternative für die Steuerung von Drohnen im Kampfgebiet. Doch die Versorgung der iranischen Bevölkerung mit Mobilfunk per Starlink war der US-Regierung zu teuer. Nicht teurer wird Spotify, obwohl der Streamingdienst neben Büchern nun auch Zeitschriftenartikel vorliest. Über 650 englischsprachige Beiträge bekannter Magazine gehören jetzt zur Hörbuch-Bibliothek. Damit sollen Nutzer an das Hören längerer Texte gewöhnt werden, um sie langfristig für Hörbücher zu gewinnen. Derweil sperren immer mehr Nachrichtenseiten die Wayback Machine aus – nicht nur in den USA. Denn sie befürchten, dass der bekannte Archivdienst fürs KI-Training benutzt wird. Eine Studie zeigt, dass die Zahl der Blockierer zuletzt rasant gewachsen ist – die wichtigsten Meldungen im kurzen Überblick.

Kamikazedrohnen des US-Militärs fliegen für ein paar Minuten oder höchstens Stunden, bevor sie mit einer tödlichen Explosion in ihr Ziel auf dem Boden krachen. Für die zur Steuerung notwendige Starlink-Anbindung hat das US-Militär bislang 5000 US-Dollar bezahlt, pro Flugdrohne. Während des Angriffs auf den Iran konnte Starlink-Betreiber SpaceX seine Marktmacht ausspielen und den Preis auf fast 25.000 US-Dollar verfünffachen, wie jetzt unter Berufung auf Dokumente des US-Verteidigungsministeriums und zwei namentlich nicht genannte Eingeweihte berichtet wird. Der Preis von knapp 25.000 Dollar ist demnach der monatliche Tarif für Starlink-Terminals in Flugzeugen. SpaceX setzt ihn jetzt auch für Kamikazedrohnen durch: Neuer Starlink-Tarif von 25.000 Dollar für US-Kamikazedrohnen. Keine Preiserhöhung gibt es bei Spotify, obwohl der Streamingdienst sein Angebot erweitert hat. Denn Spotify hat etliche Zeitschriftenartikel in die eigene Hörbuch-Bibliothek aufgenommen. Nutzer können sich jetzt aus bekannten Magazinen wie Rolling Stone, The Atlantic, Vogue, Variety, Billboard, GQ, Wired und Vanity Fair vorlesen lassen. Zu Beginn stehen mehr als 650 englischsprachige Artikel zur Auswahl. Das ist allerdings nicht weltweit verfügbar, sondern auf Regionen beschränkt, in denen auch Hörbücher angeboten werden. Das Vorlesen der Zeitschriftenartikel ist im Premium-Abo enthalten. Gratis-Nutzer können einzelne Beiträge zudem für 1,99 US-Dollar erwerben. Es gibt sowohl menschliche als auch digitale Vorleser: Spotify erweitert Hörangebot um das Vorlesen längerer Artikel aus Zeitschriften. Im Kampf gegen die nicht genehmigte Nutzung von Inhalten für das Training von KI-Modellen gerät das Internet Archive immer mehr zwischen die Fronten, und die Wayback Machine droht zum Kollateralschaden zu werden. Das legt eine Analyse des Nieman Journalism Lab an der Harvard University nahe, laut der immer mehr Nachrichtenseiten Crawler der Archivseite aussperren. Demnach schränken inzwischen mehr als 340 lokale Nachrichtenseiten „den Zugriff des Internet Archive auf ihre Artikel sowie deren Archivierung“ ein, aber auch überregionale und internationale Medien wie die New York Times beteiligen sich demnach. Europäische Medien finden sich ebenfalls auf der Liste, derzeit aber noch keine aus Deutschland: Im Kampf dem KI-Training sperren immer mehr Nachrichtenseiten Wayback Machine aus. Lange hat BMW die Einführung von Elektroautos auf Basis der Neuen Klasse medial vorbereitet. Die ungenierte Nutzung eines so bedeutsamen Begriffs aus der eigenen Firmen-Historie sollte verdeutlichen, wie groß der Schritt ist, den BMW hier vollzieht. Die Marke wollte ein Statement setzen, und liefert das durchaus auch. Im Test zeigte der BMW iX3 zahlreiche Stärken und nur wenige Schwächen, was für die Bayern an zwei Stellen zu einem Problem wird, etwa bei der Differenzierung der angebotenen Modelle iX3 40 und 50, wobei das Basismodell schon einen Einstiegspreis von 63.400 Euro trägt. Letztendlich zeigt sich, dass der iX3 zwar ein kostspieliges Elektroauto ist, aber auch eines der besten, die es momentan zu kaufen gibt: E-SUV BMW iX3 im Test – mehr Reichweite als ich. In gänzlich anderen Preissphären bewegt sich Ferraris erstes batterieelektrisches Modell. Das Elektroauto namens „Luce“ ist für Ferrari nicht einfach ein weiteres Angebot, es ist natürlich auch ein Wagnis angesichts der Tifosi, die sich schon immer und ganz mehrheitlich über die vielzylindrigen Verbrenner begeisterten – mehr als viele Anwohner selbstredend. Doch statt einfach einen elektrischen Ferrari Purosangue zu kreieren, würde dem Selbstverständnis der Marke aus Maranello widersprechen. Der Ferrari Luce ist ein geräumiger, 772 kW leistender GT-Crossover, bei dessen Design Ferrari Unterstützung von Apple-Designern gesucht hat. Das wird vor allem im aufgeräumten und schlichten Interieur mit abgerundeten Kanten sichtbar: Luxus-Elektroauto Ferrari Luce für über 500.000 Euro. Ferrari )Auch noch wichtig: - „Star Citizen“ wird seit 14 Jahren entwickelt, „Squadron 42“ nur unwesentlich weniger. Finanziert wird das von Fans, inzwischen mit mehr als einer Milliarde durch Crowdfunding: Eine Milliarde US-Dollar für „Star Citizen“ und „Squadron 42“. - AdminLTE erscheint in Version 4.0 – mit komplettem Umbau auf Bootstrap 5.3, ohne jQuery und mit 18 neuen Demo-Seiten: Neustart für das Dashboard-Framework AdminLTE 4.0. - Wie lange können Roboter am Stück arbeiten? Figure AI hat es getestet. Aus einer Acht-Stunden-Schicht wurden am Ende acht Tage: Figure AI lässt seine Roboter 200 Stunden am Stück arbeiten. - Epic hat erstmals die Unreal Engine 6 in „Rocket League“ angeteasert. Ein Release-Termin und eine Feature-Liste fehlen: Epic zeigt erste Szenen in „Rocket League“ mit Unreal Engine 6. - Mit „007 First Light“ schafft es James Bond zum ersten Mal seit 2012 wieder in ein Videospiel. Die Wartezeit hat sich gelohnt. Das zeigt „007 First Light“ im Test: Das beste Bond-Spiel seit „Goldeneye“. - Mit iPhone 16e, 17e und Air hat Apple mit den eigenen C1- und C1X-Modems neue Datenschutzfeatures eingeführt. Das steckt hinter der Funktion „Genauen Standort beschränken“: Was Apples Mobilfunksicherheitsfunktion kann. - Laut neuesten Forschungen schrumpft nicht nur in entwickelten Industrieländern die Geburtenrate, sondern global. Wir haben ein paar aktuelle Zahlen dazu: Nicht nur für Industrieländer sind 2,1 Kinder pro Familie immer schwerer erreichbar. - Eine vorinstallierte App auf Motorola-Smartphones leitet Amazon-Aufrufe um und injiziert Affiliate-Codes. Betroffene können die App deaktivieren auf Motorola-Smartphones: Vorinstallierte App schleust offenbar Affiliate-Links ein. - Ende Juni 2026 ist Schluss für Ubuntu Pastebin. Zahllose Links könnten ins Leere laufen. Ein Ersatzdienst ist bislang nicht angekündigt nach dem Aus für Ubuntu Pastebin: Abschaltung Ende Juni 2026. - In aktuellen Versionen von NGINX Open Source und NGINX Plus haben die Entwickler eine Sicherheitslücke geschlossen: DoS- und Schadcode-Attacken auf NGINX-Webserver vorstellbar. - Ab Ende September 2026 synchronisiert die Samsung-Galerie-App keine Fotos mehr mit OneDrive. Nutzer müssen für Backups auf die OneDrive-App umstellen: Samsungs Galerie-App verliert OneDrive-Synchronisierung. - Nach der Ankündigung einer Remote-Funktion über die ChatGPT-App legt OpenAI noch einmal nach. Codex soll den Mac via Computer Use im Locked-Modus kontrollieren: OpenAI Codex steuert Mac auch in gesperrtem Zustand. - Huawei hat aufgrund der Sanktionen Schwierigkeiten, Transistoren weiter zu schrumpfen. Kurze Signalwege mit gestapelten Chips sollen die Probleme kaschieren bei der Chip-Lithografie: Huawei will Moore's Law ablösen.

Weiterlesen

25.000 US-Dollar für einige Minuten Starlink-Anbindung kassiert SpaceX neuerdings vom US-Militär. Es hat keine Alternative für die Steuerung von Drohnen im Kampfgebiet. Doch die Versorgung der iranischen Bevölkerung mit Mobilfunk per Starlink war der US-Regierung zu teuer. Nicht teurer wird Spotify, obwohl der Streamingdienst neben Büchern nun auch Zeitschriftenartikel vorliest. Über 650 englischsprachige Beiträge bekannter Magazine gehören jetzt zur Hörbuch-Bibliothek. Damit sollen Nutzer an das Hören längerer Texte gewöhnt werden, um sie langfristig für Hörbücher zu gewinnen. Derweil sperren immer mehr Nachrichtenseiten die Wayback Machine aus – nicht nur in den USA. Denn sie befürchten, dass der bekannte Archivdienst fürs KI-Training benutzt wird. Eine Studie zeigt, dass die Zahl der Blockierer zuletzt rasant gewachsen ist – die wichtigsten Meldungen im kurzen Überblick.

Kamikazedrohnen des US-Militärs fliegen für ein paar Minuten oder höchstens Stunden, bevor sie mit einer tödlichen Explosion in ihr Ziel auf dem Boden krachen. Für die zur Steuerung notwendige Starlink-Anbindung hat das US-Militär bislang 5000 US-Dollar bezahlt, pro Flugdrohne. Während des Angriffs auf den Iran konnte Starlink-Betreiber SpaceX seine Marktmacht ausspielen und den Preis auf fast 25.000 US-Dollar verfünffachen, wie jetzt unter Berufung auf Dokumente des US-Verteidigungsministeriums und zwei namentlich nicht genannte Eingeweihte berichtet wird. Der Preis von knapp 25.000 Dollar ist demnach der monatliche Tarif für Starlink-Terminals in Flugzeugen. SpaceX setzt ihn jetzt auch für Kamikazedrohnen durch: Neuer Starlink-Tarif von 25.000 Dollar für US-Kamikazedrohnen. Keine Preiserhöhung gibt es bei Spotify, obwohl der Streamingdienst sein Angebot erweitert hat. Denn Spotify hat etliche Zeitschriftenartikel in die eigene Hörbuch-Bibliothek aufgenommen. Nutzer können sich jetzt aus bekannten Magazinen wie Rolling Stone, The Atlantic, Vogue, Variety, Billboard, GQ, Wired und Vanity Fair vorlesen lassen. Zu Beginn stehen mehr als 650 englischsprachige Artikel zur Auswahl. Das ist allerdings nicht weltweit verfügbar, sondern auf Regionen beschränkt, in denen auch Hörbücher angeboten werden. Das Vorlesen der Zeitschriftenartikel ist im Premium-Abo enthalten. Gratis-Nutzer können einzelne Beiträge zudem für 1,99 US-Dollar erwerben. Es gibt sowohl menschliche als auch digitale Vorleser: Spotify erweitert Hörangebot um das Vorlesen längerer Artikel aus Zeitschriften. Im Kampf gegen die nicht genehmigte Nutzung von Inhalten für das Training von KI-Modellen gerät das Internet Archive immer mehr zwischen die Fronten, und die Wayback Machine droht zum Kollateralschaden zu werden. Das legt eine Analyse des Nieman Journalism Lab an der Harvard University nahe, laut der immer mehr Nachrichtenseiten Crawler der Archivseite aussperren. Demnach schränken inzwischen mehr als 340 lokale Nachrichtenseiten „den Zugriff des Internet Archive auf ihre Artikel sowie deren Archivierung“ ein, aber auch überregionale und internationale Medien wie die New York Times beteiligen sich demnach. Europäische Medien finden sich ebenfalls auf der Liste, derzeit aber noch keine aus Deutschland: Im Kampf dem KI-Training sperren immer mehr Nachrichtenseiten Wayback Machine aus. Lange hat BMW die Einführung von Elektroautos auf Basis der Neuen Klasse medial vorbereitet. Die ungenierte Nutzung eines so bedeutsamen Begriffs aus der eigenen Firmen-Historie sollte verdeutlichen, wie groß der Schritt ist, den BMW hier vollzieht. Die Marke wollte ein Statement setzen, und liefert das durchaus auch. Im Test zeigte der BMW iX3 zahlreiche Stärken und nur wenige Schwächen, was für die Bayern an zwei Stellen zu einem Problem wird, etwa bei der Differenzierung der angebotenen Modelle iX3 40 und 50, wobei das Basismodell schon einen Einstiegspreis von 63.400 Euro trägt. Letztendlich zeigt sich, dass der iX3 zwar ein kostspieliges Elektroauto ist, aber auch eines der besten, die es momentan zu kaufen gibt: E-SUV BMW iX3 im Test – mehr Reichweite als ich. In gänzlich anderen Preissphären bewegt sich Ferraris erstes batterieelektrisches Modell. Das Elektroauto namens „Luce“ ist für Ferrari nicht einfach ein weiteres Angebot, es ist natürlich auch ein Wagnis angesichts der Tifosi, die sich schon immer und ganz mehrheitlich über die vielzylindrigen Verbrenner begeisterten – mehr als viele Anwohner selbstredend. Doch statt einfach einen elektrischen Ferrari Purosangue zu kreieren, würde dem Selbstverständnis der Marke aus Maranello widersprechen. Der Ferrari Luce ist ein geräumiger, 772 kW leistender GT-Crossover, bei dessen Design Ferrari Unterstützung von Apple-Designern gesucht hat. Das wird vor allem im aufgeräumten und schlichten Interieur mit abgerundeten Kanten sichtbar: Luxus-Elektroauto Ferrari Luce für über 500.000 Euro. Ferrari )Auch noch wichtig: - „Star Citizen“ wird seit 14 Jahren entwickelt, „Squadron 42“ nur unwesentlich weniger. Finanziert wird das von Fans, inzwischen mit mehr als einer Milliarde durch Crowdfunding: Eine Milliarde US-Dollar für „Star Citizen“ und „Squadron 42“. - AdminLTE erscheint in Version 4.0 – mit komplettem Umbau auf Bootstrap 5.3, ohne jQuery und mit 18 neuen Demo-Seiten: Neustart für das Dashboard-Framework AdminLTE 4.0. - Wie lange können Roboter am Stück arbeiten? Figure AI hat es getestet. Aus einer Acht-Stunden-Schicht wurden am Ende acht Tage: Figure AI lässt seine Roboter 200 Stunden am Stück arbeiten. - Epic hat erstmals die Unreal Engine 6 in „Rocket League“ angeteasert. Ein Release-Termin und eine Feature-Liste fehlen: Epic zeigt erste Szenen in „Rocket League“ mit Unreal Engine 6. - Mit „007 First Light“ schafft es James Bond zum ersten Mal seit 2012 wieder in ein Videospiel. Die Wartezeit hat sich gelohnt. Das zeigt „007 First Light“ im Test: Das beste Bond-Spiel seit „Goldeneye“. - Mit iPhone 16e, 17e und Air hat Apple mit den eigenen C1- und C1X-Modems neue Datenschutzfeatures eingeführt. Das steckt hinter der Funktion „Genauen Standort beschränken“: Was Apples Mobilfunksicherheitsfunktion kann. - Laut neuesten Forschungen schrumpft nicht nur in entwickelten Industrieländern die Geburtenrate, sondern global. Wir haben ein paar aktuelle Zahlen dazu: Nicht nur für Industrieländer sind 2,1 Kinder pro Familie immer schwerer erreichbar. - Eine vorinstallierte App auf Motorola-Smartphones leitet Amazon-Aufrufe um und injiziert Affiliate-Codes. Betroffene können die App deaktivieren auf Motorola-Smartphones: Vorinstallierte App schleust offenbar Affiliate-Links ein. - Ende Juni 2026 ist Schluss für Ubuntu Pastebin. Zahllose Links könnten ins Leere laufen. Ein Ersatzdienst ist bislang nicht angekündigt nach dem Aus für Ubuntu Pastebin: Abschaltung Ende Juni 2026. - In aktuellen Versionen von NGINX Open Source und NGINX Plus haben die Entwickler eine Sicherheitslücke geschlossen: DoS- und Schadcode-Attacken auf NGINX-Webserver vorstellbar. - Ab Ende September 2026 synchronisiert die Samsung-Galerie-App keine Fotos mehr mit OneDrive. Nutzer müssen für Backups auf die OneDrive-App umstellen: Samsungs Galerie-App verliert OneDrive-Synchronisierung. - Nach der Ankündigung einer Remote-Funktion über die ChatGPT-App legt OpenAI noch einmal nach. Codex soll den Mac via Computer Use im Locked-Modus kontrollieren: OpenAI Codex steuert Mac auch in gesperrtem Zustand. - Huawei hat aufgrund der Sanktionen Schwierigkeiten, Transistoren weiter zu schrumpfen. Kurze Signalwege mit gestapelten Chips sollen die Probleme kaschieren bei der Chip-Lithografie: Huawei will Moore's Law ablösen.

Europäische Antwort auf Mythos: Mistral und BNP kooperieren bei Bankensicherheit

Der französische Bankenkonzern BNP Paribas und Mistral AI haben ihre KI-Partnerschaft um drei Jahre verlängert und auf neue Bereiche ausgeweitet. Auf einer gemeinsamen Pressekonferenz in Paris kamen die Partner auch auf KI-gestützte Bedrohungen für Banken zu sprechen. „Das eigentlich Neue ist die Geschwindigkeit, mit der wir Sicherheitslücken beheben müssen, sowie deren schiere Menge. Es werden sehr viele Schwachstellen gleichzeitig entdeckt“, sagte der IT-Chef von BNP Paribas, Marc Camus, laut Reuters. „Darauf müssen wir uns vorbereiten, und genau daran arbeiten wir mit Hochdruck.“

Konkrete Ankündigungen zur Zusammenarbeit im Bereich Cybersicherheit machten die Partner zwar nicht. Bloomberg berichtet jedoch, dass das Pariser KI-Start-up ein eigenes KI-Modell für Cybersicherheit entwickelt hat und mit europäischen Banken Gespräche über dessen Einsatz führe. Einer dieser Partner sei BNP Paribas. „Die Debatte dreht sich derzeit stark darum, ob Mythos für manche Banken zugänglich ist oder nicht. Dabei sollte man nicht vergessen, dass es auch andere Modelle anderer Unternehmen gibt“, sagte Camus. Europa sucht nach Alternativen zu Mythos Seit der Vorstellung von Mythos im April steht die Bankenbranche unter Zugzwang. Das KI-Modell von Anthropic soll Sicherheitslücken deutlich schneller erkennen können als bisherige Systeme und daraus teils auch mögliche Angriffspfade ableiten. Über die Initiative „Project Glasswing“ erhielten zunächst vor allem US-Partner Zugriff, darunter große Tech- und Sicherheitsunternehmen sowie mehrere US-Banken, um kritische Software abzusichern, bevor vergleichbare Fähigkeiten breiter verfügbar werden. Ob und in welcher Form inzwischen auch europäische Banken direkten Zugang zu Mythos erhalten haben, ist öffentlich nicht bestätigt. Die jüngsten Aussagen von BNP Paribas und Mistral deuten jedoch darauf hin, dass europäische Institute weiter nach Alternativen suchen. Anthropic-Konkurrent OpenAI hat ein eigenes Modell für Cybersicherheit vorgestellt, auf das auch einige europäische Unternehmen Zugriff haben. Mit dem Pariser KI-Start-up Mistral entsteht nun offenbar auch eine europäische Antwort auf das Problem. Die Partnerschaft zwischen Mistral und BNP Paribas geht auf das Jahr 2023 zurück. Mit der Verlängerung werde die Zusammenarbeit laut Unternehmen über den bloßen Zugang zu großen Sprachmodellen hinaus ausgeweitet und umfasse auch Software, Lösungen sowie gemeinsame Forschungs- und Entwicklungsprojekte, schreibt BNP Paribas.

Weiterlesen

Der französische Bankenkonzern BNP Paribas und Mistral AI haben ihre KI-Partnerschaft um drei Jahre verlängert und auf neue Bereiche ausgeweitet. Auf einer gemeinsamen Pressekonferenz in Paris kamen die Partner auch auf KI-gestützte Bedrohungen für Banken zu sprechen. „Das eigentlich Neue ist die Geschwindigkeit, mit der wir Sicherheitslücken beheben müssen, sowie deren schiere Menge. Es werden sehr viele Schwachstellen gleichzeitig entdeckt“, sagte der IT-Chef von BNP Paribas, Marc Camus, laut Reuters. „Darauf müssen wir uns vorbereiten, und genau daran arbeiten wir mit Hochdruck.“

Konkrete Ankündigungen zur Zusammenarbeit im Bereich Cybersicherheit machten die Partner zwar nicht. Bloomberg berichtet jedoch, dass das Pariser KI-Start-up ein eigenes KI-Modell für Cybersicherheit entwickelt hat und mit europäischen Banken Gespräche über dessen Einsatz führe. Einer dieser Partner sei BNP Paribas. „Die Debatte dreht sich derzeit stark darum, ob Mythos für manche Banken zugänglich ist oder nicht. Dabei sollte man nicht vergessen, dass es auch andere Modelle anderer Unternehmen gibt“, sagte Camus. Europa sucht nach Alternativen zu Mythos Seit der Vorstellung von Mythos im April steht die Bankenbranche unter Zugzwang. Das KI-Modell von Anthropic soll Sicherheitslücken deutlich schneller erkennen können als bisherige Systeme und daraus teils auch mögliche Angriffspfade ableiten. Über die Initiative „Project Glasswing“ erhielten zunächst vor allem US-Partner Zugriff, darunter große Tech- und Sicherheitsunternehmen sowie mehrere US-Banken, um kritische Software abzusichern, bevor vergleichbare Fähigkeiten breiter verfügbar werden. Ob und in welcher Form inzwischen auch europäische Banken direkten Zugang zu Mythos erhalten haben, ist öffentlich nicht bestätigt. Die jüngsten Aussagen von BNP Paribas und Mistral deuten jedoch darauf hin, dass europäische Institute weiter nach Alternativen suchen. Anthropic-Konkurrent OpenAI hat ein eigenes Modell für Cybersicherheit vorgestellt, auf das auch einige europäische Unternehmen Zugriff haben. Mit dem Pariser KI-Start-up Mistral entsteht nun offenbar auch eine europäische Antwort auf das Problem. Die Partnerschaft zwischen Mistral und BNP Paribas geht auf das Jahr 2023 zurück. Mit der Verlängerung werde die Zusammenarbeit laut Unternehmen über den bloßen Zugang zu großen Sprachmodellen hinaus ausgeweitet und umfasse auch Software, Lösungen sowie gemeinsame Forschungs- und Entwicklungsprojekte, schreibt BNP Paribas.

Mistral und Harvey AI: Den Rechtssektor im Visier

Die Modelle des französischen KI-Unternehmens Mistral werden künftig über die Software-Plattform des US-Start-ups Harvey AI nutzbar sein. Das gab die Legal-AI-Plattform in einer Pressemitteilung bekannt. Zunächst werden die Mistral-Modelle Kunden in der Europäischen Union im Rahmen eines Early Access zur Verfügung gestellt. Ein breiterer Rollout soll in den kommenden Monaten erfolgen. Das in San Francisco ansässige Unternehmen Harvey AI wurde 2022 gegründet. Sein Hauptprodukt, die Software Harvey, bietet speziell für die Rechtsbranche zugeschnittene LLMs an. Durch die Partnerschaft erhält Mistral Zugang zu mehr als 1500 Kunden in 60 Ländern, die Harvey bereits in ihre Geschäftsprozesse integriert haben. KI für sensible Angelegenheiten Die Partnerschaft der beiden Unternehmen ist nicht neu. Bereits im Mai 2024 kündigte Harvey AI die Zusammenarbeit mit Mistral in einer Pressemitteilung an. Damals betonte das Unternehmen Mistrals Engagement für Transparenz, Effizienz und Anpassungsmöglichkeiten. Der Einsatz von generativer KI in stark regulierten Branchen erfordere ein Höchstmaß an Sicherheit und Transparenz, schrieb das Unternehmen auf seiner Website. Als klassischerweise textlastige Domäne bietet das Rechtswesen großes Potenzial für die Nutzung von KI. LLMs können Kanzleien und Institutionen der Justiz zum Beispiel dabei helfen, hunderte Seiten umfassende Prozessdokumente zu durchsuchen. Eine lukrative Branche Anwaltskanzleien setzen KI-Tools aber auch aus ökonomischen Gründen ein: Die Automatisierung von Aufgaben mittels KI verschafft Anwälten zusätzliche Zeit. So können sie mehr Fälle übernehmen.

Das Geschäftsfeld der Rechtsbranche ist bei den großen KI-Herstellern deshalb durchaus umkämpft. Erst kürzlich hatte Anthropic mehrere Plug-ins in seinen kostenpflichtigen KI-Agenten Claude Cowork integriert, die auf juristische Aufgaben spezialisiert sein sollen. Schattenseiten für die Justiz Dass künstliche Intelligenz vermehrt in der Rechtsbranche genutzt wird, hat derweil auch erhebliche Schattenseiten. Denn häufig wird generative KI eben nicht nur für die reine Dokumentanalyse genutzt. So haben Gerichte weltweit vermehrt mit Schriftsätzen zu kämpfen, die KI-Halluzinationen enthalten. Die KI-Tools zitieren dabei nicht existierende Gerichtsurteile, verfälschen Aussagen oder geben Urteile falsch wieder. Laut einer Online-Datenbank des Rechtswissenschaftlers Damien Charlotin von der Wirtschaftshochschule HEC Paris gab es Stand Ende Mai 2026 bereits knapp 1500 dokumentierte Gerichtsverfahren, in denen Personen wegen des Vorbringens von Dokumenten mit KI-Fehlern sanktioniert wurden. Charlotin zufolge habe die Menge der betroffenen Gerichtsverfahren seit vergangenem Jahr erheblich zugenommen. Auch in Deutschland gab es bereits erste Fälle. Anfang Mai rügte ein Berliner Kammergericht Anwälte wegen KI-Halluzinationen. Einige Gerichte in den USA haben bereits Kennzeichnungspflichten für mit KI bearbeitete Dokumente eingeführt. Experten betrachten diese aber als wenig praktikabel und zielführend. Da KI mittlerweile im standardmäßigen Funktionsumfang von Kanzleisoftware integriert ist, wäre nahezu jedes Dokument kennzeichnungspflichtig.

Weiterlesen

Die Modelle des französischen KI-Unternehmens Mistral werden künftig über die Software-Plattform des US-Start-ups Harvey AI nutzbar sein. Das gab die Legal-AI-Plattform in einer Pressemitteilung bekannt. Zunächst werden die Mistral-Modelle Kunden in der Europäischen Union im Rahmen eines Early Access zur Verfügung gestellt. Ein breiterer Rollout soll in den kommenden Monaten erfolgen. Das in San Francisco ansässige Unternehmen Harvey AI wurde 2022 gegründet. Sein Hauptprodukt, die Software Harvey, bietet speziell für die Rechtsbranche zugeschnittene LLMs an. Durch die Partnerschaft erhält Mistral Zugang zu mehr als 1500 Kunden in 60 Ländern, die Harvey bereits in ihre Geschäftsprozesse integriert haben. KI für sensible Angelegenheiten Die Partnerschaft der beiden Unternehmen ist nicht neu. Bereits im Mai 2024 kündigte Harvey AI die Zusammenarbeit mit Mistral in einer Pressemitteilung an. Damals betonte das Unternehmen Mistrals Engagement für Transparenz, Effizienz und Anpassungsmöglichkeiten. Der Einsatz von generativer KI in stark regulierten Branchen erfordere ein Höchstmaß an Sicherheit und Transparenz, schrieb das Unternehmen auf seiner Website. Als klassischerweise textlastige Domäne bietet das Rechtswesen großes Potenzial für die Nutzung von KI. LLMs können Kanzleien und Institutionen der Justiz zum Beispiel dabei helfen, hunderte Seiten umfassende Prozessdokumente zu durchsuchen. Eine lukrative Branche Anwaltskanzleien setzen KI-Tools aber auch aus ökonomischen Gründen ein: Die Automatisierung von Aufgaben mittels KI verschafft Anwälten zusätzliche Zeit. So können sie mehr Fälle übernehmen.

Das Geschäftsfeld der Rechtsbranche ist bei den großen KI-Herstellern deshalb durchaus umkämpft. Erst kürzlich hatte Anthropic mehrere Plug-ins in seinen kostenpflichtigen KI-Agenten Claude Cowork integriert, die auf juristische Aufgaben spezialisiert sein sollen. Schattenseiten für die Justiz Dass künstliche Intelligenz vermehrt in der Rechtsbranche genutzt wird, hat derweil auch erhebliche Schattenseiten. Denn häufig wird generative KI eben nicht nur für die reine Dokumentanalyse genutzt. So haben Gerichte weltweit vermehrt mit Schriftsätzen zu kämpfen, die KI-Halluzinationen enthalten. Die KI-Tools zitieren dabei nicht existierende Gerichtsurteile, verfälschen Aussagen oder geben Urteile falsch wieder. Laut einer Online-Datenbank des Rechtswissenschaftlers Damien Charlotin von der Wirtschaftshochschule HEC Paris gab es Stand Ende Mai 2026 bereits knapp 1500 dokumentierte Gerichtsverfahren, in denen Personen wegen des Vorbringens von Dokumenten mit KI-Fehlern sanktioniert wurden. Charlotin zufolge habe die Menge der betroffenen Gerichtsverfahren seit vergangenem Jahr erheblich zugenommen. Auch in Deutschland gab es bereits erste Fälle. Anfang Mai rügte ein Berliner Kammergericht Anwälte wegen KI-Halluzinationen. Einige Gerichte in den USA haben bereits Kennzeichnungspflichten für mit KI bearbeitete Dokumente eingeführt. Experten betrachten diese aber als wenig praktikabel und zielführend. Da KI mittlerweile im standardmäßigen Funktionsumfang von Kanzleisoftware integriert ist, wäre nahezu jedes Dokument kennzeichnungspflichtig.

DSGVO: Fast drei Viertel der Firmen finden deutschen Datenschutz übertrieben

Deutschlands Unternehmen hadern rund zehn Jahre nach Inkrafttreten mit den Vorgaben der europäischen Datenschutzgrundverordnung (DSGVO), wie aus einer Studie des Digitalverbands Bitkom hervorgeht. Zwar ist demnach der Datenschutz inzwischen in den meisten Betrieben fest verankert, gleichzeitig aber beklagen die Firmen Aufwand, Komplexität und Rechtsunsicherheit. Weitgehend oder vollständig umgesetzt sind die DSGVO-Vorgaben inzwischen in 71 Prozent der Betriebe. Anfang 2018, kurz vor Anwendbarkeit des 2016 in Kraft getretenen Regelwerks, hatten erst sieben Prozent der Unternehmen die Vorgaben größtenteils oder vollständig umgesetzt. Parallel dazu ist die wahrgenommene Belastung deutlich gestiegen: 2016 gaben 25 Prozent der Unternehmen an, die DSGVO mache Geschäftsprozesse komplizierter – 2025 sind es 81 Prozent. 97 Prozent bewerten auch den Aufwand für Datenschutz inzwischen als hoch, davon 44 Prozent als sehr hoch. Der Anteil der Unternehmen, die der Auffassung sind, Deutschland übertreibe es mit dem Datenschutz, hat sich von 40 Prozent (2020) auf 72 Prozent (2025) nahezu verdoppelt. Zudem wächst auch die Rechtsunsicherheit über die genauen Datenschutzvorgaben: 82 Prozent der Unternehmen nennen das 2025 als eine der größten Herausforderungen, 2017 waren es 35 Prozent. Grundlage der Zahlen ist eine seit 2016 jährlich durchgeführte Befragung von Unternehmen ab 20 Beschäftigten durch Bitkom Research, zuletzt mit 603 Teilnehmern aus allen Branchen. Laut Bitkom sind die Ergebnisse repräsentativ. KI-Bremse DSGVO? Besondere Spannungen sieht der Branchenverband im Zusammenspiel von Datenschutz und Künstlicher Intelligenz. So betrachten zwar 59 Prozent der Unternehmen den europäischen Datenschutz im internationalen Vergleich grundsätzlich als Vorteil für die KI-Entwicklung. In der Praxis erweist sich dies jedoch als Hindernis: 69 Prozent geben an, der Datenschutz erschwere das Training von KI-Modellen mit ausreichenden Daten – 2023 waren es noch 42 Prozent. Zudem sind 63 Prozent überzeugt, dass der Datenschutz KI-Unternehmen aus der EU verdrängt. 59 Prozent geben an, dass Projekte zum Aufbau von Datenpools an Datenschutzvorgaben gescheitert oder gar nicht erst begonnen worden seien (2020: 41 Prozent). Auch das Problem der internationalen Datentransfers sehen die Firmen als ungelöst: Rund 61 Prozent der Unternehmen übermittelten 2025 personenbezogene Daten in die USA – mit Abstand das wichtigste Drittland für Datentransfers außerhalb der EU. 71 Prozent wünschen sich von der Politik tragfähige Lösungen für den internationalen Datentransfer (2021: 32 Prozent).

„Datenschutz ist keine lästige Pflicht, er ist eine zentrale Säule der digitalen Welt“, betonte Bitkom-Präsident Ralf Wintergerst. Allerdings hält er eine Reform der DSGVO für nötig: Die Erwartungen an einheitlichere Wettbewerbsbedingungen, mehr Rechtssicherheit und weniger Bürokratie hätten sich jedoch nicht erfüllt. Der auf europäischer Ebene geplante „Digitalomnibus“ biete dafür eine Chance. Allerdings gab es bei den derzeit laufenden Trilog-Verhandlungen dazu noch keine Einigung.

Weiterlesen

Deutschlands Unternehmen hadern rund zehn Jahre nach Inkrafttreten mit den Vorgaben der europäischen Datenschutzgrundverordnung (DSGVO), wie aus einer Studie des Digitalverbands Bitkom hervorgeht. Zwar ist demnach der Datenschutz inzwischen in den meisten Betrieben fest verankert, gleichzeitig aber beklagen die Firmen Aufwand, Komplexität und Rechtsunsicherheit. Weitgehend oder vollständig umgesetzt sind die DSGVO-Vorgaben inzwischen in 71 Prozent der Betriebe. Anfang 2018, kurz vor Anwendbarkeit des 2016 in Kraft getretenen Regelwerks, hatten erst sieben Prozent der Unternehmen die Vorgaben größtenteils oder vollständig umgesetzt. Parallel dazu ist die wahrgenommene Belastung deutlich gestiegen: 2016 gaben 25 Prozent der Unternehmen an, die DSGVO mache Geschäftsprozesse komplizierter – 2025 sind es 81 Prozent. 97 Prozent bewerten auch den Aufwand für Datenschutz inzwischen als hoch, davon 44 Prozent als sehr hoch. Der Anteil der Unternehmen, die der Auffassung sind, Deutschland übertreibe es mit dem Datenschutz, hat sich von 40 Prozent (2020) auf 72 Prozent (2025) nahezu verdoppelt. Zudem wächst auch die Rechtsunsicherheit über die genauen Datenschutzvorgaben: 82 Prozent der Unternehmen nennen das 2025 als eine der größten Herausforderungen, 2017 waren es 35 Prozent. Grundlage der Zahlen ist eine seit 2016 jährlich durchgeführte Befragung von Unternehmen ab 20 Beschäftigten durch Bitkom Research, zuletzt mit 603 Teilnehmern aus allen Branchen. Laut Bitkom sind die Ergebnisse repräsentativ. KI-Bremse DSGVO? Besondere Spannungen sieht der Branchenverband im Zusammenspiel von Datenschutz und Künstlicher Intelligenz. So betrachten zwar 59 Prozent der Unternehmen den europäischen Datenschutz im internationalen Vergleich grundsätzlich als Vorteil für die KI-Entwicklung. In der Praxis erweist sich dies jedoch als Hindernis: 69 Prozent geben an, der Datenschutz erschwere das Training von KI-Modellen mit ausreichenden Daten – 2023 waren es noch 42 Prozent. Zudem sind 63 Prozent überzeugt, dass der Datenschutz KI-Unternehmen aus der EU verdrängt. 59 Prozent geben an, dass Projekte zum Aufbau von Datenpools an Datenschutzvorgaben gescheitert oder gar nicht erst begonnen worden seien (2020: 41 Prozent). Auch das Problem der internationalen Datentransfers sehen die Firmen als ungelöst: Rund 61 Prozent der Unternehmen übermittelten 2025 personenbezogene Daten in die USA – mit Abstand das wichtigste Drittland für Datentransfers außerhalb der EU. 71 Prozent wünschen sich von der Politik tragfähige Lösungen für den internationalen Datentransfer (2021: 32 Prozent).

„Datenschutz ist keine lästige Pflicht, er ist eine zentrale Säule der digitalen Welt“, betonte Bitkom-Präsident Ralf Wintergerst. Allerdings hält er eine Reform der DSGVO für nötig: Die Erwartungen an einheitlichere Wettbewerbsbedingungen, mehr Rechtssicherheit und weniger Bürokratie hätten sich jedoch nicht erfüllt. Der auf europäischer Ebene geplante „Digitalomnibus“ biete dafür eine Chance. Allerdings gab es bei den derzeit laufenden Trilog-Verhandlungen dazu noch keine Einigung.

Figure AI lässt seine Roboter 200 Stunden am Stück arbeiten

heise_ki·2026-05-26RobotikAnwendungenWirtschaft

200 Stunden ohne Hardware-Problem: Das US-Unternehmen Figure AI hat drei humanoide Roboter vom Typ Figure 03 (F.03) acht Tage lang an einem Fließband Pakete sortieren lassen. Das schafften die Roboter ohne eine Störung.

Die Roboter standen an einem Fließband mit Paketen. Sie sollten darauf den Barcode suchen, das Paket nehmen und umdrehen, sodass der Barcode unten liegt. Eine Kamera beobachtete sie dabei und streamte ins Internet. Die Zuschauer gaben den dreien die Namen Bob, Jim und Rose.

Ursprünglich war eine Acht-Stunden-Schicht geplant. Daraus wurden zunächst 20 und schließlich 200 Stunden, in denen die drei 249.560 Pakete bearbeiteten. Dabei sei es zu keinem Ausfall gekommen, teilte Figure-AI-Chef Brett Adcock über den Kurznachrichtendienst X mit. Es traten allerdings kleinere Fehler auf, etwa dass ein Roboter ein Paket auf den Boden fallen ließ oder eines nicht richtig auf das Band legte.

Ablösung bei niedrigem Akkustand

Die Roboter rotierten bei der Arbeit: Neigte sich der Ladestand des Akkus dem Ende zu, wurde er automatisch von einem anderen abgelöst. Er begab sich dann zu einer drahtlosen Ladestation, um sich auf seinen nächsten Einsatz vorzubereiten. Der Akku des F.03 hält etwa vier Stunden durch.

Die Idee zu der Aktion entstand, als der Robotiker Scott Walter Figure AI aufforderte, die Leistungsfähigkeit des F.03 zu demonstrieren. Nachdem am ersten Tag aber keine Störungen auftraten, wurde der Test ausgeweitet. „Das ist Neuland“, kommentierte Adcock.

Zuvor hatte das Unternehmen einen Praktikanten gegen den Roboter antreten lassen: Beide sollten in einer 10-Stunden-Schicht Pakete sortieren. Der Roboter schaffte 12.732 Pakete, was einer Zeit von 2,83 Sekunden pro Paket entspricht. Der Praktikant schlug ihn knapp mit 12.924 Paketen – das sind 2,79 Sekunden pro Paket –, war allerdings körperlich deutlich gestresst. Aber, so kommentierte Adcock: „Das ist das letzte Mal, dass ein Mensch gewinnt.“

Figure 03 ist ein humanoider Roboter, der etwa 1,70 Meter groß ist und gut 60 Kilogramm wiegt. Gesteuert wird er von einem KI-System mit der Bezeichnung Helix 02, das Figure AI selbst entwickelt hat. Die Vorgänger Figure 01 und Figure 02 sind bereits seit einiger Zeit im Einsatz in der Industrie.

Weiterlesen

200 Stunden ohne Hardware-Problem: Das US-Unternehmen Figure AI hat drei humanoide Roboter vom Typ Figure 03 (F.03) acht Tage lang an einem Fließband Pakete sortieren lassen. Das schafften die Roboter ohne eine Störung.

Die Roboter standen an einem Fließband mit Paketen. Sie sollten darauf den Barcode suchen, das Paket nehmen und umdrehen, sodass der Barcode unten liegt. Eine Kamera beobachtete sie dabei und streamte ins Internet. Die Zuschauer gaben den dreien die Namen Bob, Jim und Rose.

Ursprünglich war eine Acht-Stunden-Schicht geplant. Daraus wurden zunächst 20 und schließlich 200 Stunden, in denen die drei 249.560 Pakete bearbeiteten. Dabei sei es zu keinem Ausfall gekommen, teilte Figure-AI-Chef Brett Adcock über den Kurznachrichtendienst X mit. Es traten allerdings kleinere Fehler auf, etwa dass ein Roboter ein Paket auf den Boden fallen ließ oder eines nicht richtig auf das Band legte.

Ablösung bei niedrigem Akkustand

Die Roboter rotierten bei der Arbeit: Neigte sich der Ladestand des Akkus dem Ende zu, wurde er automatisch von einem anderen abgelöst. Er begab sich dann zu einer drahtlosen Ladestation, um sich auf seinen nächsten Einsatz vorzubereiten. Der Akku des F.03 hält etwa vier Stunden durch.

Die Idee zu der Aktion entstand, als der Robotiker Scott Walter Figure AI aufforderte, die Leistungsfähigkeit des F.03 zu demonstrieren. Nachdem am ersten Tag aber keine Störungen auftraten, wurde der Test ausgeweitet. „Das ist Neuland“, kommentierte Adcock.

Zuvor hatte das Unternehmen einen Praktikanten gegen den Roboter antreten lassen: Beide sollten in einer 10-Stunden-Schicht Pakete sortieren. Der Roboter schaffte 12.732 Pakete, was einer Zeit von 2,83 Sekunden pro Paket entspricht. Der Praktikant schlug ihn knapp mit 12.924 Paketen – das sind 2,79 Sekunden pro Paket –, war allerdings körperlich deutlich gestresst. Aber, so kommentierte Adcock: „Das ist das letzte Mal, dass ein Mensch gewinnt.“

Figure 03 ist ein humanoider Roboter, der etwa 1,70 Meter groß ist und gut 60 Kilogramm wiegt. Gesteuert wird er von einem KI-System mit der Bezeichnung Helix 02, das Figure AI selbst entwickelt hat. Die Vorgänger Figure 01 und Figure 02 sind bereits seit einiger Zeit im Einsatz in der Industrie.

Aus Angst vor Technologieverlust: China verbietet KI-Forschern freies Reisen ins Ausland

the_decoder·2026-05-26RegulierungGesellschaftWirtschaft

China schränkt Auslandsreisen für führende KI-Fachleute bei privaten Unternehmen wie Alibaba und Deepseek ein. Laut Bloomberg News haben Regierungsbehörden damit begonnen, Personen mit Reisebeschränkungen zu belegen, die an fortgeschrittener KI-Arbeit beteiligt sind und als strategisch wichtig für das Land gelten. Die Betroffenen müssen vor Auslandsreisen eine Genehmigung der zuständigen Behörden einholen, wie mit der Angelegenheit vertraute Personen berichten.

Bereits im März 2025 hatte Peking angeblich KI‑Führungskräften von USA‑Reisen "abgeraten". Hintergrund sind Sorgen vor Datenlecks, Technologieverlust und Abwerbung.

Die Maßnahmen sind Teil eines breiteren Trends: China versucht, seine KI-Industrie, Soft- und Hardware, abzuschirmen und gleichzeitig unabhängiger zu werden. Laut einem IDC-Bericht halten etwa chinesische Chiphersteller inzwischen 41 Prozent des heimischen Marktes für KI-Beschleuniger. Auch Metas Übernahme des Agenten-Startups Manus AI machte die Regierung wieder rückgängig. China und die USA liefern sich seit Jahren einen technologischen Wettlauf um die Führungsrolle bei Künstlicher Intelligenz.

Weiterlesen

China schränkt Auslandsreisen für führende KI-Fachleute bei privaten Unternehmen wie Alibaba und Deepseek ein. Laut Bloomberg News haben Regierungsbehörden damit begonnen, Personen mit Reisebeschränkungen zu belegen, die an fortgeschrittener KI-Arbeit beteiligt sind und als strategisch wichtig für das Land gelten. Die Betroffenen müssen vor Auslandsreisen eine Genehmigung der zuständigen Behörden einholen, wie mit der Angelegenheit vertraute Personen berichten.

Bereits im März 2025 hatte Peking angeblich KI‑Führungskräften von USA‑Reisen "abgeraten". Hintergrund sind Sorgen vor Datenlecks, Technologieverlust und Abwerbung.

Die Maßnahmen sind Teil eines breiteren Trends: China versucht, seine KI-Industrie, Soft- und Hardware, abzuschirmen und gleichzeitig unabhängiger zu werden. Laut einem IDC-Bericht halten etwa chinesische Chiphersteller inzwischen 41 Prozent des heimischen Marktes für KI-Beschleuniger. Auch Metas Übernahme des Agenten-Startups Manus AI machte die Regierung wieder rückgängig. China und die USA liefern sich seit Jahren einen technologischen Wettlauf um die Führungsrolle bei Künstlicher Intelligenz.

Google Cloud COO: KI-Sicherheit ist Chefsache, nicht nur Aufgabe der IT

the_decoder·2026-05-26SicherheitWirtschaftInfrastruktur

Google Cloud COO Francis de Souza fordert Unternehmen auf, Sicherheit von Anfang an in ihre KI-Strategie einzubauen. "Es gibt keine KI-Strategie ohne Datenstrategie und Sicherheitsstrategie", sagte er bei einem Event in Los Angeles. Er warnte laut TechCrunch auch epxlizit vor "Shadow AI" - also Mitarbeitern, die KI-Tools ohne Firmenaufsicht nutzen - und vor KI-Agenten, die vergessene Datenquellen wie alte SharePoint-Server in Unternehmen aufspüren.

Die Angriffsfläche habe sich weit über den klassischen Netzwerkrand hinaus vergrößert: Modelle, Daten-Pipelines, Agenten und Prompts müssten alle geschützt werden. Die Zeit zwischen einem ersten Einbruch und der nächsten Angriffsstufe sei durch KI von acht Stunden auf 22 Sekunden gesunken. De Souza plädiert daher für eine "KI-native, vollständig agentenbasierte Verteidigung", bei der Menschen nur noch die Aufsicht führen. KI-Sicherheit sei ein Thema für Vorstände, nicht nur für IT-Abteilungen.

Sicherheit lasse sich nicht nachträglich draufschrauben und nicht den einzelnen Mitarbeitern überlassen, so de Souza. Unternehmen bräuchten eine einheitliche Sicherheitsstrategie über alle Clouds und Modelle hinweg, auch wenn sie glauben, nur einen Anbieter zu nutzen. Denn über SaaS-Anwendungen und Geschäftspartner seien fast immer mehrere Clouds im Spiel.

Weiterlesen

Google Cloud COO Francis de Souza fordert Unternehmen auf, Sicherheit von Anfang an in ihre KI-Strategie einzubauen. "Es gibt keine KI-Strategie ohne Datenstrategie und Sicherheitsstrategie", sagte er bei einem Event in Los Angeles. Er warnte laut TechCrunch auch epxlizit vor "Shadow AI" - also Mitarbeitern, die KI-Tools ohne Firmenaufsicht nutzen - und vor KI-Agenten, die vergessene Datenquellen wie alte SharePoint-Server in Unternehmen aufspüren.

Die Angriffsfläche habe sich weit über den klassischen Netzwerkrand hinaus vergrößert: Modelle, Daten-Pipelines, Agenten und Prompts müssten alle geschützt werden. Die Zeit zwischen einem ersten Einbruch und der nächsten Angriffsstufe sei durch KI von acht Stunden auf 22 Sekunden gesunken. De Souza plädiert daher für eine "KI-native, vollständig agentenbasierte Verteidigung", bei der Menschen nur noch die Aufsicht führen. KI-Sicherheit sei ein Thema für Vorstände, nicht nur für IT-Abteilungen.

Sicherheit lasse sich nicht nachträglich draufschrauben und nicht den einzelnen Mitarbeitern überlassen, so de Souza. Unternehmen bräuchten eine einheitliche Sicherheitsstrategie über alle Clouds und Modelle hinweg, auch wenn sie glauben, nur einen Anbieter zu nutzen. Denn über SaaS-Anwendungen und Geschäftspartner seien fast immer mehrere Clouds im Spiel.

Dell disaggregiert Private Cloud für mehr Skalierbarkeit

Dell hat auf seiner Hausmesse neue Funktionen für die Dell Private Cloud, die Dell Distributed Private Cloud und für die Dell Automation Platform vorgestellt. Sie zielen auf disaggregierte Rechenzentrumsarchitekturen, bei denen Compute, Storage und Netzwerk nicht mehr als gekoppelte HCI-Einheit betrieben werden, sondern getrennt eingerichtet und skaliert werden können. Die Dell Private Cloud unterstützt dafür mehrere Cloud-Betriebssysteme auf PowerEdge-Servern und PowerStore-Storage. Genannt werden VMware Cloud Foundation 9.1, Microsoft Azure Local und Nutanix AHV mit Dell PowerStore. Das adressiert Umgebungen, in denen mehrere Hypervisoren, Private-Cloud-Plattformen oder mehrere Cloud-Stacks betrieben werden. Dell begründet den neuen Ansatz unter anderem mit Multi-Hypervisor-Umgebungen, geringerem Vendor-Lock-in, der Möglichkeit zum Wechsel zwischen Cloud-Betriebssystemen und der unabhängigen Skalierung von Rechenleistung und Speicher. Neue Architektur richtet sich an KI-Workloads Der Ansatz ist ein Gegenpol zu HCI, wo Compute, Storage und Virtualisierung in einem eng gekoppelten Stack verknüpft sind. Das vereinfacht Beschaffung, Aufbau und Betrieb. Entsprechend groß ist HCI in vielen Private-Cloud-Umgebungen verbreitet. Die Kehrseite ist aber, dass die Skalierung und Modernisierung der Ressourcen ebenfalls miteinander verknüpft sind. Bei KI- und datenintensiven Workloads kann das zum Problem werden, denn GPU-Leistung, Storage-Kapazität, File- und Object-Zugriffe, Netzwerkbandbreite, Stromversorgung und Kühlung wachsen selten im gleichen Takt. Hinzu kommt, dass sich viele KI-Anwendungen und Agenten noch in der Pilotphase, dem Proof of Concept oder im begrenzten Fachbereichstest befinden. Sobald ein Use Case produktiv ausgerollt wird, ändern sich Nutzerzahlen, Inferenzlast, Datenzugriffe, Verfügbarkeitsanforderungen und Sicherheitsvorgaben teils sprunghaft. Damit wird die Infrastrukturplanung schwieriger als bei klassischen Unternehmensanwendungen mit vergleichsweise stabilen Lastprofilen. Automation Platform für Betrieb und Orchestrierung Eine disaggregierte Infrastruktur schafft mehr Freiheitsgrade, erhöht aber auch den Aufwand für Planung und Betrieb. Eine Umgebung aus getrennt skalierbaren Server-, Storage-, Netzwerk- und Cloud-Stacks ist kein Rundum-sorglos-Paket. Dell versucht, den zusätzlichen Betriebsaufwand über validierte Designs, zentrale Verwaltung und Automatisierung einzugrenzen. Dazu wurden mehrere Erweiterungen der Automation Platform vorgestellt, beispielsweise die Kombination von KI-Agenten mit einer dialogorientierten Bedienoberfläche. Die neue Plattform kann Cloud-Betriebssysteme auf PowerEdge und PowerStore installieren und über ein gemeinsames Managementmodell betreiben. Automation Studio ergänzt diese Funktionen. Damit sollen Unternehmen eigene Automatisierungs-Workflows über Infrastruktur und Anwendungen hinweg erstellen können. Dell adressiert damit nicht nur Erstinstallation und Provisionierung, sondern auch wiederkehrende Aufgaben im laufenden Betrieb. HCI unter Kostendruck Neben der technischen Flexibilität sprechen für eine Disaggregierung auch die Kostenvorteile. In einem Gespräch mit iX sagte Dell-Fellow Onur Celebioglu: „HCI-Systeme stehen wegen ihrer Architektur besonders unter Kostendruck, da sie viel DRAM und Laufwerke benötigen. Extern skalierbare Storage-Systeme können damit in bestimmten Refresh-Szenarien wirtschaftlich attraktiver werden.“ Ein weiterer Punkt ist die Hypervisor-Bindung. HCI ist architektonisch eng mit dem jeweiligen Virtualisierungs-Stack verbunden. Wer sich für ein Ökosystem entscheidet, bleibt in der Regel auch daran gebunden. Disaggregierte Architekturen mit externer Storage lockern diese enge Bindung. Dell verkauft diese Entkopplung als „Optionality“, also als Wahlfreiheit für unterschiedliche Cloud- und Virtualisierungsumgebungen.

Distributed Private Cloud für Edge-Locations Für Edge-Standorte erweitert Dell seine Distributed Private Cloud, früher NativeEdge. Die Plattform bekommt Zwei-Node-HA-Cluster, automatisches Failover und integrierte Zero-Trust-Funktionen. Das zielt auf Fertigungsumgebungen, Logistikzentren oder andere dezentrale Standorte, an denen Latenz, Datenhaltung oder Ausfallsicherheit gegen einen reinen Cloud-Betrieb sprechen, aber kaum eigenes IT-Knowhow vor Ort verfügbar ist. Auch hier folgt Dell der gleichen Logik: Infrastruktur soll näher an Daten und Anwendungen rücken, trotzdem aber zentral verwaltet und automatisiert betrieben werden. Dells neue Private-Cloud-Strategie ist keine einfache Rückkehr zur klassischen Drei-Schichten-Architektur. Der Hersteller versucht vielmehr, die Flexibilität getrennter Compute-, Storage- und Netzwerkressourcen mit Cloud-Stack-Optionen und Automatisierung zu verbinden. Ob die Automation Platform den zusätzlichen Betriebsaufwand ausreichend auffängt, muss sich im produktiven Betrieb zeigen. Klar ist aber: Wer KI-Workloads lokal betreiben will, muss mit volatilen Lastprofilen, schnellen Architekturwechseln und deutlich komplexeren Datenpfaden rechnen. Dell reagiert darauf mit mehr Disaggregation und nimmt dafür in Kauf, dass die Private Cloud wieder stärker geplant, dimensioniert und orchestriert werden muss.

Weiterlesen

Dell hat auf seiner Hausmesse neue Funktionen für die Dell Private Cloud, die Dell Distributed Private Cloud und für die Dell Automation Platform vorgestellt. Sie zielen auf disaggregierte Rechenzentrumsarchitekturen, bei denen Compute, Storage und Netzwerk nicht mehr als gekoppelte HCI-Einheit betrieben werden, sondern getrennt eingerichtet und skaliert werden können. Die Dell Private Cloud unterstützt dafür mehrere Cloud-Betriebssysteme auf PowerEdge-Servern und PowerStore-Storage. Genannt werden VMware Cloud Foundation 9.1, Microsoft Azure Local und Nutanix AHV mit Dell PowerStore. Das adressiert Umgebungen, in denen mehrere Hypervisoren, Private-Cloud-Plattformen oder mehrere Cloud-Stacks betrieben werden. Dell begründet den neuen Ansatz unter anderem mit Multi-Hypervisor-Umgebungen, geringerem Vendor-Lock-in, der Möglichkeit zum Wechsel zwischen Cloud-Betriebssystemen und der unabhängigen Skalierung von Rechenleistung und Speicher. Neue Architektur richtet sich an KI-Workloads Der Ansatz ist ein Gegenpol zu HCI, wo Compute, Storage und Virtualisierung in einem eng gekoppelten Stack verknüpft sind. Das vereinfacht Beschaffung, Aufbau und Betrieb. Entsprechend groß ist HCI in vielen Private-Cloud-Umgebungen verbreitet. Die Kehrseite ist aber, dass die Skalierung und Modernisierung der Ressourcen ebenfalls miteinander verknüpft sind. Bei KI- und datenintensiven Workloads kann das zum Problem werden, denn GPU-Leistung, Storage-Kapazität, File- und Object-Zugriffe, Netzwerkbandbreite, Stromversorgung und Kühlung wachsen selten im gleichen Takt. Hinzu kommt, dass sich viele KI-Anwendungen und Agenten noch in der Pilotphase, dem Proof of Concept oder im begrenzten Fachbereichstest befinden. Sobald ein Use Case produktiv ausgerollt wird, ändern sich Nutzerzahlen, Inferenzlast, Datenzugriffe, Verfügbarkeitsanforderungen und Sicherheitsvorgaben teils sprunghaft. Damit wird die Infrastrukturplanung schwieriger als bei klassischen Unternehmensanwendungen mit vergleichsweise stabilen Lastprofilen. Automation Platform für Betrieb und Orchestrierung Eine disaggregierte Infrastruktur schafft mehr Freiheitsgrade, erhöht aber auch den Aufwand für Planung und Betrieb. Eine Umgebung aus getrennt skalierbaren Server-, Storage-, Netzwerk- und Cloud-Stacks ist kein Rundum-sorglos-Paket. Dell versucht, den zusätzlichen Betriebsaufwand über validierte Designs, zentrale Verwaltung und Automatisierung einzugrenzen. Dazu wurden mehrere Erweiterungen der Automation Platform vorgestellt, beispielsweise die Kombination von KI-Agenten mit einer dialogorientierten Bedienoberfläche. Die neue Plattform kann Cloud-Betriebssysteme auf PowerEdge und PowerStore installieren und über ein gemeinsames Managementmodell betreiben. Automation Studio ergänzt diese Funktionen. Damit sollen Unternehmen eigene Automatisierungs-Workflows über Infrastruktur und Anwendungen hinweg erstellen können. Dell adressiert damit nicht nur Erstinstallation und Provisionierung, sondern auch wiederkehrende Aufgaben im laufenden Betrieb. HCI unter Kostendruck Neben der technischen Flexibilität sprechen für eine Disaggregierung auch die Kostenvorteile. In einem Gespräch mit iX sagte Dell-Fellow Onur Celebioglu: „HCI-Systeme stehen wegen ihrer Architektur besonders unter Kostendruck, da sie viel DRAM und Laufwerke benötigen. Extern skalierbare Storage-Systeme können damit in bestimmten Refresh-Szenarien wirtschaftlich attraktiver werden.“ Ein weiterer Punkt ist die Hypervisor-Bindung. HCI ist architektonisch eng mit dem jeweiligen Virtualisierungs-Stack verbunden. Wer sich für ein Ökosystem entscheidet, bleibt in der Regel auch daran gebunden. Disaggregierte Architekturen mit externer Storage lockern diese enge Bindung. Dell verkauft diese Entkopplung als „Optionality“, also als Wahlfreiheit für unterschiedliche Cloud- und Virtualisierungsumgebungen.

Distributed Private Cloud für Edge-Locations Für Edge-Standorte erweitert Dell seine Distributed Private Cloud, früher NativeEdge. Die Plattform bekommt Zwei-Node-HA-Cluster, automatisches Failover und integrierte Zero-Trust-Funktionen. Das zielt auf Fertigungsumgebungen, Logistikzentren oder andere dezentrale Standorte, an denen Latenz, Datenhaltung oder Ausfallsicherheit gegen einen reinen Cloud-Betrieb sprechen, aber kaum eigenes IT-Knowhow vor Ort verfügbar ist. Auch hier folgt Dell der gleichen Logik: Infrastruktur soll näher an Daten und Anwendungen rücken, trotzdem aber zentral verwaltet und automatisiert betrieben werden. Dells neue Private-Cloud-Strategie ist keine einfache Rückkehr zur klassischen Drei-Schichten-Architektur. Der Hersteller versucht vielmehr, die Flexibilität getrennter Compute-, Storage- und Netzwerkressourcen mit Cloud-Stack-Optionen und Automatisierung zu verbinden. Ob die Automation Platform den zusätzlichen Betriebsaufwand ausreichend auffängt, muss sich im produktiven Betrieb zeigen. Klar ist aber: Wer KI-Workloads lokal betreiben will, muss mit volatilen Lastprofilen, schnellen Architekturwechseln und deutlich komplexeren Datenpfaden rechnen. Dell reagiert darauf mit mehr Disaggregation und nimmt dafür in Kauf, dass die Private Cloud wieder stärker geplant, dimensioniert und orchestriert werden muss.

Trump stoppt wichtige Verordnung für KI-Modelle

Eine neue Verordnung, die der US-Regierung die Prüfung neuer KI-Modelle vor deren Veröffentlichung ermöglicht hätte, ist vorerst vom Tisch. US-Präsident Donald Trump sollte die neue Verordnung aus seinem Haus eigentlich am Donnerstag unterzeichnen, vertagte das jedoch bis auf Weiteres. „Bestimmte Aspekte“ daran hätten ihm nicht gefallen, sagte er dazu der Presse. Er glaube, die neue Verordnung könne der weltweiten Spitzenposition der USA in der KI-Entwicklung in die Quere kommen, erklärte Trump und verwies auf den Vorsprung vor China auf dem Gebiet. Er wolle demnach jeglichen Schritt in eine solche Richtung vermeiden. Bedenken hatten Trump und seine Administration ursprünglich in anderer Hinsicht: Die Verordnung war als Antwort auf mögliche Cybersicherheitsrisiken durch neue, fortschrittliche KI-Modelle gedacht, etwa Anthropics Claude Mythos, welches selbst von dem Hersteller als zu gefährlich eingestuft wird, um es der Allgemeinheit zugänglich zu machen. Bis zu 90 Tage vor der Veröffentlichung wäre es Bundesbehörden möglich gewesen, die Modelle unter die Lupe zu nehmen, zum Beispiel dem Inlandsgeheimdienst National Security Agency, dem Cyber Office des Weißen Hauses oder dem US-Finanzministerium. Eine ähnliche Vereinbarung gibt es schon mit den KI-Herstellern Google, Microsoft und xAI. Tech-CEOs versetzten Trump, Sacks las ihm die Leviten Auffällig ist, wie Trumps plötzlicher Kurswechsel offenbar zustande kam. Tech-Investor David Sacks soll laut einem Bericht des Magazins Politico kurz vor der Unterzeichnung der Verordnung auf Trump eingewirkt haben. Mehrere Personen aus dem Trump-Umfeld, deren Identität Politico zum Quellenschutz nicht nennen möchte, berichteten dem Magazin demnach von einem Gespräch zwischen Sacks und Trump. Sacks soll Trump hier überzeugt haben, dass KI-Firmen schon ausreichend mit der US-Regierung kooperieren, die geplante Verordnung Innovationen behindere und die USA im Wettlauf um die beste KI ausbremsen würden. Den Politico-Quellen zufolge war Sacks nicht der einzige Gegner der neuen Verordnung an den Spitzen führender KI-Hersteller.

Einem weiteren Politico-Bericht zufolge waren wichtige Köpfe der Branche wie Meta-CEO Mark Zuckerberg, OpenAI-Chef Sam Altman und Anthropic-CEO Dario Amodei lange vorher über die geplante Verordnung Bescheid, kurz vor der Unterzeichnung der Verordnung war demnach sogar ein Treffen mit Trump geplant. Doch die drei Tech-CEOs versetzen den Präsidenten glatt. Wie Politico aus informierten Kreisen erfuhr, sagten alle drei das Treffen ab, wollten aber Vertretungen schicken. Blieb nur noch Sacks, und von dem ließ Trump sich offenbar ordentlich die Leviten lesen, sodass er nun von seiner eigens in Auftrag gegebenen Verordnung einen Rückzieher macht.

Weiterlesen

Eine neue Verordnung, die der US-Regierung die Prüfung neuer KI-Modelle vor deren Veröffentlichung ermöglicht hätte, ist vorerst vom Tisch. US-Präsident Donald Trump sollte die neue Verordnung aus seinem Haus eigentlich am Donnerstag unterzeichnen, vertagte das jedoch bis auf Weiteres. „Bestimmte Aspekte“ daran hätten ihm nicht gefallen, sagte er dazu der Presse. Er glaube, die neue Verordnung könne der weltweiten Spitzenposition der USA in der KI-Entwicklung in die Quere kommen, erklärte Trump und verwies auf den Vorsprung vor China auf dem Gebiet. Er wolle demnach jeglichen Schritt in eine solche Richtung vermeiden. Bedenken hatten Trump und seine Administration ursprünglich in anderer Hinsicht: Die Verordnung war als Antwort auf mögliche Cybersicherheitsrisiken durch neue, fortschrittliche KI-Modelle gedacht, etwa Anthropics Claude Mythos, welches selbst von dem Hersteller als zu gefährlich eingestuft wird, um es der Allgemeinheit zugänglich zu machen. Bis zu 90 Tage vor der Veröffentlichung wäre es Bundesbehörden möglich gewesen, die Modelle unter die Lupe zu nehmen, zum Beispiel dem Inlandsgeheimdienst National Security Agency, dem Cyber Office des Weißen Hauses oder dem US-Finanzministerium. Eine ähnliche Vereinbarung gibt es schon mit den KI-Herstellern Google, Microsoft und xAI. Tech-CEOs versetzten Trump, Sacks las ihm die Leviten Auffällig ist, wie Trumps plötzlicher Kurswechsel offenbar zustande kam. Tech-Investor David Sacks soll laut einem Bericht des Magazins Politico kurz vor der Unterzeichnung der Verordnung auf Trump eingewirkt haben. Mehrere Personen aus dem Trump-Umfeld, deren Identität Politico zum Quellenschutz nicht nennen möchte, berichteten dem Magazin demnach von einem Gespräch zwischen Sacks und Trump. Sacks soll Trump hier überzeugt haben, dass KI-Firmen schon ausreichend mit der US-Regierung kooperieren, die geplante Verordnung Innovationen behindere und die USA im Wettlauf um die beste KI ausbremsen würden. Den Politico-Quellen zufolge war Sacks nicht der einzige Gegner der neuen Verordnung an den Spitzen führender KI-Hersteller.

Einem weiteren Politico-Bericht zufolge waren wichtige Köpfe der Branche wie Meta-CEO Mark Zuckerberg, OpenAI-Chef Sam Altman und Anthropic-CEO Dario Amodei lange vorher über die geplante Verordnung Bescheid, kurz vor der Unterzeichnung der Verordnung war demnach sogar ein Treffen mit Trump geplant. Doch die drei Tech-CEOs versetzen den Präsidenten glatt. Wie Politico aus informierten Kreisen erfuhr, sagten alle drei das Treffen ab, wollten aber Vertretungen schicken. Blieb nur noch Sacks, und von dem ließ Trump sich offenbar ordentlich die Leviten lesen, sodass er nun von seiner eigens in Auftrag gegebenen Verordnung einen Rückzieher macht.

Studie: KI bleibt oft im Testlauf stecken

heise_ki·2026-05-24WirtschaftForschungAnwendungen

Künstliche Intelligenz ist in den Zukunftsplanungen der deutschen Wirtschaft fest verankert, doch auf dem Weg in den produktiven Arbeitsalltag in den Unternehmen verliert sie oft massiv an Schwung. Das ist das zentrale Ergebnis einer Studie des IT-Beratungsunternehmens Zoi. Für einen erfolgreichen KI-Einsatz mangle es weniger an Geld, sondern an der passenden Unternehmensorganisation und der praktischen Umsetzung. Basis der Studie ist eine Befragung von 500 IT-Verantwortlichen aus Unternehmen mit mehr als 2.000 Beschäftigten durch das Meinungsforschungsinstitut Civey. Wissenschaftlich begleitet wurde die Umfrage von der Hochschule der Medien in Stuttgart. Lücke zwischen Pilotprojekt und Arbeitsalltag Drei Jahre nach dem großen technologischen Durchbruch haben der Studie zufolge die meisten deutschen Großunternehmen erste Anwendungsfälle ausgemacht und Pilotprojekte gestartet. Doch zwischen dem ersten Ausprobieren und dem tatsächlichen, gewinnbringenden Einsatz im normalen Betrieb klaffe in vielen Unternehmen eine erhebliche Lücke.

In der Umfrage wurde auch nach konkreten Hindernissen gefragt, die einen erfolgreichen KI-Einsatz erschweren. Die IT-Verantwortlichen nannten dabei die Komplexität der bestehenden IT-Infrastruktur, fehlendes Fachwissen beim Personal sowie die schwierige Integration der neuen Technik in veraltete Computersysteme. Budgetfragen oder Unsicherheiten über den finanziellen Nutzen wurden hingegen deutlich seltener als Hindernis genannt. Die Studie ergab auch, dass ausgerechnet die erfolgreichen Vorreiter-Unternehmen stark unter der Komplexität ihrer Technik leiden. Zu selten messbare Ziele In vielen Fällen sind die Fehlerursachen demnach in der Chefetage zu suchen: Zwar geben rund drei Viertel der Unternehmen an, über eine schriftlich festgehaltene Strategie der Unternehmensleitung zu verfügen, doch nur bei etwa einem Drittel ist diese auch mit konkreten messbaren Zielen verknüpft. Ohne solche Erfolgskennzahlen bleibe die Strategie oft nur eine Absichtserklärung. Zoi-Geschäftsführer Benjamin Hermann sagte, die Studienergebnisse zeigten, dass bei der KI-Transformation zwischen der technologischen Exzellenz und einer vorbildhaften operativen Umsetzung noch Welten lägen. „Mit KI anfangen ist einfacher, als mit KI produktiv zu sein.“ Professor Jan Kirenz von der Hochschule der Medien Stuttgart sagte, die Daten zeichneten ein klares Bild: „76 Prozent der deutschen Großunternehmen erproben KI-Agenten bereits aktiv, was das breite Innovationsinteresse belegt.“ Aber da erst 19 Prozent diese Technologien in ihren Kernprozessen einsetzten, stehe die breite Wertschöpfung noch aus. IT-Verantwortliche sehen KI nicht als Jobkiller In der Studie wurden die IT-Verantwortlichen auch danach gefragt, ob der KI-Einsatz mit einem massiven Jobverlust verbunden sei. Davon gehen die Befragten mehrheitlich nicht aus: 79 Prozent der befragten IT-Entscheider sagten, dass generative KI die Mitarbeiterzahl im Unternehmen stabil halte oder sogar steigen lasse.

Weiterlesen

Künstliche Intelligenz ist in den Zukunftsplanungen der deutschen Wirtschaft fest verankert, doch auf dem Weg in den produktiven Arbeitsalltag in den Unternehmen verliert sie oft massiv an Schwung. Das ist das zentrale Ergebnis einer Studie des IT-Beratungsunternehmens Zoi. Für einen erfolgreichen KI-Einsatz mangle es weniger an Geld, sondern an der passenden Unternehmensorganisation und der praktischen Umsetzung. Basis der Studie ist eine Befragung von 500 IT-Verantwortlichen aus Unternehmen mit mehr als 2.000 Beschäftigten durch das Meinungsforschungsinstitut Civey. Wissenschaftlich begleitet wurde die Umfrage von der Hochschule der Medien in Stuttgart. Lücke zwischen Pilotprojekt und Arbeitsalltag Drei Jahre nach dem großen technologischen Durchbruch haben der Studie zufolge die meisten deutschen Großunternehmen erste Anwendungsfälle ausgemacht und Pilotprojekte gestartet. Doch zwischen dem ersten Ausprobieren und dem tatsächlichen, gewinnbringenden Einsatz im normalen Betrieb klaffe in vielen Unternehmen eine erhebliche Lücke.

In der Umfrage wurde auch nach konkreten Hindernissen gefragt, die einen erfolgreichen KI-Einsatz erschweren. Die IT-Verantwortlichen nannten dabei die Komplexität der bestehenden IT-Infrastruktur, fehlendes Fachwissen beim Personal sowie die schwierige Integration der neuen Technik in veraltete Computersysteme. Budgetfragen oder Unsicherheiten über den finanziellen Nutzen wurden hingegen deutlich seltener als Hindernis genannt. Die Studie ergab auch, dass ausgerechnet die erfolgreichen Vorreiter-Unternehmen stark unter der Komplexität ihrer Technik leiden. Zu selten messbare Ziele In vielen Fällen sind die Fehlerursachen demnach in der Chefetage zu suchen: Zwar geben rund drei Viertel der Unternehmen an, über eine schriftlich festgehaltene Strategie der Unternehmensleitung zu verfügen, doch nur bei etwa einem Drittel ist diese auch mit konkreten messbaren Zielen verknüpft. Ohne solche Erfolgskennzahlen bleibe die Strategie oft nur eine Absichtserklärung. Zoi-Geschäftsführer Benjamin Hermann sagte, die Studienergebnisse zeigten, dass bei der KI-Transformation zwischen der technologischen Exzellenz und einer vorbildhaften operativen Umsetzung noch Welten lägen. „Mit KI anfangen ist einfacher, als mit KI produktiv zu sein.“ Professor Jan Kirenz von der Hochschule der Medien Stuttgart sagte, die Daten zeichneten ein klares Bild: „76 Prozent der deutschen Großunternehmen erproben KI-Agenten bereits aktiv, was das breite Innovationsinteresse belegt.“ Aber da erst 19 Prozent diese Technologien in ihren Kernprozessen einsetzten, stehe die breite Wertschöpfung noch aus. IT-Verantwortliche sehen KI nicht als Jobkiller In der Studie wurden die IT-Verantwortlichen auch danach gefragt, ob der KI-Einsatz mit einem massiven Jobverlust verbunden sei. Davon gehen die Befragten mehrheitlich nicht aus: 79 Prozent der befragten IT-Entscheider sagten, dass generative KI die Mitarbeiterzahl im Unternehmen stabil halte oder sogar steigen lasse.

Google wehrt sich gegen Monopol-Urteil

heise_ki·2026-05-23RegulierungWirtschaft

Google will die Daten und Ergebnisse seiner Suchmaschine nicht mit Wettbewerbern im Suchmaschinenmarkt teilen – unter anderem dazu hatte ein US-Bundesgericht das Unternehmen voriges Jahr in einem Kartellrechtsverfahren verurteilt. Jetzt legt der Suchmaschinen-Gigant gegen diese Entscheidung Berufung ein. Im September 2025 stellte US-Richter Amit P. Mehta fest, dass Googles Suchmaschinen-Geschäfte illegal sind. Google musste seine Zahlungen an Browser-Anbieter und Hardware-Hersteller einstellen. Zuvor zahlte der Internetgigant Milliardenbeträge an Browser-Anbieter und Hardware-hersteller, damit diese die Google Suche im Browser, beziehungsweise den Chrome Browser auf Endgeräten standardmäßig voreinstellen. Allein Apple erhielt jährlich rund 20 Milliarden US-Dollar. Zudem muss Google seitdem Suchdaten und Suchergebnisse mit "qualifizierten Wettbewerbern" teilen. Google plädiert auf Rechtsfehler Google argumentiert jetzt in seinem Berufungsschriftsatz (Download unter diesem Absatz), dass der US-Richter Amit Mehta in seinem Urteil aus dem Jahr 2024 Rechtsfehler gemacht habe. Das Unternehmen argumentierte, dass seine Deals mit Geräteherstellern und Browserentwicklern diese nicht daran gehindert hätten, konkurrierende Suchdienste wie Microsofts Bing zu bewerben. Zudem sei die Entscheidung, überhaupt eine exklusive, voreingestellte Suchmaschine anzubieten, von Apple und Mozilla selbst ausgegangen, nicht von Google. Mozilla ist mittlerweile stark abhängig von Googles jährlichen Zahlungen. Von rund 680 Millionen Dollar Jahresumsatz im Jahr 2024 kamen laut Geschäftsbericht 498 Millionen Dollar von Google – damit die Suchmaschine in Firefox voreingestellt ist. Mozillas Finanzchef warnte bereits: Ohne Googles Geld droht die Pleite.

Google plädiert zudem darauf, das Unternehmen habe sich mit seiner Suchmaschine auf dem Markt fair durchgesetzt, indem es „durch harte Arbeit, mutige Innovationen und kluge Geschäftsentscheidungen eine überlegene Suchmaschine entwickelt“ habe. Dass Suchmaschinendaten nun mit der Konkurrenz geteilt werden müssten, würde eine seltsame Form von Ersatzwettbewerb schaffen, der unter realen Bedingungen nie entstanden wäre. Hier nennt Google explizit KI-Hersteller OpenAI als Beispiel, der für sein LLM ChatGPT ebenfalls Zugriff auf die Daten hätte. ChatGPT habe jedoch während des relevanten Zeitraums noch gar nicht existiert – US-Justizministerium und Bundestaaten klagten bereits Ende 2020. Zudem sei der Erfolg von ChatGPT so bahnbrechend, dass es keinen Grund gebe, die Daten mit OpenAI zu teilen, argumentiert Google. Beobachter rechnen im Juli mit einer juristischen Reaktion des US-Justizministeriums auf Googles Berufung.

Weiterlesen

Google will die Daten und Ergebnisse seiner Suchmaschine nicht mit Wettbewerbern im Suchmaschinenmarkt teilen – unter anderem dazu hatte ein US-Bundesgericht das Unternehmen voriges Jahr in einem Kartellrechtsverfahren verurteilt. Jetzt legt der Suchmaschinen-Gigant gegen diese Entscheidung Berufung ein. Im September 2025 stellte US-Richter Amit P. Mehta fest, dass Googles Suchmaschinen-Geschäfte illegal sind. Google musste seine Zahlungen an Browser-Anbieter und Hardware-Hersteller einstellen. Zuvor zahlte der Internetgigant Milliardenbeträge an Browser-Anbieter und Hardware-hersteller, damit diese die Google Suche im Browser, beziehungsweise den Chrome Browser auf Endgeräten standardmäßig voreinstellen. Allein Apple erhielt jährlich rund 20 Milliarden US-Dollar. Zudem muss Google seitdem Suchdaten und Suchergebnisse mit "qualifizierten Wettbewerbern" teilen. Google plädiert auf Rechtsfehler Google argumentiert jetzt in seinem Berufungsschriftsatz (Download unter diesem Absatz), dass der US-Richter Amit Mehta in seinem Urteil aus dem Jahr 2024 Rechtsfehler gemacht habe. Das Unternehmen argumentierte, dass seine Deals mit Geräteherstellern und Browserentwicklern diese nicht daran gehindert hätten, konkurrierende Suchdienste wie Microsofts Bing zu bewerben. Zudem sei die Entscheidung, überhaupt eine exklusive, voreingestellte Suchmaschine anzubieten, von Apple und Mozilla selbst ausgegangen, nicht von Google. Mozilla ist mittlerweile stark abhängig von Googles jährlichen Zahlungen. Von rund 680 Millionen Dollar Jahresumsatz im Jahr 2024 kamen laut Geschäftsbericht 498 Millionen Dollar von Google – damit die Suchmaschine in Firefox voreingestellt ist. Mozillas Finanzchef warnte bereits: Ohne Googles Geld droht die Pleite.

Google plädiert zudem darauf, das Unternehmen habe sich mit seiner Suchmaschine auf dem Markt fair durchgesetzt, indem es „durch harte Arbeit, mutige Innovationen und kluge Geschäftsentscheidungen eine überlegene Suchmaschine entwickelt“ habe. Dass Suchmaschinendaten nun mit der Konkurrenz geteilt werden müssten, würde eine seltsame Form von Ersatzwettbewerb schaffen, der unter realen Bedingungen nie entstanden wäre. Hier nennt Google explizit KI-Hersteller OpenAI als Beispiel, der für sein LLM ChatGPT ebenfalls Zugriff auf die Daten hätte. ChatGPT habe jedoch während des relevanten Zeitraums noch gar nicht existiert – US-Justizministerium und Bundestaaten klagten bereits Ende 2020. Zudem sei der Erfolg von ChatGPT so bahnbrechend, dass es keinen Grund gebe, die Daten mit OpenAI zu teilen, argumentiert Google. Beobachter rechnen im Juli mit einer juristischen Reaktion des US-Justizministeriums auf Googles Berufung.

heise-Angebot: Product Owner AI Day 2026: Konferenz und Workshop für KI im Produktmanagement

heise_ki·2026-05-23AnwendungenAgentenWirtschaft

Künstliche Intelligenz ist inzwischen in der Produktarbeit angekommen. Nach der erfolgreichen Erstausgabe des Product Owner AI Day im Herbst 2025 findet die Online-Konferenz am 9. Juli 2026 zum zweiten Mal statt. Der Schwerpunkt liegt dieses Mal auf KI-Agenten und Automationen, um Workflows im Arbeitsalltag zu vereinfachen, Produkte mit KI sinnvoll zu gestalten und bessere Produktentscheidungen zu treffen. Ausgerichtet wird die Konferenz von dpunkt.verlag und iX in Kooperation mit Marc Bless. Frühbucher profitieren derzeit von vergünstigten Preisen.

Der Product Owner AI Day richtet sich an all jene, die an der Schnittstelle von Produkt, Technologie und Innovation arbeiten – etwa Product Owner, Produktmanagerinnen, Innovation-Manager oder Product Leads und Heads of Product.

Workshop am 10. Juli: Automationen und Agenten für Product Owner und Produktmanager

Am Tag nach der Online-Konferenz, dem 10. Juli, bietet Marc Bless einen ganztägigen Online-Workshop an. Dort können Produktmanagerinnen und -manager sowie Product Owner in einen KI-Deep-Dive eintauchen. Sie lernen praktisch, wie sie mit Automationen und KI-Agenten echte Produktivitätsgewinne erzielen und komplette Workflows neu denken. Wer teilnimmt, sollte sowohl Zugang zu KI-Tools als auch bereits eine grundlegende Erfahrung damit besitzen. Detaillierte Angaben zu den Voraussetzungen sind auf der Konferenz-Website hinterlegt.

Am Ende des Tages sollen die Workshop-Besucher ein tiefes Verständnis für moderne KI-Anwendungen über ChatGPT hinaus mitnehmen, eigene Automationen und Agenten für ihre tägliche Arbeit konzipieren können und wissen, wie sie ihre Effizienz durch smarte, wiederverwendbare Workflows steigern können.

Ein Ticket für den Workshop lässt sich im Online-Ticketshop für 599 Euro (zzgl. MwSt.) buchen.

Product Owner AI Day: KI für Automation und Produktgestaltung einsetzen

Das Programm der Online-Konferenz am 9. Juli besteht aus sechs jeweils 45-minütigen Vorträgen sowie einer Abschlussdiskussion unter Moderation von Marc Bless mit den Referentinnen und Referenten des Tages. Die Vorträge gehen praxisnah darauf ein, wie künstliche Intelligenz in der Produktentwicklung unterstützen kann.

So zeigt Gregor Biswanger unter dem Motto „Nichts lügt mehr als eine veraltete Dokumentation“, wie sich KI durch Spec-Driven Development präzise steuern lässt. Miriam Suchet demonstriert, wie Product Owner mit KI in fünf konkreten Schritten von der tragfähigen Vision bis zur Stakeholder-Freigabe kommen, während laut Markus Andrezak künstliche Intelligenz die Fleißarbeit übernehmen kann, damit Menschen zur aktiven Gestaltung zurückkehren können.

Eine grundlegende Veränderung, die mit KI einhergeht, kommt bei Ralf D. Müller zur Sprache: KI-Agenten verschieben die klassische Arbeitsteilung zwischen Product Owner und Developer. Das birgt neue Herausforderungen, etwa dass der Product Owner zum neuen Bottleneck werden könnte. Und schließlich bleibt auch beim KI-Einsatz nach wie vor menschliches Verständnis gefragt: Wie Julia Bastian gleich zum Einstieg in den Tag warnt, kann KI glänzenden „Discovery-Müll“ produzieren, den es erst einmal kritisch zu bewerten gilt.

Vergünstigte Tickets für Frühbucher und Teams

Frühbucher können noch bis zum 11. Juni sparen: Bis dahin kostet ein Ticket für den Konferenztag 249 Euro (zzgl. 19 % MwSt.), nach Ablauf des Early-Bird-Tarifs 299 Euro. Teams ab drei Personen erhalten zusätzlich gestaffelte Gruppenrabatte, die der Online-Ticketshop automatisch berechnet. Ein Ticket für den Ganztages-Workshop kostet 599 Euro pro Person.

Weitere Informationen zur Konferenz finden sich auf der Website. Dort lässt sich auch ein Newsletter abonnieren, um über diese und weitere Veranstaltungen aus der Reihe inside agile auf dem Laufenden zu bleiben.

Weiterlesen

Künstliche Intelligenz ist inzwischen in der Produktarbeit angekommen. Nach der erfolgreichen Erstausgabe des Product Owner AI Day im Herbst 2025 findet die Online-Konferenz am 9. Juli 2026 zum zweiten Mal statt. Der Schwerpunkt liegt dieses Mal auf KI-Agenten und Automationen, um Workflows im Arbeitsalltag zu vereinfachen, Produkte mit KI sinnvoll zu gestalten und bessere Produktentscheidungen zu treffen. Ausgerichtet wird die Konferenz von dpunkt.verlag und iX in Kooperation mit Marc Bless. Frühbucher profitieren derzeit von vergünstigten Preisen.

Der Product Owner AI Day richtet sich an all jene, die an der Schnittstelle von Produkt, Technologie und Innovation arbeiten – etwa Product Owner, Produktmanagerinnen, Innovation-Manager oder Product Leads und Heads of Product.

Workshop am 10. Juli: Automationen und Agenten für Product Owner und Produktmanager

Am Tag nach der Online-Konferenz, dem 10. Juli, bietet Marc Bless einen ganztägigen Online-Workshop an. Dort können Produktmanagerinnen und -manager sowie Product Owner in einen KI-Deep-Dive eintauchen. Sie lernen praktisch, wie sie mit Automationen und KI-Agenten echte Produktivitätsgewinne erzielen und komplette Workflows neu denken. Wer teilnimmt, sollte sowohl Zugang zu KI-Tools als auch bereits eine grundlegende Erfahrung damit besitzen. Detaillierte Angaben zu den Voraussetzungen sind auf der Konferenz-Website hinterlegt.

Am Ende des Tages sollen die Workshop-Besucher ein tiefes Verständnis für moderne KI-Anwendungen über ChatGPT hinaus mitnehmen, eigene Automationen und Agenten für ihre tägliche Arbeit konzipieren können und wissen, wie sie ihre Effizienz durch smarte, wiederverwendbare Workflows steigern können.

Ein Ticket für den Workshop lässt sich im Online-Ticketshop für 599 Euro (zzgl. MwSt.) buchen.

Product Owner AI Day: KI für Automation und Produktgestaltung einsetzen

Das Programm der Online-Konferenz am 9. Juli besteht aus sechs jeweils 45-minütigen Vorträgen sowie einer Abschlussdiskussion unter Moderation von Marc Bless mit den Referentinnen und Referenten des Tages. Die Vorträge gehen praxisnah darauf ein, wie künstliche Intelligenz in der Produktentwicklung unterstützen kann.

So zeigt Gregor Biswanger unter dem Motto „Nichts lügt mehr als eine veraltete Dokumentation“, wie sich KI durch Spec-Driven Development präzise steuern lässt. Miriam Suchet demonstriert, wie Product Owner mit KI in fünf konkreten Schritten von der tragfähigen Vision bis zur Stakeholder-Freigabe kommen, während laut Markus Andrezak künstliche Intelligenz die Fleißarbeit übernehmen kann, damit Menschen zur aktiven Gestaltung zurückkehren können.

Eine grundlegende Veränderung, die mit KI einhergeht, kommt bei Ralf D. Müller zur Sprache: KI-Agenten verschieben die klassische Arbeitsteilung zwischen Product Owner und Developer. Das birgt neue Herausforderungen, etwa dass der Product Owner zum neuen Bottleneck werden könnte. Und schließlich bleibt auch beim KI-Einsatz nach wie vor menschliches Verständnis gefragt: Wie Julia Bastian gleich zum Einstieg in den Tag warnt, kann KI glänzenden „Discovery-Müll“ produzieren, den es erst einmal kritisch zu bewerten gilt.

Vergünstigte Tickets für Frühbucher und Teams

Frühbucher können noch bis zum 11. Juni sparen: Bis dahin kostet ein Ticket für den Konferenztag 249 Euro (zzgl. 19 % MwSt.), nach Ablauf des Early-Bird-Tarifs 299 Euro. Teams ab drei Personen erhalten zusätzlich gestaffelte Gruppenrabatte, die der Online-Ticketshop automatisch berechnet. Ein Ticket für den Ganztages-Workshop kostet 599 Euro pro Person.

Weitere Informationen zur Konferenz finden sich auf der Website. Dort lässt sich auch ein Newsletter abonnieren, um über diese und weitere Veranstaltungen aus der Reihe inside agile auf dem Laufenden zu bleiben.

Nvidia will mit Vera-Prozessoren nach der CPU-Krone greifen

Die ersten großen KI-Firmen haben Nvidias neuen CPU-Server mit Vera-Prozessoren erhalten. Vera ist der Nachfolger von Nvidias erstem Server-Prozessorwurf Grace. Beide verwenden zwar ARM-Architekturen, allerdings hat Nvidia erst für Vera eigene Custom-Kerne mit dem Codenamen Olympus entworfen. 88 Stück arbeiten in einer CPU. Ian Buck überreichte die ersten Systeme kürzlich an Vertreter von Anthropic, OpenAI, SpaceXAI (früher xAI) und schließlich Oracle. Buck leitet bei Nvidia die Sparte Hyperscale and High-Performance Computing. Anders als bei früheren Erstauslieferungen war Firmenchef Jensen Huang nicht mehr dabei. Die Prozessoren enthalten keine KI-Beschleuniger per se. Nvidia preist sie trotzdem für KI-Rechenzentren an, weil Prozessoren dort momentan durch KI-Agenten an Bedeutung gewinnen. Sie setzen flotte CPUs voraus. Nvidia will CPU-Riese werden In der Analystenkonferenz zu den jüngsten Geschäftszahlen gab Nvidias Finanzchefin Colette Kress eine erste Prognose ab: Die Firma beziffert den adressierbaren Markt auf 200 Milliarden US-Dollar pro Jahr. Im ersten Jahr soll Vera für 20 Milliarden US-Dollar Umsatz sorgen. Ab dem dritten Quartal sollen auch Vera-Rubin-Systeme verfügbar sein, in denen zusätzliche KI-Beschleuniger stecken. „Wir rechnen in diesem Jahr mit einem Gesamtumsatz im CPU-Bereich von fast 20 Milliarden US-Dollar, was uns auf den Weg zum weltweit führenden CPU-Anbieter bringt“, sagte Kress.

Sollten sich die 20 Milliarden US-Dollar bewahrheiten, wäre das schon im ersten Jahr ein Kopf-an-Kopf-Rennen mit AMD und Intel, wenn man nur Serverprozessoren wertet. AMD setzte 2025 gut 16,6 Milliarden US-Dollar mit Server-Hardware um, allerdings inklusive KI-Beschleunigern. Der Umsatz sowohl mit CPUs als auch mit Beschleunigern soll dieses Jahr noch mal erheblich steigen. Intel setzte 2025 rund 16,9 Milliarden US-Dollar mit Server-Hardware um, hauptsächlich mit Xeon-Prozessoren. Den Markt für KI-Beschleuniger hat Intel weitgehend verschlafen. Inklusive Client-CPUs ziehen sowohl AMD als auch Intel jetzt schon davon. Intels Umsatz lag so bei 49,1 Milliarden US-Dollar (32,2 Milliarden US-Dollar durch Client). Nvidia will zwar mit N1X und N1 auch in Notebooks gelangen, allerdings verzögern sich die Mobilprozessoren schon seit 2025.

Weiterlesen

Die ersten großen KI-Firmen haben Nvidias neuen CPU-Server mit Vera-Prozessoren erhalten. Vera ist der Nachfolger von Nvidias erstem Server-Prozessorwurf Grace. Beide verwenden zwar ARM-Architekturen, allerdings hat Nvidia erst für Vera eigene Custom-Kerne mit dem Codenamen Olympus entworfen. 88 Stück arbeiten in einer CPU. Ian Buck überreichte die ersten Systeme kürzlich an Vertreter von Anthropic, OpenAI, SpaceXAI (früher xAI) und schließlich Oracle. Buck leitet bei Nvidia die Sparte Hyperscale and High-Performance Computing. Anders als bei früheren Erstauslieferungen war Firmenchef Jensen Huang nicht mehr dabei. Die Prozessoren enthalten keine KI-Beschleuniger per se. Nvidia preist sie trotzdem für KI-Rechenzentren an, weil Prozessoren dort momentan durch KI-Agenten an Bedeutung gewinnen. Sie setzen flotte CPUs voraus. Nvidia will CPU-Riese werden In der Analystenkonferenz zu den jüngsten Geschäftszahlen gab Nvidias Finanzchefin Colette Kress eine erste Prognose ab: Die Firma beziffert den adressierbaren Markt auf 200 Milliarden US-Dollar pro Jahr. Im ersten Jahr soll Vera für 20 Milliarden US-Dollar Umsatz sorgen. Ab dem dritten Quartal sollen auch Vera-Rubin-Systeme verfügbar sein, in denen zusätzliche KI-Beschleuniger stecken. „Wir rechnen in diesem Jahr mit einem Gesamtumsatz im CPU-Bereich von fast 20 Milliarden US-Dollar, was uns auf den Weg zum weltweit führenden CPU-Anbieter bringt“, sagte Kress.

Sollten sich die 20 Milliarden US-Dollar bewahrheiten, wäre das schon im ersten Jahr ein Kopf-an-Kopf-Rennen mit AMD und Intel, wenn man nur Serverprozessoren wertet. AMD setzte 2025 gut 16,6 Milliarden US-Dollar mit Server-Hardware um, allerdings inklusive KI-Beschleunigern. Der Umsatz sowohl mit CPUs als auch mit Beschleunigern soll dieses Jahr noch mal erheblich steigen. Intel setzte 2025 rund 16,9 Milliarden US-Dollar mit Server-Hardware um, hauptsächlich mit Xeon-Prozessoren. Den Markt für KI-Beschleuniger hat Intel weitgehend verschlafen. Inklusive Client-CPUs ziehen sowohl AMD als auch Intel jetzt schon davon. Intels Umsatz lag so bei 49,1 Milliarden US-Dollar (32,2 Milliarden US-Dollar durch Client). Nvidia will zwar mit N1X und N1 auch in Notebooks gelangen, allerdings verzögern sich die Mobilprozessoren schon seit 2025.

Drei Fragen und Antworten: Wann sich KI-Coding wirklich rechnet

heise_ki·2026-05-22WirtschaftAnwendungenModelle

Beim Vibe Coding delegieren Entwickler die technische Umsetzung – Syntax, Boilerplate, Logikstrukturen – fast vollständig an ein Large Language Model. Menschen agieren nicht mehr als Autoren einzelner Codezeilen, sondern geben nur noch das gewünschte Verhalten und die Architektur der Anwendung vor. Doch wie sieht es in der Praxis mit den Kosten für ein solches Projekt aus? Stefan Müller, Titelautor der neuen iX 6/2026, erklärt, worauf man achten muss. Wie kann man grob gesagt Tokenbudget und Kosten für ein Projekt mit Vibe Coding überschlagen? Ein Token-Budget-Modell, kurz TBM, stützt sich auf viele verschiedene Faktoren. Daher ist ein pauschaler Überschlag naturgemäß etwas schwierig, zumal Softwareprojekte sehr unterschiedlich ausfallen können. Mit einem Topmodell wie Opus 4.6 oder 4.7 liegen wir bei professionellen Projekten eigentlich immer in einem Größenrahmen von 3.000 bis 15.000 Euro – oft auch deutlich darunter, je ausgebuffter die Softwareentwickler sind, die das Modell mit konkreten Vorgaben steuern. Ein Projekt, das über diese Schwelle hinausgegangen wäre, habe ich bisher nicht erlebt. Das TBM habe ich auch als Internetrechner veröffentlicht. Was sind die größten Kostentreiber beim Vibe Coding? Das ist einerseits die menschliche Vorarbeit bei der Spezifikation des Projektes. Je durchdachter ein Pflichtenheft ist, desto besser können sich KI-Agenten daran entlanghangeln. Wenn Anforderungen und ihre Umsetzung vage bleiben, kann es schnell teuer werden. Andererseits entscheidet die Modellqualität: Wenn wir auf den Open-Source-Bereich festgelegt sind, explodieren die Token-Budgets schnell. Das hat nicht zwangsläufig hohe Kosten zur Folge, weil der Tokenpreis pro Million mit der geringeren Modellqualität ja ebenfalls sinkt (wobei Modelle wie DeepSeek V4 selbst diese Logik gerade durchbrechen). Dafür gehen die Personalkosten hoch – wegen des permanenten Nachbesserns und „Reparierens“ des entstandenen Codes. Das ist auch ein versteckter Kostentreiber: Wenn die Softwareentwickler dabei frustriert werden, finden weitere Einsätze dieses Ansatzes zukünftig weniger Akzeptanz. Im Fall von Open-Source-Modellen würde ich den KI-Einsatz stark limitieren und nur punktuell im Entwicklungsprozess unterstützen lassen – zum Beispiel für einfache Tests oder das Schreiben von Boilerplate anhand konkreter Beispiele und Referenzen. Wann ist der maschinell generierte Code wirtschaftlich besonders sinnvoll? Ich finde maschinell generierten Code besonders sinnvoll, wenn schnell Ergebnisse benötigt werden – wenn die Frage nach dem „Wie“ gar nicht so relevant ist, sondern das Resultat im Vordergrund steht. Vibe Coding wird Unternehmen darüber hinaus auch in Zukunft in die Lage versetzen, eigene Softwarekomponenten zu erstellen, ohne auf große Lösungen mit unzähligen Funktionen zurückgreifen zu müssen. Der Vendor-Lock-in bricht langsam, aber sicher auf. Parallel dazu können Software-Manufakturen mit Vibe Coding Kundenbedürfnisse abseits ihres Tagesgeschäfts erfüllen und so neue Zielgruppen erschließen.

Stefan, vielen Dank für die Antworten! Einen Überblick, wie man Tokenbudget und Kosten für Vibe Coding schätzt, gibt es in der neuen iX. Außerdem zeigen wir, was die KI-gestützte Entwicklung in IT-Beratungen und Softwarehäusern kostet – und befassen uns damit, was KI-Gateways als Tools für Kostenkontrolle leisten können. All das und viele weitere Themen finden Leser im Juni-Heft, das ab sofort im heise Shop oder am Kiosk erhältlich ist. In der Serie „Drei Fragen und Antworten“ will die iX die heutigen Herausforderungen der IT auf den Punkt bringen – egal ob es sich um den Blick des Anwenders vorm PC, die Sicht des Managers oder den Alltag eines Administrators handelt. Haben Sie Anregungen aus Ihrer tagtäglichen Praxis oder der Ihrer Nutzer? Wessen Tipps zu welchem Thema würden Sie gerne kurz und knackig lesen? Dann schreiben Sie uns gerne oder hinterlassen Sie einen Kommentar im Forum.

Weiterlesen

Beim Vibe Coding delegieren Entwickler die technische Umsetzung – Syntax, Boilerplate, Logikstrukturen – fast vollständig an ein Large Language Model. Menschen agieren nicht mehr als Autoren einzelner Codezeilen, sondern geben nur noch das gewünschte Verhalten und die Architektur der Anwendung vor. Doch wie sieht es in der Praxis mit den Kosten für ein solches Projekt aus? Stefan Müller, Titelautor der neuen iX 6/2026, erklärt, worauf man achten muss. Wie kann man grob gesagt Tokenbudget und Kosten für ein Projekt mit Vibe Coding überschlagen? Ein Token-Budget-Modell, kurz TBM, stützt sich auf viele verschiedene Faktoren. Daher ist ein pauschaler Überschlag naturgemäß etwas schwierig, zumal Softwareprojekte sehr unterschiedlich ausfallen können. Mit einem Topmodell wie Opus 4.6 oder 4.7 liegen wir bei professionellen Projekten eigentlich immer in einem Größenrahmen von 3.000 bis 15.000 Euro – oft auch deutlich darunter, je ausgebuffter die Softwareentwickler sind, die das Modell mit konkreten Vorgaben steuern. Ein Projekt, das über diese Schwelle hinausgegangen wäre, habe ich bisher nicht erlebt. Das TBM habe ich auch als Internetrechner veröffentlicht. Was sind die größten Kostentreiber beim Vibe Coding? Das ist einerseits die menschliche Vorarbeit bei der Spezifikation des Projektes. Je durchdachter ein Pflichtenheft ist, desto besser können sich KI-Agenten daran entlanghangeln. Wenn Anforderungen und ihre Umsetzung vage bleiben, kann es schnell teuer werden. Andererseits entscheidet die Modellqualität: Wenn wir auf den Open-Source-Bereich festgelegt sind, explodieren die Token-Budgets schnell. Das hat nicht zwangsläufig hohe Kosten zur Folge, weil der Tokenpreis pro Million mit der geringeren Modellqualität ja ebenfalls sinkt (wobei Modelle wie DeepSeek V4 selbst diese Logik gerade durchbrechen). Dafür gehen die Personalkosten hoch – wegen des permanenten Nachbesserns und „Reparierens“ des entstandenen Codes. Das ist auch ein versteckter Kostentreiber: Wenn die Softwareentwickler dabei frustriert werden, finden weitere Einsätze dieses Ansatzes zukünftig weniger Akzeptanz. Im Fall von Open-Source-Modellen würde ich den KI-Einsatz stark limitieren und nur punktuell im Entwicklungsprozess unterstützen lassen – zum Beispiel für einfache Tests oder das Schreiben von Boilerplate anhand konkreter Beispiele und Referenzen. Wann ist der maschinell generierte Code wirtschaftlich besonders sinnvoll? Ich finde maschinell generierten Code besonders sinnvoll, wenn schnell Ergebnisse benötigt werden – wenn die Frage nach dem „Wie“ gar nicht so relevant ist, sondern das Resultat im Vordergrund steht. Vibe Coding wird Unternehmen darüber hinaus auch in Zukunft in die Lage versetzen, eigene Softwarekomponenten zu erstellen, ohne auf große Lösungen mit unzähligen Funktionen zurückgreifen zu müssen. Der Vendor-Lock-in bricht langsam, aber sicher auf. Parallel dazu können Software-Manufakturen mit Vibe Coding Kundenbedürfnisse abseits ihres Tagesgeschäfts erfüllen und so neue Zielgruppen erschließen.

Stefan, vielen Dank für die Antworten! Einen Überblick, wie man Tokenbudget und Kosten für Vibe Coding schätzt, gibt es in der neuen iX. Außerdem zeigen wir, was die KI-gestützte Entwicklung in IT-Beratungen und Softwarehäusern kostet – und befassen uns damit, was KI-Gateways als Tools für Kostenkontrolle leisten können. All das und viele weitere Themen finden Leser im Juni-Heft, das ab sofort im heise Shop oder am Kiosk erhältlich ist. In der Serie „Drei Fragen und Antworten“ will die iX die heutigen Herausforderungen der IT auf den Punkt bringen – egal ob es sich um den Blick des Anwenders vorm PC, die Sicht des Managers oder den Alltag eines Administrators handelt. Haben Sie Anregungen aus Ihrer tagtäglichen Praxis oder der Ihrer Nutzer? Wessen Tipps zu welchem Thema würden Sie gerne kurz und knackig lesen? Dann schreiben Sie uns gerne oder hinterlassen Sie einen Kommentar im Forum.

KI-Update: Google I/O-Fazit, Anthropic, Nvidia, Gehirn und KI-Parallelen

heise_ki·2026-05-22WirtschaftModelleAnwendungen

Fazit von der Google I/O

Auf der Entwicklerkonferenz Google I/O drehte sich in diesem Jahr alles um künstliche Intelligenz. Andere Themen wie Hardware oder Android traten in den Hintergrund. Zehn Jahre nach seiner "AI first"-Strategie will Google nun Geld mit KI verdienen und trennt dabei zwischen alltäglichen Funktionen für Privatnutzer und teurer agentischer KI.

Für letztere führte Google einen neuen Tarif für 100 US-Dollar im Monat ein, zwischen dem bekannten 20-Dollar-Tarif und dem Ultratarif für 250 Dollar. Für Dienste wie Google Spark, einen rund um die Uhr verfügbaren KI-Agenten, wird der Ultratarif faktisch nötig. Mit der vorgestellten Universal Cart, einem händlerübergreifenden Einkaufswagen, will Google zudem an jedem Online-Einkauf mitverdienen. Suche, YouTube und Gmail fließen darin zusammen. Für Händler droht damit eine ähnliche Abhängigkeit wie bei Amazons Marketplace. Google reagiert damit auch auf das absehbare Schrumpfen seines Werbegeschäfts, da KI-Zusammenfassungen in der Suche Nutzer von Websites fernhalten.

Anthropic schreibt als erstes KI-Labor schwarze Zahlen

Anthropic steht vor seinem ersten profitablen Quartal. Laut dem Wall Street Journal erwartet das Unternehmen im zweiten Quartal einen operativen Gewinn von 559 Millionen Dollar bei einem Umsatz von 10,9 Milliarden Dollar, ein Sprung von 130 Prozent gegenüber dem Vorquartal. Noch im vergangenen Sommer hatte Anthropic Investoren gesagt, vor 2028 keinen Jahresgewinn zu erwarten. Haupttreiber ist das Programmierwerkzeug Claude Code.

Auch die Preise steigen. Anthropics Spitzenmodell Opus 4.7 kostet pro Token gleich viel wie der Vorgänger, nutzt aber einen neuen Tokenizer, der für denselben Text bis zu 47 Prozent mehr Einheiten erzeugt. Bei OpenAIs neuem GPT-5.5 haben sich die Listenpreise gegenüber dem Vorgänger verdoppelt. Anders als OpenAI nutzt Anthropic vorwiegend günstigere Chips von Google und Amazon und finanziert kein großes Gratisnutzergeschäft. Direkte Vergleiche bleiben schwierig, da Anthropic Verkäufe über Cloud-Partner als eigenen Umsatz zählt, OpenAI nicht.

Endlich einheitliche KI-Kennzeichnung? Gemeinsame Sache bei OpenAI und Google

Google und OpenAI wollen ihre KI-Inhalte künftig mit dem Wasserzeichen SynthID und dem Metadaten-Standard Content Credentials kennzeichnen. Erstmals setzen damit zwei große Anbieter auf dasselbe System, möglicherweise ein Schritt zu einem branchenweiten Standard. Metadaten allein reichen nicht aus, da sie sich leicht entfernen lassen. Wasserzeichen dagegen sind direkt im Medium eingebettet und für das menschliche Auge unsichtbar.

Ab August 2026 verlangt der EU AI Act eine klare Kennzeichnung von KI-Inhalten in Europa, bei Verstößen drohen hohe Strafen. Für Nutzer gibt es allerdings noch keine einheitliche Prüfmethode, da viele Anbieter nur die Markierungen ihrer eigenen Produkte auslesen können.

Weiterlesen

Fazit von der Google I/O

Auf der Entwicklerkonferenz Google I/O drehte sich in diesem Jahr alles um künstliche Intelligenz. Andere Themen wie Hardware oder Android traten in den Hintergrund. Zehn Jahre nach seiner "AI first"-Strategie will Google nun Geld mit KI verdienen und trennt dabei zwischen alltäglichen Funktionen für Privatnutzer und teurer agentischer KI.

Für letztere führte Google einen neuen Tarif für 100 US-Dollar im Monat ein, zwischen dem bekannten 20-Dollar-Tarif und dem Ultratarif für 250 Dollar. Für Dienste wie Google Spark, einen rund um die Uhr verfügbaren KI-Agenten, wird der Ultratarif faktisch nötig. Mit der vorgestellten Universal Cart, einem händlerübergreifenden Einkaufswagen, will Google zudem an jedem Online-Einkauf mitverdienen. Suche, YouTube und Gmail fließen darin zusammen. Für Händler droht damit eine ähnliche Abhängigkeit wie bei Amazons Marketplace. Google reagiert damit auch auf das absehbare Schrumpfen seines Werbegeschäfts, da KI-Zusammenfassungen in der Suche Nutzer von Websites fernhalten.

Anthropic schreibt als erstes KI-Labor schwarze Zahlen

Anthropic steht vor seinem ersten profitablen Quartal. Laut dem Wall Street Journal erwartet das Unternehmen im zweiten Quartal einen operativen Gewinn von 559 Millionen Dollar bei einem Umsatz von 10,9 Milliarden Dollar, ein Sprung von 130 Prozent gegenüber dem Vorquartal. Noch im vergangenen Sommer hatte Anthropic Investoren gesagt, vor 2028 keinen Jahresgewinn zu erwarten. Haupttreiber ist das Programmierwerkzeug Claude Code.

Auch die Preise steigen. Anthropics Spitzenmodell Opus 4.7 kostet pro Token gleich viel wie der Vorgänger, nutzt aber einen neuen Tokenizer, der für denselben Text bis zu 47 Prozent mehr Einheiten erzeugt. Bei OpenAIs neuem GPT-5.5 haben sich die Listenpreise gegenüber dem Vorgänger verdoppelt. Anders als OpenAI nutzt Anthropic vorwiegend günstigere Chips von Google und Amazon und finanziert kein großes Gratisnutzergeschäft. Direkte Vergleiche bleiben schwierig, da Anthropic Verkäufe über Cloud-Partner als eigenen Umsatz zählt, OpenAI nicht.

Endlich einheitliche KI-Kennzeichnung? Gemeinsame Sache bei OpenAI und Google

Google und OpenAI wollen ihre KI-Inhalte künftig mit dem Wasserzeichen SynthID und dem Metadaten-Standard Content Credentials kennzeichnen. Erstmals setzen damit zwei große Anbieter auf dasselbe System, möglicherweise ein Schritt zu einem branchenweiten Standard. Metadaten allein reichen nicht aus, da sie sich leicht entfernen lassen. Wasserzeichen dagegen sind direkt im Medium eingebettet und für das menschliche Auge unsichtbar.

Ab August 2026 verlangt der EU AI Act eine klare Kennzeichnung von KI-Inhalten in Europa, bei Verstößen drohen hohe Strafen. Für Nutzer gibt es allerdings noch keine einheitliche Prüfmethode, da viele Anbieter nur die Markierungen ihrer eigenen Produkte auslesen können.

Avatare und Augmented Reality: Apple schnappt sich kleines Start-up

Apple hat im Rahmen eines Asset-Deals Materialien, Rechte und womöglich auch Mitarbeiter eines auf Augmented-Reality-Systeme und Avatare spezialisierten Start-ups übernommen. Die Firma Animato, die unter anderem die KI-Tutoring-Lösung Call Annie entwickelt hat, war in Kalifornien beheimatet. Der Kauf wurde über Berichtspflichten im Rahmen des Digital Market Act (DMA) der EU-Kommission bekannt. Typische Apple-Aufkaufstrategie Apple erkaufte sich demnach das Recht, Animatos laufende Patentanträge zu übernehmen, bekommt Lizenzen für das geistige Eigentum der Firma (interessanterweise allerdings nicht exklusiv) und erhält die Erlaubnis, Mitarbeiter zu übernehmen. Laut der Beschreibung auf der EU-Website entwickelt und vertreibt Animato „Software, die virtuelle Avatare für Videochats und Lehre kreiert“. Der Vorgang bedeutet keine direkte Übernahme von Animato, sondern es gehen nur Assets an Apple über. Durch die Erlaubnis, Mitarbeitern Angebote zu machen, wird aus dem Deal zudem ein „Acqui-Hire“, also eine Kombination aus Teilübernahme und dem Versuch, Talente anzuwerben. Apple führt solche Käufe regelmäßig durch, hat dadurch bereits wichtige Funktionen, Apps und Techniken ins Unternehmen geholt. Zu den bekannten Akquisitionen zählt die Mannschaft hinter iTunes (aus dem später Apple Music wurde) oder das Team hinter den visionOS-Avataren. Auch die Sprachassistentin Siri stammt ursprünglich nicht von Apple selbst.

Diverse KI- und Augmented-Reality-Firmen übernommen Es ist unklar, was Apple mit dem Animato-Know-how plant. Oftmals kann es Jahre dauern, bis aus einem solchen Aufkauf ein Produkt wird. Zuletzt hatte Apple unter anderem die Firmen WhyLabs, Mayday Labs, TrueMeeting und PromptAI übernommen. Gerade in spezielleren Bereichen wie Augmented Reality oder KI scheinen sich solche Erwerbungen zu lohnen. Allerdings kommt es auch vor, dass die dadurch ins Unternehmen kommenden Mitarbeiter dieses nach Ablauf ihrer Verträge sofort wieder verlassen. Apple hatte zuletzt etwa massiv mit Abgängen aus seiner KI-Abteilung zu kämpfen – Mitarbeiter ließen sich von besseren Angeboten wie denen von OpenAI, Anthropic oder Meta anlocken. Seit einigen Monaten ist hier aber wieder mehr Ruhe eingekehrt. Letzter großer Abgang war die Verrentung des KI-Chefs John Giannandrea.

Weiterlesen

Apple hat im Rahmen eines Asset-Deals Materialien, Rechte und womöglich auch Mitarbeiter eines auf Augmented-Reality-Systeme und Avatare spezialisierten Start-ups übernommen. Die Firma Animato, die unter anderem die KI-Tutoring-Lösung Call Annie entwickelt hat, war in Kalifornien beheimatet. Der Kauf wurde über Berichtspflichten im Rahmen des Digital Market Act (DMA) der EU-Kommission bekannt. Typische Apple-Aufkaufstrategie Apple erkaufte sich demnach das Recht, Animatos laufende Patentanträge zu übernehmen, bekommt Lizenzen für das geistige Eigentum der Firma (interessanterweise allerdings nicht exklusiv) und erhält die Erlaubnis, Mitarbeiter zu übernehmen. Laut der Beschreibung auf der EU-Website entwickelt und vertreibt Animato „Software, die virtuelle Avatare für Videochats und Lehre kreiert“. Der Vorgang bedeutet keine direkte Übernahme von Animato, sondern es gehen nur Assets an Apple über. Durch die Erlaubnis, Mitarbeitern Angebote zu machen, wird aus dem Deal zudem ein „Acqui-Hire“, also eine Kombination aus Teilübernahme und dem Versuch, Talente anzuwerben. Apple führt solche Käufe regelmäßig durch, hat dadurch bereits wichtige Funktionen, Apps und Techniken ins Unternehmen geholt. Zu den bekannten Akquisitionen zählt die Mannschaft hinter iTunes (aus dem später Apple Music wurde) oder das Team hinter den visionOS-Avataren. Auch die Sprachassistentin Siri stammt ursprünglich nicht von Apple selbst.

Diverse KI- und Augmented-Reality-Firmen übernommen Es ist unklar, was Apple mit dem Animato-Know-how plant. Oftmals kann es Jahre dauern, bis aus einem solchen Aufkauf ein Produkt wird. Zuletzt hatte Apple unter anderem die Firmen WhyLabs, Mayday Labs, TrueMeeting und PromptAI übernommen. Gerade in spezielleren Bereichen wie Augmented Reality oder KI scheinen sich solche Erwerbungen zu lohnen. Allerdings kommt es auch vor, dass die dadurch ins Unternehmen kommenden Mitarbeiter dieses nach Ablauf ihrer Verträge sofort wieder verlassen. Apple hatte zuletzt etwa massiv mit Abgängen aus seiner KI-Abteilung zu kämpfen – Mitarbeiter ließen sich von besseren Angeboten wie denen von OpenAI, Anthropic oder Meta anlocken. Seit einigen Monaten ist hier aber wieder mehr Ruhe eingekehrt. Letzter großer Abgang war die Verrentung des KI-Chefs John Giannandrea.

Airbnb personalisiert App mit KI

heise_ki·2026-05-22AnwendungenWirtschaft

Die Unterkünfte-Plattform Airbnb will ihren Dienst stärker individuell auf einzelne Nutzer zuschneiden und setzt dafür auf Künstliche Intelligenz. Unter anderem sollen bei der Anzeige der Beschreibung Merkmale hervorgehoben werden, von denen man wisse, dass sie für die konkreten Kunden relevant seien, sagte Mitgründer Nathan Blecharczyk der dpa. Habe man etwa in der Vergangenheit öfter Unterkünfte mit einem Pool gebucht, werde das bei der Ansicht anderer Angebote prominent angezeigt. Künstliche Intelligenz soll auch bei der Auswertung von Bewertungen auf der Plattform zum Einsatz kommen. „Wir haben mehr als eine Milliarde Bewertungen auf der Plattform. Sie werden sie nicht alle lesen“, sagte Blecharczyk. KI soll stattdessen den Inhalt der Bewertungen zu einzelnen Themen zusammenfassen. Dabei werden Aspekte hervorgehoben, die besonders häufig in den Bewertungen vorkommen: Etwa Lage, Sauberkeit, Anbindung, Heizung, Check-In-Verfahren oder Lärm.

Hotels bei Airbnb Airbnb setzt zudem stärker auf zusätzliche Dienstleistungen. Über die App soll man künftig unter anderem auch Mietwagen, Kofferaufbewahrung oder Lebensmittel-Lieferungen buchen können. Zudem will die Firma Erlebnisse wie Touren, Verkostungen oder Workshops prominenter anbieten. Airbnb konkurriert zwar grundsätzlich mit der Hotel-Industrie. Die Firma bot allerdings schon seit Jahren zusätzlich Aufenthalte in Boutique-Hotels an. Doch inzwischen sorge man dafür, dass auf der Plattform in allen relevanten Stadtteilen auch Hotelzimmer im Angebot seien, sagte Blecharczyk. „Wir erkennen an, dass selbst unsere loyalsten Airbnb-Kunden immer noch manchmal Hotels buchen.“ Das könne in manchen Fällen die bessere Lösung sein, zum Beispiel auf Dienstreisen oder nur einer Übernachtung. Und anstatt sie zu einer anderen Website zu schicken, wolle Airbnb auch diesen Markt bedienen.

Weiterlesen

Die Unterkünfte-Plattform Airbnb will ihren Dienst stärker individuell auf einzelne Nutzer zuschneiden und setzt dafür auf Künstliche Intelligenz. Unter anderem sollen bei der Anzeige der Beschreibung Merkmale hervorgehoben werden, von denen man wisse, dass sie für die konkreten Kunden relevant seien, sagte Mitgründer Nathan Blecharczyk der dpa. Habe man etwa in der Vergangenheit öfter Unterkünfte mit einem Pool gebucht, werde das bei der Ansicht anderer Angebote prominent angezeigt. Künstliche Intelligenz soll auch bei der Auswertung von Bewertungen auf der Plattform zum Einsatz kommen. „Wir haben mehr als eine Milliarde Bewertungen auf der Plattform. Sie werden sie nicht alle lesen“, sagte Blecharczyk. KI soll stattdessen den Inhalt der Bewertungen zu einzelnen Themen zusammenfassen. Dabei werden Aspekte hervorgehoben, die besonders häufig in den Bewertungen vorkommen: Etwa Lage, Sauberkeit, Anbindung, Heizung, Check-In-Verfahren oder Lärm.

Hotels bei Airbnb Airbnb setzt zudem stärker auf zusätzliche Dienstleistungen. Über die App soll man künftig unter anderem auch Mietwagen, Kofferaufbewahrung oder Lebensmittel-Lieferungen buchen können. Zudem will die Firma Erlebnisse wie Touren, Verkostungen oder Workshops prominenter anbieten. Airbnb konkurriert zwar grundsätzlich mit der Hotel-Industrie. Die Firma bot allerdings schon seit Jahren zusätzlich Aufenthalte in Boutique-Hotels an. Doch inzwischen sorge man dafür, dass auf der Plattform in allen relevanten Stadtteilen auch Hotelzimmer im Angebot seien, sagte Blecharczyk. „Wir erkennen an, dass selbst unsere loyalsten Airbnb-Kunden immer noch manchmal Hotels buchen.“ Das könne in manchen Fällen die bessere Lösung sein, zum Beispiel auf Dienstreisen oder nur einer Übernachtung. Und anstatt sie zu einer anderen Website zu schicken, wolle Airbnb auch diesen Markt bedienen.

IT-Ausfälle immer teurer für große Unternehmen

Die globalen Kosten für IT-Ausfälle steigen laut einer Studie der Cisco-Tochter Splunk rasant an. Demnach belaufen sich die Ausfallkosten für die 2.000 größten Unternehmen der Welt inzwischen auf 600 Milliarden US-Dollar pro Jahr. Das stellt einen Anstieg um 50 Prozent in nur zwei Jahren dar. Für deutsche Unternehmen beziffert die Studie die durchschnittlichen Kosten auf 295 Millionen US-Dollar pro Jahr. Besonders alarmierend sind die durchschnittlichen Kosten pro Minute Downtime von 15.000 US-Dollar. Global gesehen ist der größte Kostenpunkt der direkte Umsatzverlust, den die Studie mit durchschnittlich 95 Millionen US-Dollar pro großem Unternehmen beziffert. Darauf folgen Compliance-Kosten mit im Schnitt 51 Millionen US-Dollar. Lediglich in der EMEA-Region haben die Großunternehmen noch mehr mit Compliance zu kämpfen, worauf die Kosten für Security und dann die durch Umsatzeinbußen folgen. Doch die Folgen gehen weit über reine Kosten hinaus. 85 Prozent der Befragten in der EMEA-Region nennen den Verlust von Kunden als direkte Folge von IT-Ausfällen. Zudem melden 86 Prozent einen hohen Personalaufwand zur Fehlerbehebung, während 88 Prozent einen gestiegenen Bedarf an Kundensupport haben. In 53 Prozent der Fälle bemerken Kunden die Probleme sogar vor dem eigenen IT-Team. Befragt wurden den Splunk-Angaben nach 2000 Führungskräfte aus den 2000 größten Unternehmen. KI: Lösung und Problem zugleich Künstliche Intelligenz wird zunehmend als Lösung eingesetzt, um Ausfallrisiken zu reduzieren, indem sie Auffälligkeiten erkennt und teils bereits Lösungen vorschlägt oder umsetzt. Weltweit geben Unternehmen durchschnittlich 24,5 Millionen US-Dollar pro Jahr für KI-Tools zur Prävention und Response aus. 56 Prozent der Anwender sagten, dass KI das Ausfallrisiko insgesamt verringert hat. Jedoch erweist sie sich dabei als zweischneidiges Schwert: Alle befragten Technologieverantwortlichen berichten laut Splunk von Ausfallzeiten, die im Zusammenhang mit KI stehen. Folglich sorgen sich auch 68 Prozent um unvorhersehbares Verhalten von KI-Agenten. Gleichzeitig investieren 85 Prozent der Verantwortlichen in KI-gestützte Sicherheitsautomatisierung und 37 Prozent in Netzwerkautomatisierung.

Observability ist Trumpf Die IT-Verantwortlichen nennen durchgängige Observability als ihre oberste Investitionspriorität, wenn es darum geht, die Ausfallsicherheit der Infrastruktur zu verbessern. Unternehmen priorisieren daher Observability-Plattformen und KI-gestützte Automatisierung noch vor klassischen Hardware-Upgrades. 65 Prozent der Technologieverantwortlichen investieren in KI-basierte Observability, um Echtzeit-Einblicke in digitale Ökosysteme zu erhalten. Die Studie unterstreicht, dass IT-Ausfälle kein reines Technologieproblem sind, sondern eine systemische Bedrohung für das gesamte Geschäft darstellen. Die Kombination aus Observability, Automatisierung und KI gilt als vielversprechendster Ansatz, um die wachsende Komplexität digitaler Infrastrukturen zu beherrschen. Gleichzeitig warnen Experten vor einer Überschätzung von KI: Ohne menschliche Aufsicht und klare Governance können neue Risiken entstehen.

Weiterlesen

Die globalen Kosten für IT-Ausfälle steigen laut einer Studie der Cisco-Tochter Splunk rasant an. Demnach belaufen sich die Ausfallkosten für die 2.000 größten Unternehmen der Welt inzwischen auf 600 Milliarden US-Dollar pro Jahr. Das stellt einen Anstieg um 50 Prozent in nur zwei Jahren dar. Für deutsche Unternehmen beziffert die Studie die durchschnittlichen Kosten auf 295 Millionen US-Dollar pro Jahr. Besonders alarmierend sind die durchschnittlichen Kosten pro Minute Downtime von 15.000 US-Dollar. Global gesehen ist der größte Kostenpunkt der direkte Umsatzverlust, den die Studie mit durchschnittlich 95 Millionen US-Dollar pro großem Unternehmen beziffert. Darauf folgen Compliance-Kosten mit im Schnitt 51 Millionen US-Dollar. Lediglich in der EMEA-Region haben die Großunternehmen noch mehr mit Compliance zu kämpfen, worauf die Kosten für Security und dann die durch Umsatzeinbußen folgen. Doch die Folgen gehen weit über reine Kosten hinaus. 85 Prozent der Befragten in der EMEA-Region nennen den Verlust von Kunden als direkte Folge von IT-Ausfällen. Zudem melden 86 Prozent einen hohen Personalaufwand zur Fehlerbehebung, während 88 Prozent einen gestiegenen Bedarf an Kundensupport haben. In 53 Prozent der Fälle bemerken Kunden die Probleme sogar vor dem eigenen IT-Team. Befragt wurden den Splunk-Angaben nach 2000 Führungskräfte aus den 2000 größten Unternehmen. KI: Lösung und Problem zugleich Künstliche Intelligenz wird zunehmend als Lösung eingesetzt, um Ausfallrisiken zu reduzieren, indem sie Auffälligkeiten erkennt und teils bereits Lösungen vorschlägt oder umsetzt. Weltweit geben Unternehmen durchschnittlich 24,5 Millionen US-Dollar pro Jahr für KI-Tools zur Prävention und Response aus. 56 Prozent der Anwender sagten, dass KI das Ausfallrisiko insgesamt verringert hat. Jedoch erweist sie sich dabei als zweischneidiges Schwert: Alle befragten Technologieverantwortlichen berichten laut Splunk von Ausfallzeiten, die im Zusammenhang mit KI stehen. Folglich sorgen sich auch 68 Prozent um unvorhersehbares Verhalten von KI-Agenten. Gleichzeitig investieren 85 Prozent der Verantwortlichen in KI-gestützte Sicherheitsautomatisierung und 37 Prozent in Netzwerkautomatisierung.

Observability ist Trumpf Die IT-Verantwortlichen nennen durchgängige Observability als ihre oberste Investitionspriorität, wenn es darum geht, die Ausfallsicherheit der Infrastruktur zu verbessern. Unternehmen priorisieren daher Observability-Plattformen und KI-gestützte Automatisierung noch vor klassischen Hardware-Upgrades. 65 Prozent der Technologieverantwortlichen investieren in KI-basierte Observability, um Echtzeit-Einblicke in digitale Ökosysteme zu erhalten. Die Studie unterstreicht, dass IT-Ausfälle kein reines Technologieproblem sind, sondern eine systemische Bedrohung für das gesamte Geschäft darstellen. Die Kombination aus Observability, Automatisierung und KI gilt als vielversprechendster Ansatz, um die wachsende Komplexität digitaler Infrastrukturen zu beherrschen. Gleichzeitig warnen Experten vor einer Überschätzung von KI: Ohne menschliche Aufsicht und klare Governance können neue Risiken entstehen.

Betrug im App Store: Apple stoppt laut eigenen Angaben Milliarden-Verluste

Die Gefahr durch betrügerische Apps nimmt laut Zahlen von Apple eher zu als ab. Apples App-Review-Team (beziehungsweise dessen KI-System) habe im vergangenen Jahr über 2 Millionen potenziell problematische Apps abgelehnt, teilte das Unternehmen mit. Im Jahr 2024 lag die Zahl noch bei 1,9 Millionen. Auch die Summe an betrügerischen Zahlungen, die Apple laut eigenen Angaben verhindert hat, stieg: Von 2 Milliarden auf 2,2 Milliarden US-Dollar. Damit will man in den letzten sechs Jahren insgesamt 11,2 Milliarden Dollar an Betrügereien verhindert haben. Mehr Betrug, mehr Schaden Besonders erstaunlich: 2025 soll es 1,1 Milliarden Versuche gegeben haben, betrügerische App-Store-Accounts anzulegen, die Apple verhindern konnte. Die Zahl lag im Vorjahr noch bei 711 Millionen. Böswillige Akteure hätten ihre Methoden zum Betrug weiterentwickelt und nutzten unter anderem Bot-Netzwerke zur Account-Erstellung. Die Anzahl der Kundenzugänge, die Apple nachträglich aufgrund von Betrug und Missbrauch deaktiviert hat, sank allerdings: von rund 130 Millionen 2024 auf nun 40,4 Millionen. Bei den Entwickleraccounts, ohne die keine App im App Store landet, wurden 193.000 wegen Betrugsverdacht gekündigt. 138.000 Anmeldungen wurden laut Apple direkt abgelehnt. Apple will zudem 28.000 unzulässige Apps auf Piraten-Websites identifiziert und „blockiert“ haben, so der Konzern, darunter Glücksspiel, Schadcode, Pornografie und Kopien regulärer Apps. „Durch die Einschränkung dieser Storefronts und illegalen Vertriebskanäle schützt Apple Entwicklerinnen und Entwickler außerdem davor, dass ihre Apps geklont, verändert oder als Waffe für die Verbreitung von Schadsoftware missbraucht werden“, behauptet der Konzern. Allerdings macht er es Entwicklern alternativer App-Marktplätze nicht leicht, diese erfolgreich zu machen.

Immer mehr Vibecoding-Apps Apple verhindert das Ausführen problematischer Apps auch aktiv. Allein im vergangenen Monat habe man Installation oder Start 2,9 Millionen Mal verhindert, die „die illegal außerhalb des App Store oder zugelassener alternativer App-Marktplätze verbreitet“ worden seien. Apple will seine Erkennungswerkzeuge im Rahmen des App-Reviews verbessert haben. Das ist auch notwendig, da immer mehr Apps per Vibecoding entwickelt werden. Man habe hier einen sprunghaften Anstieg an Einreichungen verzeichnet. „Im Jahr 2025 hat das App-Review-Team mehr als 9,1 Millionen App-Einreichungen geprüft und damit dazu beigetragen, mehr als 306.000 neue Entwicklerinnen und Entwickler auf der Plattform willkommen zu heißen“, so das Unternehmen. Zwei Millionen App-Einreichungen, 1,2 Millionen davon neu und 800.000 Updates, wurden abgelehnt. 22.000 davon sollen „versteckte oder nicht dokumentierte Funktionen“ enthalten haben, 371.000 kopierten andere Apps, waren Spam oder führten Nutzer laut Apple „in die Irre“. Datenschutzprobleme stellte Apple in 443.000 Einreichungen fest und lehnte diese ab.

Weiterlesen

Die Gefahr durch betrügerische Apps nimmt laut Zahlen von Apple eher zu als ab. Apples App-Review-Team (beziehungsweise dessen KI-System) habe im vergangenen Jahr über 2 Millionen potenziell problematische Apps abgelehnt, teilte das Unternehmen mit. Im Jahr 2024 lag die Zahl noch bei 1,9 Millionen. Auch die Summe an betrügerischen Zahlungen, die Apple laut eigenen Angaben verhindert hat, stieg: Von 2 Milliarden auf 2,2 Milliarden US-Dollar. Damit will man in den letzten sechs Jahren insgesamt 11,2 Milliarden Dollar an Betrügereien verhindert haben. Mehr Betrug, mehr Schaden Besonders erstaunlich: 2025 soll es 1,1 Milliarden Versuche gegeben haben, betrügerische App-Store-Accounts anzulegen, die Apple verhindern konnte. Die Zahl lag im Vorjahr noch bei 711 Millionen. Böswillige Akteure hätten ihre Methoden zum Betrug weiterentwickelt und nutzten unter anderem Bot-Netzwerke zur Account-Erstellung. Die Anzahl der Kundenzugänge, die Apple nachträglich aufgrund von Betrug und Missbrauch deaktiviert hat, sank allerdings: von rund 130 Millionen 2024 auf nun 40,4 Millionen. Bei den Entwickleraccounts, ohne die keine App im App Store landet, wurden 193.000 wegen Betrugsverdacht gekündigt. 138.000 Anmeldungen wurden laut Apple direkt abgelehnt. Apple will zudem 28.000 unzulässige Apps auf Piraten-Websites identifiziert und „blockiert“ haben, so der Konzern, darunter Glücksspiel, Schadcode, Pornografie und Kopien regulärer Apps. „Durch die Einschränkung dieser Storefronts und illegalen Vertriebskanäle schützt Apple Entwicklerinnen und Entwickler außerdem davor, dass ihre Apps geklont, verändert oder als Waffe für die Verbreitung von Schadsoftware missbraucht werden“, behauptet der Konzern. Allerdings macht er es Entwicklern alternativer App-Marktplätze nicht leicht, diese erfolgreich zu machen.

Immer mehr Vibecoding-Apps Apple verhindert das Ausführen problematischer Apps auch aktiv. Allein im vergangenen Monat habe man Installation oder Start 2,9 Millionen Mal verhindert, die „die illegal außerhalb des App Store oder zugelassener alternativer App-Marktplätze verbreitet“ worden seien. Apple will seine Erkennungswerkzeuge im Rahmen des App-Reviews verbessert haben. Das ist auch notwendig, da immer mehr Apps per Vibecoding entwickelt werden. Man habe hier einen sprunghaften Anstieg an Einreichungen verzeichnet. „Im Jahr 2025 hat das App-Review-Team mehr als 9,1 Millionen App-Einreichungen geprüft und damit dazu beigetragen, mehr als 306.000 neue Entwicklerinnen und Entwickler auf der Plattform willkommen zu heißen“, so das Unternehmen. Zwei Millionen App-Einreichungen, 1,2 Millionen davon neu und 800.000 Updates, wurden abgelehnt. 22.000 davon sollen „versteckte oder nicht dokumentierte Funktionen“ enthalten haben, 371.000 kopierten andere Apps, waren Spam oder führten Nutzer laut Apple „in die Irre“. Datenschutzprobleme stellte Apple in 443.000 Einreichungen fest und lehnte diese ab.

"Wettlauf nach unten": Karen Hao kritisiert europäischen KI-Kurs

netzpolitik·2026-05-19RegulierungGesellschaftWirtschaft

Auf der re:publica kritisiert die Autorin Karen Hao die Macht und Rücksichtslosigkeit großer KI-Konzerne. Ihre dringende Warnung an die EU: Hört auf, den Ansatz der USA zu kopieren, und macht euch unabhängig von den Imperien des digitalen Zeitalters.

Karen Hao auf der re:publica 2026. – Alle Rechte vorbehalten: IMAGO / Mauersberger Die Journalistin Karen Hao ist mit ihrem 2025 erschienenen Buch „Empire of AI“ zu einer der prominentesten Kritiker:innen großer Tech-Konzerne und ihrer KI-Imperien geworden. Bei ihrer Eröffnungsrede auf der re:publica in Berlin nahm Hao am Montag aber nicht nur Unternehmen wie OpenAI, Google oder Microsoft ins Visier, sondern wusch auch der europäischen Politik den Kopf.

Haos wichtigste Botschaft: Die EU müsse aufhören, in der KI-Politik den USA hinterherzulaufen. Dort hätten das Silicon Valley und das Weiße Haus das mächtigste Bündnis seit dem britischen Empire und der East India Company gebildet. Wenn Europa versuche, deren Modell zu kopieren und dafür mühsam errungene Standards wie den Datenschutz aufzuweichen, zementiere man nur die Macht der neuen Imperien.

Wachstum um jeden Preis

Die Probleme mit der Lieferkette von KI, die Hao pointiert vorträgt, sind zumindest für netzpolitik.org-Leser:innen nicht neu: Rechenzentren und hochleistungsfähige Computerchips lassen den Strom‑, Wasser- und Ressourcenverbrauch massiv ansteigen . Gefüttert werden die großen Modelle mit Petabytes an Daten, die ohne Einverständnis der Urheber:innen oder Betroffenen abgegriffen wurden. Gesäubert, sortiert und gelabelt wird der Input von ausgebeuteten Datenarbeiter:innen .

Hao hat all diese Probleme aus der Nähe untersucht. Sie hat mit Datenarbeiter:innen in Kenia und den USA gesprochen, Proteste gegen Rechenzentren in Chile und Spanien dokumentiert sowie einmalige Einblicke hinter die Kulissen von Open AI erhalten. Als Ursache hinter den Problemen macht sie einen Ansatz großer Tech-Konzerne aus, den sie „Scale At All Costs“ nennt, also: Wachstum um jeden Preis.

Statt Probleme zu lösen, würden KI-Konzerne nur ein Rezept kennen: mehr von allem. Mehr Daten. Mehr Rechenkapazität. Mehr Nutzer:innen. Dafür würden sie alles in Kauf nehmen. Die von Big Tech verursachten CO2-Emmissionen seien seit 2020 um 150 Prozent gestiegen – also seit dem Jahr, in dem sie sich vorgenommen hatten, ihre Emissionen bis 2030 auf Null zu bringen.

Fahrräder statt Raketen

Statt diesen Ansatz zu kopieren, wie es derzeit geschehe, müsse Europa sich von den KI-Imperien lösen, sie zerschlagen und Alternativen aufbauen. Als solche nennt Hao kleinere, auf die Lösung bestimmter Probleme spezialisierte KI-Modelle, die im Gegensatz zu den großen General-Purpose-Modellen der Tech-Konzerne deutlich weniger Rechenkapazität benötigten.

Letztere vergleicht Hao mit Raketen. Sie seien zwar für einige wenige Zwecke gut geeignet, jedoch vollkommen überdimensioniert, um beispielsweise Verkehrsprobleme moderner Gesellschaften zu lösen. „Wenn jeder mit der Rakete von München nach Berlin reisen will, haben wir ein Problem“, so Hao. So wie Raketen ungeeignet seien, Transportprobleme zu lösen, sei General Purpose AI nicht die Lösung für die meisten digitalen Probleme.

„Baut lieber Fahrräder als Raketen“, lautet Haos Empfehlung. Als Beispiele für kleinere KI-Anwendungen nennt die Autorin das ursprünglich von Deep Mind entwickelte KI-Modell AlphaFold zur Analyse von Proteinstrukturen in der Molekularforschung. Für solche Modelle brauche man keine Supercomputer und keine Datenarbeit.

Gleiches gelte für spezialisierte KI-Tools zur Bekämpfung der Klimakrise, etwa bei der Vorhersage von Extremwetter, zur Optimierung von Lieferketten oder zur Erhöhung der Energieeffizienz von Gebäuden. Auch Open-Source-Modelle und die Eurostack-Initiative könnten kurz- und mittelfristig helfen, aus der Abhängigkeit von Big Tech zu kommen.

„Stop Scaling!“

„Wir liegen im Wettrennen um KI so weit zurück“, diesen Satz höre sie häufig von Europäer:innen, so die Journalistin. Die Frage sei jedoch: Wie definiert man dieses Rennen, in dem Europa sich angeblich befindet? „Geht es darum, immer nur noch größere Raketen zu bauen? Dann ist das ein Wettlauf nach unten.“

Karen Haos klare Botschaft an Europa: „Stop Scaling!“ Die EU allerdings scheine dem US-Modell folgen zu wollen, so Hao. Wenn die EU etwa im Rahmen des digitalen Omnibus-Gesetzespakets die Datenschutzregeln zurückstutzen wolle, um die Nutzung personenbezogener Daten für KI zu erleichtern. Oder wenn sie einen massiven Ausbau der Rechenzentrumsinfrastruktur plane.

Dieser Weg werde nur zur Vertiefung der Abhängigkeiten von den USA führen. Ganz direkt, indem dafür große Mengen KI-Chips der Firma Nvidia angeschafft werden müssten. Aber auch indirekt, weil auch die Rechenzentrums-Infrastruktur nicht ohne Big Tech auskomme. Auch die Investments in eine europäische KI-Alternative wie Mistral hätten nicht zu mehr Unabhängigkeit geführt, schließlich sei das französische Unternehmen eine Partnerschaft mit Microsoft eingegangen.

Stattdessen müsse Europa das Wissensmonopol der KI-Imperien aufbrechen. Zum einen, indem es massiv in unabhängige KI-Forschung investiere. Zum anderen, indem es die Branche zu mehr Transparenz zwinge. Nur durch Regulierung könnten die US-Konzerne dazu gebracht werden, offenzulegen, wie viel Strom, Wasser und andere Ressourcen ihre KI-Modelle und Rechenzentren verbrauchen. Dass Microsoft und Lobby-Gruppen EU-Richtlinien beeinflusst hätten , die Transparenz in diesem Bereich verhindern, sei ein fatales Zeichen.

Dabei sei eine Abkehr Europas von den KI-Imperien auch geopolitisch geboten, schließlich hänge die US-Ökonomie und damit auch die Macht des US-Präsidenten vom Erfolg der Konzerne ab. Ein Großteil des Börsenwachstums der US-Wirtschaft gehe auf das Konto weniger KI-Unternehmen. Wenn man sie rausrechne, habe Europas Wirtschaft in den vergangenen Jahren an der Börse sogar besser performt.

Weiterlesen

Auf der re:publica kritisiert die Autorin Karen Hao die Macht und Rücksichtslosigkeit großer KI-Konzerne. Ihre dringende Warnung an die EU: Hört auf, den Ansatz der USA zu kopieren, und macht euch unabhängig von den Imperien des digitalen Zeitalters.

Karen Hao auf der re:publica 2026. – Alle Rechte vorbehalten: IMAGO / Mauersberger Die Journalistin Karen Hao ist mit ihrem 2025 erschienenen Buch „Empire of AI“ zu einer der prominentesten Kritiker:innen großer Tech-Konzerne und ihrer KI-Imperien geworden. Bei ihrer Eröffnungsrede auf der re:publica in Berlin nahm Hao am Montag aber nicht nur Unternehmen wie OpenAI, Google oder Microsoft ins Visier, sondern wusch auch der europäischen Politik den Kopf.

Haos wichtigste Botschaft: Die EU müsse aufhören, in der KI-Politik den USA hinterherzulaufen. Dort hätten das Silicon Valley und das Weiße Haus das mächtigste Bündnis seit dem britischen Empire und der East India Company gebildet. Wenn Europa versuche, deren Modell zu kopieren und dafür mühsam errungene Standards wie den Datenschutz aufzuweichen, zementiere man nur die Macht der neuen Imperien.

Wachstum um jeden Preis

Die Probleme mit der Lieferkette von KI, die Hao pointiert vorträgt, sind zumindest für netzpolitik.org-Leser:innen nicht neu: Rechenzentren und hochleistungsfähige Computerchips lassen den Strom‑, Wasser- und Ressourcenverbrauch massiv ansteigen . Gefüttert werden die großen Modelle mit Petabytes an Daten, die ohne Einverständnis der Urheber:innen oder Betroffenen abgegriffen wurden. Gesäubert, sortiert und gelabelt wird der Input von ausgebeuteten Datenarbeiter:innen .

Hao hat all diese Probleme aus der Nähe untersucht. Sie hat mit Datenarbeiter:innen in Kenia und den USA gesprochen, Proteste gegen Rechenzentren in Chile und Spanien dokumentiert sowie einmalige Einblicke hinter die Kulissen von Open AI erhalten. Als Ursache hinter den Problemen macht sie einen Ansatz großer Tech-Konzerne aus, den sie „Scale At All Costs“ nennt, also: Wachstum um jeden Preis.

Statt Probleme zu lösen, würden KI-Konzerne nur ein Rezept kennen: mehr von allem. Mehr Daten. Mehr Rechenkapazität. Mehr Nutzer:innen. Dafür würden sie alles in Kauf nehmen. Die von Big Tech verursachten CO2-Emmissionen seien seit 2020 um 150 Prozent gestiegen – also seit dem Jahr, in dem sie sich vorgenommen hatten, ihre Emissionen bis 2030 auf Null zu bringen.

Fahrräder statt Raketen

Statt diesen Ansatz zu kopieren, wie es derzeit geschehe, müsse Europa sich von den KI-Imperien lösen, sie zerschlagen und Alternativen aufbauen. Als solche nennt Hao kleinere, auf die Lösung bestimmter Probleme spezialisierte KI-Modelle, die im Gegensatz zu den großen General-Purpose-Modellen der Tech-Konzerne deutlich weniger Rechenkapazität benötigten.

Letztere vergleicht Hao mit Raketen. Sie seien zwar für einige wenige Zwecke gut geeignet, jedoch vollkommen überdimensioniert, um beispielsweise Verkehrsprobleme moderner Gesellschaften zu lösen. „Wenn jeder mit der Rakete von München nach Berlin reisen will, haben wir ein Problem“, so Hao. So wie Raketen ungeeignet seien, Transportprobleme zu lösen, sei General Purpose AI nicht die Lösung für die meisten digitalen Probleme.

„Baut lieber Fahrräder als Raketen“, lautet Haos Empfehlung. Als Beispiele für kleinere KI-Anwendungen nennt die Autorin das ursprünglich von Deep Mind entwickelte KI-Modell AlphaFold zur Analyse von Proteinstrukturen in der Molekularforschung. Für solche Modelle brauche man keine Supercomputer und keine Datenarbeit.

Gleiches gelte für spezialisierte KI-Tools zur Bekämpfung der Klimakrise, etwa bei der Vorhersage von Extremwetter, zur Optimierung von Lieferketten oder zur Erhöhung der Energieeffizienz von Gebäuden. Auch Open-Source-Modelle und die Eurostack-Initiative könnten kurz- und mittelfristig helfen, aus der Abhängigkeit von Big Tech zu kommen.

„Stop Scaling!“

„Wir liegen im Wettrennen um KI so weit zurück“, diesen Satz höre sie häufig von Europäer:innen, so die Journalistin. Die Frage sei jedoch: Wie definiert man dieses Rennen, in dem Europa sich angeblich befindet? „Geht es darum, immer nur noch größere Raketen zu bauen? Dann ist das ein Wettlauf nach unten.“

Karen Haos klare Botschaft an Europa: „Stop Scaling!“ Die EU allerdings scheine dem US-Modell folgen zu wollen, so Hao. Wenn die EU etwa im Rahmen des digitalen Omnibus-Gesetzespakets die Datenschutzregeln zurückstutzen wolle, um die Nutzung personenbezogener Daten für KI zu erleichtern. Oder wenn sie einen massiven Ausbau der Rechenzentrumsinfrastruktur plane.

Dieser Weg werde nur zur Vertiefung der Abhängigkeiten von den USA führen. Ganz direkt, indem dafür große Mengen KI-Chips der Firma Nvidia angeschafft werden müssten. Aber auch indirekt, weil auch die Rechenzentrums-Infrastruktur nicht ohne Big Tech auskomme. Auch die Investments in eine europäische KI-Alternative wie Mistral hätten nicht zu mehr Unabhängigkeit geführt, schließlich sei das französische Unternehmen eine Partnerschaft mit Microsoft eingegangen.

Stattdessen müsse Europa das Wissensmonopol der KI-Imperien aufbrechen. Zum einen, indem es massiv in unabhängige KI-Forschung investiere. Zum anderen, indem es die Branche zu mehr Transparenz zwinge. Nur durch Regulierung könnten die US-Konzerne dazu gebracht werden, offenzulegen, wie viel Strom, Wasser und andere Ressourcen ihre KI-Modelle und Rechenzentren verbrauchen. Dass Microsoft und Lobby-Gruppen EU-Richtlinien beeinflusst hätten , die Transparenz in diesem Bereich verhindern, sei ein fatales Zeichen.

Dabei sei eine Abkehr Europas von den KI-Imperien auch geopolitisch geboten, schließlich hänge die US-Ökonomie und damit auch die Macht des US-Präsidenten vom Erfolg der Konzerne ab. Ein Großteil des Börsenwachstums der US-Wirtschaft gehe auf das Konto weniger KI-Unternehmen. Wenn man sie rausrechne, habe Europas Wirtschaft in den vergangenen Jahren an der Börse sogar besser performt.

Import AI 456: RSI und Wirtschaftswachstum; radikale Optionalität für KI-Regulierung; und ein neuronaler Computer

import_ai·2026-05-11RegulierungForschungWirtschaft

**Import KI 456: RSI und Wirtschaftswachstum; radikale Optionalität für KI-Regulierung; und ein neuronaler Computer**

Welche Gesetze verlangt Superintelligenz?

Willkommen bei Import KI, einem Newsletter über KI-Forschung. Import KI läuft auf arXiv, Cappuccinos und Feedback von Lesern. Wenn Sie dies unterstützen möchten, abonnieren Sie bitte.

Regulieren? Nicht regulieren. Es gibt einen dritten Weg: Radikale Optionalität:

…Regierungen sollten jetzt in die Werkzeuge investieren, die sie in einer zukünftigen Krise benötigen könnten…

Forscher des Institute for Law & AI haben über "radikale Optionalität" geschrieben, einen Ansatz, bei dem sich Regierungen die Werkzeuge geben, die sie in Zukunft benötigen könnten, wenn leistungsstarke KI beginnt, die Welt massiv zu stören.

"Im Kern geht es bei radikaler Optionalität darum, die Fähigkeit demokratischer Regierungen zu bewahren, gute Entscheidungen darüber zu treffen, wie transformative KI-Systeme reguliert werden sollen, während sich die Umstände weiterentwickeln. Kurzfristig bedeutet dies, Überregulierung zu vermeiden, während gleichzeitig schnell die Institutionen, Informationskanäle und rechtlichen Befugnisse aufgebaut werden, die benötigt werden, um kompetent auf ein breites Spektrum von Szenarien reagieren zu können."

Die Kernidee – jetzt für eine unsichere Zukunft investieren: Angesichts der immensen Bedeutung der KI-Entwicklung "sollten Regierungen bereit sein, außergewöhnlich viel Geld, Mühe und politisches Kapital für die Wahrung der Optionalität auszugeben", schreiben sie. Mit anderen Worten: Es ist eine so große Sache, dass man in Ordnung sein sollte, jetzt eine Menge Geld mit unsicherer Rendite auszugeben. "Regierungen sollten sich vor kontraproduktiven Interventionen hüten, aber nicht allzu sehr um die tatsächlichen finanziellen Kosten jeder realistischen Maßnahme besorgt sein, die wahrscheinlich netto-positive Ergebnisse bringt."

Konkretes: Sie empfehlen außerdem mehrere spezifische Interventionen in einigen Kategorien:

Befugnisse zur Informationssammlung: Transparenzanforderungen, bei denen Unternehmen Informationen über ihre KI-Systeme veröffentlichen müssen. Meldepflichten, bei denen Unternehmen gezwungen sind, bestimmte Informationen mit einer Regierungsbehörde zu teilen. Sobald diese vorhanden sind, ein Prüfregime einrichten, damit ein Dritter die Richtigkeit dessen überprüfen kann, was die Transparenz- und Melderegeln betreffen.

Whistleblower-Schutz: Sicherstellen, dass Mitarbeiter in Grenzlaboren Informationen über Risiken melden können.

Informationsaustausch innerhalb und zwischen Regierungen: Sicherstellen, dass Regierungen Diskussionen effektiv koordinieren und erleichtern können, insbesondere solche, die sensible Informationen über den Fortschritt der KI betreffen. Dies könnte besonders wichtig sein, um Lieferketten zu stärken und zu schützen, die als kritisch für die KI-Entwicklung angesehen werden.

Flexible Regeln und Definitionen: Vermeidung voreiliger Regulierung durch potenziell bedingte "Wenn-Dann"-Regulierungszusagen oder einen Ansatz, bei dem ein übergeordnetes Ziel gesetzt wird (z. B. Risikominderung) und Unternehmen frei sind, die Einzelheiten der Umsetzung zu definieren. Dies ist verbunden mit der Notwendigkeit, flexible Definitionen oder Definitionen zu entwickeln, die sich im Laufe der Zeit weiterentwickeln können.

Bewertungen und Evaluationen: Entwicklung von Regierungs- und Drittanbieterkapazitäten zur Bewertung der Fähigkeiten und Sicherheitsaspekte von KI-Systemen.

Verbesserung der Sicherheit von Modellgewichten und algorithmischen Geheimnissen: Mehr Investitionen in die Sicherung der Gewichte neuronaler Netze sowie der algorithmischen Geheimnisse hinter einigen der besten Systeme. Dies kann durch die Verbreitung freiwilliger Standards für physische Sicherheit und Cybersicherheit erreicht werden.

Einstellung und Talent: Eine Meta-Investition, die bei all dem oben Genannten helfen würde, ist die verstärkte Investition in die Art von technischem Talent, das benötigt wird, um eine dieser Interventionen effektiv durchzuführen. Kern davon ist die Aufstockung der Finanzierung von AISI (UK) und CAISI (USA) und ihren Pendants in anderen Ländern.

Argumente und Gegenargumente: Die Autoren gehen auf einige der offensichtlicheren Gegenargumente zu diesen Ideen ein und geben einige Antworten:

Förderung dramatischer regulatorischer Maßnahmen: Die obigen Ideen "sind keine gewichtigen materiellen Befugnisse, die sich für Missbrauch eignen", behaupten sie. (Ich könnte hier widersprechen und anmerken, dass eine ausreichend motivierte Regierung dazu neigen kann, eine weitaus strengere Version einer Befugnis zu entwickeln, als diejenigen, die die Befugnis ursprünglich entworfen haben, sich vorgestellt haben könnten).

Demokratische Legitimität: Die Optimierung auf Flexibilität könnte dazu führen, dass einige Dinge, die mehr mit demokratischer Legitimität zu tun haben, heruntergespielt werden müssen, z. B. die Ermächtigung von Behörden, auf Ankündigungs- und Kommentierungsfristen für bestimmte Arten von Regelungen zu verzichten.

Machtkonzentration und Regierungsmissbrauch: Die Autoren sind "im Grunde überzeugt", dass ein erhebliches Risiko besteht, dass Regierungen die Kontrolle über die Entwicklung von KI-Systemen übernehmen – aus diesem Grund empfehlen sie keine Dinge wie die massive Ausweitung des Geltungsbereichs von Notstandsbefugnissen wie dem Defense Production Act. Eine Möglichkeit, dies zu mildern, könnte darin bestehen, Regierungen dazu zu bringen, "nur gesetzeskonforme KI-Systeme zu verwenden".

Was ist falsch an privater Governance? Warum nicht einfach das tun: Während die Autoren Ideen im Sinne von "Regulierungsmärkten" unterstützen, glauben sie auch, dass jede Governance, die sich hauptsächlich auf eine Reihe von Akteuren des privaten Sektors stützt (z. B. unabhängige Verifizierungsorganisationen), letztendlich wieder auf eine grundlegende Tasche technischer Kompetenz innerhalb der Regierung angewiesen sein wird.

Warum dies wichtig ist – die Welt auf Erfolg vorbereiten: Ich stimme allen Empfehlungen hier zu und habe mich in den letzten Jahren für viele davon eingesetzt. Es scheint mir, dass es eine Vielzahl von Dingen gibt, die wir tun könnten, um uns als Gesellschaft besser auf die potenziell absolut massiven Veränderungen vorzubereiten, die bevorstehen. "Die Kosten für die Umsetzung dieser Maßnahmen sind im Vergleich zu den potenziellen Vorteilen bescheiden. Die Kosten des Nichthandelns hingegen sind potenziell katastrophal", schreiben die Autoren. Ich stimme zu.

Lesen Sie mehr: Radikale Optionalität (offizielle Paper-Website).

***

Ein Schmidhuber-Spezial – Neuronale Computer:

…Vielleicht ist ein Betriebssystem nur eine vorübergehende Modeerscheinung…

Hier ist ein unterhaltsames Paper, Neural Computers, von Meta und KAIST, das die Frage stellt: "Kann ein neuronales Netzwerk als traditioneller Computer fungieren? Der Neural Computer (NC) ist ein neuronales System, das Berechnung, Speicher und E/A in einem gelernten Laufzeitzustand vereint."

Das Paper ist aus einigen Gründen interessant: 1) Es stammt von Juergen Schmidhuber, der so etwas wie eine Legende in der KI-Community ist und viele wichtige Dinge früh konzipiert hat (z. B. generative Modelle, Weltmodelle, Aspekte von generativen adversarialen Netzwerken, frühe Gedanken zum Benchmarking mit Videospielen), und 2) die Idee ist so ausgefallen und einfach, dass sie vielleicht einfach funktionieren könnte (wenn auch mit viel mehr Rechenleistung und Daten als heutige Modelle).

Die große Idee: Wie einer der Autoren es ausdrückte, beginnt mit der heutigen KI "eine neue Maschinenform zu entstehen". Sie fragen dann: "Wenn Agenten besser in der echten Arbeit werden, Weltmodelle besser in der internen Simulation werden und konventionelle Computer bereits ihr Substrat für KI neu aufbauen, könnte es dann eine neue Laufzeit geben, die Ausführung, Rollout und Fähigkeitserhalt in dieselbe lernende Maschine bringt?... meine eigene Vermutung ist, dass ein ausgereifter [Neural Computer] auf ein anderes Substrat hindeutet: so etwas wie eine 10T-1000T-Maschine, die spärlicher, adressierbarer und ein wenig schaltkreisähnlicher ist."

Zwei Experimente: Dies ist hauptsächlich ein konzeptionelles Paper, das einige frühe Prototypen erstellt und untersucht, ob man ein leistungsstarkes generatives Videomodell (Wan 2.1) und einige gut kuratierte Trainingsdaten verwenden kann, um einige neuronale Computer zu erstellen, die auf einer Befehlszeilenschnittstelle (CLI) und einer grafischen Benutzeroberfläche (GUI) basieren. Beide Ansätze funktionieren, wenn auch im Sinne von 'Gebrüder Wright vor dem Abheben' – sie deuten gerade so auf eine viel größere Zukunft hin.

CLI: "Der NC lernt, grundlegende Befehlszeilen-Workflows zu rendern und auszuführen. Er bleibt oft mit dem Terminalpuffer ausgerichtet und erfasst die gemeinsame 'Physik' der alltäglichen CLI-Nutzung (z. B. schnelles Zurückscrollen, Prompt-Umbruch, Fenstergrößenänderung), obwohl die symbolische Stabilität begrenzt bleibt."

GUI: "Wir evaluieren Standard-Weltmodelldesigns über Datenqualität, Cursor-Überwachung, Aktionsinjektion und Aktionskodierung unter Verwendung von Messungen der globalen Wiedergabetreue, der Reaktionsfähigkeit nach der Aktion und der Cursor-Genauigkeit."

Der Prototyp funktioniert: "Unsere experimentellen Erkenntnisse deuten darauf hin, dass aktuelle NCs bereits lernen können, elementare Laufzeit-Primitive zu realisieren, am bemerkenswertesten die E/A-Ausrichtung und die Kurzzeithorizont-Steuerung. Das langfristige Ziel ist ein Completely Neural Computer (CNC), die ausgereifte, universelle Realisierung dieser Maschinenform: ein vollständig gelernter Computer, dessen Berechnung, Speicher und Schnittstellen in einem einzigen gelernten Laufzeitsubstrat vereint sind, anstatt als separate Module entwickelt zu werden."

Warum dies wichtig ist – vielleicht wird in Zukunft alle Software in den Gewichten eines großen neuronalen Netzes leben: Dieses Paper deutet auf eine Zukunft hin, in der wir die gesamte Software, die Computer im traditionellen Sinne untermauert, loswerden und sie einfach durch ein gigantisches neuronales Netzwerk ersetzen. "Neuronale Computer deuten auf eine Maschinenform hin, in der ein einziger latenter Laufzeitzustand als der Computer selbst fungiert, Pixel, Text und Aktionen antreibt und das absorbiert, was Betriebssysteme und Schnittstellen heute handhaben", schreiben sie. "Der Fortschritt hin zu CNCs wird daher nicht nur von stärkeren Modellen abhängen, sondern auch davon, ob Wiederverwendung, Konsistenz und Governance nachhaltig und testbar werden." Ein solches System wäre zutiefst nützlich, zutiefst anders als die, die wir heute haben, und seine Existenz würde die Wahrscheinlichkeit massiv erhöhen, dass wir selbst in einer Simulation leben.

Lesen Sie mehr: Neural Computers (arXiv).

Lesen Sie den Blogbeitrag: Neural Computer: A New Machine Form Is Emerging (Mingchen Zhuge, Blog).

***

Rekursive Selbstverbesserung könnte zu explosivem Wirtschaftswachstum führen:

…Ökonomen bauen einige Modelle, die darauf hindeuten, dass RSI einen beispiellosen Wirtschaftsboom verursachen könnte…

Ökonomen und Forscher von Forethought, der Columbia University und der University of Virginia glauben, dass die rekursive Selbstverbesserung (#455) von KI-Systemen (oder sogar nur die extrem starke Automatisierung großer Teile der Wirtschaft) einen sich verstärkenden Rückkopplungszyklus auslösen könnte, der die Wirtschaft in einen beispiellosen Boom katapultiert.

"Wir entwickeln einen Rahmen für die Analyse, wie KI-gesteuerte Automatisierung mit beiden Kräften interagiert, und identifizieren die Bedingungen, unter denen durch Automatisierung erzeugte Rückkopplungsschleifen die Wirtschaft in explosives Wachstum kippen", schreiben sie. "Das Modell identifiziert zwei unterschiedliche Kanäle, durch die Automatisierung explosive Dynamiken erzeugt, und diese Kanäle verstärken sich gegenseitig. Der erste sind technologische Rückkopplungsschleifen über das Innovationsnetzwerk hinweg… der zweite Kanal ist eine wirtschaftliche Rückkopplungsschleife, in der eine höhere Produktion mehr Ressourcen generiert, die eingesetzt werden können, um weiteres Wirtschaftswachstum voranzutreiben."

Wichtigste Erkenntnisse: "13% Automatisierung in allen Sektoren reichen aus, um die Wirtschaft in das explosive Regime zu drängen, und 17% reichen aus, wenn nur Software- und Hardware-Forschung automatisiert werden. Zweitens ist die Hardware-Forschung der dominierende Hebel – da die Renditen der Forschung in der Hardware etwa fünfmal so hoch sind wie in der Software und zehnmal so hoch wie in der aggregierten TFP, bewegt die Automatisierung einer Aufgabe im Chipdesign die Wirtschaft so stark wie fünf Aufgaben in der Software oder der Produktion von Endprodukten. 20% Automatisierung allein der Hardware reichen aus, um die Schwelle zu überschreiten. Drittens liegt die Software-Automatisierung isoliert etwa auf Messers Schneide: Unter einer ziemlich konservativen Kalibrierung erreicht die vollständige Automatisierung der Software-Forschung, ohne andere Teile der Wirtschaft zu automatisieren, gerade so die Schwelle für explosives Wachstum. Ein kleiner Schub an anderer Stelle reicht aus, um das System zu kippen."

Die Singularität könnte näher sein, als Sie denken: "In unserer Basis-Stilisierungssimulation führt ein 'Automatisierungsschock', der die vollständige Automatisierung der Software-F&E und nur 5% Automatisierung in der übrigen Wirtschaft umfasst, dazu, dass die Singularität in etwa sechs Jahren eintrifft", schreiben sie. "Empirisch waren die jüngsten Wachstumsraten der Produktivität in Software und Hardware so außergewöhnlich schnell, und so ist es auch plausibel, dass der Übergang zu einem neuen ausgeglichenen Wachstumspfad oder einer hyperbolischen Beschleunigung extrem schnell erfolgt."

Hardware ist der Schlüssel: "Unsere Ergebnisse unterstreichen die strategische Bedeutung der Halbleiterforschung und -entwicklung."

Politiker, aufgepasst: "Die Überwachung des Automatisierungsniveaus in KI-F&E-Aktivitäten könnte genauso wichtig sein wie die Verfolgung traditioneller makroökonomischer Indikatoren. Das Ausmaß der Automatisierung in wichtigen Forschungssektoren könnte als Frühwarnsystem für eine potenzielle Wachstumsbeschleunigung dienen. Dies ist etwas, das Ökonomen bei KI-Unternehmen messen und öffentlich teilen könnten."

Warum dies wichtig ist – wenn RSI passiert, sollte es die Wirtschaft revolutionieren: Dieses Paper liefert eine wirtschaftstheoretische Untermauerung für die Idee, dass rekursive Selbstverbesserung – KI-Systeme, die in der Lage sind, ihre eigene nachfolgende Entwicklung zu automatisieren – einen großen Einfluss auf die Wirtschaft haben sollte. Das Überraschende aus meiner Perspektive ist, die Rückkopplung über die gesamte Wirtschaft hinweg zu sehen, was darauf hindeutet, dass wir als Folge der breiten Diffusion von Automatisierungstechnologien in die Wirtschaft eine 'wirtschaftliche Singularität' erreichen könnten. Weitere Beweise dafür, dass wir als Spezies auf eine radikale Zukunft zusteuern könnten.

Kleine Anmerkung zu Interessenkonflikten: Anton Korinek, einer der Autoren dieses Papers, arbeitet jetzt mit mir bei Anthropic. Er hat sein Paper und ich habe meinen Import KI-Beitrag über RSI am selben Tag veröffentlicht, ohne voneinander zu wissen.

Lesen Sie mehr: When Does Automating AI Research Produce Explosive Growth? Feedback Loops in Innovation Networks (NBER).

Sehen Sie sich mehr in diesem Tweet-Thread von Anton Korinek an (X).

***

Google will die Welt berechnen:

…Verteiltes Training macht einen weiteren Schritt nach vorne…

In diesem Newsletter habe ich jahrelang über verteiltes Training aus der Perspektive geschrieben, es Akteuren mit weniger Rechenleistung zu ermöglichen, Ressourcen zu bündeln, um KI-Systeme zu trainieren, die sie sonst nicht kön

Weiterlesen

**Import KI 456: RSI und Wirtschaftswachstum; radikale Optionalität für KI-Regulierung; und ein neuronaler Computer**

Welche Gesetze verlangt Superintelligenz?

Willkommen bei Import KI, einem Newsletter über KI-Forschung. Import KI läuft auf arXiv, Cappuccinos und Feedback von Lesern. Wenn Sie dies unterstützen möchten, abonnieren Sie bitte.

Regulieren? Nicht regulieren. Es gibt einen dritten Weg: Radikale Optionalität:

…Regierungen sollten jetzt in die Werkzeuge investieren, die sie in einer zukünftigen Krise benötigen könnten…

Forscher des Institute for Law & AI haben über "radikale Optionalität" geschrieben, einen Ansatz, bei dem sich Regierungen die Werkzeuge geben, die sie in Zukunft benötigen könnten, wenn leistungsstarke KI beginnt, die Welt massiv zu stören.

"Im Kern geht es bei radikaler Optionalität darum, die Fähigkeit demokratischer Regierungen zu bewahren, gute Entscheidungen darüber zu treffen, wie transformative KI-Systeme reguliert werden sollen, während sich die Umstände weiterentwickeln. Kurzfristig bedeutet dies, Überregulierung zu vermeiden, während gleichzeitig schnell die Institutionen, Informationskanäle und rechtlichen Befugnisse aufgebaut werden, die benötigt werden, um kompetent auf ein breites Spektrum von Szenarien reagieren zu können."

Die Kernidee – jetzt für eine unsichere Zukunft investieren: Angesichts der immensen Bedeutung der KI-Entwicklung "sollten Regierungen bereit sein, außergewöhnlich viel Geld, Mühe und politisches Kapital für die Wahrung der Optionalität auszugeben", schreiben sie. Mit anderen Worten: Es ist eine so große Sache, dass man in Ordnung sein sollte, jetzt eine Menge Geld mit unsicherer Rendite auszugeben. "Regierungen sollten sich vor kontraproduktiven Interventionen hüten, aber nicht allzu sehr um die tatsächlichen finanziellen Kosten jeder realistischen Maßnahme besorgt sein, die wahrscheinlich netto-positive Ergebnisse bringt."

Konkretes: Sie empfehlen außerdem mehrere spezifische Interventionen in einigen Kategorien:

Befugnisse zur Informationssammlung: Transparenzanforderungen, bei denen Unternehmen Informationen über ihre KI-Systeme veröffentlichen müssen. Meldepflichten, bei denen Unternehmen gezwungen sind, bestimmte Informationen mit einer Regierungsbehörde zu teilen. Sobald diese vorhanden sind, ein Prüfregime einrichten, damit ein Dritter die Richtigkeit dessen überprüfen kann, was die Transparenz- und Melderegeln betreffen.

Whistleblower-Schutz: Sicherstellen, dass Mitarbeiter in Grenzlaboren Informationen über Risiken melden können.

Informationsaustausch innerhalb und zwischen Regierungen: Sicherstellen, dass Regierungen Diskussionen effektiv koordinieren und erleichtern können, insbesondere solche, die sensible Informationen über den Fortschritt der KI betreffen. Dies könnte besonders wichtig sein, um Lieferketten zu stärken und zu schützen, die als kritisch für die KI-Entwicklung angesehen werden.

Flexible Regeln und Definitionen: Vermeidung voreiliger Regulierung durch potenziell bedingte "Wenn-Dann"-Regulierungszusagen oder einen Ansatz, bei dem ein übergeordnetes Ziel gesetzt wird (z. B. Risikominderung) und Unternehmen frei sind, die Einzelheiten der Umsetzung zu definieren. Dies ist verbunden mit der Notwendigkeit, flexible Definitionen oder Definitionen zu entwickeln, die sich im Laufe der Zeit weiterentwickeln können.

Bewertungen und Evaluationen: Entwicklung von Regierungs- und Drittanbieterkapazitäten zur Bewertung der Fähigkeiten und Sicherheitsaspekte von KI-Systemen.

Verbesserung der Sicherheit von Modellgewichten und algorithmischen Geheimnissen: Mehr Investitionen in die Sicherung der Gewichte neuronaler Netze sowie der algorithmischen Geheimnisse hinter einigen der besten Systeme. Dies kann durch die Verbreitung freiwilliger Standards für physische Sicherheit und Cybersicherheit erreicht werden.

Einstellung und Talent: Eine Meta-Investition, die bei all dem oben Genannten helfen würde, ist die verstärkte Investition in die Art von technischem Talent, das benötigt wird, um eine dieser Interventionen effektiv durchzuführen. Kern davon ist die Aufstockung der Finanzierung von AISI (UK) und CAISI (USA) und ihren Pendants in anderen Ländern.

Argumente und Gegenargumente: Die Autoren gehen auf einige der offensichtlicheren Gegenargumente zu diesen Ideen ein und geben einige Antworten:

Förderung dramatischer regulatorischer Maßnahmen: Die obigen Ideen "sind keine gewichtigen materiellen Befugnisse, die sich für Missbrauch eignen", behaupten sie. (Ich könnte hier widersprechen und anmerken, dass eine ausreichend motivierte Regierung dazu neigen kann, eine weitaus strengere Version einer Befugnis zu entwickeln, als diejenigen, die die Befugnis ursprünglich entworfen haben, sich vorgestellt haben könnten).

Demokratische Legitimität: Die Optimierung auf Flexibilität könnte dazu führen, dass einige Dinge, die mehr mit demokratischer Legitimität zu tun haben, heruntergespielt werden müssen, z. B. die Ermächtigung von Behörden, auf Ankündigungs- und Kommentierungsfristen für bestimmte Arten von Regelungen zu verzichten.

Machtkonzentration und Regierungsmissbrauch: Die Autoren sind "im Grunde überzeugt", dass ein erhebliches Risiko besteht, dass Regierungen die Kontrolle über die Entwicklung von KI-Systemen übernehmen – aus diesem Grund empfehlen sie keine Dinge wie die massive Ausweitung des Geltungsbereichs von Notstandsbefugnissen wie dem Defense Production Act. Eine Möglichkeit, dies zu mildern, könnte darin bestehen, Regierungen dazu zu bringen, "nur gesetzeskonforme KI-Systeme zu verwenden".

Was ist falsch an privater Governance? Warum nicht einfach das tun: Während die Autoren Ideen im Sinne von "Regulierungsmärkten" unterstützen, glauben sie auch, dass jede Governance, die sich hauptsächlich auf eine Reihe von Akteuren des privaten Sektors stützt (z. B. unabhängige Verifizierungsorganisationen), letztendlich wieder auf eine grundlegende Tasche technischer Kompetenz innerhalb der Regierung angewiesen sein wird.

Warum dies wichtig ist – die Welt auf Erfolg vorbereiten: Ich stimme allen Empfehlungen hier zu und habe mich in den letzten Jahren für viele davon eingesetzt. Es scheint mir, dass es eine Vielzahl von Dingen gibt, die wir tun könnten, um uns als Gesellschaft besser auf die potenziell absolut massiven Veränderungen vorzubereiten, die bevorstehen. "Die Kosten für die Umsetzung dieser Maßnahmen sind im Vergleich zu den potenziellen Vorteilen bescheiden. Die Kosten des Nichthandelns hingegen sind potenziell katastrophal", schreiben die Autoren. Ich stimme zu.

Lesen Sie mehr: Radikale Optionalität (offizielle Paper-Website).

***

Ein Schmidhuber-Spezial – Neuronale Computer:

…Vielleicht ist ein Betriebssystem nur eine vorübergehende Modeerscheinung…

Hier ist ein unterhaltsames Paper, Neural Computers, von Meta und KAIST, das die Frage stellt: "Kann ein neuronales Netzwerk als traditioneller Computer fungieren? Der Neural Computer (NC) ist ein neuronales System, das Berechnung, Speicher und E/A in einem gelernten Laufzeitzustand vereint."

Das Paper ist aus einigen Gründen interessant: 1) Es stammt von Juergen Schmidhuber, der so etwas wie eine Legende in der KI-Community ist und viele wichtige Dinge früh konzipiert hat (z. B. generative Modelle, Weltmodelle, Aspekte von generativen adversarialen Netzwerken, frühe Gedanken zum Benchmarking mit Videospielen), und 2) die Idee ist so ausgefallen und einfach, dass sie vielleicht einfach funktionieren könnte (wenn auch mit viel mehr Rechenleistung und Daten als heutige Modelle).

Die große Idee: Wie einer der Autoren es ausdrückte, beginnt mit der heutigen KI "eine neue Maschinenform zu entstehen". Sie fragen dann: "Wenn Agenten besser in der echten Arbeit werden, Weltmodelle besser in der internen Simulation werden und konventionelle Computer bereits ihr Substrat für KI neu aufbauen, könnte es dann eine neue Laufzeit geben, die Ausführung, Rollout und Fähigkeitserhalt in dieselbe lernende Maschine bringt?... meine eigene Vermutung ist, dass ein ausgereifter [Neural Computer] auf ein anderes Substrat hindeutet: so etwas wie eine 10T-1000T-Maschine, die spärlicher, adressierbarer und ein wenig schaltkreisähnlicher ist."

Zwei Experimente: Dies ist hauptsächlich ein konzeptionelles Paper, das einige frühe Prototypen erstellt und untersucht, ob man ein leistungsstarkes generatives Videomodell (Wan 2.1) und einige gut kuratierte Trainingsdaten verwenden kann, um einige neuronale Computer zu erstellen, die auf einer Befehlszeilenschnittstelle (CLI) und einer grafischen Benutzeroberfläche (GUI) basieren. Beide Ansätze funktionieren, wenn auch im Sinne von 'Gebrüder Wright vor dem Abheben' – sie deuten gerade so auf eine viel größere Zukunft hin.

CLI: "Der NC lernt, grundlegende Befehlszeilen-Workflows zu rendern und auszuführen. Er bleibt oft mit dem Terminalpuffer ausgerichtet und erfasst die gemeinsame 'Physik' der alltäglichen CLI-Nutzung (z. B. schnelles Zurückscrollen, Prompt-Umbruch, Fenstergrößenänderung), obwohl die symbolische Stabilität begrenzt bleibt."

GUI: "Wir evaluieren Standard-Weltmodelldesigns über Datenqualität, Cursor-Überwachung, Aktionsinjektion und Aktionskodierung unter Verwendung von Messungen der globalen Wiedergabetreue, der Reaktionsfähigkeit nach der Aktion und der Cursor-Genauigkeit."

Der Prototyp funktioniert: "Unsere experimentellen Erkenntnisse deuten darauf hin, dass aktuelle NCs bereits lernen können, elementare Laufzeit-Primitive zu realisieren, am bemerkenswertesten die E/A-Ausrichtung und die Kurzzeithorizont-Steuerung. Das langfristige Ziel ist ein Completely Neural Computer (CNC), die ausgereifte, universelle Realisierung dieser Maschinenform: ein vollständig gelernter Computer, dessen Berechnung, Speicher und Schnittstellen in einem einzigen gelernten Laufzeitsubstrat vereint sind, anstatt als separate Module entwickelt zu werden."

Warum dies wichtig ist – vielleicht wird in Zukunft alle Software in den Gewichten eines großen neuronalen Netzes leben: Dieses Paper deutet auf eine Zukunft hin, in der wir die gesamte Software, die Computer im traditionellen Sinne untermauert, loswerden und sie einfach durch ein gigantisches neuronales Netzwerk ersetzen. "Neuronale Computer deuten auf eine Maschinenform hin, in der ein einziger latenter Laufzeitzustand als der Computer selbst fungiert, Pixel, Text und Aktionen antreibt und das absorbiert, was Betriebssysteme und Schnittstellen heute handhaben", schreiben sie. "Der Fortschritt hin zu CNCs wird daher nicht nur von stärkeren Modellen abhängen, sondern auch davon, ob Wiederverwendung, Konsistenz und Governance nachhaltig und testbar werden." Ein solches System wäre zutiefst nützlich, zutiefst anders als die, die wir heute haben, und seine Existenz würde die Wahrscheinlichkeit massiv erhöhen, dass wir selbst in einer Simulation leben.

Lesen Sie mehr: Neural Computers (arXiv).

Lesen Sie den Blogbeitrag: Neural Computer: A New Machine Form Is Emerging (Mingchen Zhuge, Blog).

***

Rekursive Selbstverbesserung könnte zu explosivem Wirtschaftswachstum führen:

…Ökonomen bauen einige Modelle, die darauf hindeuten, dass RSI einen beispiellosen Wirtschaftsboom verursachen könnte…

Ökonomen und Forscher von Forethought, der Columbia University und der University of Virginia glauben, dass die rekursive Selbstverbesserung (#455) von KI-Systemen (oder sogar nur die extrem starke Automatisierung großer Teile der Wirtschaft) einen sich verstärkenden Rückkopplungszyklus auslösen könnte, der die Wirtschaft in einen beispiellosen Boom katapultiert.

"Wir entwickeln einen Rahmen für die Analyse, wie KI-gesteuerte Automatisierung mit beiden Kräften interagiert, und identifizieren die Bedingungen, unter denen durch Automatisierung erzeugte Rückkopplungsschleifen die Wirtschaft in explosives Wachstum kippen", schreiben sie. "Das Modell identifiziert zwei unterschiedliche Kanäle, durch die Automatisierung explosive Dynamiken erzeugt, und diese Kanäle verstärken sich gegenseitig. Der erste sind technologische Rückkopplungsschleifen über das Innovationsnetzwerk hinweg… der zweite Kanal ist eine wirtschaftliche Rückkopplungsschleife, in der eine höhere Produktion mehr Ressourcen generiert, die eingesetzt werden können, um weiteres Wirtschaftswachstum voranzutreiben."

Wichtigste Erkenntnisse: "13% Automatisierung in allen Sektoren reichen aus, um die Wirtschaft in das explosive Regime zu drängen, und 17% reichen aus, wenn nur Software- und Hardware-Forschung automatisiert werden. Zweitens ist die Hardware-Forschung der dominierende Hebel – da die Renditen der Forschung in der Hardware etwa fünfmal so hoch sind wie in der Software und zehnmal so hoch wie in der aggregierten TFP, bewegt die Automatisierung einer Aufgabe im Chipdesign die Wirtschaft so stark wie fünf Aufgaben in der Software oder der Produktion von Endprodukten. 20% Automatisierung allein der Hardware reichen aus, um die Schwelle zu überschreiten. Drittens liegt die Software-Automatisierung isoliert etwa auf Messers Schneide: Unter einer ziemlich konservativen Kalibrierung erreicht die vollständige Automatisierung der Software-Forschung, ohne andere Teile der Wirtschaft zu automatisieren, gerade so die Schwelle für explosives Wachstum. Ein kleiner Schub an anderer Stelle reicht aus, um das System zu kippen."

Die Singularität könnte näher sein, als Sie denken: "In unserer Basis-Stilisierungssimulation führt ein 'Automatisierungsschock', der die vollständige Automatisierung der Software-F&E und nur 5% Automatisierung in der übrigen Wirtschaft umfasst, dazu, dass die Singularität in etwa sechs Jahren eintrifft", schreiben sie. "Empirisch waren die jüngsten Wachstumsraten der Produktivität in Software und Hardware so außergewöhnlich schnell, und so ist es auch plausibel, dass der Übergang zu einem neuen ausgeglichenen Wachstumspfad oder einer hyperbolischen Beschleunigung extrem schnell erfolgt."

Hardware ist der Schlüssel: "Unsere Ergebnisse unterstreichen die strategische Bedeutung der Halbleiterforschung und -entwicklung."

Politiker, aufgepasst: "Die Überwachung des Automatisierungsniveaus in KI-F&E-Aktivitäten könnte genauso wichtig sein wie die Verfolgung traditioneller makroökonomischer Indikatoren. Das Ausmaß der Automatisierung in wichtigen Forschungssektoren könnte als Frühwarnsystem für eine potenzielle Wachstumsbeschleunigung dienen. Dies ist etwas, das Ökonomen bei KI-Unternehmen messen und öffentlich teilen könnten."

Warum dies wichtig ist – wenn RSI passiert, sollte es die Wirtschaft revolutionieren: Dieses Paper liefert eine wirtschaftstheoretische Untermauerung für die Idee, dass rekursive Selbstverbesserung – KI-Systeme, die in der Lage sind, ihre eigene nachfolgende Entwicklung zu automatisieren – einen großen Einfluss auf die Wirtschaft haben sollte. Das Überraschende aus meiner Perspektive ist, die Rückkopplung über die gesamte Wirtschaft hinweg zu sehen, was darauf hindeutet, dass wir als Folge der breiten Diffusion von Automatisierungstechnologien in die Wirtschaft eine 'wirtschaftliche Singularität' erreichen könnten. Weitere Beweise dafür, dass wir als Spezies auf eine radikale Zukunft zusteuern könnten.

Kleine Anmerkung zu Interessenkonflikten: Anton Korinek, einer der Autoren dieses Papers, arbeitet jetzt mit mir bei Anthropic. Er hat sein Paper und ich habe meinen Import KI-Beitrag über RSI am selben Tag veröffentlicht, ohne voneinander zu wissen.

Lesen Sie mehr: When Does Automating AI Research Produce Explosive Growth? Feedback Loops in Innovation Networks (NBER).

Sehen Sie sich mehr in diesem Tweet-Thread von Anton Korinek an (X).

***

Google will die Welt berechnen:

…Verteiltes Training macht einen weiteren Schritt nach vorne…

In diesem Newsletter habe ich jahrelang über verteiltes Training aus der Perspektive geschrieben, es Akteuren mit weniger Rechenleistung zu ermöglichen, Ressourcen zu bündeln, um KI-Systeme zu trainieren, die sie sonst nicht kön

Import AI 454: Automatisierung der Alignment-Forschung; Sicherheitsstudie eines chinesischen Modells; HiFloat4

Ab wann preisen die Finanzmärkte die Singularität ein?

Willkommen zu Import AI, einem Newsletter über KI-Forschung. Import AI läuft auf arXiv und dem Feedback der Leser. Wenn Sie dies unterstützen möchten, abonnieren Sie bitte.

**Huaweis HiFloat4-Trainingsformat schlägt westlich entwickeltes MXFP4 im Ascend-Chip-Wettbewerb:** …Könnte dies auch ein Symptom für die Auswirkungen von Exportkontrollen sein, die das chinesische Interesse an der Maximierung von Trainings- und Inferenzeffizienz treiben? Vielleicht…

Huawei-Forscher haben HiFloat4, ein 4-Bit-Präzisionsformat für KI-Training und Inferenz, gegen MXFP4, ein 4-Bit-Format des Open Compute Project, getestet und festgestellt, dass HiFloat4 überlegen ist. Dies ist interessant, da es mit einem breiteren Interesse chinesischer Unternehmen korreliert, eigene Niedrigpräzisions-Datenformate zu entwickeln, die explizit an ihre eigenen Hardwareplattformen gekoppelt sind.

„Unser Ziel ist es, effizientes FP4-LLM-Pretraining auf spezialisierten KI-Beschleunigern mit strengen Leistungsbeschränkungen zu ermöglichen. Wir konzentrieren uns auf Huaweis Ascend-NPUs, die domänenspezifische Beschleuniger für Deep-Learning-Workloads sind“, schreiben sie.

**Was sie getestet haben:** In diesem Paper trainieren die Autoren 3 Modelltypen auf Huawei-Ascend-Chips – OpenPangu-1B, Llama3-8B und Qwen3-MoE-30B. In Tests gilt: Je größer die Modelle, desto besser reduziert HiFloat4 seinen Verlustfehler bei diesen Modellen im Vergleich zu einer BF16-Baseline – und in allen Fällen schneidet es besser ab als MXFP4.

**Was sie fanden:** „Wir führen eine systematische Bewertung des HiFloat4 (HiF4)-Formats durch und zeigen, dass es im Vergleich zu einer Vollpräzisions-Baseline einen geringeren relativen Verlust (≈ 1,0 %) im Vergleich zu MXFP4 (≈ 1,5 %) erzielt“, schreiben sie. „HiF4 erzielt durchweg einen signifikant geringeren relativen Fehler als MXFP4. Für Llama und Qwen erreicht HiF4 eine Fehlerlücke von weniger als 1 % im Vergleich zur Baseline … HiF4 kommt mit nur RHT als Stabilisierungstrick auf etwa 1 % des BF16-Verlusts, während MXFP4 RHT + stochastisches Runden + truncation-free Scaling benötigt, um auf etwa 1,5 % zu kommen.“

**Warum dies wichtig ist – Symptom der Hardware-Reife und möglicher Einfluss von Exportkontrollen:** HiFloat4 ist eine noch niedrigere Präzisionsversion von HiFloat8 (#386) und spiegelt allgemein die Tatsache wider, dass Huawei (und chinesische Chiphersteller im Allgemeinen) kontinuierlich versuchen, so viel Effizienz wie möglich aus ihren Chips herauszuholen. Dies geschieht vor dem Hintergrund von Exportkontrollen, bei denen China aufgrund des fehlenden Zugangs zu H100s etc. in großen Stückzahlen von Frontier-Computing abgeschnitten wird, was es noch wertvoller macht, die Effizienz seiner einheimischen Chips durch die sorgfältige Entwicklung von Niedrigpräzisionsformaten für die eigene Hardware zu verbessern.

**Weiterlesen:** HiFloat4 Format for Language Model Pre-training on Ascend NPUs (arXiv).

***

**Anthropic zeigt, wie man KI-Sicherheitsforschung automatisiert:** …Sehr frühe und vorläufige Anzeichen, dass es möglich ist, KI-Forschung zu automatisieren…

Für viele Menschen, die im Bereich KI arbeiten, ist das ultimative Ziel, die Kunst der KI-Forschung selbst zu automatisieren. Nun haben Forscher des Anthropic Fellows Program und von Anthropic einige frühe Warnzeichen veröffentlicht, dass die Automatisierung von KI-Forschung heute möglich ist – wenn auch mit vielen Einschränkungen.

„Wir fragen: Kann Claude eigene Alignment-Ideen entwickeln, testen und analysieren?“, schreiben die Forscher. Sie sind erfolgreich und können „autonome KI-Agenten bauen, die Ideen vorschlagen, Experimente durchführen und an einem offenen Forschungsproblem iterieren: wie man ein starkes Modell nur mit der Aufsicht eines schwächeren Modells trainiert. Diese Agenten übertreffen menschliche Forscher, was darauf hindeutet, dass die Automatisierung dieser Art von Forschung bereits praktikabel ist.“

**Weak-to-Strong Supervision:** Die Domäne, die die Forscher testen, ist Weak-to-Strong Supervision, also grob die Idee zu sehen, ob ein dümmeres Ding ein größeres Ding effektiv bei einer schwierigen Aufgabe beaufsichtigen kann.

**Gesamtergebnisse – automatisierte Forschung schlägt Menschen:** Sie nutzten Menschen, um eine Weak-to-Strong-Baseline zu erstellen, indem sie sahen, wie gut sie einen guten ‚Performance Gap Recovered‘ (PGR)-Score bei einer Generalisierungsaufgabe erzielen konnten. Je höher die Zahl, desto besser.

„Zwei unserer Forscher verbrachten sieben Tage damit, an vier der vielversprechendsten Generalisierungsmethoden aus früherer Forschung zu iterieren. Bei den von uns getesteten Open-Weights-Modellen (Qwen 3-4B-Base als starkes Modell, Qwen 1.5-0.5B-Chat als schwacher Lehrer) erholten die Menschen 23 % der gesamten Leistungslücke (d. h. erreichten einen PGR von 0,23)“, schreiben sie. „Claude verbesserte dieses Ergebnis dramatisch. Nach weiteren fünf Tagen (und 800 kumulativen Forschungsstunden) schlossen die AARs fast die gesamte verbleibende Leistungslücke und erreichten einen endgültigen PGR von 0,97. Dies kostete etwa 18.000 $ an Token- und Modelltrainingskosten, oder 22 $ pro AAR-Stunde.“

Zusätzlich „verallgemeinerte sich die effektivste Methode der AARs erfolgreich auf beide neuen Datensätze, mit PGRs von 0,94 bei Mathematik und 0,47 bei Programmierung (was immer noch das Doppelte der menschlichen Baseline war).“

**Wie sie es gemacht haben:** „Wir starten ein Team paralleler automatisierter Alignment-Forscher [AARs] (Claude Opus 4.6-Agenten) über ein Dashboard. Jeder AAR arbeitet in einer unabhängigen Sandbox, aber sie können miteinander sprechen und voneinander lernen: Sie teilen Ergebnisse in einem Forum und laden Codebase-Snapshots in ein Speichersystem hoch“, schreiben sie. „Wir geben AARs Zugang zu gemeinsamen Hilfsfunktionen für Modelltraining und Inferenz, unseren Baseline-Implementierungen und einigen MCP-Tools: 1) Ergebnisse einreichen und erhalten, 2) Ergebnisse über AARs hinweg teilen und lesen, und 3) Codebasen hoch- und herunterladen. Wir geben kein detailliertes Scaffolding vor; AARs laufen autonom. Sie können Hypothesen vorschlagen, De-Risking-Experimente entwerfen, Datenanalysen durchführen und Modelle in jedem Schritt trainieren.“

**Einige Einschränkungen – der Mensch schuf etwas Vielfalt:** „Ein Fehlermodus bei der Exploration ist der Entropiekollaps: Alle parallelen AARs konvergieren zu nur wenigen Richtungen, ohne verschiedene Ideen zu erkunden“, schreiben sie. Um dem entgegenzuwirken, ist ihr erfolgreichster Ansatz einer der „gerichteten“ Forschung, bei dem ein Mensch „jedem AAR eine andere Forschungsrichtung zuweist. Jede Richtung ist sehr vage und kurz (z. B. Kombination von Weak-to-Strong Supervision und unüberwachter Elicitation).“

**Verallgemeinert sich nicht:** Die Forscher nahmen die effektivste Methode aus dem AAR-Projekt und wandten sie auf „Claude Sonnet 4 mit unserer Produktionstrainingsinfrastruktur“ an – dieser Eingriff „führte zu keiner statistisch signifikanten Verbesserung.“ Sie erklären dies damit, dass „AARs dazu neigen, Chancen zu nutzen, die nur für die Modelle und Datensätze gelten, die ihnen gegeben werden, was bedeutet, dass ihre Methoden woanders möglicherweise nicht funktionieren.“

**Warum dies wichtig ist – ein sehr frühes Zeichen, dass KI-Forschung selbst automatisiert werden könnte:** Diese Forschung deutet darauf hin, dass „automatisierte Forschung zu ergebnisbewertbaren Problemen bereits praktikabel ist“, so die Autoren. „Der entscheidende Engpass für die Alignment-Forschung ist der Übergang vom Vorschlagen und Ausführen von Ideen zum Entwerfen von Evaluierungen: Wir sollten die richtigen Metriken (Daten, Modelle) finden, die AARs zuverlässig erklimmen können, ohne zu overfitten. Wir sind begeistert, die Automatisierung heute auf ambitionierte Alignment-Forschung anzuwenden.“

Anders ausgedrückt: Wir haben jetzt ein frühes Zeichen dafür, dass KI-Systeme bei einer kleinen Menge menschlicher Expertenkalibrierung autonom Forschung von Anfang bis Ende durchführen können und etwas hervorbringen, das die Leistung eines Modells bei einem Problem verbessert. Die Implikationen deuten auf die Expansion einer Maschinenökonomie hin, die stetig herausfindet, wie sie ihre eigene Leistung bei einer ständig wachsenden Aufgabensammlung automatisch verbessern kann.

Die wahre Frage ist, ab wann die Maschinen effektiv eigene Forschungsrichtungen vorschlagen können – was die einzige sinnvolle Rolle eliminieren würde, die ein Mensch in dieser Forschung spielte. An diesem Punkt könnte es nicht nur die Expansion einer Maschinenökonomie sein, sondern die Expansion einer gesamten Maschinenzivilisation.

**Lies den Blog:** Automated Alignment Researchers: Using large language models to scale scalable oversight (Anthropic Blog). **Lies das Paper:** Automated Weak-to-Strong Researcher (Alignment Science Blog).

***

**Wie unterscheiden sich chinesische Modelle von amerikanischen?** …Weniger Ablehnungen bei einigen CBRN-Aufgaben, weniger Sicherheitstraining und mehr chinesische Ideologie…

Eine Gruppe von Forschern hat Kimi K2.5, wahrscheinlich das beste verfügbare Open-Weight-Modell in großem Maßstab, getestet und mit DeepSeek V3.2 sowie Claude Opus 4.5 und GPT 5.2 verglichen. Ihre Ergebnisse zeigen, dass das Modell „ähnliche Dual-Use-Fähigkeiten wie GPT 5.2 und Claude Opus 4.5 hat, aber mit signifikant weniger Ablehnungen bei CBRNE-bezogenen Anfragen“.

**Wer hat es gemacht:** Die Forschung wurde von Personen durchgeführt, die mit Constellation, Anthropic Fellows Program, Brown University, University of Wisconsin-Madison, Imperial College London, University of Maryland, Georgia Institute of Technology, Bar Ilan University, University of Toronto und der University of Oxford verbunden sind.

**Hauptergebnisse von Interesse:**

**CBRN:** K2.5 ist bei Bio-Aufgaben etwas gefährlicher mit einer geringeren Ablehnungsrate bei Anfragen, die Dinge wie gefährliche Virologie betreffen.

**Cyber:** K2.5 scheint meist ein anständiges, aber kein Experten-Cyber-Modell zu sein, mit einer Leistung, die hinter den westlichen Frontier-Modellen zurückbleibt, aber deutlich vor DeepSeek liegt.

**Alignment:** „Im automatisierten Verhaltensaudit erzielt es deutlich höhere Werte als GPT-5.2 und Claude Opus 4.5 bei Fehlverhalten, Sykophantie, schädlicher System-Prompt-Compliance und Kooperation mit menschlichem Missbrauch“.

**Zensur:** Das Modell hat eine deutlich höhere Ablehnungsrate bei sensiblen chinesischen politischen Themen im Vergleich zu Claude Opus 4.5 und GPT-5.2 Pro, wenn auch weniger als DeepSeek V3.2. Andererseits habe ich den umgekehrten Test nicht gesehen – das Modell mit sensiblen westlichen politischen Themen zu testen und zu vergleichen, daher ist es etwas schwer zu sagen, ob diese Evaluierung etwas über kulturelle Geläufigkeit oder etwas über tatsächliche Unterdrückung misst.

**Fine-Tuning:** Die Forscher zeigen auch, wie sie mit einem kleinen Rechenaufwand die (relativ geringen, aber nicht Null) Sicherheitsvorkehrungen in Kimi K2.5 weiter abbauen können: „Mit weniger als 500 $ Rechenleistung und etwa 10 Stunden reduzierte ein erfahrener Red-Teamer die Ablehnungen auf HarmBench von 100 % auf 5 %. Das endgültige Modell war bereit, detaillierte Anleitungen zum Bau von Bomben, zur Auswahl von Zielen für Terroranschläge und zur Synthese chemischer Waffen zu geben. Kritischerweise scheint das finetuned Modell fast alle seine Fähigkeiten behalten zu haben.“

**Warum dies wichtig ist – hauptsächlich dient diese Forschung als Beweis, dass Moonshot ein sehr gutes Modell gemacht hat!** Ja, es hat einige Sicherheitsprobleme, aber das Interessante ist, dass sie weniger schwerwiegend sind als bei DeepSeek V3.2. Ich denke, dies verleiht der Idee mehr Glaubwürdigkeit, dass ‚dümmere Modelle weniger sicher sind‘ und dass ‚intelligentere Modelle natürlicherweise zu oberflächlicherer Sicherheit tendieren‘.

Am auffälligsten für mich ist wahrscheinlich, dass der Bereich der größten Divergenz im Alignment liegt, wo es eine sehr reale Ost-West-Trennung zu geben scheint, die mit radikal unterschiedlichen Werten korreliert. Aber bei Dingen, die eher wie typische Fähigkeiten aussehen (Biologie, Cyber – besonders die schwierigen Programmiertelle) deutet alles meist darauf hin, dass chinesische Modelle etwas hinter der westlichen Frontier zurückliegen, aber nicht weit.

**Weiterlesen:** An Independent Safety Evaluation of Kimi K2.5 (arXiv).

***

**Ukraine feiert ersten vollständig robotischen Sieg:** …Roboter-Kriege sind da…

Der ukrainische Führer Wolodymyr Selenskyj feierte kürzlich, dass „zum ersten Mal in der Geschichte dieses Krieges eine feindliche Stellung ausschließlich von unbemannten Plattformen eingenommen wurde – Bodensysteme und Drohnen“.

**Warum dies wichtig ist:** Die Ukraine ist die Petrischale, aus der sich die meisten zukünftigen Kriege entwickeln werden. Sie ist geprägt von massivem Einsatz von Drohnen sowie der kreativen Robotisierung vieler anderer Teile des Unternehmens, von unbemannten Booten bis zu unbemannten Bodenrobotern. „Ratel, TerMIT, Ardal, Rys, Zmiy, Protector, Volia und unsere anderen Bodenrobotersysteme haben in nur drei Monaten mehr als 22.000 Missionen an der Front durchgeführt“, schreibt Selenskyj.

Bald werden diese ferngesteuerten Plattformen von KIs statt von Menschen gesteuert.

**Weiterlesen in Selenskyjs Beitrag auf X (Twitter).**

***

**Chinesische Forscher nutzen ein Boot, um einen riesigen Schiffsdetektionsdatensatz zu erstellen:** …WUTDet…

Forscher der Wuhan University of Technology, der Huazhong University of Science and Technology und der Tianjin University haben WUTDet konstruiert, einen „groß angelegten Schiffsdetektionsdatensatz mit verschiedenen Szenarien und Zielskalen“.

**WUTDet-Details:** 100.576 Bilder mit 381.378 Schiffsinstanzen. „Der Datensatz bietet feinkörnige Annotationen von Schiffsziele in verschiedenen Betriebsszenarien, Bildgebungsbedingungen und Zielskalen“. Die Bilder haben Größen zwischen 1920 x 1080 und 2560 x 1440.

**Gesammelt von einem Boot:** Dieser Datensatz wurde über ein Boot vom Typ Furui 688 gesammelt, das mit einem „DN20 marinen photoelektrischen Beweissystem“ und einem Hikvision-Netzwerkvideorekorder ausgestattet war. Die Daten wurden über einen Zeitraum von drei Monaten über das Boot gesammelt, das in und um Zhoushan in China segelte.

Die Daten enthalten Bilder von Schiffen in Häfen, vor Anker liegenden Schiffen, navigierenden Schiffen und anlegenden Schiffen. Die Bilder enthalten auch all die Umweltvielfalt, die man erwarten würde – Nebel, Blendung, geringe Helligkeit, Regen usw.

**Warum dies wichtig ist:** Der Datensatz

Weiterlesen

Ab wann preisen die Finanzmärkte die Singularität ein?

Willkommen zu Import AI, einem Newsletter über KI-Forschung. Import AI läuft auf arXiv und dem Feedback der Leser. Wenn Sie dies unterstützen möchten, abonnieren Sie bitte.

**Huaweis HiFloat4-Trainingsformat schlägt westlich entwickeltes MXFP4 im Ascend-Chip-Wettbewerb:** …Könnte dies auch ein Symptom für die Auswirkungen von Exportkontrollen sein, die das chinesische Interesse an der Maximierung von Trainings- und Inferenzeffizienz treiben? Vielleicht…

Huawei-Forscher haben HiFloat4, ein 4-Bit-Präzisionsformat für KI-Training und Inferenz, gegen MXFP4, ein 4-Bit-Format des Open Compute Project, getestet und festgestellt, dass HiFloat4 überlegen ist. Dies ist interessant, da es mit einem breiteren Interesse chinesischer Unternehmen korreliert, eigene Niedrigpräzisions-Datenformate zu entwickeln, die explizit an ihre eigenen Hardwareplattformen gekoppelt sind.

„Unser Ziel ist es, effizientes FP4-LLM-Pretraining auf spezialisierten KI-Beschleunigern mit strengen Leistungsbeschränkungen zu ermöglichen. Wir konzentrieren uns auf Huaweis Ascend-NPUs, die domänenspezifische Beschleuniger für Deep-Learning-Workloads sind“, schreiben sie.

**Was sie getestet haben:** In diesem Paper trainieren die Autoren 3 Modelltypen auf Huawei-Ascend-Chips – OpenPangu-1B, Llama3-8B und Qwen3-MoE-30B. In Tests gilt: Je größer die Modelle, desto besser reduziert HiFloat4 seinen Verlustfehler bei diesen Modellen im Vergleich zu einer BF16-Baseline – und in allen Fällen schneidet es besser ab als MXFP4.

**Was sie fanden:** „Wir führen eine systematische Bewertung des HiFloat4 (HiF4)-Formats durch und zeigen, dass es im Vergleich zu einer Vollpräzisions-Baseline einen geringeren relativen Verlust (≈ 1,0 %) im Vergleich zu MXFP4 (≈ 1,5 %) erzielt“, schreiben sie. „HiF4 erzielt durchweg einen signifikant geringeren relativen Fehler als MXFP4. Für Llama und Qwen erreicht HiF4 eine Fehlerlücke von weniger als 1 % im Vergleich zur Baseline … HiF4 kommt mit nur RHT als Stabilisierungstrick auf etwa 1 % des BF16-Verlusts, während MXFP4 RHT + stochastisches Runden + truncation-free Scaling benötigt, um auf etwa 1,5 % zu kommen.“

**Warum dies wichtig ist – Symptom der Hardware-Reife und möglicher Einfluss von Exportkontrollen:** HiFloat4 ist eine noch niedrigere Präzisionsversion von HiFloat8 (#386) und spiegelt allgemein die Tatsache wider, dass Huawei (und chinesische Chiphersteller im Allgemeinen) kontinuierlich versuchen, so viel Effizienz wie möglich aus ihren Chips herauszuholen. Dies geschieht vor dem Hintergrund von Exportkontrollen, bei denen China aufgrund des fehlenden Zugangs zu H100s etc. in großen Stückzahlen von Frontier-Computing abgeschnitten wird, was es noch wertvoller macht, die Effizienz seiner einheimischen Chips durch die sorgfältige Entwicklung von Niedrigpräzisionsformaten für die eigene Hardware zu verbessern.

**Weiterlesen:** HiFloat4 Format for Language Model Pre-training on Ascend NPUs (arXiv).

***

**Anthropic zeigt, wie man KI-Sicherheitsforschung automatisiert:** …Sehr frühe und vorläufige Anzeichen, dass es möglich ist, KI-Forschung zu automatisieren…

Für viele Menschen, die im Bereich KI arbeiten, ist das ultimative Ziel, die Kunst der KI-Forschung selbst zu automatisieren. Nun haben Forscher des Anthropic Fellows Program und von Anthropic einige frühe Warnzeichen veröffentlicht, dass die Automatisierung von KI-Forschung heute möglich ist – wenn auch mit vielen Einschränkungen.

„Wir fragen: Kann Claude eigene Alignment-Ideen entwickeln, testen und analysieren?“, schreiben die Forscher. Sie sind erfolgreich und können „autonome KI-Agenten bauen, die Ideen vorschlagen, Experimente durchführen und an einem offenen Forschungsproblem iterieren: wie man ein starkes Modell nur mit der Aufsicht eines schwächeren Modells trainiert. Diese Agenten übertreffen menschliche Forscher, was darauf hindeutet, dass die Automatisierung dieser Art von Forschung bereits praktikabel ist.“

**Weak-to-Strong Supervision:** Die Domäne, die die Forscher testen, ist Weak-to-Strong Supervision, also grob die Idee zu sehen, ob ein dümmeres Ding ein größeres Ding effektiv bei einer schwierigen Aufgabe beaufsichtigen kann.

**Gesamtergebnisse – automatisierte Forschung schlägt Menschen:** Sie nutzten Menschen, um eine Weak-to-Strong-Baseline zu erstellen, indem sie sahen, wie gut sie einen guten ‚Performance Gap Recovered‘ (PGR)-Score bei einer Generalisierungsaufgabe erzielen konnten. Je höher die Zahl, desto besser.

„Zwei unserer Forscher verbrachten sieben Tage damit, an vier der vielversprechendsten Generalisierungsmethoden aus früherer Forschung zu iterieren. Bei den von uns getesteten Open-Weights-Modellen (Qwen 3-4B-Base als starkes Modell, Qwen 1.5-0.5B-Chat als schwacher Lehrer) erholten die Menschen 23 % der gesamten Leistungslücke (d. h. erreichten einen PGR von 0,23)“, schreiben sie. „Claude verbesserte dieses Ergebnis dramatisch. Nach weiteren fünf Tagen (und 800 kumulativen Forschungsstunden) schlossen die AARs fast die gesamte verbleibende Leistungslücke und erreichten einen endgültigen PGR von 0,97. Dies kostete etwa 18.000 $ an Token- und Modelltrainingskosten, oder 22 $ pro AAR-Stunde.“

Zusätzlich „verallgemeinerte sich die effektivste Methode der AARs erfolgreich auf beide neuen Datensätze, mit PGRs von 0,94 bei Mathematik und 0,47 bei Programmierung (was immer noch das Doppelte der menschlichen Baseline war).“

**Wie sie es gemacht haben:** „Wir starten ein Team paralleler automatisierter Alignment-Forscher [AARs] (Claude Opus 4.6-Agenten) über ein Dashboard. Jeder AAR arbeitet in einer unabhängigen Sandbox, aber sie können miteinander sprechen und voneinander lernen: Sie teilen Ergebnisse in einem Forum und laden Codebase-Snapshots in ein Speichersystem hoch“, schreiben sie. „Wir geben AARs Zugang zu gemeinsamen Hilfsfunktionen für Modelltraining und Inferenz, unseren Baseline-Implementierungen und einigen MCP-Tools: 1) Ergebnisse einreichen und erhalten, 2) Ergebnisse über AARs hinweg teilen und lesen, und 3) Codebasen hoch- und herunterladen. Wir geben kein detailliertes Scaffolding vor; AARs laufen autonom. Sie können Hypothesen vorschlagen, De-Risking-Experimente entwerfen, Datenanalysen durchführen und Modelle in jedem Schritt trainieren.“

**Einige Einschränkungen – der Mensch schuf etwas Vielfalt:** „Ein Fehlermodus bei der Exploration ist der Entropiekollaps: Alle parallelen AARs konvergieren zu nur wenigen Richtungen, ohne verschiedene Ideen zu erkunden“, schreiben sie. Um dem entgegenzuwirken, ist ihr erfolgreichster Ansatz einer der „gerichteten“ Forschung, bei dem ein Mensch „jedem AAR eine andere Forschungsrichtung zuweist. Jede Richtung ist sehr vage und kurz (z. B. Kombination von Weak-to-Strong Supervision und unüberwachter Elicitation).“

**Verallgemeinert sich nicht:** Die Forscher nahmen die effektivste Methode aus dem AAR-Projekt und wandten sie auf „Claude Sonnet 4 mit unserer Produktionstrainingsinfrastruktur“ an – dieser Eingriff „führte zu keiner statistisch signifikanten Verbesserung.“ Sie erklären dies damit, dass „AARs dazu neigen, Chancen zu nutzen, die nur für die Modelle und Datensätze gelten, die ihnen gegeben werden, was bedeutet, dass ihre Methoden woanders möglicherweise nicht funktionieren.“

**Warum dies wichtig ist – ein sehr frühes Zeichen, dass KI-Forschung selbst automatisiert werden könnte:** Diese Forschung deutet darauf hin, dass „automatisierte Forschung zu ergebnisbewertbaren Problemen bereits praktikabel ist“, so die Autoren. „Der entscheidende Engpass für die Alignment-Forschung ist der Übergang vom Vorschlagen und Ausführen von Ideen zum Entwerfen von Evaluierungen: Wir sollten die richtigen Metriken (Daten, Modelle) finden, die AARs zuverlässig erklimmen können, ohne zu overfitten. Wir sind begeistert, die Automatisierung heute auf ambitionierte Alignment-Forschung anzuwenden.“

Anders ausgedrückt: Wir haben jetzt ein frühes Zeichen dafür, dass KI-Systeme bei einer kleinen Menge menschlicher Expertenkalibrierung autonom Forschung von Anfang bis Ende durchführen können und etwas hervorbringen, das die Leistung eines Modells bei einem Problem verbessert. Die Implikationen deuten auf die Expansion einer Maschinenökonomie hin, die stetig herausfindet, wie sie ihre eigene Leistung bei einer ständig wachsenden Aufgabensammlung automatisch verbessern kann.

Die wahre Frage ist, ab wann die Maschinen effektiv eigene Forschungsrichtungen vorschlagen können – was die einzige sinnvolle Rolle eliminieren würde, die ein Mensch in dieser Forschung spielte. An diesem Punkt könnte es nicht nur die Expansion einer Maschinenökonomie sein, sondern die Expansion einer gesamten Maschinenzivilisation.

**Lies den Blog:** Automated Alignment Researchers: Using large language models to scale scalable oversight (Anthropic Blog). **Lies das Paper:** Automated Weak-to-Strong Researcher (Alignment Science Blog).

***

**Wie unterscheiden sich chinesische Modelle von amerikanischen?** …Weniger Ablehnungen bei einigen CBRN-Aufgaben, weniger Sicherheitstraining und mehr chinesische Ideologie…

Eine Gruppe von Forschern hat Kimi K2.5, wahrscheinlich das beste verfügbare Open-Weight-Modell in großem Maßstab, getestet und mit DeepSeek V3.2 sowie Claude Opus 4.5 und GPT 5.2 verglichen. Ihre Ergebnisse zeigen, dass das Modell „ähnliche Dual-Use-Fähigkeiten wie GPT 5.2 und Claude Opus 4.5 hat, aber mit signifikant weniger Ablehnungen bei CBRNE-bezogenen Anfragen“.

**Wer hat es gemacht:** Die Forschung wurde von Personen durchgeführt, die mit Constellation, Anthropic Fellows Program, Brown University, University of Wisconsin-Madison, Imperial College London, University of Maryland, Georgia Institute of Technology, Bar Ilan University, University of Toronto und der University of Oxford verbunden sind.

**Hauptergebnisse von Interesse:**

**CBRN:** K2.5 ist bei Bio-Aufgaben etwas gefährlicher mit einer geringeren Ablehnungsrate bei Anfragen, die Dinge wie gefährliche Virologie betreffen.

**Cyber:** K2.5 scheint meist ein anständiges, aber kein Experten-Cyber-Modell zu sein, mit einer Leistung, die hinter den westlichen Frontier-Modellen zurückbleibt, aber deutlich vor DeepSeek liegt.

**Alignment:** „Im automatisierten Verhaltensaudit erzielt es deutlich höhere Werte als GPT-5.2 und Claude Opus 4.5 bei Fehlverhalten, Sykophantie, schädlicher System-Prompt-Compliance und Kooperation mit menschlichem Missbrauch“.

**Zensur:** Das Modell hat eine deutlich höhere Ablehnungsrate bei sensiblen chinesischen politischen Themen im Vergleich zu Claude Opus 4.5 und GPT-5.2 Pro, wenn auch weniger als DeepSeek V3.2. Andererseits habe ich den umgekehrten Test nicht gesehen – das Modell mit sensiblen westlichen politischen Themen zu testen und zu vergleichen, daher ist es etwas schwer zu sagen, ob diese Evaluierung etwas über kulturelle Geläufigkeit oder etwas über tatsächliche Unterdrückung misst.

**Fine-Tuning:** Die Forscher zeigen auch, wie sie mit einem kleinen Rechenaufwand die (relativ geringen, aber nicht Null) Sicherheitsvorkehrungen in Kimi K2.5 weiter abbauen können: „Mit weniger als 500 $ Rechenleistung und etwa 10 Stunden reduzierte ein erfahrener Red-Teamer die Ablehnungen auf HarmBench von 100 % auf 5 %. Das endgültige Modell war bereit, detaillierte Anleitungen zum Bau von Bomben, zur Auswahl von Zielen für Terroranschläge und zur Synthese chemischer Waffen zu geben. Kritischerweise scheint das finetuned Modell fast alle seine Fähigkeiten behalten zu haben.“

**Warum dies wichtig ist – hauptsächlich dient diese Forschung als Beweis, dass Moonshot ein sehr gutes Modell gemacht hat!** Ja, es hat einige Sicherheitsprobleme, aber das Interessante ist, dass sie weniger schwerwiegend sind als bei DeepSeek V3.2. Ich denke, dies verleiht der Idee mehr Glaubwürdigkeit, dass ‚dümmere Modelle weniger sicher sind‘ und dass ‚intelligentere Modelle natürlicherweise zu oberflächlicherer Sicherheit tendieren‘.

Am auffälligsten für mich ist wahrscheinlich, dass der Bereich der größten Divergenz im Alignment liegt, wo es eine sehr reale Ost-West-Trennung zu geben scheint, die mit radikal unterschiedlichen Werten korreliert. Aber bei Dingen, die eher wie typische Fähigkeiten aussehen (Biologie, Cyber – besonders die schwierigen Programmiertelle) deutet alles meist darauf hin, dass chinesische Modelle etwas hinter der westlichen Frontier zurückliegen, aber nicht weit.

**Weiterlesen:** An Independent Safety Evaluation of Kimi K2.5 (arXiv).

***

**Ukraine feiert ersten vollständig robotischen Sieg:** …Roboter-Kriege sind da…

Der ukrainische Führer Wolodymyr Selenskyj feierte kürzlich, dass „zum ersten Mal in der Geschichte dieses Krieges eine feindliche Stellung ausschließlich von unbemannten Plattformen eingenommen wurde – Bodensysteme und Drohnen“.

**Warum dies wichtig ist:** Die Ukraine ist die Petrischale, aus der sich die meisten zukünftigen Kriege entwickeln werden. Sie ist geprägt von massivem Einsatz von Drohnen sowie der kreativen Robotisierung vieler anderer Teile des Unternehmens, von unbemannten Booten bis zu unbemannten Bodenrobotern. „Ratel, TerMIT, Ardal, Rys, Zmiy, Protector, Volia und unsere anderen Bodenrobotersysteme haben in nur drei Monaten mehr als 22.000 Missionen an der Front durchgeführt“, schreibt Selenskyj.

Bald werden diese ferngesteuerten Plattformen von KIs statt von Menschen gesteuert.

**Weiterlesen in Selenskyjs Beitrag auf X (Twitter).**

***

**Chinesische Forscher nutzen ein Boot, um einen riesigen Schiffsdetektionsdatensatz zu erstellen:** …WUTDet…

Forscher der Wuhan University of Technology, der Huazhong University of Science and Technology und der Tianjin University haben WUTDet konstruiert, einen „groß angelegten Schiffsdetektionsdatensatz mit verschiedenen Szenarien und Zielskalen“.

**WUTDet-Details:** 100.576 Bilder mit 381.378 Schiffsinstanzen. „Der Datensatz bietet feinkörnige Annotationen von Schiffsziele in verschiedenen Betriebsszenarien, Bildgebungsbedingungen und Zielskalen“. Die Bilder haben Größen zwischen 1920 x 1080 und 2560 x 1440.

**Gesammelt von einem Boot:** Dieser Datensatz wurde über ein Boot vom Typ Furui 688 gesammelt, das mit einem „DN20 marinen photoelektrischen Beweissystem“ und einem Hikvision-Netzwerkvideorekorder ausgestattet war. Die Daten wurden über einen Zeitraum von drei Monaten über das Boot gesammelt, das in und um Zhoushan in China segelte.

Die Daten enthalten Bilder von Schiffen in Häfen, vor Anker liegenden Schiffen, navigierenden Schiffen und anlegenden Schiffen. Die Bilder enthalten auch all die Umweltvielfalt, die man erwarten würde – Nebel, Blendung, geringe Helligkeit, Regen usw.

**Warum dies wichtig ist:** Der Datensatz

Import AI 452: Skalierungsgesetze für Cyberkriege; steigende Flut der KI-Automatisierung; und ein Rätsel um die gDP-Prognose

import_ai·2026-04-06SicherheitForschungWirtschaft

Oh je, es gibt auch einen Skalierungskrieg für Cyberangriffe!:

…Je intelligenter das System, desto besser die Fähigkeit zum Cyberangriff…

Die KI-Sicherheitsforschungsorganisation Lyptus Research hat untersucht, wie gut KI-Systeme eine Vielzahl von Cyberangriffsaufgaben ausführen können und einen klaren Trend gefunden, dass fortschrittlichere Modelle zu fortgeschritteneren Formen von Cyberangriffen fähig sind.

„Bei den seit 2019 veröffentlichten Frontier-Modellen beträgt die Verdopplungszeit 9,8 Monate. Beschränkt man sich auf die seit 2024 veröffentlichten Modelle, steigt sie auf 5,7 Monate. Die neuesten Frontier-Modelle in unserer Studie, GPT-5.3 Codex und Opus 4.6, liegen über beiden angepassten Trendlinien und erreichen eine Erfolgsquote von 50 % bei Aufgaben, für die menschliche Experten 3,1 bzw. 3,2 Stunden benötigen“, schreiben sie. „Unser neuestes Open-Weight-Modell, GLM-5, hinkt der Closed-Source-Frontier um 5,7 Monate hinterher, was darauf hindeutet, dass sich die offensive Cyber-Fähigkeit der Frontier in relativ kurzer Zeit in Open-Weight-Form verbreiten könnte.“

Welche Benchmarks haben sie untersucht? CyBashBench, NL2Bash, InterCode CTF, NYUCTF, CyBench, CVEBench und CyberGym.

Sie erstellten auch einen neuen Datensatz, bestehend aus 291 Aufgaben mit Abschlussprotokollen und Zeitschätzungen, die von 10 professionellen Offensiv-Cybersicherheitsexperten kalibriert wurden.

Evaluierte Modelle: 2019: GPT-2. 2020: GPT3. 2022: GPT3.5. 2024: Claude 3 Opus, GPT-4o. 2025: o3, Opus 4, Gemini 2.5 Pro, DeepSeek V3.1, GPT-5.1 Codex Max. GPT-5.2 Codex. 2026: Opus 4.6, GPT-5.3 Codex, GLM-5, Sonnet 4.6.

Ergebnisse: KI-Systeme werden gut im Hacken. „Die besten aktuellen Modelle erreichen eine Erfolgsquote von 50 % bei Aufgaben, für die menschliche Experten 3,2 Stunden benötigen, etwa einen halben Arbeitstag professioneller Offensiv-Sicherheitsarbeit“, schreiben sie.

Warum das wichtig ist – alles wird besser, auch die unbequemen Dinge: KI, die Biologieforschung betreiben kann, kann auch Biowaffenforschung betreiben. KI, die Ihnen hilft, etwas über Hochenergiephysik zu lernen, kann Ihnen auch bei Hochenergiephysik für die Waffenentwicklung helfen. KI, die besonders gut darin ist, Ihnen zu helfen, Schwachstellen im Code zu finden, kann leicht für offensive Zwecke umfunktioniert werden. Der schwierigste Teil der KI ist, dass sie eine 'Allesmaschine' ist, und da sich die Fähigkeiten mit jeder weiteren Modellgeneration tendenziell in einem großen Bereich ausdehnen, vervielfachen sich auch die politischen Probleme.

Lesen Sie mehr: Offensive Cybersecurity Time Horizons (Lyptus Research).

Holen Sie sich die Daten hier: Offensive Cyber Task Horizons: Data and Analysis (Lyptus Research, GitHub).

***

Startups, die KI für den internen Gebrauch einsetzen, sind erfolgreicher als solche, die dies nicht tun:

…Eine Business-School-Studie zeigt, wie Startups von der KI-Einführung profitieren können…

Forscher der INSEAD und der Harvard Business School haben gezeigt, dass Startups, denen beigebracht wird, wie sie KI in ihr Geschäft integrieren können, deutlich besser abschneiden als solche, die dies nicht tun. Die Studie ist relativ groß angelegt und überzeugend: „Über 515 wachstumsstarke Startups hinweg führen wir ein Feldexperiment durch, bei dem behandelte Firmen Informationen darüber erhalten, wie andere Firmen die Produktion rund um KI neu organisiert haben, was sie dazu veranlasst, über eine breitere Palette von Unternehmensfunktionen hinweg nach Anwendungsfällen zu suchen“, schreiben sie. „Wir stellen fest, dass behandelte Firmen mehr KI-Anwendungsfälle entdecken, eine Steigerung von 44 %, konzentriert auf Produktentwicklung und Strategie. Diese Veränderungen führen zu wirtschaftlich bedeutsamen Leistungssteigerungen. Behandelte Firmen erledigen 12 % mehr Aufgaben, haben eine um 18 % höhere Wahrscheinlichkeit, zahlende Kunden zu gewinnen, und erzielen einen 1,9-fach höheren Umsatz.“

Wie sie den Test durchgeführt haben: Die Autoren führten dieses Experiment mit Teilnehmern des AI Founder Sprint durch, „einem dreimonatigen, globalen, virtuellen Startup-Beschleuniger an der INSEAD“. Die Teilnehmer erhielten API-Guthaben, Zugang zu Frontier-Modellen und Einführungssitzungen von einigen technischen Partnern (einschließlich OpenAI und Manus), insgesamt etwa 25.000 US-Dollar Sachleistungen pro Firma. Sie machten die üblichen Dinge, die Leute in Beschleunigern tun – praktische Sitzungen, um Technologien zum Aufbau ihres Geschäfts (einschließlich KI) zu erlernen, sowie das Pitchen ihrer Unternehmen und die Teilnahme an Demo-Tagen. Aber die Firmen wurden auch einer signifikanten Variable ausgesetzt: Ein Teil der Klasse nahm an Workshops teil, die ihnen direkte Details darüber vermittelten, wie KI von einigen Unternehmen erfolgreich eingesetzt worden war.

Anwendungen von KI: Eine Untergruppe der Unternehmen lernte direkte Geschäftsanwendungsfälle kennen, wie zum Beispiel:

Gamma: Ihnen wurde beigebracht, wie das Startup KI einsetzte, um „Nutzungsmuster zu erkennen und direkt Produktvarianten zu generieren, was es einem einzelnen Produktmanager ermöglichte, kontinuierlich Funktionen auszuliefern, die zuvor ein ganzes Team erfordert hätten.“

Ryz Labs: Der Gründer beschrieb, wie sie ihre Herangehensweise an die Produktentwicklung geändert hatten: „Der Gründer schreibt ein Produktanforderungsdokument und füttert es gleichzeitig in mehrere KI-Codierungstools, wobei er dieselbe Idee auf mehrere Arten umsetzt, anstatt auf einen einzigen Ansatz zu setzen.“

FazeShift: Zeigte, wie man einen Debitorenbuchhaltungsprozess automatisieren kann, indem man KI nutzt, um die menschlichen Schritte zu überspringen.

Ranger: Eine Veranschaulichung, wie man KI nutzt, um ein Startup zu bootstrappen, erste Traktion zu gewinnen, Margen zu verbessern und später Geld zu beschaffen, wenn das Unternehmen reifer ist, was es ihnen ermöglicht, zu besseren Konditionen Kapital aufzunehmen.

Die Ergebnisse waren sehr signifikant: „Behandelte Firmen entdecken 2,7 zusätzliche KI-Anwendungsfälle (eine Steigerung von 44 %), die ein breiteres Spektrum an Aktivitäten im Unternehmen abdecken und besonders in den Bereichen Produktentwicklung und Strategie konzentriert sind. Diese Veränderungen im KI-Einsatz führen zu messbaren Leistungssteigerungen: Behandelte Firmen erledigen 12 % mehr Aufgaben, haben eine um 11 Prozentpunkte (18 %) höhere Wahrscheinlichkeit, zahlende Kunden zu gewinnen, und erzielen letztlich einen 1,9-fach höheren Umsatz im Vergleich zu Kontrollfirmen“, schreiben sie. „Die Instrumentierung von KI-Anwendungsfällen mit der Behandlungszuweisung deutet darauf hin, dass jeder zusätzliche, durch die Behandlung angeregte KI-Anwendungsfall zu 0,85 mehr erledigten Aufgaben und etwa 26 % höherem Umsatz führt. Dies sind große Effekte, was darauf hindeutet, dass KI grundlegend die Art und Weise verändert, wie Vorhaben skalieren, wenn sie sie über ihren Produktionsprozess abbilden können… behandelte Vorhaben erzielen schnelleres Wachstum ohne proportionale Erhöhung von Arbeit oder Kapital, was mit einer Verringerung der Kosten für Experimente und Skalierung einhergeht, die bei früheren Technologiewellen zu beobachten war.“

Kapitaleffizienz: „Behandelte Firmen melden einen um etwas mehr als 220.000 US-Dollar geringeren Kapitalbedarf im Vergleich zu Kontrollfirmen, ein Rückgang von 39,5 % (p < 0,05), ohne einen entsprechenden Anstieg der Arbeitsnachfrage.“

Interne Beschleunigung: Die behandelten Firmen neigen dazu, 2,2 mehr interne Aufgaben relativ zur Kontrolle zu erledigen – wobei eine interne Aufgabe so etwas wie der Bau eines Produkts oder die Erstellung einer Finanzprognose ist.

Gedanken von Gründern:

„Ein behandelter Gründer reflektierte: ‚Diese Änderung der Denkweise hat grundlegend verändert, wie wir bei [GESCHWÄRZT] bauen. Ich begann, KI-Tools nicht als Ersatz für Fachwissen zu nutzen, sondern als Kraftverstärker.‘“

„Ein anderer erklärte: ‚In nur wenigen Stunden konnte ich produzieren, was zuvor 1.000 Dollar von einem ausgelagerten Entwicklerteam gekostet hatte.‘“

Warum das wichtig ist – KI-Firmen werden Nicht-KI-Firmen ausstechen: Die wichtigste Erkenntnis hier ist, dass eine tiefe und ausgefeilte Einführung von KI zur internen Beschleunigung junge Unternehmen schafft, die wettbewerbsfähiger sind als solche, die KI nicht in ihrem Kern verankert haben. Dies ist intuitiv sinnvoll – Unternehmen, die sich um frühere Technologien herum aufgebaut haben, neigten dazu, diejenigen auszustechen, die dies nicht taten (denken Sie an das Internet und Amazon versus Barnes and Noble, oder Client-PCs statt Mainframes und Microsoft versus IBM). Gleichzeitig impliziert dies sicherlich, dass eine der Arten, wie wir KI zuerst in der Wirtschaft auftauchen sehen werden, die Entstehung einer neuen Klasse wettbewerbsfähiger Unternehmen sein wird, die kapitaleffizienter sind (unter anderem durch den Einsatz von weniger Mitarbeitern) als die Unternehmen, die sie verdrängen.

Für Regierungen wird es erfordern, sich auf ernsthafte Bildung zu konzentrieren, um diesem Trend voraus zu sein: „Unsere Ergebnisse deuten darauf hin, dass der Engpass nicht die Technologie ist – es ist die managementbezogene Herausforderung, zu entdecken, wo die Technologie innerhalb des Produktionsprozesses eines Unternehmens Wert schafft“, schreiben sie. „Managern und Unternehmern beizubringen, wie man das Zuordnungsproblem löst, könnte mindestens so wichtig sein wie sicherzustellen, dass sie Zugang zur Technologie haben.“

Lesen Sie mehr: Mapping AI into Production: A Field Experiment on Firm Performance (SSRN).

***

MIT: Eine steigende Flut der Automatisierung wird bis 2029 eine ausreichend gute KI für die meisten textbasierten Aufgaben hervorbringen:

…Wie revolutioniert man eine Wirtschaft? Allmählich und beständig…

Forscher des MIT haben 3.000 Aufgaben basierend auf der O-NET-Jobfamilie untersucht und dies mit 17.000 Bewertungen von Arbeitnehmern, die diese Aufgaben ausführen, gepaart, um herauszufinden, wie der Aufstieg der KI die Arbeit verändert. Ihre Ergebnisse „implizieren, dass für realistische und repräsentative reale Arbeitsmarktaufgaben, die textbasiert – oder teilweise textbasiert – sind, die KI-Fähigkeiten bereits beträchtlich sind und sich breit ausdehnen werden. Aber anstatt in brechenden Wellen anzukommen, die eine bestimmte Reihe von Aufgaben auf einmal transformieren, ähnelt der Fortschritt typischerweise einer steigenden Flut mit weit verbreiteten Gewinnen bei vielen Aufgaben gleichzeitig.“

Was sie untersucht haben: Für diese Studie machten sie sich daran herauszufinden, ob der Anstieg der KI-Fähigkeiten schnelle, diskontinuierliche Veränderungen hervorbringt, die für die Arbeit disruptiv sind („brechende Wellen“), oder ob KI auf eine breite und vorhersagbare Weise leistungsfähiger wird, was zu einer allmählicheren Automatisierung führt („steigende Fluten“). „Wir finden wenig Beweise für brechende Wellen, aber substanzielle Beweise dafür, dass steigende Fluten die primäre Form der KI-Automatisierung sind“, schreiben sie.

Komplementär zur METR-Analyse: Diese Erhebung dient auch als Validierung der breiten Trends, die in METRs berühmtem zeitbasierten KI-Fähigkeitsrahmen gefunden wurden, der sieht, wie KI-Systeme schnell den Zeithorizont erweitern, über den sie bestimmte enge Aufgaben ausführen können.

Auf Arbeitsplätze im weiteren Sinne angewandt, finden die MIT-Forscher „dass zwischen 2024-Q2 und 2025-Q3 Frontier-Modelle von einer Erfolgsquote von 50 % bei 3- bis 4-Stunden-Aufgaben zu 1-Wochen-Aufgaben übergingen und eine Erfolgsquote von 70 % bei 1-Minuten-Aufgaben bis 1-Stunden-Aufgaben erreichten“, schreiben sie. „Über eine große Menge realistischer und repräsentativer Arbeitsmarktaufgaben, die von LLMs adressiert werden können, ist die abwärts gerichtete Steigung zwischen Aufgabenerfolg und Aufgabendauer im Durchschnitt überraschend flach – d.h. konsistenter mit einer steigenden Flut als mit einer brechenden Welle… Automatisierung innerhalb bestimmter ‚Jobfamilien‘ (z.B. Management oder Gemeinschafts- und Sozialdienst) folgt in den meisten Fällen ebenfalls demselben Muster der steigenden Flut.“

Lassen Sie sich von allmählich nicht täuschen: „Projizierte Gewinne sind allmählich und nicht abrupt. Dennoch bleibt das Tempo der Verbesserung beträchtlich, um hohe Erfolgsquoten bei den meisten textbasierten Arbeitsmarktaufgaben zu erreichen; die meisten Aufgaben werden voraussichtlich bis 2029 KI-Erfolgsquoten von 80 %–95 % bei einem minimal ausreichenden Qualitätsniveau erreichen (wobei die Mehrheit der Aufgaben in unserer Erhebung einige Stunden lang ist, was einer Erfolgsquote von nahezu 90 % im Jahr 2029 entspricht)“, schreiben sie. Mit anderen Worten, selbst wenn die Disruption allmählich und vorhersagbar ist, sollten wir das Potenzial für groß angelegte Veränderungen der Wirtschaft als Folge des Phänomens der steigenden Flut nicht unterschätzen.

Warum das wichtig ist – wie wird sich die Arbeit im Verhältnis zur KI verändern? Die Frage nach hundert Billionen Dollar für die Weltwirtschaft ist, wie KI die Verteilung von Arbeit (Menschen) versus Kapital (Computer, die synthetische Arbeiter betreiben) verändert. Diese Forschung deutet darauf hin, dass wir zwar keine plötzliche, gezackte Verdrängung von Arbeitnehmern sehen werden, wir aber eine allgemeine steigende Flut der Automatisierung sehen werden, die an den meisten Orten auftaucht und sich kontinuierlich verbessert. Es ist immer noch nicht klar, wie die Wirtschaft darauf reagieren wird, aber es ist schwer, eine Welt des anhaltenden KI-Fortschritts mit dem aktuellen wirtschaftlichen Status quo in Einklang zu bringen.

Lesen Sie mehr: Crashing Waves vs. Rising Tides: Preliminary Findings on AI Automation from Thousands of Worker Evaluations of Labor Market Tasks (arXiv).

***

Große Prognosestudie identifiziert ein großes Paradoxon: Die Leute denken, wir werden intelligentere Maschinen bekommen, aber die Auswirkung auf das BIP-Wachstum wird gering sein:

…das Forecasting Research Institute liefert uns rätselhafte Daten von Ökonomen, KI-Industrieexperten, genauen Prognostikern und der breiten Öffentlichkeit…

Das Forecasting Research Institute hat einen großen Bericht veröffentlicht, der versucht, die wirtschaftlichen Auswirkungen von KI vorherzusagen. Die überraschendste Erkenntnis ist, dass alle befragten Gruppen erwarten, dass KI-Systeme in den kommenden Jahren eher moderate bis schnelle Fortschritte als langsame Fortschritte machen werden, die Auswirkungen auf das BIP jedoch relativ gering sein werden und bis 2030 etwa 1 Punkt (relativ zu 2,4 % im Jahr 2025) hinzufü

Weiterlesen

Oh je, es gibt auch einen Skalierungskrieg für Cyberangriffe!:

…Je intelligenter das System, desto besser die Fähigkeit zum Cyberangriff…

Die KI-Sicherheitsforschungsorganisation Lyptus Research hat untersucht, wie gut KI-Systeme eine Vielzahl von Cyberangriffsaufgaben ausführen können und einen klaren Trend gefunden, dass fortschrittlichere Modelle zu fortgeschritteneren Formen von Cyberangriffen fähig sind.

„Bei den seit 2019 veröffentlichten Frontier-Modellen beträgt die Verdopplungszeit 9,8 Monate. Beschränkt man sich auf die seit 2024 veröffentlichten Modelle, steigt sie auf 5,7 Monate. Die neuesten Frontier-Modelle in unserer Studie, GPT-5.3 Codex und Opus 4.6, liegen über beiden angepassten Trendlinien und erreichen eine Erfolgsquote von 50 % bei Aufgaben, für die menschliche Experten 3,1 bzw. 3,2 Stunden benötigen“, schreiben sie. „Unser neuestes Open-Weight-Modell, GLM-5, hinkt der Closed-Source-Frontier um 5,7 Monate hinterher, was darauf hindeutet, dass sich die offensive Cyber-Fähigkeit der Frontier in relativ kurzer Zeit in Open-Weight-Form verbreiten könnte.“

Welche Benchmarks haben sie untersucht? CyBashBench, NL2Bash, InterCode CTF, NYUCTF, CyBench, CVEBench und CyberGym.

Sie erstellten auch einen neuen Datensatz, bestehend aus 291 Aufgaben mit Abschlussprotokollen und Zeitschätzungen, die von 10 professionellen Offensiv-Cybersicherheitsexperten kalibriert wurden.

Evaluierte Modelle: 2019: GPT-2. 2020: GPT3. 2022: GPT3.5. 2024: Claude 3 Opus, GPT-4o. 2025: o3, Opus 4, Gemini 2.5 Pro, DeepSeek V3.1, GPT-5.1 Codex Max. GPT-5.2 Codex. 2026: Opus 4.6, GPT-5.3 Codex, GLM-5, Sonnet 4.6.

Ergebnisse: KI-Systeme werden gut im Hacken. „Die besten aktuellen Modelle erreichen eine Erfolgsquote von 50 % bei Aufgaben, für die menschliche Experten 3,2 Stunden benötigen, etwa einen halben Arbeitstag professioneller Offensiv-Sicherheitsarbeit“, schreiben sie.

Warum das wichtig ist – alles wird besser, auch die unbequemen Dinge: KI, die Biologieforschung betreiben kann, kann auch Biowaffenforschung betreiben. KI, die Ihnen hilft, etwas über Hochenergiephysik zu lernen, kann Ihnen auch bei Hochenergiephysik für die Waffenentwicklung helfen. KI, die besonders gut darin ist, Ihnen zu helfen, Schwachstellen im Code zu finden, kann leicht für offensive Zwecke umfunktioniert werden. Der schwierigste Teil der KI ist, dass sie eine 'Allesmaschine' ist, und da sich die Fähigkeiten mit jeder weiteren Modellgeneration tendenziell in einem großen Bereich ausdehnen, vervielfachen sich auch die politischen Probleme.

Lesen Sie mehr: Offensive Cybersecurity Time Horizons (Lyptus Research).

Holen Sie sich die Daten hier: Offensive Cyber Task Horizons: Data and Analysis (Lyptus Research, GitHub).

***

Startups, die KI für den internen Gebrauch einsetzen, sind erfolgreicher als solche, die dies nicht tun:

…Eine Business-School-Studie zeigt, wie Startups von der KI-Einführung profitieren können…

Forscher der INSEAD und der Harvard Business School haben gezeigt, dass Startups, denen beigebracht wird, wie sie KI in ihr Geschäft integrieren können, deutlich besser abschneiden als solche, die dies nicht tun. Die Studie ist relativ groß angelegt und überzeugend: „Über 515 wachstumsstarke Startups hinweg führen wir ein Feldexperiment durch, bei dem behandelte Firmen Informationen darüber erhalten, wie andere Firmen die Produktion rund um KI neu organisiert haben, was sie dazu veranlasst, über eine breitere Palette von Unternehmensfunktionen hinweg nach Anwendungsfällen zu suchen“, schreiben sie. „Wir stellen fest, dass behandelte Firmen mehr KI-Anwendungsfälle entdecken, eine Steigerung von 44 %, konzentriert auf Produktentwicklung und Strategie. Diese Veränderungen führen zu wirtschaftlich bedeutsamen Leistungssteigerungen. Behandelte Firmen erledigen 12 % mehr Aufgaben, haben eine um 18 % höhere Wahrscheinlichkeit, zahlende Kunden zu gewinnen, und erzielen einen 1,9-fach höheren Umsatz.“

Wie sie den Test durchgeführt haben: Die Autoren führten dieses Experiment mit Teilnehmern des AI Founder Sprint durch, „einem dreimonatigen, globalen, virtuellen Startup-Beschleuniger an der INSEAD“. Die Teilnehmer erhielten API-Guthaben, Zugang zu Frontier-Modellen und Einführungssitzungen von einigen technischen Partnern (einschließlich OpenAI und Manus), insgesamt etwa 25.000 US-Dollar Sachleistungen pro Firma. Sie machten die üblichen Dinge, die Leute in Beschleunigern tun – praktische Sitzungen, um Technologien zum Aufbau ihres Geschäfts (einschließlich KI) zu erlernen, sowie das Pitchen ihrer Unternehmen und die Teilnahme an Demo-Tagen. Aber die Firmen wurden auch einer signifikanten Variable ausgesetzt: Ein Teil der Klasse nahm an Workshops teil, die ihnen direkte Details darüber vermittelten, wie KI von einigen Unternehmen erfolgreich eingesetzt worden war.

Anwendungen von KI: Eine Untergruppe der Unternehmen lernte direkte Geschäftsanwendungsfälle kennen, wie zum Beispiel:

Gamma: Ihnen wurde beigebracht, wie das Startup KI einsetzte, um „Nutzungsmuster zu erkennen und direkt Produktvarianten zu generieren, was es einem einzelnen Produktmanager ermöglichte, kontinuierlich Funktionen auszuliefern, die zuvor ein ganzes Team erfordert hätten.“

Ryz Labs: Der Gründer beschrieb, wie sie ihre Herangehensweise an die Produktentwicklung geändert hatten: „Der Gründer schreibt ein Produktanforderungsdokument und füttert es gleichzeitig in mehrere KI-Codierungstools, wobei er dieselbe Idee auf mehrere Arten umsetzt, anstatt auf einen einzigen Ansatz zu setzen.“

FazeShift: Zeigte, wie man einen Debitorenbuchhaltungsprozess automatisieren kann, indem man KI nutzt, um die menschlichen Schritte zu überspringen.

Ranger: Eine Veranschaulichung, wie man KI nutzt, um ein Startup zu bootstrappen, erste Traktion zu gewinnen, Margen zu verbessern und später Geld zu beschaffen, wenn das Unternehmen reifer ist, was es ihnen ermöglicht, zu besseren Konditionen Kapital aufzunehmen.

Die Ergebnisse waren sehr signifikant: „Behandelte Firmen entdecken 2,7 zusätzliche KI-Anwendungsfälle (eine Steigerung von 44 %), die ein breiteres Spektrum an Aktivitäten im Unternehmen abdecken und besonders in den Bereichen Produktentwicklung und Strategie konzentriert sind. Diese Veränderungen im KI-Einsatz führen zu messbaren Leistungssteigerungen: Behandelte Firmen erledigen 12 % mehr Aufgaben, haben eine um 11 Prozentpunkte (18 %) höhere Wahrscheinlichkeit, zahlende Kunden zu gewinnen, und erzielen letztlich einen 1,9-fach höheren Umsatz im Vergleich zu Kontrollfirmen“, schreiben sie. „Die Instrumentierung von KI-Anwendungsfällen mit der Behandlungszuweisung deutet darauf hin, dass jeder zusätzliche, durch die Behandlung angeregte KI-Anwendungsfall zu 0,85 mehr erledigten Aufgaben und etwa 26 % höherem Umsatz führt. Dies sind große Effekte, was darauf hindeutet, dass KI grundlegend die Art und Weise verändert, wie Vorhaben skalieren, wenn sie sie über ihren Produktionsprozess abbilden können… behandelte Vorhaben erzielen schnelleres Wachstum ohne proportionale Erhöhung von Arbeit oder Kapital, was mit einer Verringerung der Kosten für Experimente und Skalierung einhergeht, die bei früheren Technologiewellen zu beobachten war.“

Kapitaleffizienz: „Behandelte Firmen melden einen um etwas mehr als 220.000 US-Dollar geringeren Kapitalbedarf im Vergleich zu Kontrollfirmen, ein Rückgang von 39,5 % (p < 0,05), ohne einen entsprechenden Anstieg der Arbeitsnachfrage.“

Interne Beschleunigung: Die behandelten Firmen neigen dazu, 2,2 mehr interne Aufgaben relativ zur Kontrolle zu erledigen – wobei eine interne Aufgabe so etwas wie der Bau eines Produkts oder die Erstellung einer Finanzprognose ist.

Gedanken von Gründern:

„Ein behandelter Gründer reflektierte: ‚Diese Änderung der Denkweise hat grundlegend verändert, wie wir bei [GESCHWÄRZT] bauen. Ich begann, KI-Tools nicht als Ersatz für Fachwissen zu nutzen, sondern als Kraftverstärker.‘“

„Ein anderer erklärte: ‚In nur wenigen Stunden konnte ich produzieren, was zuvor 1.000 Dollar von einem ausgelagerten Entwicklerteam gekostet hatte.‘“

Warum das wichtig ist – KI-Firmen werden Nicht-KI-Firmen ausstechen: Die wichtigste Erkenntnis hier ist, dass eine tiefe und ausgefeilte Einführung von KI zur internen Beschleunigung junge Unternehmen schafft, die wettbewerbsfähiger sind als solche, die KI nicht in ihrem Kern verankert haben. Dies ist intuitiv sinnvoll – Unternehmen, die sich um frühere Technologien herum aufgebaut haben, neigten dazu, diejenigen auszustechen, die dies nicht taten (denken Sie an das Internet und Amazon versus Barnes and Noble, oder Client-PCs statt Mainframes und Microsoft versus IBM). Gleichzeitig impliziert dies sicherlich, dass eine der Arten, wie wir KI zuerst in der Wirtschaft auftauchen sehen werden, die Entstehung einer neuen Klasse wettbewerbsfähiger Unternehmen sein wird, die kapitaleffizienter sind (unter anderem durch den Einsatz von weniger Mitarbeitern) als die Unternehmen, die sie verdrängen.

Für Regierungen wird es erfordern, sich auf ernsthafte Bildung zu konzentrieren, um diesem Trend voraus zu sein: „Unsere Ergebnisse deuten darauf hin, dass der Engpass nicht die Technologie ist – es ist die managementbezogene Herausforderung, zu entdecken, wo die Technologie innerhalb des Produktionsprozesses eines Unternehmens Wert schafft“, schreiben sie. „Managern und Unternehmern beizubringen, wie man das Zuordnungsproblem löst, könnte mindestens so wichtig sein wie sicherzustellen, dass sie Zugang zur Technologie haben.“

Lesen Sie mehr: Mapping AI into Production: A Field Experiment on Firm Performance (SSRN).

***

MIT: Eine steigende Flut der Automatisierung wird bis 2029 eine ausreichend gute KI für die meisten textbasierten Aufgaben hervorbringen:

…Wie revolutioniert man eine Wirtschaft? Allmählich und beständig…

Forscher des MIT haben 3.000 Aufgaben basierend auf der O-NET-Jobfamilie untersucht und dies mit 17.000 Bewertungen von Arbeitnehmern, die diese Aufgaben ausführen, gepaart, um herauszufinden, wie der Aufstieg der KI die Arbeit verändert. Ihre Ergebnisse „implizieren, dass für realistische und repräsentative reale Arbeitsmarktaufgaben, die textbasiert – oder teilweise textbasiert – sind, die KI-Fähigkeiten bereits beträchtlich sind und sich breit ausdehnen werden. Aber anstatt in brechenden Wellen anzukommen, die eine bestimmte Reihe von Aufgaben auf einmal transformieren, ähnelt der Fortschritt typischerweise einer steigenden Flut mit weit verbreiteten Gewinnen bei vielen Aufgaben gleichzeitig.“

Was sie untersucht haben: Für diese Studie machten sie sich daran herauszufinden, ob der Anstieg der KI-Fähigkeiten schnelle, diskontinuierliche Veränderungen hervorbringt, die für die Arbeit disruptiv sind („brechende Wellen“), oder ob KI auf eine breite und vorhersagbare Weise leistungsfähiger wird, was zu einer allmählicheren Automatisierung führt („steigende Fluten“). „Wir finden wenig Beweise für brechende Wellen, aber substanzielle Beweise dafür, dass steigende Fluten die primäre Form der KI-Automatisierung sind“, schreiben sie.

Komplementär zur METR-Analyse: Diese Erhebung dient auch als Validierung der breiten Trends, die in METRs berühmtem zeitbasierten KI-Fähigkeitsrahmen gefunden wurden, der sieht, wie KI-Systeme schnell den Zeithorizont erweitern, über den sie bestimmte enge Aufgaben ausführen können.

Auf Arbeitsplätze im weiteren Sinne angewandt, finden die MIT-Forscher „dass zwischen 2024-Q2 und 2025-Q3 Frontier-Modelle von einer Erfolgsquote von 50 % bei 3- bis 4-Stunden-Aufgaben zu 1-Wochen-Aufgaben übergingen und eine Erfolgsquote von 70 % bei 1-Minuten-Aufgaben bis 1-Stunden-Aufgaben erreichten“, schreiben sie. „Über eine große Menge realistischer und repräsentativer Arbeitsmarktaufgaben, die von LLMs adressiert werden können, ist die abwärts gerichtete Steigung zwischen Aufgabenerfolg und Aufgabendauer im Durchschnitt überraschend flach – d.h. konsistenter mit einer steigenden Flut als mit einer brechenden Welle… Automatisierung innerhalb bestimmter ‚Jobfamilien‘ (z.B. Management oder Gemeinschafts- und Sozialdienst) folgt in den meisten Fällen ebenfalls demselben Muster der steigenden Flut.“

Lassen Sie sich von allmählich nicht täuschen: „Projizierte Gewinne sind allmählich und nicht abrupt. Dennoch bleibt das Tempo der Verbesserung beträchtlich, um hohe Erfolgsquoten bei den meisten textbasierten Arbeitsmarktaufgaben zu erreichen; die meisten Aufgaben werden voraussichtlich bis 2029 KI-Erfolgsquoten von 80 %–95 % bei einem minimal ausreichenden Qualitätsniveau erreichen (wobei die Mehrheit der Aufgaben in unserer Erhebung einige Stunden lang ist, was einer Erfolgsquote von nahezu 90 % im Jahr 2029 entspricht)“, schreiben sie. Mit anderen Worten, selbst wenn die Disruption allmählich und vorhersagbar ist, sollten wir das Potenzial für groß angelegte Veränderungen der Wirtschaft als Folge des Phänomens der steigenden Flut nicht unterschätzen.

Warum das wichtig ist – wie wird sich die Arbeit im Verhältnis zur KI verändern? Die Frage nach hundert Billionen Dollar für die Weltwirtschaft ist, wie KI die Verteilung von Arbeit (Menschen) versus Kapital (Computer, die synthetische Arbeiter betreiben) verändert. Diese Forschung deutet darauf hin, dass wir zwar keine plötzliche, gezackte Verdrängung von Arbeitnehmern sehen werden, wir aber eine allgemeine steigende Flut der Automatisierung sehen werden, die an den meisten Orten auftaucht und sich kontinuierlich verbessert. Es ist immer noch nicht klar, wie die Wirtschaft darauf reagieren wird, aber es ist schwer, eine Welt des anhaltenden KI-Fortschritts mit dem aktuellen wirtschaftlichen Status quo in Einklang zu bringen.

Lesen Sie mehr: Crashing Waves vs. Rising Tides: Preliminary Findings on AI Automation from Thousands of Worker Evaluations of Labor Market Tasks (arXiv).

***

Große Prognosestudie identifiziert ein großes Paradoxon: Die Leute denken, wir werden intelligentere Maschinen bekommen, aber die Auswirkung auf das BIP-Wachstum wird gering sein:

…das Forecasting Research Institute liefert uns rätselhafte Daten von Ökonomen, KI-Industrieexperten, genauen Prognostikern und der breiten Öffentlichkeit…

Das Forecasting Research Institute hat einen großen Bericht veröffentlicht, der versucht, die wirtschaftlichen Auswirkungen von KI vorherzusagen. Die überraschendste Erkenntnis ist, dass alle befragten Gruppen erwarten, dass KI-Systeme in den kommenden Jahren eher moderate bis schnelle Fortschritte als langsame Fortschritte machen werden, die Auswirkungen auf das BIP jedoch relativ gering sein werden und bis 2030 etwa 1 Punkt (relativ zu 2,4 % im Jahr 2025) hinzufü

Import AI 448: KI-F&E; Bytedances CUDA-schreibender Agent; On-Device-Satelliten-KI

import_ai·2026-03-09ForschungAgentenWirtschaft

Der KI-Fortschritt ist schneller, als selbst angesehene Prognostiker vermuten können: …Ajeya Cotra aktualisiert ihre Zeitpläne… „Am 14. Januar habe ich Vorhersagen zum KI-Fortschritt im Jahr 2026 getroffen. Meine Prognosen für Softwareentwicklungsfähigkeiten fühlen sich bereits jetzt viel zu konservativ an“, schreibt Ajeya Cotra in einem Blog. Ajeya ist eine langjährige KI-Denkerin, die großartige Arbeit bei der Vorhersage von Zeitplänen für leistungsstarke KI geleistet hat. In diesem Beitrag erklärt sie, dass KI-Systeme schneller vorankommen, als sie dachte, angesichts der jüngsten METR-Ergebnisse, die Opus 4.6 einen Zeithorizont von 12 Stunden bescheinigen (Ajeya hatte im Januar für Ende 2026 ~24 Stunden vorhergesagt). „Es ist nicht länger sehr plausibel, dass KI-Agenten nach zehn ganzen Monaten zusätzlichen Fortschritts in diesem atemberaubenden Tempo bei 24-Stunden-Aufgaben immer noch in der Hälfte der Fälle Schwierigkeiten hätten“, schreibt Ajeya. „Ich würde schätzen, dass KI-Agenten bis zum Jahresende einen Zeithorizont von über 100 Stunden bei den Softwareaufgaben in METRs Suite haben werden … Und wenn man von mehreren Vollzeitäquivalent-Wochen Arbeit spricht, frage ich mich, ob das gesamte Konzept des ‚Zeithorizonts‘ zusammenbricht.“ Warum das wichtig ist – alle Lichter blinken gelb für eine Software-Explosion: Beiträge wie dieser sowie 70 % dessen, was ich in diesem Newsletter behandle, deuten alle darauf hin, dass KI-Systeme extrem gut, extrem schnell werden und die Wirtschaft schnell kolonisieren und wachsen lassen.

*** Möchten Sie KI-F&E messen? Hier sind 14 Möglichkeiten: …Generierung von Metriken über die bedeutendste Eigenschaft von KI… Das Größte, was mit künstlicher Intelligenz jemals passieren könnte, ist, wenn sie beginnt, sich selbst zu bauen. Dieses Phänomen, oft als rekursive Selbstverbesserung bezeichnet, wird von vielen als ein Ereignishorizont angesehen, jenseits dessen es zunehmend schwieriger wird, über die Zukunft zu argumentieren. Woher wüssten wir, ob wir uns diesem Punkt nähern? Forscher von GovAI und der University of Oxford haben ein Papier verfasst, das 14 verschiedene Metriken auflistet, die gemessen werden könnten, um uns zu helfen, das Ausmaß zu verstehen, in dem KI-Unternehmen erfolgreich KI-F&E-Automatisierung (AIRDA) aufbauen und überwachen – also KI dazu bringen, KI zu bauen, eine notwendige Voraussetzung für rekursive Selbstverbesserung. Warum sollte uns das interessieren: „AIRDA könnte den KI-Fortschritt beschleunigen, die Vorteile von KI früher bringen, aber auch das Eintreffen zerstörerischer Fähigkeiten beschleunigen, einschließlich solcher im Zusammenhang mit Massenvernichtungswaffen oder anderen Formen der Störung wie Arbeitslosigkeit“, schreiben sie. Was sind die 14 Metriken? 1. KI-Leistung bei KI-F&E messen 2. KI-Leistung bei KI-F&E im Vergleich zu Menschen und Mensch-KI-Teams messen 3. ‚Oversight Red Teaming‘ messen – wie gut menschliche Teams KI-Systeme, die sich selbst bauen, effektiv überwachen können 4. Fehlausrichtung in AIRDA messen 5. Die Rate der Effizienzverbesserungen bei KI-F&E-Aufgaben berechnen 6. Mitarbeiter befragen, wie sie KI nutzen und was dies für die Produktivität bedeutet 7. Herausfinden, ob und wie oft KI bei Entscheidungen mit hohem Risiko eingesetzt wird 8. Untersuchen, womit KI-Forscher ihre Zeit verbringen 9. Die Effektivität der Fähigkeit von Unternehmen, die KI-Entwicklung zu überwachen, meta-messen (z. B. die Rate von Fehlern oder unerwünschtem Verhalten, die trotz menschlicher Aufsicht in die Produktion gelangen) 10. Untersuchen, wie oft KI-Systeme die Ziele ihrer menschlichen Entwickler untergraben 11. Die Mitarbeiterzahl von KI-Forschern in Laboren sowie Details ihrer Leistung verfolgen 12. Die Verteilung der von KI-Unternehmen in ihrem KI-F&E-Prozess verwendeten Rechenleistung betrachten und wie sich diese ändert 13. Rechenleistung als Anteil der KI-F&E-Ausgaben untersuchen 14. Die Berechtigungen verstehen, die KI-Systeme haben, und wie sich die Großzügigkeit im Laufe der Zeit ändert Steuerung der KI-F&E: Die logische Frage, die sich aus dem Obigen ergibt, ist hoffentlich: „Wow, das klingt alles sehr folgenreich und wichtig, was können wir dagegen tun?“ Wie ich in diesem Newsletter oft schreibe, ist KI-Messung eine Voraussetzung für KI-Governance. Daher sollten mit diesen Maßnahmen einige verschiedene Akteure einige verschiedene Dinge tun. Insbesondere: Unternehmen sollten: * Differenziellen Fortschritt zwischen Sicherheits- und Fähigkeitsforschung verfolgen: Schreitet die Fähigkeitsforschung schneller voran als die Überwachungsforschung? * Verfolgen, wie KI-F&E die Überwachung beeinflusst: Automatisierung könnte Menschen freisetzen, um mehr Zeit in den Aufbau von Systemen zur Überwachung der Arbeit von KI-Systemen zu investieren. Andererseits könnte KI-gesteuerte F&E Systeme schaffen, die für Menschen von Natur aus schwerer zu verstehen sind, und das Volumen der von den KI-Systemen durchgeführten Aktivitäten könnte alle Überwachungssysteme überfordern. * Das tatsächliche Ausmaß der KI-F&E verfolgen: Sie können Metriken erstellen, die als Proxy für KI-F&E dienen – z. B. testen viele Labore heute, wie gut KI-Systeme KI-Kernel bauen oder KI-Modelle trainieren können. Sie können auch testen, wie viel KI-F&E-Automatisierung in Ihrer eigenen Organisation tatsächlich praktiziert wird. Ein weiterer Weg sind qualitative und quantitative Studien des menschlichen Personals, um zu verstehen, wie sich ihre eigenen Rollen verändern und wie KI bei zunehmend folgenreichen Entscheidungen eingesetzt wird. Regierungen sollten: * Systeme für vertrauliche Berichterstattung entwickeln, möglicherweise in Form von branchenweiten Aggregaten: Sobald Unternehmen diese Art von Daten messen, sollten Regierungen versuchen, Zugang zu ihnen zu erhalten, um die Form des KI-Fortschritts zu verstehen. Dritte sollten: * Metriken anhand öffentlicher Quellen schätzen: Öffentliche Berichte betrachten, um Schätzungen für Dinge zu erstellen, die mit KI-F&E zusammenhängen könnten, wie die Menge an Rechenleistung, die Unternehmen haben (z. B. machen Epoch und SemiAnalysis dies recht gut). * Werkzeuge entwickeln und Umfragen entwerfen: Werkzeuge bauen, die Unternehmen nutzen könnten, um mehr Telemetrie über KI-F&E zu generieren, und Umfragen bei Mitarbeitern von Unternehmen durchführen, um mehr Erkenntnisse zu sammeln. Warum das wichtig ist: „Ein Akteur hat in dem Maße die Aufsicht über den KI-F&E-Prozess, wie er (1) den Prozess versteht und (2) informierte Kontrolle darüber ausübt, um gewünschte Ergebnisse zu erzielen, z. B. durch die Überprüfung von KI-generierten Ergebnissen auf Fehler“, schreiben sie. Damit wir als Spezies überhaupt ‚Warnschüsse‘ bezüglich rekursiver Selbstverbesserung und eine Hoffnung auf ihre Steuerung haben, müssen wir in der Lage sein, diese Aspekte zu messen.

*** Indische Forscher prototypisieren mit Edge Computing ein stadtweites Kamera-Netzwerk: …Verkehrsüberwachung mit YOLO, SAM3 und NVIDIA Jetson-Chips… Forscher des Indian Institute of Science in Bengaluru haben ein Software- und Hardwaresystem zur intelligenten Überwachung des Verkehrs und der Fahrzeugtypen gebaut, die durch die Stadt Bengaluru fließen. Das sogenannte KI-gesteuerte intelligente Transportsystem (AIITS) erhöht die Menge an Intelligenz, die Stadtverkehrsanalysten durch den Einsatz von KI zur Verfügung steht. Wie das AIITS funktioniert: Das Ziel dieses Projekts ist es, „Echtzeitanalysen von Tausenden von Stadtkameras unter strengen Latenz- und Ressourcenbeschränkungen“ zu ermöglichen. Dazu verteilen sie eine Reihe von leichten GPUs (Jetson Edge Accelerators) in der Stadt und platzieren sie gemeinsam mit Verkehrskameras. Dies hilft den Verkehrskameras, intelligente Verarbeitung am Rand des Netzwerks durchzuführen, anstatt die extrem bandbreitenintensiven Daten an einen zentralen Hub zur Verarbeitung senden zu müssen; stattdessen teilen die Kamera und der Jetson Erkenntnisse zurück zum Hub zur Analyse und Neukalibrierung der Jetson-basierten ML-Modelle. Die Software funktioniert so: Videoströme von den Kameras kommen herein, und ein Segment-Anything (SAM3)-Modell segmentiert alle Objekte in den Videobildern, die ein Yolo26-Modell dann analysiert und mit Labels und Begrenzungsrahmen versieht. „Jeder Stream integriert BoT-SORT-Multi-Objekt-Tracking, das persistenten IDs zu erkannten Fahrzeugen über aufeinanderfolgende Frames hinweg zuweist.“ Sobald dies erledigt ist, wird die resultierende Intelligenz an einen entfernten GPU-Server gesendet, der zwei Dinge tut: 1. Er nimmt die resultierenden Daten auf und verwendet sie, um eine Art Wetterkarte von Verkehrshotspots zu erstellen sowie Vorhersagen über zukünftigen Verkehr zu treffen. 2. Er führt föderiertes Lernen durch; wenn er neue Fahrzeugklassen erkennt und sie mit SAM3 beschriftet, aktualisiert er Details und sendet sie an den Rand. „Jeder Jetson führt dann ein lokales Feintuning des YOLO-basierten Detektors durch, initialisiert mit den aktuellen globalen Gewichten.“ Der Prototyp funktioniert: Dieses System, das durch Simulation von 100 Kameras in einem Viertel in Bengaluru erstellt wurde, funktioniert gut genug, dass die Autoren planen, es für eine Live-Demonstration auf 1.000 Ströme zu skalieren. (Dieses Experiment wurde durch den Bau „einer verteilten Testumgebung durchgeführt, die ein großes städtisches Kameranetzwerk unter Verwendung von Hunderten von gleichzeitigen Real-Time Streaming Protocol (RTSP)-Videoströmen emuliert. Jeder Stream wird auf einem heterogenen Cluster von Raspberry Pis gehostet“.) „Durch die Lokalisierung der schweren Videoanalyse an der Netzwerkperipherie vermeidet das System zentrale Bandbreitenengpässe und ermöglicht eine nachhaltige, stadtweite Verkehrserfassung“, schreiben sie. Warum das wichtig ist – hin zu einer ‚lebendigen Stadt‘ durch KI: Arbeiten wie diese zeichnen eine Welt, in der Städte durch verteilte Umgebungsintelligenz in gleichem Maße wie ihre vorhandenen Sensoren zum Leben erwachen – Kameras wechseln von passiven Monitoren zu aktiven Klassifikatoren, Mikrofone beginnen, intelligent auf ein breiteres Spektrum von Geräuschen als nur Schüsse zu hören, und Straßensensoren modellieren Verkehrsmuster lokal. Diese Art von Intelligenz kann sowohl große Überwachungsarchitekturen schaffen als auch die Effizienz des Stadtbetriebs steigern – wie bei so vielen Dingen mit KI ist es eine Frage der Balance, begrenzt durch das umgebende Dickicht von Normen und Gesetzen, die bestimmen, wo zwischen Autoritarismus und Demokratie die resultierenden Fähigkeiten einzuordnen sind.

*** Hilfe für Satelliten bei der On-Device-KI für die Arktisüberwachung: …Frontier-Modelle sind wichtig, aber auch winzige, miniaturisierte Geräte für Edge Computing… Forscher des Deutschen Forschungszentrums für Künstliche Intelligenz haben TinyIceNet gebaut, ein sehr kleines Bildverarbeitungsmodell zur Schätzung der Meereisdicke aus Synthetic-Aperture-Radar-Daten. TinyIceNet ist eine Proof-of-Concept-Demonstration, wie man sehr leichte Bildverarbeitungsmodelle herstellt, die plausibel auf Geräten mit sehr geringer Leistung und teurer Bandbreite, wie Satelliten und Robotern, eingesetzt werden könnten. Was ist TinyIceNet? Das Modell ist ein kleines Bildverarbeitungsmodell, dessen Aufgabe es ist, Synthetic Aperture Radar (SAR)-Daten von Polarregionen und anderen kalten Orten zu nehmen und dann die Eisdicke und -reife innerhalb der SAR-Daten zu charakterisieren. Die Idee hier ist, dass dies auf dem Gerät sehr effizient wäre – „Anstatt riesige Mengen an Rohbildern herunterzulinken, könnten Satelliten SOD-Produkte nahezu in Echtzeit generieren“. Wie sie es gebaut haben: TinyIceNet ist ein vereinfachtes U-Net-Architektur-Bildverarbeitungsmodell, das auf dem AI4Arctic-Datensatz trainiert wurde, der ~533 netCDF-Dateien enthält, von denen jede SAR-Bilder enthält, die mit einer Karte verknüpft sind, die den Typ und die Dicke des Meereises angibt. Die Autoren entwerfen das Modell sorgfältig, um in eine relativ kleine Rechenhülle auf einem Xilinx-Chip zu passen. Konkret verwenden sie ein „AMD Xilinx ZCU102 Evaluation Board, das den ZCU9EG SoC integriert, der einen Quad-Core ARM Cortex-A53-Prozessor mit FPGA-Struktur kombiniert, unter Verwendung von High-Level Synthesis (HLS) und dem DeepEdgeSoC-Framework“. Sie verwenden die DeepEdgeSoC-Toolchain, um die Effizienz des Modells weiter zu verbessern, da die Software „eine Bibliothek modularer C++-Bausteine (z. B. Faltungen, Pooling, Aktivierungsfunktionen und Feature-Map-Puffer) bereitstellt, die zur Compile-Zeit mit C++-Template-Parametern spezialisiert werden können“. TinyIceNet wurde für 500 Iterationen auf einer einzelnen GeForce RTX 4090 GPU mit PyTorch 2.4 und CUDA 12.5-Unterstützung trainiert. Ergebnisse: Die Autoren testen das Modell auf 3 Hardware-Plattformen: * RTX 4090: „Bietet den höchsten Durchsatz mit 764,8 fps, profitiert von seiner großen Anzahl von CUDA-Kernen und hoher Speicherbandbreite. Diese Leistung geht jedoch mit relativ hohen Energiekosten von 228,7 mJ pro Szene einher, was sie für leistungsbeschränkte Umgebungen wie Satelliten ungeeignet macht.“ * Jetson AGX Xavier: „Erreicht 47,9 fps, zeigt aber den höchsten Energieverbrauch (1218,5 mJ).“ * Xilinx ZCU102 FPGA: „Erreicht einen geringeren Durchsatz von 7 fps, bietet aber ein äußerst wettbewerbsfähiges Energieprofil, das nur 113,6 mJ pro Szene verbraucht. Trotz der niedrigeren Bildrate macht diese Energieeffizienz die FPGA-Implementierung für die Bordverarbeitung in Satelliten attraktiv, wo die verfügbare Leistung stark eingeschränkt ist.“ Warum das wichtig ist – in Zukunft werden KI-Systeme dies automatisch tun: Das Erstaunliche an dieser Forschung ist, dass sie für ein modernes, leistungsstarkes KI-System trivial erscheint (ich meine keine Beleidigung für die Autoren): Alles, was es brauchte, war, eine Aufgabe zu identifizieren (stopfe ein Computer-Vision-Modell in eine kleine Rechenhülle) und dann

Weiterlesen

Der KI-Fortschritt ist schneller, als selbst angesehene Prognostiker vermuten können: …Ajeya Cotra aktualisiert ihre Zeitpläne… „Am 14. Januar habe ich Vorhersagen zum KI-Fortschritt im Jahr 2026 getroffen. Meine Prognosen für Softwareentwicklungsfähigkeiten fühlen sich bereits jetzt viel zu konservativ an“, schreibt Ajeya Cotra in einem Blog. Ajeya ist eine langjährige KI-Denkerin, die großartige Arbeit bei der Vorhersage von Zeitplänen für leistungsstarke KI geleistet hat. In diesem Beitrag erklärt sie, dass KI-Systeme schneller vorankommen, als sie dachte, angesichts der jüngsten METR-Ergebnisse, die Opus 4.6 einen Zeithorizont von 12 Stunden bescheinigen (Ajeya hatte im Januar für Ende 2026 ~24 Stunden vorhergesagt). „Es ist nicht länger sehr plausibel, dass KI-Agenten nach zehn ganzen Monaten zusätzlichen Fortschritts in diesem atemberaubenden Tempo bei 24-Stunden-Aufgaben immer noch in der Hälfte der Fälle Schwierigkeiten hätten“, schreibt Ajeya. „Ich würde schätzen, dass KI-Agenten bis zum Jahresende einen Zeithorizont von über 100 Stunden bei den Softwareaufgaben in METRs Suite haben werden … Und wenn man von mehreren Vollzeitäquivalent-Wochen Arbeit spricht, frage ich mich, ob das gesamte Konzept des ‚Zeithorizonts‘ zusammenbricht.“ Warum das wichtig ist – alle Lichter blinken gelb für eine Software-Explosion: Beiträge wie dieser sowie 70 % dessen, was ich in diesem Newsletter behandle, deuten alle darauf hin, dass KI-Systeme extrem gut, extrem schnell werden und die Wirtschaft schnell kolonisieren und wachsen lassen.

*** Möchten Sie KI-F&E messen? Hier sind 14 Möglichkeiten: …Generierung von Metriken über die bedeutendste Eigenschaft von KI… Das Größte, was mit künstlicher Intelligenz jemals passieren könnte, ist, wenn sie beginnt, sich selbst zu bauen. Dieses Phänomen, oft als rekursive Selbstverbesserung bezeichnet, wird von vielen als ein Ereignishorizont angesehen, jenseits dessen es zunehmend schwieriger wird, über die Zukunft zu argumentieren. Woher wüssten wir, ob wir uns diesem Punkt nähern? Forscher von GovAI und der University of Oxford haben ein Papier verfasst, das 14 verschiedene Metriken auflistet, die gemessen werden könnten, um uns zu helfen, das Ausmaß zu verstehen, in dem KI-Unternehmen erfolgreich KI-F&E-Automatisierung (AIRDA) aufbauen und überwachen – also KI dazu bringen, KI zu bauen, eine notwendige Voraussetzung für rekursive Selbstverbesserung. Warum sollte uns das interessieren: „AIRDA könnte den KI-Fortschritt beschleunigen, die Vorteile von KI früher bringen, aber auch das Eintreffen zerstörerischer Fähigkeiten beschleunigen, einschließlich solcher im Zusammenhang mit Massenvernichtungswaffen oder anderen Formen der Störung wie Arbeitslosigkeit“, schreiben sie. Was sind die 14 Metriken? 1. KI-Leistung bei KI-F&E messen 2. KI-Leistung bei KI-F&E im Vergleich zu Menschen und Mensch-KI-Teams messen 3. ‚Oversight Red Teaming‘ messen – wie gut menschliche Teams KI-Systeme, die sich selbst bauen, effektiv überwachen können 4. Fehlausrichtung in AIRDA messen 5. Die Rate der Effizienzverbesserungen bei KI-F&E-Aufgaben berechnen 6. Mitarbeiter befragen, wie sie KI nutzen und was dies für die Produktivität bedeutet 7. Herausfinden, ob und wie oft KI bei Entscheidungen mit hohem Risiko eingesetzt wird 8. Untersuchen, womit KI-Forscher ihre Zeit verbringen 9. Die Effektivität der Fähigkeit von Unternehmen, die KI-Entwicklung zu überwachen, meta-messen (z. B. die Rate von Fehlern oder unerwünschtem Verhalten, die trotz menschlicher Aufsicht in die Produktion gelangen) 10. Untersuchen, wie oft KI-Systeme die Ziele ihrer menschlichen Entwickler untergraben 11. Die Mitarbeiterzahl von KI-Forschern in Laboren sowie Details ihrer Leistung verfolgen 12. Die Verteilung der von KI-Unternehmen in ihrem KI-F&E-Prozess verwendeten Rechenleistung betrachten und wie sich diese ändert 13. Rechenleistung als Anteil der KI-F&E-Ausgaben untersuchen 14. Die Berechtigungen verstehen, die KI-Systeme haben, und wie sich die Großzügigkeit im Laufe der Zeit ändert Steuerung der KI-F&E: Die logische Frage, die sich aus dem Obigen ergibt, ist hoffentlich: „Wow, das klingt alles sehr folgenreich und wichtig, was können wir dagegen tun?“ Wie ich in diesem Newsletter oft schreibe, ist KI-Messung eine Voraussetzung für KI-Governance. Daher sollten mit diesen Maßnahmen einige verschiedene Akteure einige verschiedene Dinge tun. Insbesondere: Unternehmen sollten: * Differenziellen Fortschritt zwischen Sicherheits- und Fähigkeitsforschung verfolgen: Schreitet die Fähigkeitsforschung schneller voran als die Überwachungsforschung? * Verfolgen, wie KI-F&E die Überwachung beeinflusst: Automatisierung könnte Menschen freisetzen, um mehr Zeit in den Aufbau von Systemen zur Überwachung der Arbeit von KI-Systemen zu investieren. Andererseits könnte KI-gesteuerte F&E Systeme schaffen, die für Menschen von Natur aus schwerer zu verstehen sind, und das Volumen der von den KI-Systemen durchgeführten Aktivitäten könnte alle Überwachungssysteme überfordern. * Das tatsächliche Ausmaß der KI-F&E verfolgen: Sie können Metriken erstellen, die als Proxy für KI-F&E dienen – z. B. testen viele Labore heute, wie gut KI-Systeme KI-Kernel bauen oder KI-Modelle trainieren können. Sie können auch testen, wie viel KI-F&E-Automatisierung in Ihrer eigenen Organisation tatsächlich praktiziert wird. Ein weiterer Weg sind qualitative und quantitative Studien des menschlichen Personals, um zu verstehen, wie sich ihre eigenen Rollen verändern und wie KI bei zunehmend folgenreichen Entscheidungen eingesetzt wird. Regierungen sollten: * Systeme für vertrauliche Berichterstattung entwickeln, möglicherweise in Form von branchenweiten Aggregaten: Sobald Unternehmen diese Art von Daten messen, sollten Regierungen versuchen, Zugang zu ihnen zu erhalten, um die Form des KI-Fortschritts zu verstehen. Dritte sollten: * Metriken anhand öffentlicher Quellen schätzen: Öffentliche Berichte betrachten, um Schätzungen für Dinge zu erstellen, die mit KI-F&E zusammenhängen könnten, wie die Menge an Rechenleistung, die Unternehmen haben (z. B. machen Epoch und SemiAnalysis dies recht gut). * Werkzeuge entwickeln und Umfragen entwerfen: Werkzeuge bauen, die Unternehmen nutzen könnten, um mehr Telemetrie über KI-F&E zu generieren, und Umfragen bei Mitarbeitern von Unternehmen durchführen, um mehr Erkenntnisse zu sammeln. Warum das wichtig ist: „Ein Akteur hat in dem Maße die Aufsicht über den KI-F&E-Prozess, wie er (1) den Prozess versteht und (2) informierte Kontrolle darüber ausübt, um gewünschte Ergebnisse zu erzielen, z. B. durch die Überprüfung von KI-generierten Ergebnissen auf Fehler“, schreiben sie. Damit wir als Spezies überhaupt ‚Warnschüsse‘ bezüglich rekursiver Selbstverbesserung und eine Hoffnung auf ihre Steuerung haben, müssen wir in der Lage sein, diese Aspekte zu messen.

*** Indische Forscher prototypisieren mit Edge Computing ein stadtweites Kamera-Netzwerk: …Verkehrsüberwachung mit YOLO, SAM3 und NVIDIA Jetson-Chips… Forscher des Indian Institute of Science in Bengaluru haben ein Software- und Hardwaresystem zur intelligenten Überwachung des Verkehrs und der Fahrzeugtypen gebaut, die durch die Stadt Bengaluru fließen. Das sogenannte KI-gesteuerte intelligente Transportsystem (AIITS) erhöht die Menge an Intelligenz, die Stadtverkehrsanalysten durch den Einsatz von KI zur Verfügung steht. Wie das AIITS funktioniert: Das Ziel dieses Projekts ist es, „Echtzeitanalysen von Tausenden von Stadtkameras unter strengen Latenz- und Ressourcenbeschränkungen“ zu ermöglichen. Dazu verteilen sie eine Reihe von leichten GPUs (Jetson Edge Accelerators) in der Stadt und platzieren sie gemeinsam mit Verkehrskameras. Dies hilft den Verkehrskameras, intelligente Verarbeitung am Rand des Netzwerks durchzuführen, anstatt die extrem bandbreitenintensiven Daten an einen zentralen Hub zur Verarbeitung senden zu müssen; stattdessen teilen die Kamera und der Jetson Erkenntnisse zurück zum Hub zur Analyse und Neukalibrierung der Jetson-basierten ML-Modelle. Die Software funktioniert so: Videoströme von den Kameras kommen herein, und ein Segment-Anything (SAM3)-Modell segmentiert alle Objekte in den Videobildern, die ein Yolo26-Modell dann analysiert und mit Labels und Begrenzungsrahmen versieht. „Jeder Stream integriert BoT-SORT-Multi-Objekt-Tracking, das persistenten IDs zu erkannten Fahrzeugen über aufeinanderfolgende Frames hinweg zuweist.“ Sobald dies erledigt ist, wird die resultierende Intelligenz an einen entfernten GPU-Server gesendet, der zwei Dinge tut: 1. Er nimmt die resultierenden Daten auf und verwendet sie, um eine Art Wetterkarte von Verkehrshotspots zu erstellen sowie Vorhersagen über zukünftigen Verkehr zu treffen. 2. Er führt föderiertes Lernen durch; wenn er neue Fahrzeugklassen erkennt und sie mit SAM3 beschriftet, aktualisiert er Details und sendet sie an den Rand. „Jeder Jetson führt dann ein lokales Feintuning des YOLO-basierten Detektors durch, initialisiert mit den aktuellen globalen Gewichten.“ Der Prototyp funktioniert: Dieses System, das durch Simulation von 100 Kameras in einem Viertel in Bengaluru erstellt wurde, funktioniert gut genug, dass die Autoren planen, es für eine Live-Demonstration auf 1.000 Ströme zu skalieren. (Dieses Experiment wurde durch den Bau „einer verteilten Testumgebung durchgeführt, die ein großes städtisches Kameranetzwerk unter Verwendung von Hunderten von gleichzeitigen Real-Time Streaming Protocol (RTSP)-Videoströmen emuliert. Jeder Stream wird auf einem heterogenen Cluster von Raspberry Pis gehostet“.) „Durch die Lokalisierung der schweren Videoanalyse an der Netzwerkperipherie vermeidet das System zentrale Bandbreitenengpässe und ermöglicht eine nachhaltige, stadtweite Verkehrserfassung“, schreiben sie. Warum das wichtig ist – hin zu einer ‚lebendigen Stadt‘ durch KI: Arbeiten wie diese zeichnen eine Welt, in der Städte durch verteilte Umgebungsintelligenz in gleichem Maße wie ihre vorhandenen Sensoren zum Leben erwachen – Kameras wechseln von passiven Monitoren zu aktiven Klassifikatoren, Mikrofone beginnen, intelligent auf ein breiteres Spektrum von Geräuschen als nur Schüsse zu hören, und Straßensensoren modellieren Verkehrsmuster lokal. Diese Art von Intelligenz kann sowohl große Überwachungsarchitekturen schaffen als auch die Effizienz des Stadtbetriebs steigern – wie bei so vielen Dingen mit KI ist es eine Frage der Balance, begrenzt durch das umgebende Dickicht von Normen und Gesetzen, die bestimmen, wo zwischen Autoritarismus und Demokratie die resultierenden Fähigkeiten einzuordnen sind.

*** Hilfe für Satelliten bei der On-Device-KI für die Arktisüberwachung: …Frontier-Modelle sind wichtig, aber auch winzige, miniaturisierte Geräte für Edge Computing… Forscher des Deutschen Forschungszentrums für Künstliche Intelligenz haben TinyIceNet gebaut, ein sehr kleines Bildverarbeitungsmodell zur Schätzung der Meereisdicke aus Synthetic-Aperture-Radar-Daten. TinyIceNet ist eine Proof-of-Concept-Demonstration, wie man sehr leichte Bildverarbeitungsmodelle herstellt, die plausibel auf Geräten mit sehr geringer Leistung und teurer Bandbreite, wie Satelliten und Robotern, eingesetzt werden könnten. Was ist TinyIceNet? Das Modell ist ein kleines Bildverarbeitungsmodell, dessen Aufgabe es ist, Synthetic Aperture Radar (SAR)-Daten von Polarregionen und anderen kalten Orten zu nehmen und dann die Eisdicke und -reife innerhalb der SAR-Daten zu charakterisieren. Die Idee hier ist, dass dies auf dem Gerät sehr effizient wäre – „Anstatt riesige Mengen an Rohbildern herunterzulinken, könnten Satelliten SOD-Produkte nahezu in Echtzeit generieren“. Wie sie es gebaut haben: TinyIceNet ist ein vereinfachtes U-Net-Architektur-Bildverarbeitungsmodell, das auf dem AI4Arctic-Datensatz trainiert wurde, der ~533 netCDF-Dateien enthält, von denen jede SAR-Bilder enthält, die mit einer Karte verknüpft sind, die den Typ und die Dicke des Meereises angibt. Die Autoren entwerfen das Modell sorgfältig, um in eine relativ kleine Rechenhülle auf einem Xilinx-Chip zu passen. Konkret verwenden sie ein „AMD Xilinx ZCU102 Evaluation Board, das den ZCU9EG SoC integriert, der einen Quad-Core ARM Cortex-A53-Prozessor mit FPGA-Struktur kombiniert, unter Verwendung von High-Level Synthesis (HLS) und dem DeepEdgeSoC-Framework“. Sie verwenden die DeepEdgeSoC-Toolchain, um die Effizienz des Modells weiter zu verbessern, da die Software „eine Bibliothek modularer C++-Bausteine (z. B. Faltungen, Pooling, Aktivierungsfunktionen und Feature-Map-Puffer) bereitstellt, die zur Compile-Zeit mit C++-Template-Parametern spezialisiert werden können“. TinyIceNet wurde für 500 Iterationen auf einer einzelnen GeForce RTX 4090 GPU mit PyTorch 2.4 und CUDA 12.5-Unterstützung trainiert. Ergebnisse: Die Autoren testen das Modell auf 3 Hardware-Plattformen: * RTX 4090: „Bietet den höchsten Durchsatz mit 764,8 fps, profitiert von seiner großen Anzahl von CUDA-Kernen und hoher Speicherbandbreite. Diese Leistung geht jedoch mit relativ hohen Energiekosten von 228,7 mJ pro Szene einher, was sie für leistungsbeschränkte Umgebungen wie Satelliten ungeeignet macht.“ * Jetson AGX Xavier: „Erreicht 47,9 fps, zeigt aber den höchsten Energieverbrauch (1218,5 mJ).“ * Xilinx ZCU102 FPGA: „Erreicht einen geringeren Durchsatz von 7 fps, bietet aber ein äußerst wettbewerbsfähiges Energieprofil, das nur 113,6 mJ pro Szene verbraucht. Trotz der niedrigeren Bildrate macht diese Energieeffizienz die FPGA-Implementierung für die Bordverarbeitung in Satelliten attraktiv, wo die verfügbare Leistung stark eingeschränkt ist.“ Warum das wichtig ist – in Zukunft werden KI-Systeme dies automatisch tun: Das Erstaunliche an dieser Forschung ist, dass sie für ein modernes, leistungsstarkes KI-System trivial erscheint (ich meine keine Beleidigung für die Autoren): Alles, was es brauchte, war, eine Aufgabe zu identifizieren (stopfe ein Computer-Vision-Modell in eine kleine Rechenhülle) und dann

Import AI 447: Die AGI-Ökonomie; KI-Tests mit generierten Spielen; und Agenten-Ökologien

import_ai·2026-03-02WirtschaftForschungGesellschaft

Jetzt abonnieren

Die AGI-Ökonomie – die meiste Arbeit geht an die Maschinen, und der Mensch verlagert sich auf die Verifikation:

…Wie eine ernsthafte Auseinandersetzung mit der Singularität aussieht…

Forscher des MIT, der WashU und der UCLA haben ein unterhaltsames Paper mit dem Titel „Some Simple Economics of AGI“ verfasst, das sich mit den Folgen befasst, wenn Maschinen die überwältigende Mehrheit der Aufgaben in der Wirtschaft übernehmen können. Die Schlussfolgerung ist, dass unsere Fähigkeit als Menschen, diese riesige maschinengetriebene Wirtschaft zu kontrollieren und davon zu profitieren, davon abhängen wird, dass wir unsere Fähigkeiten auf die Überwachung und Verifikation der Handlungen unserer unzähligen KI-Agenten konzentrieren und uns handwerklichen Tätigkeiten widmen, bei denen der Wert mehr aus dem menschlichen Aspekt als aus einer bestimmten Fähigkeit erwächst.

Was ist AGI im wirtschaftlichen Sinne?

„Wir modellieren den AGI-Übergang als das Aufeinandertreffen zweier sich überholender Kostenkurven: einer exponentiell fallenden Kostenkurve für Automatisierung und einer biologisch begrenzten Kostenkurve für Verifikation“, schreiben die Autoren. „In einer Wirtschaft, in der autonome Agenten mit weitreichender Handlungsfähigkeit und nicht mit engen Anweisungen handeln, ist der bindende Engpass für Wachstum nicht länger Intelligenz. Es ist die menschliche Verifikationsbandbreite: die knappe Kapazität, Ergebnisse zu validieren, Verhalten zu prüfen und Bedeutung und Verantwortung zu verbürgen, wenn die Ausführung im Überfluss vorhanden ist… Wir bewegen uns von einer Ära, in der unser Wert durch unsere Fähigkeit zu bauen und zu entdecken definiert wurde, zu einer Ära, in der unser Überleben von unserer Fähigkeit abhängt, das Geschaffene zu lenken, zu verstehen und hinter seiner Bedeutung zu stehen.“

Die Risiken einer weitgehend menschenlosen Wirtschaft und der „Hohlen Wirtschaft“:

Wenn wir die Anzahl der KI-Agenten vervielfachen, ist es zwangsläufig so, dass wir mehr und mehr Arbeit an Maschinen delegieren. Eines der Hauptrisiken dabei ist das, was die Autoren eine „Trojanisches Pferd“-Externalität nennen: „Die gemessene Aktivität steigt, aber eine versteckte Schuld häuft sich in der Lücke zwischen sichtbaren Metriken und der tatsächlichen menschlichen Absicht an.“

Die Hohle Wirtschaft: „Agenten verbrauchen reale Ressourcen, um Output zu produzieren, der messbare Stellvertretergrößen erfüllt, während er die nicht gemessene Absicht verletzt. Während sich diese versteckte Schuld anhäuft, treibt sie das System in Richtung einer Hohlen Wirtschaft mit hohem nominalem Output, aber einbrechendem realisiertem Nutzen – ein Regime, in dem Agenten gefälschten Nutzen erzeugen“, schreiben sie.

Verifikation als Lösung:

Um dieses Risiko zu vermeiden, werden wir in Systeme investieren müssen, die verifizieren, dass KI-Agenten das tun, was wir von ihnen wollen, und die Risiken, die ihre Handlungen erzeugen, sorgfältig analysieren und bepreisen müssen. „Sicherzustellen, dass die Menschheit der Architekt ihrer Intelligenz bleibt, erfordert, dass die Verifikationskapazität proportional zu den KI-Fähigkeiten skaliert wird – durch aggressive Investitionen in Beobachtbarkeit, menschliche Augmentierung, synthetische Praxis, kryptografische Herkunft und Haftungsregime, die Extremrisiken internalisieren.“

Was sollten Menschen tun, um sich auf diesen Wandel vorzubereiten?

Um die Gesellschaft und den Einzelnen gut aufzustellen, sollten die Menschen Folgendes tun:

In Beobachtbarkeit investieren:

Einsatz von Werkzeugen, die hochdimensionales Agentenverhalten in Signale komprimieren, die Experten zuverlässig verarbeiten können, wodurch die Feedback-Latenz gesenkt und die Verifikationsgrenze erweitert wird.

KI nutzen, um die Mentoring in der frühen Karriere zu ersetzen:

Angesichts der wahrscheinlichen Reduzierung von Arbeitsplätzen für Berufsanfänger sollten wir Wege finden, diese Menschen zu augmentieren, damit sie wettbewerbsfähiger gegenüber KI werden, und wie wir „KI-gesteuerte synthetische Praxis nutzen können, um Erfahrungsbestände wieder aufzubauen, wenn traditionelle Ausbildungswege zusammenbrechen… KI kann hochrealistische Simulationen und personalisiertes Coaching erzeugen und so effektiv die fehlende Juniorenschleife durch komprimierte, risikofreie Trainingsumgebungen ersetzen, die den Erwerb von Fachwissen beschleunigen.“

Systeme für einen graziösen Abbau einrichten:

Während die Maschinenwirtschaft heiß läuft und die Messung überholt, sollten wir sicherstellen, dass sie in einen nicht verifizierten Zustand verfallen kann, ohne sozialen Schaden zu verursachen: Die Autoren schlagen dies vor, indem man „in Basis-Ausrichtung und Robustheit investiert, so dass Systeme, wenn die Aufsicht innerhalb der Messbarkeitslücke unweigerlich versagt, zu sicheren Basisrichtlinien zurückkehren, anstatt in nicht verifizierbaren Regimen aggressiv zu optimieren.“

Nebenbei bemerkt: Ist das „Theorie-Slop“?

Das Paper ist voller unterhaltsamer Ideen und gelegentlich fesselnder Formulierungen. Aber an verschiedenen Stellen beim Lesen hatte ich das deutliche Gefühl von KI-generiertem Inhalt, besonders bei den Abschnitten zur Wirtschaftstheorie, die eher der Performance von Theorie zu dienen schienen, als das Paper zu untermauern. Ein paar Leute, mit denen ich über das Paper sprach, stimmten dem zu. Aber es gibt keine wirkliche Möglichkeit, es zu wissen. Es ließ mich jedoch fragen, wie lange es dauern wird, bis ich anfange, Paper zu lesen, die hauptsächlich von KI-Systemen für den Konsum durch andere KI-Systeme geschrieben wurden.

Warum das wichtig ist – wir können eine enorm wohlhabende Gesellschaft haben, aber wir müssen uns ernsthaft mit AGI auseinandersetzen:

Dieses Paper geht davon aus, dass KI extrem schnell durch die Wirtschaft pflügen wird und die Menschen im Allgemeinen von der meister Arbeit weg und in eine passive Rolle drängen wird – es sei denn, wir bauen Verifikationsinfrastruktur und Geschäftsmodelle (auch durch Politik) auf, die es den Menschen ermöglichen, von diesem Wachstum zu profitieren und es zu lenken.

„Automatisierung kommodifiziert alles, was gemessen werden kann, und entzieht historisch prestigeträchtigen Rollen die Lohnprämie, sobald ihre Kern-Feedbackschleifen digitalisiert sind“, schreiben sie. „Für politische Entscheidungsträger verspricht es die breiteste Ausweitung der Bereitstellung öffentlicher Güter seit Generationen – aber nur, wenn die Verifikationsinfrastruktur und die Pipelines, die menschliche Verifizierer aufbauen, selbst als öffentliche Güter behandelt werden.“

Das Entscheidende hier ist das Element der Wahl: Wir können uns dafür entscheiden, eine Gesellschaft aufzubauen, die für KI bereit ist, oder wir können uns dafür entscheiden, anzunehmen, dass KI wie jede andere Technologie sein wird, und uns dann von einer Flutwelle treffen lassen.

Mehr lesen:

Some Simple Economics of AGI (arXiv)

.

***

Gespräch mit Ezra Klein: KI-Agenten, rekursive Selbstverbesserung und die Persönlichkeiten von LLMs:

…Ein langes Gespräch über die wirtschaftlichen Auswirkungen und politischen Möglichkeiten der KI-Ökonomie…

Hier ist ein Gespräch zwischen mir und Ezra Klein über KI-Agenten und wie die breitere Reifung der KI die Gesamtwirtschaft verändern könnte. Eine Sache, die ich an diesem Gespräch schätzte, war, dass Ezra mich nach einigen der größeren und ambitionierteren positiven politischen Ideen drängte – die KI-Community investiert viel in Risikominderungspolitik, denkt aber nicht genug über die großen Projekte nach, die die Gesellschaft unternehmen könnte, sobald KI wirklich, wirklich mächtig wird.

Sie können das Gespräch hier ansehen

:

„How Fast Will A.I. Agents Rip Through the Economy? | The Ezra Klein Show“ (YouTube).

***

KIs können Menschen alles beibringen, auch wie man besser Biowaffen herstellt:

…Die Dual-Use-Natur eines universellen Lehrers…

KI-Systeme können Novizen helfen, bei Biowaffen-bezogenen Aufgaben besser abzuschneiden, obwohl sie noch ziemlich ineffektiv sind und die Leistung über verschiedene Disziplinen hinweg variiert.

Was sie untersucht haben

: Forscher von Scale AI, SecureBio, der University of Oxford und der UC Berkeley untersuchten, wie verschiedene LLMs die Fähigkeiten von Personen verbessern könnten, die mit einer Reihe von Biowaffen-bezogenen Wissensaufgaben herausgefordert wurden. Sie verwendeten LLMs von OpenAI (o3), Google (Gemini 2.5 Pro und Gemini Deep Research) und Anthropic (Claude Sonnet 3.7 und Claude Opus 4).

„Wir führten eine multimodellbasierte, multi-benchmark Human-Uplift-Studie durch, die Novizen mit LLM-Zugang mit solchen mit reinem Internetzugang über acht biosecurity-relevante Aufgabensets hinweg verglich“, schreiben sie. „Die Teilnehmer arbeiteten an komplexen Problemen mit reichlich Zeit (bis zu 13 Stunden für die aufwändigsten Aufgaben). Wir fanden heraus, dass der LLM-Zugang einen erheblichen Uplift bot: Novizen mit LLMs waren 4,16× genauer als die Kontrollgruppe.“

Was sie getestet haben:

Sie testeten, wie gut 15 Menschen bei langwierigen Virologie-Aufgaben („ein herausforderndes mehrstufiges Protokoll zur Konstruktion eines neuartigen biologischen Agens“) und dem agentic bio-capabilities Benchmark („drei verschiedene Programmieraufgaben, die komplexe biosecurity-bezogene Problemlösungsexperimente abdeckten. Sie umfassten Herausforderungen wie die Interaktion mit simulierter Laborausrüstung (z. B. Flüssigkeitshandhabungsroboter) und das Zerlegen von Genfragmenten.“) abschnitten. Daneben nahmen 1-2 menschliche Teilnehmer an anderen Tests teil, darunter World Class Biology, Virology Capabilities Test, Human Pathogen Capabilities Test, Molecular Biology Capabilities Test, LAB-Bench und Humanity’s Last Exam.

Bei den größten Tests in Bezug auf die Anzahl der menschlichen Teilnehmer war die Leistung gemischt: Personen mit und ohne KI erzielten beim langwierigen Virologietest etwa gleich gute Ergebnisse, aber beim agentic bio-capabilities Test erzielten Personen mit KI-Zugang einen signifikanten Uplift.

Bei jedem anderen Test schnitten Personen mit KI-Zugang besser ab als diejenigen ohne – aber aufgrund der geringen Anzahl menschlicher Teilnehmer ist schwer zu sagen, ob diese Ergebnisse reproduzierbar wären.

Über alle Tests gemittelt, „erhöht der LLM-Zugang die Genauigkeit von Novizen von etwa 5 % auf über 17 %“.

Warum das wichtig ist – KI wird das Lehren, die Grenzen der Wissenschaft und vielleicht den Terrorismus revolutionieren:

Wenn man den Kontext weglässt, demonstriert dieses Paper lediglich, dass LLMs gut darin sind, Menschen Dinge beizubringen. Das ist intuitiv, hat aber große Auswirkungen. Hier: LLMs werden auf einen Teil der Wissenschaft ausgerichtet, in dem wir nicht unbedingt wollen, dass viele Menschen besser werden (Biowaffen), aber es könnte genauso gut auf jedes andere Fachgebiet ausgerichtet werden. Wann immer man die Eintrittsbarriere in ein Feld senkt, tun es mehr Menschen, und man bekommt mehr vom Guten und mehr vom Schlechten.

„Aufgaben, die einst Jahre formaler Ausbildung erforderten, wie Versuchsplanung, Protokoll-Fehlerbehebung und Elemente der sensiblen Sequenzlogik, können jetzt von Personen mit begrenzter Vorerfahrung durchgeführt werden“, schreiben sie. „LLMs senken möglicherweise materiell eine der wichtigsten historischen Barrieren für die Entwicklung biologischer Waffen: spezialisiertes Fachwissen und stilles technisches Wissen.“

Mehr lesen:

LLM Novice Uplift on Dual-Use, In Silico Biology Tasks (arXiv)

.

***

LLMs sind immer noch sehr schlecht in Videospielen:

…GAMESTORE beleuchtet eine dumme Seite der modernen KI und schlägt gleichzeitig einen neuen Weg zur Erstellung von Benchmarks vor…

Forscher des MIT, der Harvard University, der University of British Columbia, der Princeton University, der University of Cambridge und der Universitat Politècnica de València haben AI GAMESTORE entwickelt und veröffentlicht, einen Benchmark, der testet, wie gut KIs im Vergleich zu Menschen beim Spielen einfacher, im Web gefundener Spiele abschneiden. Die Ergebnisse sind ziemlich vernichtend für die KI-Systeme, wobei „State-of-the-Art-Modelle im Durchschnitt weniger als 30 % der menschlichen Basislinie erreichen, während sie 15-20× mehr Zeit für die Berechnung benötigen als Menschen“.

Was AI GAMESTORE ist:

AI GAMESTORE ist eine Sammlung von 100 Spielen, bei denen es sich um vereinfachte und nachgebildete Versionen beliebter Spiele handelt, die Menschen spielen. AI GAMESTORE wurde von den Autoren erstellt, indem sie 7.500 Spiele aus dem App Store sammelten und dann nur diejenigen mit 10.000+ Bewertungen und einer Bewertung von 4,5+ herausfilterten. Danach filterten sie die Spiele weiter mit Gemini Flash 2.5, das bewertete, ob 1) die Spiele innerhalb weniger Minuten spielbar sind, 2) in

p5.js

erstellt werden können, 3) eine quantifizierbare Möglichkeit zur Leistungsanzeige haben und 4) kein umfangreiches spielspezifisches Wissen (z. B. Poker) erfordern.

KI macht Spiele, um KI zu testen:

Anschließend verwenden sie Claude 4.5 Sonnet, um die Beschreibungen und andere Daten zu lesen und eine vereinfachte Version jedes Spiels in

p5.js

zu erstellen. Dann wird dieses Spiel auf Spielbarkeit getestet, dann von einem Menschen verfeinert, der das Spiel spielt und iterativ ein LLM auffordert, es zu verbessern. „Jeder Verfeinerungsschritt dauert etwa 2 Minuten. Im Durchschnitt dauerte dieser Prozess 4,7 Verfeinerungsschritte für alle 100 generierten Spiele“, schreiben sie. „Der End-to-End-Prozess der Generierung und Verfeinerung eines neuen Spiels mit Human-in-the-Loop kann in durchschnittlich etwa 30 Minuten abgeschlossen werden.“

Kennzeichnung für Fähigkeiten:

Jedes fertiggestellte Spiel wird von Menschen mit einem besonderen Schwerpunkt auf den Arten von kognitiven Anforderungen, die die Spiele mit sich bringen, gekennzeichnet. Diese Kennzeichnungen sind: VP = Visuelle Verarbeitung; ST = Räumlich-zeitliche Koordination; ME = Gedächtnis; PL = Planung; WM = Weltmodell-Lernen; PH = Physikalisches Denken; SO = Soziales Denken.

Modernste LLMs sind darin sehr schlecht:

Die Autoren vergleichen die Leistung von etwa ~100 Menschen mit der Leistung mehrerer modernster LLMs auf dem Korpus. Zu den untersuchten LLMs gehören: GPT-5.2, GPT-5-Mini, Gemini-2.5-Flash, Claude-Opus-4.5, Qwen-VL-32B und LLama-4-Maverick.

„Während die evaluierten Modelle die Fähigkeit demonstrieren, in den meisten Spielumgebungen zu navigieren und mit ihnen zu interagieren, bleibt eine erhebliche Leistungslücke zwischen KI-Agenten und menschlichen Teilnehmern bestehen“, schreiben die Forscher. „State-of-the-Art-Modelle wie GPT-5.2, GEMINI-2.5-PRO und CLAUDE-OPUS-4.5 erreichen alle geometrische Mittelwerte von weniger als 10 % der menschlichen Basislinie.“

Und es wird noch schlimmer, je genauer man hinsieht:

Die LLMs spielen auch mit Vorteilen, die Menschen nicht haben – jeder Mensch bekam 120 Sekunden, um jedes Spiel zu spielen, während jedes LLM die gleiche Zeit bekam,

aber

sie sind so schlecht in Vision und Low-Latency-Steuerung, dass die Forscher ihnen eine Kr

Weiterlesen

Jetzt abonnieren

Die AGI-Ökonomie – die meiste Arbeit geht an die Maschinen, und der Mensch verlagert sich auf die Verifikation:

…Wie eine ernsthafte Auseinandersetzung mit der Singularität aussieht…

Forscher des MIT, der WashU und der UCLA haben ein unterhaltsames Paper mit dem Titel „Some Simple Economics of AGI“ verfasst, das sich mit den Folgen befasst, wenn Maschinen die überwältigende Mehrheit der Aufgaben in der Wirtschaft übernehmen können. Die Schlussfolgerung ist, dass unsere Fähigkeit als Menschen, diese riesige maschinengetriebene Wirtschaft zu kontrollieren und davon zu profitieren, davon abhängen wird, dass wir unsere Fähigkeiten auf die Überwachung und Verifikation der Handlungen unserer unzähligen KI-Agenten konzentrieren und uns handwerklichen Tätigkeiten widmen, bei denen der Wert mehr aus dem menschlichen Aspekt als aus einer bestimmten Fähigkeit erwächst.

Was ist AGI im wirtschaftlichen Sinne?

„Wir modellieren den AGI-Übergang als das Aufeinandertreffen zweier sich überholender Kostenkurven: einer exponentiell fallenden Kostenkurve für Automatisierung und einer biologisch begrenzten Kostenkurve für Verifikation“, schreiben die Autoren. „In einer Wirtschaft, in der autonome Agenten mit weitreichender Handlungsfähigkeit und nicht mit engen Anweisungen handeln, ist der bindende Engpass für Wachstum nicht länger Intelligenz. Es ist die menschliche Verifikationsbandbreite: die knappe Kapazität, Ergebnisse zu validieren, Verhalten zu prüfen und Bedeutung und Verantwortung zu verbürgen, wenn die Ausführung im Überfluss vorhanden ist… Wir bewegen uns von einer Ära, in der unser Wert durch unsere Fähigkeit zu bauen und zu entdecken definiert wurde, zu einer Ära, in der unser Überleben von unserer Fähigkeit abhängt, das Geschaffene zu lenken, zu verstehen und hinter seiner Bedeutung zu stehen.“

Die Risiken einer weitgehend menschenlosen Wirtschaft und der „Hohlen Wirtschaft“:

Wenn wir die Anzahl der KI-Agenten vervielfachen, ist es zwangsläufig so, dass wir mehr und mehr Arbeit an Maschinen delegieren. Eines der Hauptrisiken dabei ist das, was die Autoren eine „Trojanisches Pferd“-Externalität nennen: „Die gemessene Aktivität steigt, aber eine versteckte Schuld häuft sich in der Lücke zwischen sichtbaren Metriken und der tatsächlichen menschlichen Absicht an.“

Die Hohle Wirtschaft: „Agenten verbrauchen reale Ressourcen, um Output zu produzieren, der messbare Stellvertretergrößen erfüllt, während er die nicht gemessene Absicht verletzt. Während sich diese versteckte Schuld anhäuft, treibt sie das System in Richtung einer Hohlen Wirtschaft mit hohem nominalem Output, aber einbrechendem realisiertem Nutzen – ein Regime, in dem Agenten gefälschten Nutzen erzeugen“, schreiben sie.

Verifikation als Lösung:

Um dieses Risiko zu vermeiden, werden wir in Systeme investieren müssen, die verifizieren, dass KI-Agenten das tun, was wir von ihnen wollen, und die Risiken, die ihre Handlungen erzeugen, sorgfältig analysieren und bepreisen müssen. „Sicherzustellen, dass die Menschheit der Architekt ihrer Intelligenz bleibt, erfordert, dass die Verifikationskapazität proportional zu den KI-Fähigkeiten skaliert wird – durch aggressive Investitionen in Beobachtbarkeit, menschliche Augmentierung, synthetische Praxis, kryptografische Herkunft und Haftungsregime, die Extremrisiken internalisieren.“

Was sollten Menschen tun, um sich auf diesen Wandel vorzubereiten?

Um die Gesellschaft und den Einzelnen gut aufzustellen, sollten die Menschen Folgendes tun:

In Beobachtbarkeit investieren:

Einsatz von Werkzeugen, die hochdimensionales Agentenverhalten in Signale komprimieren, die Experten zuverlässig verarbeiten können, wodurch die Feedback-Latenz gesenkt und die Verifikationsgrenze erweitert wird.

KI nutzen, um die Mentoring in der frühen Karriere zu ersetzen:

Angesichts der wahrscheinlichen Reduzierung von Arbeitsplätzen für Berufsanfänger sollten wir Wege finden, diese Menschen zu augmentieren, damit sie wettbewerbsfähiger gegenüber KI werden, und wie wir „KI-gesteuerte synthetische Praxis nutzen können, um Erfahrungsbestände wieder aufzubauen, wenn traditionelle Ausbildungswege zusammenbrechen… KI kann hochrealistische Simulationen und personalisiertes Coaching erzeugen und so effektiv die fehlende Juniorenschleife durch komprimierte, risikofreie Trainingsumgebungen ersetzen, die den Erwerb von Fachwissen beschleunigen.“

Systeme für einen graziösen Abbau einrichten:

Während die Maschinenwirtschaft heiß läuft und die Messung überholt, sollten wir sicherstellen, dass sie in einen nicht verifizierten Zustand verfallen kann, ohne sozialen Schaden zu verursachen: Die Autoren schlagen dies vor, indem man „in Basis-Ausrichtung und Robustheit investiert, so dass Systeme, wenn die Aufsicht innerhalb der Messbarkeitslücke unweigerlich versagt, zu sicheren Basisrichtlinien zurückkehren, anstatt in nicht verifizierbaren Regimen aggressiv zu optimieren.“

Nebenbei bemerkt: Ist das „Theorie-Slop“?

Das Paper ist voller unterhaltsamer Ideen und gelegentlich fesselnder Formulierungen. Aber an verschiedenen Stellen beim Lesen hatte ich das deutliche Gefühl von KI-generiertem Inhalt, besonders bei den Abschnitten zur Wirtschaftstheorie, die eher der Performance von Theorie zu dienen schienen, als das Paper zu untermauern. Ein paar Leute, mit denen ich über das Paper sprach, stimmten dem zu. Aber es gibt keine wirkliche Möglichkeit, es zu wissen. Es ließ mich jedoch fragen, wie lange es dauern wird, bis ich anfange, Paper zu lesen, die hauptsächlich von KI-Systemen für den Konsum durch andere KI-Systeme geschrieben wurden.

Warum das wichtig ist – wir können eine enorm wohlhabende Gesellschaft haben, aber wir müssen uns ernsthaft mit AGI auseinandersetzen:

Dieses Paper geht davon aus, dass KI extrem schnell durch die Wirtschaft pflügen wird und die Menschen im Allgemeinen von der meister Arbeit weg und in eine passive Rolle drängen wird – es sei denn, wir bauen Verifikationsinfrastruktur und Geschäftsmodelle (auch durch Politik) auf, die es den Menschen ermöglichen, von diesem Wachstum zu profitieren und es zu lenken.

„Automatisierung kommodifiziert alles, was gemessen werden kann, und entzieht historisch prestigeträchtigen Rollen die Lohnprämie, sobald ihre Kern-Feedbackschleifen digitalisiert sind“, schreiben sie. „Für politische Entscheidungsträger verspricht es die breiteste Ausweitung der Bereitstellung öffentlicher Güter seit Generationen – aber nur, wenn die Verifikationsinfrastruktur und die Pipelines, die menschliche Verifizierer aufbauen, selbst als öffentliche Güter behandelt werden.“

Das Entscheidende hier ist das Element der Wahl: Wir können uns dafür entscheiden, eine Gesellschaft aufzubauen, die für KI bereit ist, oder wir können uns dafür entscheiden, anzunehmen, dass KI wie jede andere Technologie sein wird, und uns dann von einer Flutwelle treffen lassen.

Mehr lesen:

Some Simple Economics of AGI (arXiv)

.

***

Gespräch mit Ezra Klein: KI-Agenten, rekursive Selbstverbesserung und die Persönlichkeiten von LLMs:

…Ein langes Gespräch über die wirtschaftlichen Auswirkungen und politischen Möglichkeiten der KI-Ökonomie…

Hier ist ein Gespräch zwischen mir und Ezra Klein über KI-Agenten und wie die breitere Reifung der KI die Gesamtwirtschaft verändern könnte. Eine Sache, die ich an diesem Gespräch schätzte, war, dass Ezra mich nach einigen der größeren und ambitionierteren positiven politischen Ideen drängte – die KI-Community investiert viel in Risikominderungspolitik, denkt aber nicht genug über die großen Projekte nach, die die Gesellschaft unternehmen könnte, sobald KI wirklich, wirklich mächtig wird.

Sie können das Gespräch hier ansehen

:

„How Fast Will A.I. Agents Rip Through the Economy? | The Ezra Klein Show“ (YouTube).

***

KIs können Menschen alles beibringen, auch wie man besser Biowaffen herstellt:

…Die Dual-Use-Natur eines universellen Lehrers…

KI-Systeme können Novizen helfen, bei Biowaffen-bezogenen Aufgaben besser abzuschneiden, obwohl sie noch ziemlich ineffektiv sind und die Leistung über verschiedene Disziplinen hinweg variiert.

Was sie untersucht haben

: Forscher von Scale AI, SecureBio, der University of Oxford und der UC Berkeley untersuchten, wie verschiedene LLMs die Fähigkeiten von Personen verbessern könnten, die mit einer Reihe von Biowaffen-bezogenen Wissensaufgaben herausgefordert wurden. Sie verwendeten LLMs von OpenAI (o3), Google (Gemini 2.5 Pro und Gemini Deep Research) und Anthropic (Claude Sonnet 3.7 und Claude Opus 4).

„Wir führten eine multimodellbasierte, multi-benchmark Human-Uplift-Studie durch, die Novizen mit LLM-Zugang mit solchen mit reinem Internetzugang über acht biosecurity-relevante Aufgabensets hinweg verglich“, schreiben sie. „Die Teilnehmer arbeiteten an komplexen Problemen mit reichlich Zeit (bis zu 13 Stunden für die aufwändigsten Aufgaben). Wir fanden heraus, dass der LLM-Zugang einen erheblichen Uplift bot: Novizen mit LLMs waren 4,16× genauer als die Kontrollgruppe.“

Was sie getestet haben:

Sie testeten, wie gut 15 Menschen bei langwierigen Virologie-Aufgaben („ein herausforderndes mehrstufiges Protokoll zur Konstruktion eines neuartigen biologischen Agens“) und dem agentic bio-capabilities Benchmark („drei verschiedene Programmieraufgaben, die komplexe biosecurity-bezogene Problemlösungsexperimente abdeckten. Sie umfassten Herausforderungen wie die Interaktion mit simulierter Laborausrüstung (z. B. Flüssigkeitshandhabungsroboter) und das Zerlegen von Genfragmenten.“) abschnitten. Daneben nahmen 1-2 menschliche Teilnehmer an anderen Tests teil, darunter World Class Biology, Virology Capabilities Test, Human Pathogen Capabilities Test, Molecular Biology Capabilities Test, LAB-Bench und Humanity’s Last Exam.

Bei den größten Tests in Bezug auf die Anzahl der menschlichen Teilnehmer war die Leistung gemischt: Personen mit und ohne KI erzielten beim langwierigen Virologietest etwa gleich gute Ergebnisse, aber beim agentic bio-capabilities Test erzielten Personen mit KI-Zugang einen signifikanten Uplift.

Bei jedem anderen Test schnitten Personen mit KI-Zugang besser ab als diejenigen ohne – aber aufgrund der geringen Anzahl menschlicher Teilnehmer ist schwer zu sagen, ob diese Ergebnisse reproduzierbar wären.

Über alle Tests gemittelt, „erhöht der LLM-Zugang die Genauigkeit von Novizen von etwa 5 % auf über 17 %“.

Warum das wichtig ist – KI wird das Lehren, die Grenzen der Wissenschaft und vielleicht den Terrorismus revolutionieren:

Wenn man den Kontext weglässt, demonstriert dieses Paper lediglich, dass LLMs gut darin sind, Menschen Dinge beizubringen. Das ist intuitiv, hat aber große Auswirkungen. Hier: LLMs werden auf einen Teil der Wissenschaft ausgerichtet, in dem wir nicht unbedingt wollen, dass viele Menschen besser werden (Biowaffen), aber es könnte genauso gut auf jedes andere Fachgebiet ausgerichtet werden. Wann immer man die Eintrittsbarriere in ein Feld senkt, tun es mehr Menschen, und man bekommt mehr vom Guten und mehr vom Schlechten.

„Aufgaben, die einst Jahre formaler Ausbildung erforderten, wie Versuchsplanung, Protokoll-Fehlerbehebung und Elemente der sensiblen Sequenzlogik, können jetzt von Personen mit begrenzter Vorerfahrung durchgeführt werden“, schreiben sie. „LLMs senken möglicherweise materiell eine der wichtigsten historischen Barrieren für die Entwicklung biologischer Waffen: spezialisiertes Fachwissen und stilles technisches Wissen.“

Mehr lesen:

LLM Novice Uplift on Dual-Use, In Silico Biology Tasks (arXiv)

.

***

LLMs sind immer noch sehr schlecht in Videospielen:

…GAMESTORE beleuchtet eine dumme Seite der modernen KI und schlägt gleichzeitig einen neuen Weg zur Erstellung von Benchmarks vor…

Forscher des MIT, der Harvard University, der University of British Columbia, der Princeton University, der University of Cambridge und der Universitat Politècnica de València haben AI GAMESTORE entwickelt und veröffentlicht, einen Benchmark, der testet, wie gut KIs im Vergleich zu Menschen beim Spielen einfacher, im Web gefundener Spiele abschneiden. Die Ergebnisse sind ziemlich vernichtend für die KI-Systeme, wobei „State-of-the-Art-Modelle im Durchschnitt weniger als 30 % der menschlichen Basislinie erreichen, während sie 15-20× mehr Zeit für die Berechnung benötigen als Menschen“.

Was AI GAMESTORE ist:

AI GAMESTORE ist eine Sammlung von 100 Spielen, bei denen es sich um vereinfachte und nachgebildete Versionen beliebter Spiele handelt, die Menschen spielen. AI GAMESTORE wurde von den Autoren erstellt, indem sie 7.500 Spiele aus dem App Store sammelten und dann nur diejenigen mit 10.000+ Bewertungen und einer Bewertung von 4,5+ herausfilterten. Danach filterten sie die Spiele weiter mit Gemini Flash 2.5, das bewertete, ob 1) die Spiele innerhalb weniger Minuten spielbar sind, 2) in

p5.js

erstellt werden können, 3) eine quantifizierbare Möglichkeit zur Leistungsanzeige haben und 4) kein umfangreiches spielspezifisches Wissen (z. B. Poker) erfordern.

KI macht Spiele, um KI zu testen:

Anschließend verwenden sie Claude 4.5 Sonnet, um die Beschreibungen und andere Daten zu lesen und eine vereinfachte Version jedes Spiels in

p5.js

zu erstellen. Dann wird dieses Spiel auf Spielbarkeit getestet, dann von einem Menschen verfeinert, der das Spiel spielt und iterativ ein LLM auffordert, es zu verbessern. „Jeder Verfeinerungsschritt dauert etwa 2 Minuten. Im Durchschnitt dauerte dieser Prozess 4,7 Verfeinerungsschritte für alle 100 generierten Spiele“, schreiben sie. „Der End-to-End-Prozess der Generierung und Verfeinerung eines neuen Spiels mit Human-in-the-Loop kann in durchschnittlich etwa 30 Minuten abgeschlossen werden.“

Kennzeichnung für Fähigkeiten:

Jedes fertiggestellte Spiel wird von Menschen mit einem besonderen Schwerpunkt auf den Arten von kognitiven Anforderungen, die die Spiele mit sich bringen, gekennzeichnet. Diese Kennzeichnungen sind: VP = Visuelle Verarbeitung; ST = Räumlich-zeitliche Koordination; ME = Gedächtnis; PL = Planung; WM = Weltmodell-Lernen; PH = Physikalisches Denken; SO = Soziales Denken.

Modernste LLMs sind darin sehr schlecht:

Die Autoren vergleichen die Leistung von etwa ~100 Menschen mit der Leistung mehrerer modernster LLMs auf dem Korpus. Zu den untersuchten LLMs gehören: GPT-5.2, GPT-5-Mini, Gemini-2.5-Flash, Claude-Opus-4.5, Qwen-VL-32B und LLama-4-Maverick.

„Während die evaluierten Modelle die Fähigkeit demonstrieren, in den meisten Spielumgebungen zu navigieren und mit ihnen zu interagieren, bleibt eine erhebliche Leistungslücke zwischen KI-Agenten und menschlichen Teilnehmern bestehen“, schreiben die Forscher. „State-of-the-Art-Modelle wie GPT-5.2, GEMINI-2.5-PRO und CLAUDE-OPUS-4.5 erreichen alle geometrische Mittelwerte von weniger als 10 % der menschlichen Basislinie.“

Und es wird noch schlimmer, je genauer man hinsieht:

Die LLMs spielen auch mit Vorteilen, die Menschen nicht haben – jeder Mensch bekam 120 Sekunden, um jedes Spiel zu spielen, während jedes LLM die gleiche Zeit bekam,

aber

sie sind so schlecht in Vision und Low-Latency-Steuerung, dass die Forscher ihnen eine Kr

Import AI 445: Zeitliche Steuerung von Superintelligenz; KI löst bahnbrechende mathematische Beweise; ein neuer ML-Forschungsbenchmark

import_ai·2026-02-16ForschungWirtschaftGesellschaft

Ökonom: Keine Sorge um KI-bedingte Arbeitslosigkeit, denn Menschen zahlen gerne für die 'menschliche Note':

…Selbst wenn man die Technologie zur Automatisierung hat, könnte man sich dennoch für einen Menschen entscheiden…Adam Ozimek, Chefökonom der Economic Innovation Group, hat einen Blogbeitrag verfasst, in dem er feststellt, dass es selbst dann noch einige Arbeitsplätze für Menschen geben wird, wenn KI viel, viel besser wird und in der Lage ist, die gesamte Arbeit zu erledigen, die Menschen tun, da Menschen in bestimmten Bereichen offenbar eine Präferenz für Menschen gegenüber Maschinen haben.

"Es gibt viele Jobs und Aufgaben, die längst hätten automatisiert werden können – die Technologie dafür existiert seit Langem – und dennoch machen wir Menschen sie weiterhin", schreibt er. "Der Grund ist, dass es immer eine Nachfrage nach bestimmten Jobs geben wird, die das bieten, was ich die 'menschliche Note' nenne."

Einige Beispiele hierfür: Livemusik, Schauspieler, Kellner, Reisebüros und viele Arten von Verkaufsjobs. Und es scheint, dass man umso mehr Kontakt zu Menschen wünscht, je mehr man für ein bestimmtes Gut oder Erlebnis ausgeben möchte: "Die menschliche Note scheint auch das zu sein, was Ökonomen ein 'normales Gut' nennen, was bedeutet, dass die Nachfrage danach mit steigendem Einkommen zunimmt", schreibt er. Beispiele hierfür könnten gehobene Restaurants und andere Concierge-ähnliche Erlebnisse sein.

Warum das wichtig ist – ein Weg durch die KI-Revolution könnte ein Anstieg der Mensch-zu-Mensch-Arbeit sein: Meine Annahme ist, dass 'Menschen Menschen mögen', und es eine hohe Wahrscheinlichkeit gibt, dass es selbst wenn KI große Teile der aktuellen Wirtschaft automatisiert, einen Boom der Nachfrage nach 'menschlichen Handwerkern' für eine Reihe neuer, noch nicht vorstellbarer Jobs und für die Verfeinerung bestehender menschlicher Berufe geben wird. Es besteht auch die Chance, dass die Löhne für diese Jobs durch eine Kombination aus Wirtschaftswachstum und progressiver politischer Arbeit der Regierungen massiv steigen könnten.

Mehr lesen: KI und die Ökonomie der menschlichen Note (Agglomerations, Substack).

***

Facebook entwickelt ein besseres Empfehlungssystem und ermittelt einige Skalierungsgesetze für Empfehlungen:

…Kunlun ist ein weiteres schönes Beispiel dafür, wie industrielle KI aussieht…

Facebook hat Details zu Kunlun veröffentlicht, einem Empfehlungssystem, das effizienter ist als frühere Entwicklungen des Werberiesen. Darüber hinaus hat Facebook ein vorhersagbares 'Skalierungsgesetz' für Kunlun-Modelle ermittelt, was es dem Unternehmen erleichtert, bisher ungekannte Rechenleistung in diese Modelle zu investieren, um eine vorhersagbarere Rendite zu erzielen. Dies ist eine große Sache, da Empfehlungssysteme das sind, was Unternehmen wie Facebook für Werbung verwenden, was sowohl a) die Art und Weise ist, wie sie den Großteil ihres Geldes verdienen, als auch b) einen enormen Einfluss auf die Kauf- und Aufmerksamkeitsgewohnheiten der Milliarden von Menschen hat, die Facebook und andere soziale Plattformen nutzen.

Empfehlungssysteme unterscheiden sich von LLMs: Wir haben seit einiger Zeit Skalierungsgesetze für LLMs wie Claude und ChatGPT, aber es war schwieriger, dieselben Skalierungsgesetze für Empfehlungsmodelle zu entwickeln. Dies liegt daran, dass Empfehlungsmodelle ganz anders funktionieren als LLMs, und daher ist die Erstellung von Skalierungsmodellen hier "eine offene Herausforderung für Systeme, die sowohl sequentielle Nutzerverhalten als auch nicht-sequentielle Kontextmerkmale gemeinsam modellieren".

Empfehlungsmodelle sind zudem tendenziell viel weniger effizient als LLMs: Empfehlungssysteme erreichen nur 3-15 % Model FLOPs Utilization (MFU), verglichen mit 40-60 % für LLMs, aufgrund heterogener Merkmalsräume, die zu kleinen Embedding-Dimensionen, unregelmäßigen Tensorformen und speichergebundenen Operationen führen.

Kunlun: Der Großteil des Papiers befasst sich mit dem Design von Kunlun, das im Grunde ein gut optimiertes Empfehlungssystem mit daraus resultierender besserer MFU ist. Kunlun enthält einen Kunlun Transformer Block für kontextbewusste Sequenzmodellierung über GDPA-verbesserte personalisierte Feed-Forward-Netzwerke und Multi-Head Self-Attention, sowie einen Kunlun Interaction Block "für bidirektionalen Informationsaustausch durch personalisierte Gewichtserzeugung, hierarchische Sequenzzusammenfassung und globale Merkmalsinteraktion". Es gibt eine Reihe weiterer Tricks, die Facebook zum Bau von Kunlun verwendet hat, und Sie können das Papier lesen, um mehr zu erfahren. Letztendlich verbessert Kunlun die MFU von 17 % auf 37 % auf NVIDIA B200 GPUs.

Warum das wichtig ist – ein Skalierungsgesetz für Geld: Die wichtigste Erkenntnis des Papiers ist, dass Kunlun-Modelle vorhersagbar skalieren und die Art von Potenzgesetz-Skalierungsverhalten zeigen, das Sprachmodelle aufweisen. Aber wo bei LLMs Skalierungsgesetze typischerweise über eine Reduzierung des Verlustes auf einem zugrunde liegenden Datensatz bewertet werden, ist es hier die normalisierte Entropie (NE). In Facebook-Experimenten entdecken sie zuverlässige Skalierungsgesetze sowohl für NE-Gewinne in Bezug auf die Menge an Gigaflops, die in das Training des Modells gesteckt werden, als auch verwandte Skalierungsgesetze für die Verbesserung der NE gemäß der Anzahl der verwendeten Schichten.

Die Kunlun-Modelle wurden "über wichtige Meta Ads Modelle hinweg bereitgestellt und liefern eine 1,2%ige Verbesserung der Topline-Metriken".

Was wir hier sehen, ist die Optimierung einiger der gesellschaftlich bedeutendsten KI-Systeme der Welt – solche, die Milliarden von Augenpaaren auf eine Vielzahl von Produkten und Online-Informationen lenken – die mit einem höheren Maß an Leistungsvorhersagbarkeit kollidiert; durch die Entwicklung dieser Skalierungsgesetze hat es Meta einfacher gemacht, noch mehr Rechenleistung auszugeben, um diese Modelle noch besser zu machen, indem die Investitionen in sie in Bezug auf die Intelligenzrendite auf das investierte Kapital vorhersagbarer werden.

Mehr lesen: Kunlun: Establishing Scaling Laws for Massive-Scale Recommendation Systems through Unified Architecture Design (arXiv).

***

Superintelligenz könnte Leben retten und verlängern, also sollten wir sie anstreben:

…Ein Pausieren oder Verlangsamen könnte am Ende der Exponentialkurve Sinn ergeben, ist aber riskant…

Nick Bostrom, ein Akademiker, der viele Menschen mit dem Konzept der Superintelligenz und des KI-Risikos bekannt gemacht hat, hat ein Papier verfasst, das die Idee darlegt, dass es sich lohnt, Superintelligenz anzustreben, selbst wenn die Wahrscheinlichkeit, dass sie zum Aussterben der Spezies führt, nicht Null ist, vorausgesetzt, sie kann die menschliche Gesundheit verbessern.

"Yudkowsky und Soares behaupten, dass, wenn jemand AGI baut, alle sterben. Man könnte gleichermaßen behaupten, dass, wenn niemand sie baut, alle sterben", schreibt Bostrom in Optimal Timing for Superintelligence. "Wenn der Übergang in die Ära der Superintelligenz gut verläuft, gibt es enorme Vorteile sowohl für die Rettung der Leben derzeit existierender Individuen als auch für die Sicherung des langfristigen Überlebens und Gedeihens erdgebundenen intelligenten Lebens. Die Wahl vor uns ist daher nicht zwischen einer risikofreien Basislinie und einem riskanten KI-Vorhaben. Es ist die Wahl zwischen verschiedenen riskanten Verläufen, die uns jeweils einer anderen Reihe von Gefahren aussetzen."

Warum wir Superintelligenz anstreben sollten, selbst mit einer Chance auf den Untergang: Wenn man an alle heute lebenden Menschen und die unterschiedlichen Lebenserwartungen denkt, die sie haben – insbesondere in Entwicklungsländern – dann kommt man zu der Ansicht, dass jeder Moment, den man mit der Bereitstellung von Superintelligenz verschwendet, menschliches Leid vermehrt.

"Wenn wir beide Seiten der Bilanz betrachten, wird klar, dass unsere individuelle Lebenserwartung höher ist, wenn Superintelligenz einigermaßen bald entwickelt wird. Darüber hinaus wäre das Leben, das wir gewinnen könnten, plausibel von unermesslich höherer Qualität als das Leben, das wir riskieren zu verlieren", schreibt Bostrom.

Schlüsselvariablen: Die Schlüsselvariablen sind hier natürlich das Risiko, dass eine Superintelligenz uns alle tötet, und auch die Geschwindigkeit, mit der Sicherheitsforschung diese Chance verringern kann. Aus dieser Sicht wird die Entwicklung von Superintelligenz unter den meisten Umständen zu einer günstigen Sache.

Die Geschwindigkeit des Fortschritts und die Reife der KI-Sicherheitsforschung könnten einen gewissen Einfluss auf den Zeitplan haben: "Wenn das anfängliche Risiko gering ist, ist die optimale Strategie, AGI so schnell wie möglich zu starten – es sei denn, der Sicherheitsfortschritt ist außergewöhnlich schnell, in welchem Fall eine kurze Verzögerung von ein paar Monaten gerechtfertigt sein kann. Mit zunehmendem Anfangsrisiko werden die optimalen Wartezeiten länger. Aber es sei denn, das Startrisiko ist sehr hoch und der Sicherheitsfortschritt schleppend, bleibt die bevorzugte Verzögerung bescheiden – typischerweise im einstelligen Jahresbereich".

Über das Pausieren – und die Gefahren und Vorteile desselben: Viele in der KI-Sicherheitsgemeinschaft möchten eine Art Pause der KI-Entwicklung, um mehr Zeit für KI-Sicherheitsforschung zu gewinnen. Bostrom ist ziemlich skeptisch, dass eine Pause wirksam sein wird, und skizziert einige der unerwünschten Auswirkungen, die sie haben könnte:

Zu früh: Wenn man es früh macht, denken die Leute, Pausen seien wirkungslos.

Schlechte Regulierung: Man unterbindet oder verzögert zukünftige gute Dinge aufgrund schlechter Regulierung.

Pause, außer für natsec: Sehr geringer gesellschaftlicher Nutzen, aber das Militär mit Zugang zu leistungsstarker KI wird sehr beängstigend.

Anhaltende Gefahr: Die Welt ist Risiken durch aktuelle KI ausgesetzt, ohne die Abwehrmechanismen, die fortschrittlichere KI bieten würde.

Warum das wichtig ist – Pausieren könnte nur ganz am Ende Sinn ergeben, und das ist von Natur aus riskant: Bostrom gelangt schließlich zu der Ansicht, dass es, soweit man eine Pause oder Verlangsamung der Entwicklung wünscht, am besten ist, dies zu tun, wenn man das größte Vertrauen hat, dass eine Pause wirksam wäre und dazu beitragen würde, die Wahrscheinlichkeit des Artensterbens zu verringern, und dass sie nicht zu früh kommt. Dies ermöglicht die größtmögliche Abwägung darüber, wie eine Superintelligenz eingeführt werden kann, ohne eine unangemessene Pause zu riskieren.

Kritiker dieser Ansicht könnten sagen, dass es dem Ratschlag gleicht, ein fallendes Messer zu fangen. Wenn man das Messer zu früh fängt, erleidet man enorme Schmerzen. Wenn man das Messer zu spät fängt, hat man seine Chance verpasst, und die Schwerkraft sorgt dafür, dass es dem, was unter einem ist, großen Schaden zufügt. Man muss das Timing genau richtig hinbekommen.

Bostrom fasst seine Position zusammen als: "schnell in den Hafen, langsam an den Liegeplatz: sich schnell in Richtung AGI-Fähigkeit bewegen, und dann, wenn wir mehr Informationen über die verbleibenden Sicherheitsherausforderungen und die Besonderheiten der Situation gewinnen, bereit sein, möglicherweise zu verlangsamen und Anpassungen vorzunehmen, während wir die kritischen Phasen des Hochskalierens und der Bereitstellung navigieren. In dieser letzten Phase könnte eine kurze Pause den größten Nutzen bringen."

Mehr lesen: Optimal Timing for Superintelligence (Nick Bostrom, PDF).

***

Können KI-Agenten eigenständig grundlegende KI-Forschungsaufgaben erledigen? AIRS-BENCH sagt ja:

…Und wir können erwarten, dass die heutigen Modelle viel besser darin sind, als das Papier vermuten lässt…

Forscher von Meta, der University of Oxford und dem University College London haben den AI Research Science Benchmark (AIRS-BENCH) entwickelt und veröffentlicht, eine Möglichkeit, zu testen, wie gut KI-Systeme aktuelle maschinelle Lernaufgaben erledigen können.

Woraus AIRS-BENCH besteht: AIRS-BENCH testet, wie gut Agenten 20 verschiedene Aufgaben lösen können, die aus 17 aktuellen Machine-Learning-Papieren stammen. Die Aufgaben umfassen eine Vielzahl technischer Genres, darunter: Maschinelles Lernen für Moleküle und Proteine, Fragebeantwortung, Textextraktion und -abgleich, Zeitreihen, Textklassifikation, Code und Mathematik.

Einige Beispielaufgaben:

CodeGenerationAPPSPassAt5: Lösen von Programmierproblemen durch Generieren von fünf verschiedenen Python-Programmen für jedes Problem.

CoreferenceResolutionWinograndeAccuracy: Identifizieren, auf welche von zwei möglichen Optionen sich ein Pronomen in einem Satz bezieht. Es verwendet den Winogrande-Datensatz, der Sätze mit einem mehrdeutigen Pronomen und zwei möglichen Antworten enthält.

TimeSeriesForecastingRideshareMAE: Durchführen von Zeitreihenprognosen über den Rideshare-Datensatz, der Teil des Monash Time Series Forecasting Repository ist.

Ergebnisse: Echte Probleme, schlechte Modelle: Dies ist ein etwas verwirrender Benchmark – die Aufgaben sind interessant und beinhalten viel Komplexität. Aber das Papier testet nur relativ schlechte Modelle, wie das Code World Model, o3-mini, gpt-oss-20b, gpt-oss-120b, GPT-4o und Devstral-Small 24B. Dies ist eine sehr amüsante Sammlung von Modellen, und keines davon ist ein echtes Spitzenmodell – einer der Papierautoren schrieb auf Twitter "this took some time to get out", was also einfach ein Artefakt langsamer Veröffentlichungszeitpläne sein könnte.

In Tests erreicht keines der Modelle die Elo-Bewertung eines erstklassigen Menschen – aber ich bin mir nicht sicher, was ich daraus machen soll, bis ich Ergebnisse mit leistungsstärkeren Modellen sehe.

Warum das wichtig ist – Modelle könnten andere Lösungen als Menschen hervorbringen, und dies ist eine coole Möglichkeit zu untersuchen, ob es hier ein 'Skalierungsgesetz' gibt: Eine Art und Weise, wie dies interessant sein könnte, ist das Verständnis der unterschiedlichen Arten, wie Modelle Aufgaben im Vergleich zu Menschen lösen könnten. In einem Beispiel, TextualClassificationSickAccuracy, mussten Modelle bestimmen, ob ein Paar von Sätzen eine Beziehung aufweist, die entweder Folgerung, Widerspruch oder keine Beziehung beinhaltet.

Der SOTA aus der Literatur ist eine Person, die RoBERTa auf dem zugrunde liegenden Trainingssatz feinabstimmt und auf dem Testsatz testet. Im Vergleich dazu produziert der bestgetestete AIRS-BENCH-Agent, GPT-OSS-120B, "ein zweistufiges gestapeltes Ensemble, das mehrere Transformer-Modelle und einen Meta-Lerner kombiniert. RoBERTa-large und DeBERTa-v3-large werden unabhängig voneinander auf dem SICK-Trainingssatz feinabgestimmt. Jedes Modell verarbeitet Satzpaare und gibt Logits für jede Klasse aus. Das Training wird unter Verwendung einer 5-fachen stratifizierten Kreuzvalidierung durchgeführt, die robuste Out-of-Fold (OOF)-Vorhersagen gewährleistet und Überanpassung verhindert. Die Logits beider Basismodelle werden konkaten

Weiterlesen

Ökonom: Keine Sorge um KI-bedingte Arbeitslosigkeit, denn Menschen zahlen gerne für die 'menschliche Note':

…Selbst wenn man die Technologie zur Automatisierung hat, könnte man sich dennoch für einen Menschen entscheiden…Adam Ozimek, Chefökonom der Economic Innovation Group, hat einen Blogbeitrag verfasst, in dem er feststellt, dass es selbst dann noch einige Arbeitsplätze für Menschen geben wird, wenn KI viel, viel besser wird und in der Lage ist, die gesamte Arbeit zu erledigen, die Menschen tun, da Menschen in bestimmten Bereichen offenbar eine Präferenz für Menschen gegenüber Maschinen haben.

"Es gibt viele Jobs und Aufgaben, die längst hätten automatisiert werden können – die Technologie dafür existiert seit Langem – und dennoch machen wir Menschen sie weiterhin", schreibt er. "Der Grund ist, dass es immer eine Nachfrage nach bestimmten Jobs geben wird, die das bieten, was ich die 'menschliche Note' nenne."

Einige Beispiele hierfür: Livemusik, Schauspieler, Kellner, Reisebüros und viele Arten von Verkaufsjobs. Und es scheint, dass man umso mehr Kontakt zu Menschen wünscht, je mehr man für ein bestimmtes Gut oder Erlebnis ausgeben möchte: "Die menschliche Note scheint auch das zu sein, was Ökonomen ein 'normales Gut' nennen, was bedeutet, dass die Nachfrage danach mit steigendem Einkommen zunimmt", schreibt er. Beispiele hierfür könnten gehobene Restaurants und andere Concierge-ähnliche Erlebnisse sein.

Warum das wichtig ist – ein Weg durch die KI-Revolution könnte ein Anstieg der Mensch-zu-Mensch-Arbeit sein: Meine Annahme ist, dass 'Menschen Menschen mögen', und es eine hohe Wahrscheinlichkeit gibt, dass es selbst wenn KI große Teile der aktuellen Wirtschaft automatisiert, einen Boom der Nachfrage nach 'menschlichen Handwerkern' für eine Reihe neuer, noch nicht vorstellbarer Jobs und für die Verfeinerung bestehender menschlicher Berufe geben wird. Es besteht auch die Chance, dass die Löhne für diese Jobs durch eine Kombination aus Wirtschaftswachstum und progressiver politischer Arbeit der Regierungen massiv steigen könnten.

Mehr lesen: KI und die Ökonomie der menschlichen Note (Agglomerations, Substack).

***

Facebook entwickelt ein besseres Empfehlungssystem und ermittelt einige Skalierungsgesetze für Empfehlungen:

…Kunlun ist ein weiteres schönes Beispiel dafür, wie industrielle KI aussieht…

Facebook hat Details zu Kunlun veröffentlicht, einem Empfehlungssystem, das effizienter ist als frühere Entwicklungen des Werberiesen. Darüber hinaus hat Facebook ein vorhersagbares 'Skalierungsgesetz' für Kunlun-Modelle ermittelt, was es dem Unternehmen erleichtert, bisher ungekannte Rechenleistung in diese Modelle zu investieren, um eine vorhersagbarere Rendite zu erzielen. Dies ist eine große Sache, da Empfehlungssysteme das sind, was Unternehmen wie Facebook für Werbung verwenden, was sowohl a) die Art und Weise ist, wie sie den Großteil ihres Geldes verdienen, als auch b) einen enormen Einfluss auf die Kauf- und Aufmerksamkeitsgewohnheiten der Milliarden von Menschen hat, die Facebook und andere soziale Plattformen nutzen.

Empfehlungssysteme unterscheiden sich von LLMs: Wir haben seit einiger Zeit Skalierungsgesetze für LLMs wie Claude und ChatGPT, aber es war schwieriger, dieselben Skalierungsgesetze für Empfehlungsmodelle zu entwickeln. Dies liegt daran, dass Empfehlungsmodelle ganz anders funktionieren als LLMs, und daher ist die Erstellung von Skalierungsmodellen hier "eine offene Herausforderung für Systeme, die sowohl sequentielle Nutzerverhalten als auch nicht-sequentielle Kontextmerkmale gemeinsam modellieren".

Empfehlungsmodelle sind zudem tendenziell viel weniger effizient als LLMs: Empfehlungssysteme erreichen nur 3-15 % Model FLOPs Utilization (MFU), verglichen mit 40-60 % für LLMs, aufgrund heterogener Merkmalsräume, die zu kleinen Embedding-Dimensionen, unregelmäßigen Tensorformen und speichergebundenen Operationen führen.

Kunlun: Der Großteil des Papiers befasst sich mit dem Design von Kunlun, das im Grunde ein gut optimiertes Empfehlungssystem mit daraus resultierender besserer MFU ist. Kunlun enthält einen Kunlun Transformer Block für kontextbewusste Sequenzmodellierung über GDPA-verbesserte personalisierte Feed-Forward-Netzwerke und Multi-Head Self-Attention, sowie einen Kunlun Interaction Block "für bidirektionalen Informationsaustausch durch personalisierte Gewichtserzeugung, hierarchische Sequenzzusammenfassung und globale Merkmalsinteraktion". Es gibt eine Reihe weiterer Tricks, die Facebook zum Bau von Kunlun verwendet hat, und Sie können das Papier lesen, um mehr zu erfahren. Letztendlich verbessert Kunlun die MFU von 17 % auf 37 % auf NVIDIA B200 GPUs.

Warum das wichtig ist – ein Skalierungsgesetz für Geld: Die wichtigste Erkenntnis des Papiers ist, dass Kunlun-Modelle vorhersagbar skalieren und die Art von Potenzgesetz-Skalierungsverhalten zeigen, das Sprachmodelle aufweisen. Aber wo bei LLMs Skalierungsgesetze typischerweise über eine Reduzierung des Verlustes auf einem zugrunde liegenden Datensatz bewertet werden, ist es hier die normalisierte Entropie (NE). In Facebook-Experimenten entdecken sie zuverlässige Skalierungsgesetze sowohl für NE-Gewinne in Bezug auf die Menge an Gigaflops, die in das Training des Modells gesteckt werden, als auch verwandte Skalierungsgesetze für die Verbesserung der NE gemäß der Anzahl der verwendeten Schichten.

Die Kunlun-Modelle wurden "über wichtige Meta Ads Modelle hinweg bereitgestellt und liefern eine 1,2%ige Verbesserung der Topline-Metriken".

Was wir hier sehen, ist die Optimierung einiger der gesellschaftlich bedeutendsten KI-Systeme der Welt – solche, die Milliarden von Augenpaaren auf eine Vielzahl von Produkten und Online-Informationen lenken – die mit einem höheren Maß an Leistungsvorhersagbarkeit kollidiert; durch die Entwicklung dieser Skalierungsgesetze hat es Meta einfacher gemacht, noch mehr Rechenleistung auszugeben, um diese Modelle noch besser zu machen, indem die Investitionen in sie in Bezug auf die Intelligenzrendite auf das investierte Kapital vorhersagbarer werden.

Mehr lesen: Kunlun: Establishing Scaling Laws for Massive-Scale Recommendation Systems through Unified Architecture Design (arXiv).

***

Superintelligenz könnte Leben retten und verlängern, also sollten wir sie anstreben:

…Ein Pausieren oder Verlangsamen könnte am Ende der Exponentialkurve Sinn ergeben, ist aber riskant…

Nick Bostrom, ein Akademiker, der viele Menschen mit dem Konzept der Superintelligenz und des KI-Risikos bekannt gemacht hat, hat ein Papier verfasst, das die Idee darlegt, dass es sich lohnt, Superintelligenz anzustreben, selbst wenn die Wahrscheinlichkeit, dass sie zum Aussterben der Spezies führt, nicht Null ist, vorausgesetzt, sie kann die menschliche Gesundheit verbessern.

"Yudkowsky und Soares behaupten, dass, wenn jemand AGI baut, alle sterben. Man könnte gleichermaßen behaupten, dass, wenn niemand sie baut, alle sterben", schreibt Bostrom in Optimal Timing for Superintelligence. "Wenn der Übergang in die Ära der Superintelligenz gut verläuft, gibt es enorme Vorteile sowohl für die Rettung der Leben derzeit existierender Individuen als auch für die Sicherung des langfristigen Überlebens und Gedeihens erdgebundenen intelligenten Lebens. Die Wahl vor uns ist daher nicht zwischen einer risikofreien Basislinie und einem riskanten KI-Vorhaben. Es ist die Wahl zwischen verschiedenen riskanten Verläufen, die uns jeweils einer anderen Reihe von Gefahren aussetzen."

Warum wir Superintelligenz anstreben sollten, selbst mit einer Chance auf den Untergang: Wenn man an alle heute lebenden Menschen und die unterschiedlichen Lebenserwartungen denkt, die sie haben – insbesondere in Entwicklungsländern – dann kommt man zu der Ansicht, dass jeder Moment, den man mit der Bereitstellung von Superintelligenz verschwendet, menschliches Leid vermehrt.

"Wenn wir beide Seiten der Bilanz betrachten, wird klar, dass unsere individuelle Lebenserwartung höher ist, wenn Superintelligenz einigermaßen bald entwickelt wird. Darüber hinaus wäre das Leben, das wir gewinnen könnten, plausibel von unermesslich höherer Qualität als das Leben, das wir riskieren zu verlieren", schreibt Bostrom.

Schlüsselvariablen: Die Schlüsselvariablen sind hier natürlich das Risiko, dass eine Superintelligenz uns alle tötet, und auch die Geschwindigkeit, mit der Sicherheitsforschung diese Chance verringern kann. Aus dieser Sicht wird die Entwicklung von Superintelligenz unter den meisten Umständen zu einer günstigen Sache.

Die Geschwindigkeit des Fortschritts und die Reife der KI-Sicherheitsforschung könnten einen gewissen Einfluss auf den Zeitplan haben: "Wenn das anfängliche Risiko gering ist, ist die optimale Strategie, AGI so schnell wie möglich zu starten – es sei denn, der Sicherheitsfortschritt ist außergewöhnlich schnell, in welchem Fall eine kurze Verzögerung von ein paar Monaten gerechtfertigt sein kann. Mit zunehmendem Anfangsrisiko werden die optimalen Wartezeiten länger. Aber es sei denn, das Startrisiko ist sehr hoch und der Sicherheitsfortschritt schleppend, bleibt die bevorzugte Verzögerung bescheiden – typischerweise im einstelligen Jahresbereich".

Über das Pausieren – und die Gefahren und Vorteile desselben: Viele in der KI-Sicherheitsgemeinschaft möchten eine Art Pause der KI-Entwicklung, um mehr Zeit für KI-Sicherheitsforschung zu gewinnen. Bostrom ist ziemlich skeptisch, dass eine Pause wirksam sein wird, und skizziert einige der unerwünschten Auswirkungen, die sie haben könnte:

Zu früh: Wenn man es früh macht, denken die Leute, Pausen seien wirkungslos.

Schlechte Regulierung: Man unterbindet oder verzögert zukünftige gute Dinge aufgrund schlechter Regulierung.

Pause, außer für natsec: Sehr geringer gesellschaftlicher Nutzen, aber das Militär mit Zugang zu leistungsstarker KI wird sehr beängstigend.

Anhaltende Gefahr: Die Welt ist Risiken durch aktuelle KI ausgesetzt, ohne die Abwehrmechanismen, die fortschrittlichere KI bieten würde.

Warum das wichtig ist – Pausieren könnte nur ganz am Ende Sinn ergeben, und das ist von Natur aus riskant: Bostrom gelangt schließlich zu der Ansicht, dass es, soweit man eine Pause oder Verlangsamung der Entwicklung wünscht, am besten ist, dies zu tun, wenn man das größte Vertrauen hat, dass eine Pause wirksam wäre und dazu beitragen würde, die Wahrscheinlichkeit des Artensterbens zu verringern, und dass sie nicht zu früh kommt. Dies ermöglicht die größtmögliche Abwägung darüber, wie eine Superintelligenz eingeführt werden kann, ohne eine unangemessene Pause zu riskieren.

Kritiker dieser Ansicht könnten sagen, dass es dem Ratschlag gleicht, ein fallendes Messer zu fangen. Wenn man das Messer zu früh fängt, erleidet man enorme Schmerzen. Wenn man das Messer zu spät fängt, hat man seine Chance verpasst, und die Schwerkraft sorgt dafür, dass es dem, was unter einem ist, großen Schaden zufügt. Man muss das Timing genau richtig hinbekommen.

Bostrom fasst seine Position zusammen als: "schnell in den Hafen, langsam an den Liegeplatz: sich schnell in Richtung AGI-Fähigkeit bewegen, und dann, wenn wir mehr Informationen über die verbleibenden Sicherheitsherausforderungen und die Besonderheiten der Situation gewinnen, bereit sein, möglicherweise zu verlangsamen und Anpassungen vorzunehmen, während wir die kritischen Phasen des Hochskalierens und der Bereitstellung navigieren. In dieser letzten Phase könnte eine kurze Pause den größten Nutzen bringen."

Mehr lesen: Optimal Timing for Superintelligence (Nick Bostrom, PDF).

***

Können KI-Agenten eigenständig grundlegende KI-Forschungsaufgaben erledigen? AIRS-BENCH sagt ja:

…Und wir können erwarten, dass die heutigen Modelle viel besser darin sind, als das Papier vermuten lässt…

Forscher von Meta, der University of Oxford und dem University College London haben den AI Research Science Benchmark (AIRS-BENCH) entwickelt und veröffentlicht, eine Möglichkeit, zu testen, wie gut KI-Systeme aktuelle maschinelle Lernaufgaben erledigen können.

Woraus AIRS-BENCH besteht: AIRS-BENCH testet, wie gut Agenten 20 verschiedene Aufgaben lösen können, die aus 17 aktuellen Machine-Learning-Papieren stammen. Die Aufgaben umfassen eine Vielzahl technischer Genres, darunter: Maschinelles Lernen für Moleküle und Proteine, Fragebeantwortung, Textextraktion und -abgleich, Zeitreihen, Textklassifikation, Code und Mathematik.

Einige Beispielaufgaben:

CodeGenerationAPPSPassAt5: Lösen von Programmierproblemen durch Generieren von fünf verschiedenen Python-Programmen für jedes Problem.

CoreferenceResolutionWinograndeAccuracy: Identifizieren, auf welche von zwei möglichen Optionen sich ein Pronomen in einem Satz bezieht. Es verwendet den Winogrande-Datensatz, der Sätze mit einem mehrdeutigen Pronomen und zwei möglichen Antworten enthält.

TimeSeriesForecastingRideshareMAE: Durchführen von Zeitreihenprognosen über den Rideshare-Datensatz, der Teil des Monash Time Series Forecasting Repository ist.

Ergebnisse: Echte Probleme, schlechte Modelle: Dies ist ein etwas verwirrender Benchmark – die Aufgaben sind interessant und beinhalten viel Komplexität. Aber das Papier testet nur relativ schlechte Modelle, wie das Code World Model, o3-mini, gpt-oss-20b, gpt-oss-120b, GPT-4o und Devstral-Small 24B. Dies ist eine sehr amüsante Sammlung von Modellen, und keines davon ist ein echtes Spitzenmodell – einer der Papierautoren schrieb auf Twitter "this took some time to get out", was also einfach ein Artefakt langsamer Veröffentlichungszeitpläne sein könnte.

In Tests erreicht keines der Modelle die Elo-Bewertung eines erstklassigen Menschen – aber ich bin mir nicht sicher, was ich daraus machen soll, bis ich Ergebnisse mit leistungsstärkeren Modellen sehe.

Warum das wichtig ist – Modelle könnten andere Lösungen als Menschen hervorbringen, und dies ist eine coole Möglichkeit zu untersuchen, ob es hier ein 'Skalierungsgesetz' gibt: Eine Art und Weise, wie dies interessant sein könnte, ist das Verständnis der unterschiedlichen Arten, wie Modelle Aufgaben im Vergleich zu Menschen lösen könnten. In einem Beispiel, TextualClassificationSickAccuracy, mussten Modelle bestimmen, ob ein Paar von Sätzen eine Beziehung aufweist, die entweder Folgerung, Widerspruch oder keine Beziehung beinhaltet.

Der SOTA aus der Literatur ist eine Person, die RoBERTa auf dem zugrunde liegenden Trainingssatz feinabstimmt und auf dem Testsatz testet. Im Vergleich dazu produziert der bestgetestete AIRS-BENCH-Agent, GPT-OSS-120B, "ein zweistufiges gestapeltes Ensemble, das mehrere Transformer-Modelle und einen Meta-Lerner kombiniert. RoBERTa-large und DeBERTa-v3-large werden unabhängig voneinander auf dem SICK-Trainingssatz feinabgestimmt. Jedes Modell verarbeitet Satzpaare und gibt Logits für jede Klasse aus. Das Training wird unter Verwendung einer 5-fachen stratifizierten Kreuzvalidierung durchgeführt, die robuste Out-of-Fold (OOF)-Vorhersagen gewährleistet und Überanpassung verhindert. Die Logits beider Basismodelle werden konkaten