OpenWAI News

OpenWAI News

kuratierte KI-Nachrichten, übersetzt und thematisch geordnet

Fehler in Docker Model Runner erlaubt Sandboxausbruch unter macOS

Nutzen Angreifer eine Sicherheitslücke in Docker unter macOS erfolgreich aus, können sie aus der Sandbox ausbrechen und Schadcode im Hostsystem ausführen. Eine dagegen gerüstete Version steht zum Download bereit. Die Sicherheitslücke In einer Warnmeldung erläutern die Entwickler, dass die Schwachstelle (CVE-2026-5843 „hoch“) in Docker Model Runner zum Laden und Ausführen von lokalen LLMs steckt. Darüber können Angreifer die Komponente dazu bringen, ein mit Schadcode verseuchtes KI-Modell zu laden. Dafür müssen sie aber über ein Netzwerk Zugriff auf Container haben. Das Sicherheitsproblem liegt konkret im Umgang mit Python-Code in diesem Kontext. Weil keine Überprüfung stattfindet, wird ein LLM ohne Sicherheitsabfrage direkt geladen. Unter macOS handhabt Apples MLX-Framework lokale KI-Modelle. In diesem Fall liest MLX die config.json und führt malicious_script.py direkt aus. Weil MLX außerhalb der Docker-Umgebung ohne Sandbox direkt auf Systemebene läuft, können Angreifer eigenen Code mit den Rechten des Nutzers ausführen können.

Die Entwickler geben an, dass Docker ab Version 4.56.0 bedroht ist. Sie versichern, die Sicherheitsproblematik in der Ausgabe 4.71.0 gelöst zu haben. Bislang gibt es keine Berichte, dass Angreifer die Lücke bereits ausnutzen. Die Version ist bereits seit April dieses Jahres verfügbar. Konkrete Informationen zur Lücke sind aber erst seit Kurzem bekannt. Aktuell ist die Ausgabe 4.75.0, in der die Entwickler unter macOS und Windows verschiedene Bugs ausgebügelt haben. In 4.72.0 haben sie die Linux-Kernel-Sicherheitslücke „Copy Fail“ (CVE-2026-31432 „hoch“) geschlossen. Die Copy-Fail-Schwachstelle wird bereits ausgenutzt und Angreifer kompromittieren darüber Systeme als root-Nutzer. Demzufolge sollten Admins sicherstellen, dass auf ihren Systemen eine aktuelle Ausgabe installiert ist.

Weiterlesen

Nutzen Angreifer eine Sicherheitslücke in Docker unter macOS erfolgreich aus, können sie aus der Sandbox ausbrechen und Schadcode im Hostsystem ausführen. Eine dagegen gerüstete Version steht zum Download bereit. Die Sicherheitslücke In einer Warnmeldung erläutern die Entwickler, dass die Schwachstelle (CVE-2026-5843 „hoch“) in Docker Model Runner zum Laden und Ausführen von lokalen LLMs steckt. Darüber können Angreifer die Komponente dazu bringen, ein mit Schadcode verseuchtes KI-Modell zu laden. Dafür müssen sie aber über ein Netzwerk Zugriff auf Container haben. Das Sicherheitsproblem liegt konkret im Umgang mit Python-Code in diesem Kontext. Weil keine Überprüfung stattfindet, wird ein LLM ohne Sicherheitsabfrage direkt geladen. Unter macOS handhabt Apples MLX-Framework lokale KI-Modelle. In diesem Fall liest MLX die config.json und führt malicious_script.py direkt aus. Weil MLX außerhalb der Docker-Umgebung ohne Sandbox direkt auf Systemebene läuft, können Angreifer eigenen Code mit den Rechten des Nutzers ausführen können.

Die Entwickler geben an, dass Docker ab Version 4.56.0 bedroht ist. Sie versichern, die Sicherheitsproblematik in der Ausgabe 4.71.0 gelöst zu haben. Bislang gibt es keine Berichte, dass Angreifer die Lücke bereits ausnutzen. Die Version ist bereits seit April dieses Jahres verfügbar. Konkrete Informationen zur Lücke sind aber erst seit Kurzem bekannt. Aktuell ist die Ausgabe 4.75.0, in der die Entwickler unter macOS und Windows verschiedene Bugs ausgebügelt haben. In 4.72.0 haben sie die Linux-Kernel-Sicherheitslücke „Copy Fail“ (CVE-2026-31432 „hoch“) geschlossen. Die Copy-Fail-Schwachstelle wird bereits ausgenutzt und Angreifer kompromittieren darüber Systeme als root-Nutzer. Demzufolge sollten Admins sicherstellen, dass auf ihren Systemen eine aktuelle Ausgabe installiert ist.

Dell AI Factory 2.0: Neue Server mit Nvidia B300 und eigenes Dateisystem

Auf seiner Hausmesse hat Dell neue und erweiterte Integrationen mit Nvidia, Intel, Google, Cohere, Hugging Face, Palantir und ServiceNow vorgestellt. Hinzu kamen Erweiterungen der Dell AI Data Platform, das Dell Data Lakehouse und das neue parallele Dateisystem Project Lightning. Damit soll die KI näher an die Unternehmensdaten gebracht werden. Laut Michael Dell planen 85 Prozent der Firmen, generative KI-Workloads innerhalb der nächsten 24 Monate on-premises auszuführen. Mehr On-Prem-Modelle und Partnerstacks Zentraler Baustein bleibt die Dell AI Factory mit Nvidia. Dell hat dazu Version 2.0 angekündigt. Sie kombiniert neue KI-Server, Netzwerk, Storage, Kühlung, Managed Services und Softwarekomponenten für Training, Inferenz und agentische KI. Dazu gehören unter anderem die PowerEdge-Systeme XE9780L und XE9785L mit jeweils acht Nvidia-B300-Beschleunigern sowie Support für Nvidia RTX Pro 6000. Daneben erweitert Dell die AI Factory um Intel-Gaudi-3-Beschleuniger und den PowerEdge XE9680. Dell positioniert die Plattform als validierte Komplettlösung mit PowerEdge-Servern, PowerScale-Storage, PowerSwitch-Netzwerk, Services und einem Open-Source-Softwarestack, beispielsweise PyTorch, Kubernetes, Grafana und Prometheus. Auch bei Modellen und Agentenplattformen baut Dell das Angebot aus. Gemeinsam mit Google Cloud sollen Gemini-Modelle on-premises bereitgestellt werden. Die Lösung steht exklusiv für Dell-Kunden zur Verfügung und soll mehr Kontrolle über Daten und Infrastruktur ermöglichen. Mit Cohere bringt Dell außerdem die Agentenplattform Cohere North auf die eigene Infrastruktur. North soll sich mit Dell-Storage und allen Datenquellen verbinden lassen. Als validierte On-Prem-Lösungen nennt Dell unter anderem Hugging Face, Palantir, Reflection, ServiceNow und SpaceXAI. Hinzu kommen validierte KI-Lösungen mit Mistral, Fogsphere, Ipsotek, UneeQ Digital Humans und Poolside, die über den Katalog der Dell Automation Platform bereitgestellt werden können. Damit deckt Dell ein breites Spektrum ab: Modelle, Agentenplattformen, Entwicklungswerkzeuge, Workflow-Automation, Computer Vision und verschiedene Formen des Datenzugriffs.

On-Prem-Modelle allein lösen das zentrale Problem allerdings nicht: Agenten, RAG-Anwendungen und domänenspezifische Modelle benötigen Zugriff auf bereinigte, auffindbare und schnell verfügbare Daten. Diese liegen häufig verteilt in File- und Object-Stores, Datenbanken, ERP- und CRM-Systemen oder an Edge-Standorten. Hier setzt Dell mit der erweiterten AI Data Platform an. Sie soll Datenquellen erschließen, Datenflüsse beschleunigen und Unternehmensdaten für KI-Anwendungen besser nutzbar machen. In der Keynote beschrieb Dell-COO Jeff Clarke die Plattform als neues Element der AI Factory. Sie soll helfen, Daten für KI-Workflows vorzubereiten, zu organisieren, zu verarbeiten und zu schützen. Lakehouse, PowerScale und ObjectScale Ein Baustein der AI Data Platform ist das Dell Data Lakehouse. Es kombiniert die Skalierbarkeit und Kosteneffizienz eines Data Lake mit der Struktur und Zuverlässigkeit eines Data Warehouse. Eine föderierte Query Engine soll Daten über verschiedene Umgebungen hinweg auffindbar, analysierbar und verarbeitbar machen. Zudem soll sie helfen, die Orchestrierung für Agenten zu automatisieren. Als Storage-Grundlage nennt Dell PowerScale und ObjectScale. PowerScale ist für File- und Object-Storage für unstrukturierte Daten und KI-Analysen zuständig, ObjectScale S3-kompatible Object-Workloads. Dell hatte bereits kurz vor der Veranstaltung angekündigt, PowerFlex in Dell Exascale Storage einzubinden. Damit deckt die Architektur Blockzugriffe über PowerFlex, File-Workloads über PowerScale und Lightning sowie Object-Storage über ObjectScale ab. Für KI-Anwendungen ist diese Trennung relevant, weil Trainings-, Inferenz- und RAG-Workloads häufig andere Datenpfade benötigen als klassische Unternehmensanwendungen. Während ERP- und Datenbankdaten oft blockbasiert verarbeitet werden, dominieren bei vielen KI-Workloads unstrukturierte Daten, File- und Object-Zugriffe, Vektorindizes, Metadaten und Kontextinformationen. Lightning File System für GPU-Workloads Mit Project Lightning kündigte Dell ein neues paralleles Dateisystem für KI- und HPC-Workloads an. Es ist für hohen Durchsatz, niedrige Latenz und parallele Zugriffe vieler GPU-Knoten ausgelegt. Dell nennt als Einsatzfelder unter anderem Training, Inferenz, Checkpointing, Key-Value-Caching und Metadatenanalysen. Pro Node verspricht Dell 97 GByte/s Random-Read-Durchsatz und 97 Prozent Bandbreiteneffizienz. Die Architektur nutzt RDMA-Netzwerke und unterstützt Nvidia GPUDirect Storage. Damit soll Lightning einen 67 Prozent schnelleren Datenzugriff und einen doppelt so hohen Durchsatz gegenüber dem Wettbewerb erreichen. Zusätzlich arbeitet Dell mit Nvidia an einer hochskalierbaren Caching-Lösung für beschleunigte Inferenz. Sie integriert sich mit Nvidias NIXL-Bibliothek und zielt auf agentische Workloads sowie Reasoning-Modelle mit langen Denk- und Kontextphasen. Dell nennt dafür bis zu 100-mal mehr Tokens pro Sekunde und 80 Prozent geringere Latenz. Eine On-Prem-Plattform für die ganze KI Dell entwickelt seine AI Factory von einer reinen GPU- und Infrastrukturplattform zu einer umfassenden Umgebung für Enterprise-KI. Die Partnerstacks liefern Modelle, Agenten und Integrationen; die AI Data Platform organisiert und beschleunigt den Zugriff auf Unternehmensdaten. Das passt zum On-Prem-Trend: KI soll dort laufen, wo Daten, Latenzanforderungen, Zugriffsrechte und Governance-Vorgaben liegen. Doch ob das in heterogenen Umgebungen funktioniert, hängt weniger vom Modellkatalog als von Datenqualität, Governance, Zugriffsrechten und den tatsächlichen Datenpfaden ab. Dell liefert dafür zwar mehr Bausteine, die eigentliche Arbeit bleibt jedoch die gleiche: Unternehmen müssen wissen, welche Daten sie haben, wie relevant sie im Einzelfall sind und ob sie für KI überhaupt brauchbar sind.

Weiterlesen

Auf seiner Hausmesse hat Dell neue und erweiterte Integrationen mit Nvidia, Intel, Google, Cohere, Hugging Face, Palantir und ServiceNow vorgestellt. Hinzu kamen Erweiterungen der Dell AI Data Platform, das Dell Data Lakehouse und das neue parallele Dateisystem Project Lightning. Damit soll die KI näher an die Unternehmensdaten gebracht werden. Laut Michael Dell planen 85 Prozent der Firmen, generative KI-Workloads innerhalb der nächsten 24 Monate on-premises auszuführen. Mehr On-Prem-Modelle und Partnerstacks Zentraler Baustein bleibt die Dell AI Factory mit Nvidia. Dell hat dazu Version 2.0 angekündigt. Sie kombiniert neue KI-Server, Netzwerk, Storage, Kühlung, Managed Services und Softwarekomponenten für Training, Inferenz und agentische KI. Dazu gehören unter anderem die PowerEdge-Systeme XE9780L und XE9785L mit jeweils acht Nvidia-B300-Beschleunigern sowie Support für Nvidia RTX Pro 6000. Daneben erweitert Dell die AI Factory um Intel-Gaudi-3-Beschleuniger und den PowerEdge XE9680. Dell positioniert die Plattform als validierte Komplettlösung mit PowerEdge-Servern, PowerScale-Storage, PowerSwitch-Netzwerk, Services und einem Open-Source-Softwarestack, beispielsweise PyTorch, Kubernetes, Grafana und Prometheus. Auch bei Modellen und Agentenplattformen baut Dell das Angebot aus. Gemeinsam mit Google Cloud sollen Gemini-Modelle on-premises bereitgestellt werden. Die Lösung steht exklusiv für Dell-Kunden zur Verfügung und soll mehr Kontrolle über Daten und Infrastruktur ermöglichen. Mit Cohere bringt Dell außerdem die Agentenplattform Cohere North auf die eigene Infrastruktur. North soll sich mit Dell-Storage und allen Datenquellen verbinden lassen. Als validierte On-Prem-Lösungen nennt Dell unter anderem Hugging Face, Palantir, Reflection, ServiceNow und SpaceXAI. Hinzu kommen validierte KI-Lösungen mit Mistral, Fogsphere, Ipsotek, UneeQ Digital Humans und Poolside, die über den Katalog der Dell Automation Platform bereitgestellt werden können. Damit deckt Dell ein breites Spektrum ab: Modelle, Agentenplattformen, Entwicklungswerkzeuge, Workflow-Automation, Computer Vision und verschiedene Formen des Datenzugriffs.

On-Prem-Modelle allein lösen das zentrale Problem allerdings nicht: Agenten, RAG-Anwendungen und domänenspezifische Modelle benötigen Zugriff auf bereinigte, auffindbare und schnell verfügbare Daten. Diese liegen häufig verteilt in File- und Object-Stores, Datenbanken, ERP- und CRM-Systemen oder an Edge-Standorten. Hier setzt Dell mit der erweiterten AI Data Platform an. Sie soll Datenquellen erschließen, Datenflüsse beschleunigen und Unternehmensdaten für KI-Anwendungen besser nutzbar machen. In der Keynote beschrieb Dell-COO Jeff Clarke die Plattform als neues Element der AI Factory. Sie soll helfen, Daten für KI-Workflows vorzubereiten, zu organisieren, zu verarbeiten und zu schützen. Lakehouse, PowerScale und ObjectScale Ein Baustein der AI Data Platform ist das Dell Data Lakehouse. Es kombiniert die Skalierbarkeit und Kosteneffizienz eines Data Lake mit der Struktur und Zuverlässigkeit eines Data Warehouse. Eine föderierte Query Engine soll Daten über verschiedene Umgebungen hinweg auffindbar, analysierbar und verarbeitbar machen. Zudem soll sie helfen, die Orchestrierung für Agenten zu automatisieren. Als Storage-Grundlage nennt Dell PowerScale und ObjectScale. PowerScale ist für File- und Object-Storage für unstrukturierte Daten und KI-Analysen zuständig, ObjectScale S3-kompatible Object-Workloads. Dell hatte bereits kurz vor der Veranstaltung angekündigt, PowerFlex in Dell Exascale Storage einzubinden. Damit deckt die Architektur Blockzugriffe über PowerFlex, File-Workloads über PowerScale und Lightning sowie Object-Storage über ObjectScale ab. Für KI-Anwendungen ist diese Trennung relevant, weil Trainings-, Inferenz- und RAG-Workloads häufig andere Datenpfade benötigen als klassische Unternehmensanwendungen. Während ERP- und Datenbankdaten oft blockbasiert verarbeitet werden, dominieren bei vielen KI-Workloads unstrukturierte Daten, File- und Object-Zugriffe, Vektorindizes, Metadaten und Kontextinformationen. Lightning File System für GPU-Workloads Mit Project Lightning kündigte Dell ein neues paralleles Dateisystem für KI- und HPC-Workloads an. Es ist für hohen Durchsatz, niedrige Latenz und parallele Zugriffe vieler GPU-Knoten ausgelegt. Dell nennt als Einsatzfelder unter anderem Training, Inferenz, Checkpointing, Key-Value-Caching und Metadatenanalysen. Pro Node verspricht Dell 97 GByte/s Random-Read-Durchsatz und 97 Prozent Bandbreiteneffizienz. Die Architektur nutzt RDMA-Netzwerke und unterstützt Nvidia GPUDirect Storage. Damit soll Lightning einen 67 Prozent schnelleren Datenzugriff und einen doppelt so hohen Durchsatz gegenüber dem Wettbewerb erreichen. Zusätzlich arbeitet Dell mit Nvidia an einer hochskalierbaren Caching-Lösung für beschleunigte Inferenz. Sie integriert sich mit Nvidias NIXL-Bibliothek und zielt auf agentische Workloads sowie Reasoning-Modelle mit langen Denk- und Kontextphasen. Dell nennt dafür bis zu 100-mal mehr Tokens pro Sekunde und 80 Prozent geringere Latenz. Eine On-Prem-Plattform für die ganze KI Dell entwickelt seine AI Factory von einer reinen GPU- und Infrastrukturplattform zu einer umfassenden Umgebung für Enterprise-KI. Die Partnerstacks liefern Modelle, Agenten und Integrationen; die AI Data Platform organisiert und beschleunigt den Zugriff auf Unternehmensdaten. Das passt zum On-Prem-Trend: KI soll dort laufen, wo Daten, Latenzanforderungen, Zugriffsrechte und Governance-Vorgaben liegen. Doch ob das in heterogenen Umgebungen funktioniert, hängt weniger vom Modellkatalog als von Datenqualität, Governance, Zugriffsrechten und den tatsächlichen Datenpfaden ab. Dell liefert dafür zwar mehr Bausteine, die eigentliche Arbeit bleibt jedoch die gleiche: Unternehmen müssen wissen, welche Daten sie haben, wie relevant sie im Einzelfall sind und ob sie für KI überhaupt brauchbar sind.

KI-Boom treibt Nvidias Taiwan-Ausgaben in drei Jahren von 15 auf 150 Milliarden Dollar

the_decoder·2026-05-27WirtschaftInfrastruktur

Nvidia gibt mittlerweile bis zu 150 Milliarden US-Dollar pro Jahr für seine Zulieferer wie TSMC in Taiwan aus. Vor drei oder vier Jahren seien es nur 10 bis 15 Milliarden Dollar jährlich gewesen. Das sagte CEO Jensen Huang bei einem Firmentreffen in Taipei, laut Nikkei Asia.

Nvidia plant zudem, die Belegschaft in Taiwan von derzeit 1.000 auf 4.000 Mitarbeiter zu vervierfachen. Dafür entsteht in Taipei ein neuer Firmenkomplex namens Constellation, dessen Bau Ende 2026 starten und 2030 fertig sein soll. Das Konzept soll später am neuen kalifornischen Hauptsitz wiederholt werden.

Konkurrent AMD will ebenfalls stärker in Taiwan investieren. AMD-Chefin Lisa Su kündigte mehr als 10 Milliarden Dollar für Taiwans Chip-Ökosystem an, vor allem um Kapazität für fortschrittliches Packaging zu sichern.

Die Summe ist jedoch nicht direkt mit Nvidias Ausgaben vergleichbar: AMD nennt eine mehrjährige Investition in zusätzliche Kapazität, während Huang über Nvidias laufende jährliche Ausgaben bei taiwanischen Zulieferern sprach.

Weiterlesen

Nvidia gibt mittlerweile bis zu 150 Milliarden US-Dollar pro Jahr für seine Zulieferer wie TSMC in Taiwan aus. Vor drei oder vier Jahren seien es nur 10 bis 15 Milliarden Dollar jährlich gewesen. Das sagte CEO Jensen Huang bei einem Firmentreffen in Taipei, laut Nikkei Asia.

Nvidia plant zudem, die Belegschaft in Taiwan von derzeit 1.000 auf 4.000 Mitarbeiter zu vervierfachen. Dafür entsteht in Taipei ein neuer Firmenkomplex namens Constellation, dessen Bau Ende 2026 starten und 2030 fertig sein soll. Das Konzept soll später am neuen kalifornischen Hauptsitz wiederholt werden.

Konkurrent AMD will ebenfalls stärker in Taiwan investieren. AMD-Chefin Lisa Su kündigte mehr als 10 Milliarden Dollar für Taiwans Chip-Ökosystem an, vor allem um Kapazität für fortschrittliches Packaging zu sichern.

Die Summe ist jedoch nicht direkt mit Nvidias Ausgaben vergleichbar: AMD nennt eine mehrjährige Investition in zusätzliche Kapazität, während Huang über Nvidias laufende jährliche Ausgaben bei taiwanischen Zulieferern sprach.

heise-Angebot: CLC 2026: KI-Agenten, Platform Engineering und Software Delivery im Fokus

Bei der von iX und dpunkt.verlag organisierten Konferenz CLC 2026 dreht sich vom 10. bis 12. November in Mannheim alles um die Bereiche Developer Experience, Platform Engineering und Software Delivery. Ein besonderer Fokus liegt in diesem Jahr darauf, wie Agentic AI die Arbeit von Senior-Softwareentwicklern, Software-Architekten, DevOps- und Platform Engineers verändert und wie sich digitale Souveränität nachhaltig erreichen lässt.

Die Veranstaltung beginnt am Dienstag, dem 10. November, mit drei ganztägigen Vor-Ort-Workshops. Daniel Bodky (NETWAYS) führt unter dem Titel „Von Zero Observability zu Zero-Code Observability“ in die praktische Arbeit mit OpenTelemetry ein. Mathias Tausig und Andreas Boll (SBA Research) widmen sich den „Container Security Fundamentals“, während Hossein Salahi (Liquid Reply) in seinem Workshop den Aufbau KI-nativer Plattformen behandelt.

KI-Agenten als roter Faden durch die Konferenztage

Den inhaltlichen Auftakt in das deutsch-englische Vortragsprogramm am Mittwoch, dem 11. November, bildet die Keynote „Why SREs and AI Agents Are a Perfect Match – Real demos, real infrastructure, real failures“ von Paul Stack (System Initiative). Die anschließenden Tracks zeigen, dass KI-Agenten und ihr Zusammenspiel mit klassischen Delivery-Praktiken einen Schwerpunkt der Konferenz bilden. Steffen Schluff und Thorsten Maier (Accenture) sprechen unter dem Titel „Weniger tippen, mehr denken“ über den Einfluss von KI-Agenten auf die Developer Experience. Robert Hoffmann und Christian Denich (Amazon Web Services) berichten in „From AI-frustrated to AI-native – The Amazon Story So Far“ über die interne Transformation des Konzerns.

Rainer Stropek (software architects) argumentiert in „From DevOps to AgentOps: Why Rock-Solid CI/CD Makes You AI-Ready“, dass solide Pipelines die Voraussetzung für den produktiven Einsatz von Agenten seien. Prerit Munjal (Groupon) verknüpft KI mit dem Abbau technischer Schulden („AI at the Door, Turning ‚Tech Debt Panic‘ into ‚Tech Debt Repairs‘“). Mirko Böttcher und Oliver Zeigermann (Techniker Krankenkasse) räumen unter „Wie erkläre ich es meinem Chef?“ mit Mythen und Missverständnissen rund um GenAI, LLMs und Agenten auf. Benjamin Hofmann (Hyground) erläutert in „How an AI SRE agent can manage 20,000 workloads“ den Einsatz eines SRE-Agenten im Großbetrieb. Ergänzend ist ein „Panel on AI in Software Delivery“ angesetzt.

Am Donnerstag schildern Oliver Nocon und Lukas Heimann (SAP) im Praxisbericht „Vibe Coding im Konzern“, wie SAP KI-gestützte Entwicklung skaliert, während Mario-Leander Reimer (QAware) mit „Zero Trust Agents“ zeigt, wie sich KI-Workloads mit OPA und Kubernetes absichern lassen.

Platform Engineering, Multi-Cluster-Betrieb und GitOps

Ein zweiter inhaltlicher Block widmet sich dem Aufbau und Betrieb interner Entwicklerplattformen. Dominik Schmidle (Giant Swarm) stellt in „What Platform-as-a-Product Actually Means (And What Most Teams Get Wrong)“ Produktdenken in der Plattformentwicklung in den Mittelpunkt. Sönke Sothmann und Johannes Koch (FICO) behandeln „Kubernetes Custom Resources as Your Platform API: Declarative Self-Service with Crossplane“. Alexander Troppmann und Bruno Margula (Carl ZEISS) berichten unter „Custom-build Platform Tooling mit AI“ darüber, was in der Praxis funktioniert und was nicht. Lian Li widmet sich dem Inner Sourcing einer Internal Developer Platform und Tobias Hauser (Vodafone) beschreibt mit „Vom Betreiber zum Plattformbauer“, wie IT-Operations zur Plattformorganisation wird.

Im Kubernetes-Umfeld erläutert Nicholas Dille (Haufe) die Cluster API, Marcelo Castro (intersoft) zeigt anhand von ArgoCD, Kured und Renovate ein „wartungsarmes Kubernetes on-prem“. Manuel Zapf (codecentric) stellt in „From Clusters to Control Planes“ Ansätze für Multi-Tenancy zur Diskussion, Robin Afflerbach behandelt „Zentrale Golden Paths für Cluster-Flotten“ und das Multi-Cluster-fähige Erweitern bestehender Controller. Thorsten Wussow (Slix) widmet sich dem Flux Operator als Weg zu „GitOps im Autopilot-Modus“ und Christian Fritz (QAware) bewertet die Kubernetes Gateway API in der Praxis. Stefan Nachtrab und Mirabell Büscher (adorsys) sprechen über den Übergang „Vom Multi-Cloud-Chaos zum Knowledge Graph“ inklusive FinOps- und Compliance-Aspekten.

Sicherheit in Pipelines, Lieferkette und Laufzeit

Security zieht sich quer durch das Programm. Sujeevan Vijayakumaran (Friday Deployments) bezeichnet in seinem Talk die CI/CD-Pipeline als „Einfallstor“. Moritz Johner (Form3) ordnet „CVE Remediation“ als Platform-Engineering-Aufgabe ein. Bertram Vogel (codecentric) plädiert mit „Move Slow to Secure Things“ für einen Update-Cooldown in Projekten. Marius Shekow (SprintEins) erklärt Container Image Signing und Attestations, Daniel Bodky (NETWAYS) stellt Echtzeit-Threat-Detection mit Falco vor.

Hinzu kommen Beiträge zu Architektur und Organisation: Miriam Greis (adorsys) typisiert in „Team Topologies in the Wild“ Teamstereotypen, Daniel Raniz Raneland (factor10) widmet sich der Modernisierung von Legacy-Systemen mit dem Strangler-Fig-Pattern, Tom Asel (tangible concepts) fordert unter „Continuous Architecture“ weniger Reden und mehr Umsetzung. Ludovic Toison (Opensend) berichtet über das Skalieren von Engineering-Teams über Kontinente hinweg. Observability adressieren Tobias Hauser (Vodafone) mit einem Personas-basierten Ansatz sowie Timon Engelke und Christian Rohmann (inovex), die mit eBPF unsichtbaren Traffic in Kubernetes aufdecken wollen. Elena Kulgavaya (Source2Sea) hinterfragt mit „Your Pipeline Is Ready. Your Tests Are Not.“ den Reifegrad gängiger Teststrategien, Max Schmidt (Liquid Reply) zeigt metrikgetriebene Canary-Rollouts. Christopher Haar (upbound) und Johannes Koch (FICO) beleuchten unter „LLM FinOps“ Fehler beim GPU-Kostenvergleich.

Digitale Souveränität und Open Source

Einen weiteren Strang bildet die Diskussion um digitale Souveränität. David Sterz argumentiert in seinem Vortrag, warum Europas Cloud-Markt souverän und dezentralisiert sein sollte. Stefan Nachtrab (adorsys) liefert mit „Von GitHub nach Codeberg“ einen Erfahrungsbericht zum Plattformwechsel. Sandra Parsick und Sebastian T. Tiemann (Open Elements) hinterfragen unter „Open Source gibt es doch gratis! Warum dafür zahlen?“ verbreitete Annahmen zur Finanzierung freier Software. Ergänzend ist eine Paneldiskussion zur digitalen Souveränität angesetzt.

Maren Afflerbach (Sixt) widmet sich mit „Our Monolith has no Owners“ der Frage, wie Runtime-Analyse Abhängigkeiten in monolithischen Systemen sichtbar macht. Viktor Didenchuk (JPMorgan) thematisiert unter „Notified ≠ Understood“ die Kommunikation von Plattform-Updates an die nutzenden Teams. Nikita Golovko (Siemens) skizziert in „From Data to Decisions“ einen domänengetriebenen Weg zu industrieller KI.

Tickets zum Frühbucherpreis sichern

Mit der Freigabe des Konferenzprogramms können sich Interessierte ab sofort Tickets zum Frühbucherpreis mit 200 Euro Rabatt sichern. Bis zum 22. September kostet das Konferenzticket 1149 Euro (alle Preise zzgl. MwSt.), für das Kombiticket aus Konferenz und 1-Tages-Workshop fallen 1699 Euro an. Die ganztägigen Workshops lassen sich einzeln zum Preis von 649 Euro buchen. Teams oder Gruppen ab drei Personen erhalten im Ticketshop zudem automatisch mindestens 15 Prozent Rabatt. Schülerinnen und Schüler, Studierende und Hochschulangehörige erhalten auf Anfrage ebenfalls einen Nachlass.

Wer über den Fortgang der Konferenz informiert bleiben möchte, kann sich auf der CLC-Website für den Newsletter registrieren oder den Veranstaltern auf LinkedIn folgen – der Hashtag lautet #CLC_Conf.

Weiterlesen

Bei der von iX und dpunkt.verlag organisierten Konferenz CLC 2026 dreht sich vom 10. bis 12. November in Mannheim alles um die Bereiche Developer Experience, Platform Engineering und Software Delivery. Ein besonderer Fokus liegt in diesem Jahr darauf, wie Agentic AI die Arbeit von Senior-Softwareentwicklern, Software-Architekten, DevOps- und Platform Engineers verändert und wie sich digitale Souveränität nachhaltig erreichen lässt.

Die Veranstaltung beginnt am Dienstag, dem 10. November, mit drei ganztägigen Vor-Ort-Workshops. Daniel Bodky (NETWAYS) führt unter dem Titel „Von Zero Observability zu Zero-Code Observability“ in die praktische Arbeit mit OpenTelemetry ein. Mathias Tausig und Andreas Boll (SBA Research) widmen sich den „Container Security Fundamentals“, während Hossein Salahi (Liquid Reply) in seinem Workshop den Aufbau KI-nativer Plattformen behandelt.

KI-Agenten als roter Faden durch die Konferenztage

Den inhaltlichen Auftakt in das deutsch-englische Vortragsprogramm am Mittwoch, dem 11. November, bildet die Keynote „Why SREs and AI Agents Are a Perfect Match – Real demos, real infrastructure, real failures“ von Paul Stack (System Initiative). Die anschließenden Tracks zeigen, dass KI-Agenten und ihr Zusammenspiel mit klassischen Delivery-Praktiken einen Schwerpunkt der Konferenz bilden. Steffen Schluff und Thorsten Maier (Accenture) sprechen unter dem Titel „Weniger tippen, mehr denken“ über den Einfluss von KI-Agenten auf die Developer Experience. Robert Hoffmann und Christian Denich (Amazon Web Services) berichten in „From AI-frustrated to AI-native – The Amazon Story So Far“ über die interne Transformation des Konzerns.

Rainer Stropek (software architects) argumentiert in „From DevOps to AgentOps: Why Rock-Solid CI/CD Makes You AI-Ready“, dass solide Pipelines die Voraussetzung für den produktiven Einsatz von Agenten seien. Prerit Munjal (Groupon) verknüpft KI mit dem Abbau technischer Schulden („AI at the Door, Turning ‚Tech Debt Panic‘ into ‚Tech Debt Repairs‘“). Mirko Böttcher und Oliver Zeigermann (Techniker Krankenkasse) räumen unter „Wie erkläre ich es meinem Chef?“ mit Mythen und Missverständnissen rund um GenAI, LLMs und Agenten auf. Benjamin Hofmann (Hyground) erläutert in „How an AI SRE agent can manage 20,000 workloads“ den Einsatz eines SRE-Agenten im Großbetrieb. Ergänzend ist ein „Panel on AI in Software Delivery“ angesetzt.

Am Donnerstag schildern Oliver Nocon und Lukas Heimann (SAP) im Praxisbericht „Vibe Coding im Konzern“, wie SAP KI-gestützte Entwicklung skaliert, während Mario-Leander Reimer (QAware) mit „Zero Trust Agents“ zeigt, wie sich KI-Workloads mit OPA und Kubernetes absichern lassen.

Platform Engineering, Multi-Cluster-Betrieb und GitOps

Ein zweiter inhaltlicher Block widmet sich dem Aufbau und Betrieb interner Entwicklerplattformen. Dominik Schmidle (Giant Swarm) stellt in „What Platform-as-a-Product Actually Means (And What Most Teams Get Wrong)“ Produktdenken in der Plattformentwicklung in den Mittelpunkt. Sönke Sothmann und Johannes Koch (FICO) behandeln „Kubernetes Custom Resources as Your Platform API: Declarative Self-Service with Crossplane“. Alexander Troppmann und Bruno Margula (Carl ZEISS) berichten unter „Custom-build Platform Tooling mit AI“ darüber, was in der Praxis funktioniert und was nicht. Lian Li widmet sich dem Inner Sourcing einer Internal Developer Platform und Tobias Hauser (Vodafone) beschreibt mit „Vom Betreiber zum Plattformbauer“, wie IT-Operations zur Plattformorganisation wird.

Im Kubernetes-Umfeld erläutert Nicholas Dille (Haufe) die Cluster API, Marcelo Castro (intersoft) zeigt anhand von ArgoCD, Kured und Renovate ein „wartungsarmes Kubernetes on-prem“. Manuel Zapf (codecentric) stellt in „From Clusters to Control Planes“ Ansätze für Multi-Tenancy zur Diskussion, Robin Afflerbach behandelt „Zentrale Golden Paths für Cluster-Flotten“ und das Multi-Cluster-fähige Erweitern bestehender Controller. Thorsten Wussow (Slix) widmet sich dem Flux Operator als Weg zu „GitOps im Autopilot-Modus“ und Christian Fritz (QAware) bewertet die Kubernetes Gateway API in der Praxis. Stefan Nachtrab und Mirabell Büscher (adorsys) sprechen über den Übergang „Vom Multi-Cloud-Chaos zum Knowledge Graph“ inklusive FinOps- und Compliance-Aspekten.

Sicherheit in Pipelines, Lieferkette und Laufzeit

Security zieht sich quer durch das Programm. Sujeevan Vijayakumaran (Friday Deployments) bezeichnet in seinem Talk die CI/CD-Pipeline als „Einfallstor“. Moritz Johner (Form3) ordnet „CVE Remediation“ als Platform-Engineering-Aufgabe ein. Bertram Vogel (codecentric) plädiert mit „Move Slow to Secure Things“ für einen Update-Cooldown in Projekten. Marius Shekow (SprintEins) erklärt Container Image Signing und Attestations, Daniel Bodky (NETWAYS) stellt Echtzeit-Threat-Detection mit Falco vor.

Hinzu kommen Beiträge zu Architektur und Organisation: Miriam Greis (adorsys) typisiert in „Team Topologies in the Wild“ Teamstereotypen, Daniel Raniz Raneland (factor10) widmet sich der Modernisierung von Legacy-Systemen mit dem Strangler-Fig-Pattern, Tom Asel (tangible concepts) fordert unter „Continuous Architecture“ weniger Reden und mehr Umsetzung. Ludovic Toison (Opensend) berichtet über das Skalieren von Engineering-Teams über Kontinente hinweg. Observability adressieren Tobias Hauser (Vodafone) mit einem Personas-basierten Ansatz sowie Timon Engelke und Christian Rohmann (inovex), die mit eBPF unsichtbaren Traffic in Kubernetes aufdecken wollen. Elena Kulgavaya (Source2Sea) hinterfragt mit „Your Pipeline Is Ready. Your Tests Are Not.“ den Reifegrad gängiger Teststrategien, Max Schmidt (Liquid Reply) zeigt metrikgetriebene Canary-Rollouts. Christopher Haar (upbound) und Johannes Koch (FICO) beleuchten unter „LLM FinOps“ Fehler beim GPU-Kostenvergleich.

Digitale Souveränität und Open Source

Einen weiteren Strang bildet die Diskussion um digitale Souveränität. David Sterz argumentiert in seinem Vortrag, warum Europas Cloud-Markt souverän und dezentralisiert sein sollte. Stefan Nachtrab (adorsys) liefert mit „Von GitHub nach Codeberg“ einen Erfahrungsbericht zum Plattformwechsel. Sandra Parsick und Sebastian T. Tiemann (Open Elements) hinterfragen unter „Open Source gibt es doch gratis! Warum dafür zahlen?“ verbreitete Annahmen zur Finanzierung freier Software. Ergänzend ist eine Paneldiskussion zur digitalen Souveränität angesetzt.

Maren Afflerbach (Sixt) widmet sich mit „Our Monolith has no Owners“ der Frage, wie Runtime-Analyse Abhängigkeiten in monolithischen Systemen sichtbar macht. Viktor Didenchuk (JPMorgan) thematisiert unter „Notified ≠ Understood“ die Kommunikation von Plattform-Updates an die nutzenden Teams. Nikita Golovko (Siemens) skizziert in „From Data to Decisions“ einen domänengetriebenen Weg zu industrieller KI.

Tickets zum Frühbucherpreis sichern

Mit der Freigabe des Konferenzprogramms können sich Interessierte ab sofort Tickets zum Frühbucherpreis mit 200 Euro Rabatt sichern. Bis zum 22. September kostet das Konferenzticket 1149 Euro (alle Preise zzgl. MwSt.), für das Kombiticket aus Konferenz und 1-Tages-Workshop fallen 1699 Euro an. Die ganztägigen Workshops lassen sich einzeln zum Preis von 649 Euro buchen. Teams oder Gruppen ab drei Personen erhalten im Ticketshop zudem automatisch mindestens 15 Prozent Rabatt. Schülerinnen und Schüler, Studierende und Hochschulangehörige erhalten auf Anfrage ebenfalls einen Nachlass.

Wer über den Fortgang der Konferenz informiert bleiben möchte, kann sich auf der CLC-Website für den Newsletter registrieren oder den Veranstaltern auf LinkedIn folgen – der Hashtag lautet #CLC_Conf.

Für 250 Millionen Euro: Bund schafft neue Abhängigkeiten von IT-Konzernen

netzpolitik·2026-05-27InfrastrukturWirtschaftRegulierung

Für eine dreistellige Millionensumme sollen SAP und Telekom eine „KI-Cloud“ für die öffentliche Verwaltung bauen. Digitalminister Karsten Wildberger nennt das souverän. Unabhängig wird Deutschlands Verwaltung damit nicht, warnen Opposition und Fachleute.

Karsten Wildberger freut sich auf die KI-Cloud für die Verwaltung. (Symbolbild) – Alle Rechte vorbehalten: IMAGO / dts Nachrichtenagentur Für 250 Millionen Euro sollen deutsche Konzerne IT-Infrastruktur für die öffentliche Verwaltung aufbauen. Im Mittelpunkt steht eine „KI-Cloud“. Das sind Server, auf denen KI-Software laufen soll.

Damit setzt Digitalminister Karsten Wildberger (CDU) seinen KI-freundlichen Kurs fort. Zuletzt hatte er den Agentic AI Hub gestartet. Sogenannte KI-Agenten sollen Beamt*innen zum Beispiel dabei helfen, Dokumente auf Vollständigkeit zu prüfen. Im Gegensatz zu Sprachmodellen wie ChatGPT geben KI-Agenten nicht nur Antworten, sondern erfüllen Aufgaben mit digitalen Werkzeugen.

Die neue „KI-Cloud“ soll nun „zur zentralen Schaltstelle für die öffentliche Verwaltung werden“, erklärt das Digitalministerium. Zunächst soll die KI-Plattform KIPITZ dorthin umziehen. Die Cloud sei das „Rückgrat einer souveränen, digitalen und KI-fähigen Verwaltung“, sagt der Digitalminister. Die dafür veranschlagten 250 Millionen Euro will sein Ministerium an zwei Konsortien verteilen: 70 Prozent erhalten die Telekom-Tochter T‑Systems und SAP; weitere 30 Prozent ein Konsortium um den Wiesbadener IT-Dienstleister SVA .

Wie die Deutsche Presse-Agentur berichtet, sei der Auftrag „bewusst zweigeteilt“ worden, um die Abhängigkeit von nur einem Anbieter zu umgehen. Wildberger sprach von einer „Infrastruktur, die wir selbst kontrollieren“. Telekom-Chef Tim Höttges sagte: „Zusammen sorgen wir dafür, dass Deutschland und Europa die digitale Zukunft selbst in der Hand haben.“ Das soll unter anderem mit SAPs „Business AI Platform“ geschehen. SAP-Chef Christian Klein zeigte sich zufrieden, dass seine KI-Cloud „Teil des Deutschland-Stack s“ werden soll.

Bund zahlt hunderte Millionen für Lizenzen

SAP profitiert bereits in großem Stil von Steuergeldern: Allein im Haushaltsjahr 2025 überwies der Bund an das deutsche Softwareunternehmen 110 Millionen Euro für Lizenzen und weitere 71 Millionen Euro für Produkte und Dienstleistungen. Das zeigt die Antwort der Bundesregierung auf eine Schriftliche Frage von Sonja Lemke von der Linksfraktion, die netzpolitik.org vorliegt.

Zum Vergleich: Im selben Jahr hat der Bund 481 Millionen Euro für Microsoft-Lizenzen ausgegeben. Die Kosten sind im Vergleich zu den beiden Vorjahren stetig gestiegen: 2023 waren es noch rund 274 Millionen Euro, ein Jahr später bereits rund 348 Millionen.

Nicht nur Lizenzen großer US-Unternehmen sind „ein wahnsinniger Kostenfaktor“, kommentiert die Abgeordnete gegenüber netzpolitik.org.

Wir sind ein spendenfinanziertes Medium.

Unterstütze auch Du unsere Arbeit mit einer Spende.

Jetzt spenden

Warnung vor Lock-in-Effekt

Die Projekte aus dem Digitalministerium zeigen: Künftig könnte vermehrt Geld an deutsche oder europäische Konzerne fließen. Das entspricht dem Tenor aus dem Gipfel zur europäischen digitalen Souveränität im November: „ buy european “, kauft in Europa ein. Kritik daran gibt es von der Opposition und von Fachleuten. Sie warnen vor neuen Abhängigkeiten durch andere Konzerne.

So kritisiert Linken-Abgeordnete Lemke: US-Konzerne hätten kein Patent darauf, Kunden von sich abhängig zu machen. Sie warnt vor dem Lock-in-Effekt – also davor, dass die Verwaltung von einem einmal gewählten Anbieter nicht mehr loskommt. Dieser Effekt richtet sich nicht danach, wo ein Unternehmen sitzt, sondern danach, wie das IT-Produkt gestaltet ist. „Wer einmal SAP nutzt, kann die eigenen Daten nicht mehr einfach zu einem anderen Anbieter umziehen“, warnt Lemke.

Deshalb fordert sie ein Umdenken: „Digitalisierung muss endlich heißen, eigene Infrastrukturen aufzubauen.“ Dafür brauche es eigene Rechenzentren sowie eigene Betriebssysteme und Software, über die die öffentliche Hand selbst verfügen kann. Die Verwaltung brauche mehr IT-Kompetenz, um weniger von externen Beraterfirmen abhängig zu sein.

Ähnlich argumentiert die Free Software Foundation Europe. Mit Blick auf die Debatte um digitale Souveränität in Deutschland pocht der gemeinnützige Verein auf das Credo „Public Money, Public Code“.

Dahinter steht der Gedanke: Wenn Bürger*innen mit ihren Steuern eine Software zahlen, dann sollte sie allen gehören und öffentlich einsehbar sein. „Nur so lässt sich die strukturelle Abhängigkeit öffentlicher Verwaltungen von proprietärer Software und ihren Herstellern beenden und technologische Souveränität erreichen.“

Weiterlesen

Für eine dreistellige Millionensumme sollen SAP und Telekom eine „KI-Cloud“ für die öffentliche Verwaltung bauen. Digitalminister Karsten Wildberger nennt das souverän. Unabhängig wird Deutschlands Verwaltung damit nicht, warnen Opposition und Fachleute.

Karsten Wildberger freut sich auf die KI-Cloud für die Verwaltung. (Symbolbild) – Alle Rechte vorbehalten: IMAGO / dts Nachrichtenagentur Für 250 Millionen Euro sollen deutsche Konzerne IT-Infrastruktur für die öffentliche Verwaltung aufbauen. Im Mittelpunkt steht eine „KI-Cloud“. Das sind Server, auf denen KI-Software laufen soll.

Damit setzt Digitalminister Karsten Wildberger (CDU) seinen KI-freundlichen Kurs fort. Zuletzt hatte er den Agentic AI Hub gestartet. Sogenannte KI-Agenten sollen Beamt*innen zum Beispiel dabei helfen, Dokumente auf Vollständigkeit zu prüfen. Im Gegensatz zu Sprachmodellen wie ChatGPT geben KI-Agenten nicht nur Antworten, sondern erfüllen Aufgaben mit digitalen Werkzeugen.

Die neue „KI-Cloud“ soll nun „zur zentralen Schaltstelle für die öffentliche Verwaltung werden“, erklärt das Digitalministerium. Zunächst soll die KI-Plattform KIPITZ dorthin umziehen. Die Cloud sei das „Rückgrat einer souveränen, digitalen und KI-fähigen Verwaltung“, sagt der Digitalminister. Die dafür veranschlagten 250 Millionen Euro will sein Ministerium an zwei Konsortien verteilen: 70 Prozent erhalten die Telekom-Tochter T‑Systems und SAP; weitere 30 Prozent ein Konsortium um den Wiesbadener IT-Dienstleister SVA .

Wie die Deutsche Presse-Agentur berichtet, sei der Auftrag „bewusst zweigeteilt“ worden, um die Abhängigkeit von nur einem Anbieter zu umgehen. Wildberger sprach von einer „Infrastruktur, die wir selbst kontrollieren“. Telekom-Chef Tim Höttges sagte: „Zusammen sorgen wir dafür, dass Deutschland und Europa die digitale Zukunft selbst in der Hand haben.“ Das soll unter anderem mit SAPs „Business AI Platform“ geschehen. SAP-Chef Christian Klein zeigte sich zufrieden, dass seine KI-Cloud „Teil des Deutschland-Stack s“ werden soll.

Bund zahlt hunderte Millionen für Lizenzen

SAP profitiert bereits in großem Stil von Steuergeldern: Allein im Haushaltsjahr 2025 überwies der Bund an das deutsche Softwareunternehmen 110 Millionen Euro für Lizenzen und weitere 71 Millionen Euro für Produkte und Dienstleistungen. Das zeigt die Antwort der Bundesregierung auf eine Schriftliche Frage von Sonja Lemke von der Linksfraktion, die netzpolitik.org vorliegt.

Zum Vergleich: Im selben Jahr hat der Bund 481 Millionen Euro für Microsoft-Lizenzen ausgegeben. Die Kosten sind im Vergleich zu den beiden Vorjahren stetig gestiegen: 2023 waren es noch rund 274 Millionen Euro, ein Jahr später bereits rund 348 Millionen.

Nicht nur Lizenzen großer US-Unternehmen sind „ein wahnsinniger Kostenfaktor“, kommentiert die Abgeordnete gegenüber netzpolitik.org.

Wir sind ein spendenfinanziertes Medium.

Unterstütze auch Du unsere Arbeit mit einer Spende.

Jetzt spenden

Warnung vor Lock-in-Effekt

Die Projekte aus dem Digitalministerium zeigen: Künftig könnte vermehrt Geld an deutsche oder europäische Konzerne fließen. Das entspricht dem Tenor aus dem Gipfel zur europäischen digitalen Souveränität im November: „ buy european “, kauft in Europa ein. Kritik daran gibt es von der Opposition und von Fachleuten. Sie warnen vor neuen Abhängigkeiten durch andere Konzerne.

So kritisiert Linken-Abgeordnete Lemke: US-Konzerne hätten kein Patent darauf, Kunden von sich abhängig zu machen. Sie warnt vor dem Lock-in-Effekt – also davor, dass die Verwaltung von einem einmal gewählten Anbieter nicht mehr loskommt. Dieser Effekt richtet sich nicht danach, wo ein Unternehmen sitzt, sondern danach, wie das IT-Produkt gestaltet ist. „Wer einmal SAP nutzt, kann die eigenen Daten nicht mehr einfach zu einem anderen Anbieter umziehen“, warnt Lemke.

Deshalb fordert sie ein Umdenken: „Digitalisierung muss endlich heißen, eigene Infrastrukturen aufzubauen.“ Dafür brauche es eigene Rechenzentren sowie eigene Betriebssysteme und Software, über die die öffentliche Hand selbst verfügen kann. Die Verwaltung brauche mehr IT-Kompetenz, um weniger von externen Beraterfirmen abhängig zu sein.

Ähnlich argumentiert die Free Software Foundation Europe. Mit Blick auf die Debatte um digitale Souveränität in Deutschland pocht der gemeinnützige Verein auf das Credo „Public Money, Public Code“.

Dahinter steht der Gedanke: Wenn Bürger*innen mit ihren Steuern eine Software zahlen, dann sollte sie allen gehören und öffentlich einsehbar sein. „Nur so lässt sich die strukturelle Abhängigkeit öffentlicher Verwaltungen von proprietärer Software und ihren Herstellern beenden und technologische Souveränität erreichen.“

Mercedes: Teilautonomer Fahrassistent soll Anfang 2027 deutschlandweit starten

Der Stuttgarter Autobauer Mercedes-Benz will seine autonome Fahrassistenz MB.Drive Assist Pro ab Ende 2026 in ersten deutschen Städten für einige Fahrzeugmodelle verfügbar machen. Das System bietet eine autonome Tür-zu-Tür-Navigation auf Basis des SAE-Levels 2++. Anfang 2027 soll es „deutschlandweit ausgerollt werden“. In enger Abstimmung mit dem Bundesverkehrsministerium Mercedes' teilautonome Fahrassistenz MB.Drive Assist Pro ist zuerst auf der IAA 2025 angekündigt worden und konnte Anfang dieses Jahres von heise Autos in einem Mercedes CLA ausprobiert werden. Das System basiert auf dem SAE-Level 2++, bei dem das Fahrzeug selbst lenken kann, aber der Fahrer immer in der Verantwortung bleibt und jederzeit wieder übernehmen können muss. Die Fahrerin oder der Fahrer darf während der Fahrt zeitweilig die Hände vom Lenkrad nehmen, jedoch nie die Augen von der Straße abwenden – daher spricht man bei diesem Grad der Automation auch von „hands-off, eyes-on“. Dieser Automatisierungsgrad ist bis Ende dieses Jahres zunächst in Innenstädten erlaubt, wie der Mercedes-Entwicklungsvorstand Jörg Burzer in einem LinkedIn-Beitrag nach einem Termin mit Verkehrsminister Patrick Schnieder (CDU) schreibt. Die ersten Städte werden laut dem Handelsblatt Stuttgart und München sein. „Damit bringen wir diese Technologie neben China und den USA nun auch auf unseren Heimatmarkt“, teilte Burzer mit. Dabei erfolgt die Einführung des Systems „in enger Abstimmung mit dem Bundesverkehrsministerium“. Deutschland ist dabei nicht das erste Land, in dem MB.Drive Assist Pro verfügbar sein wird: Denn in China bietet Mercedes das teilautomatisierte Fahren schon seit Herbst 2025 an. Dafür kooperiert das Unternehmen mit der chinesischen KI- und Softwarefirma Momenta. In den USA und auch für den hiesigen Markt setzt Mercedes auf den US-Konzern Nvidia als Partner. Das System setze hardwareseitig auf etwa 30 Sensoren, darunter zehn Kameras, fünf Radarsensoren und zwölf Ultraschallsensoren, erklärt Mercedes.

Laut Mercedes-Benz soll das Level-2++-System „Fahrassistenz und Navigation zu einem neuen, sicheren Fahrerlebnis“ verschmelzen. So lasse sich das Fahrzeug auf Knopfdruck „mit fortschrittlicher SAE-Level-2-Unterstützung durch die Stadt navigieren – vom Parkplatz bis zum Ziel“. Mithilfe eines kooperativen Lenkansatzes seien zudem Lenkanpassungen jederzeit möglich, ohne das System zu deaktivieren, erklärt das Unternehmen. Günstiger als Level 3 oder 4 Dass Mercedes künftig verstärkt auf Level 2 setzt – das bestätige der Konzern im Zuge der Ankündigung der überarbeiteten S-Klasse Anfang dieses Jahres – hat dem Unternehmen zufolge unter anderem wirtschaftliche Gründe. Denn nur wenige Kunden sind bereit, für die recht übersichtlichen Fähigkeiten dieses autonomen Levels mehrere Tausend Euro zusätzlich zu investieren. Unter anderem kann Mercedes den Einsatz teurer Lidar-Sensoren sparen. Durch weniger technischen Aufwand im Fahrzeug bei Level 2 gehen geringere Kosten einher. Mercedes geht damit einerseits von einer größeren Verbreitung aus, andererseits eröffnet es dem Hersteller die Möglichkeit, aus gesammelten Daten zu lernen. Davon profitieren dann auch Systeme, die versprechen, in bestimmten Situationen allein klarzukommen. Denn Mercedes stampft Level 3 und 4 nicht komplett ein. Jedoch lässt Mercedes offen, wann vollautonomes Fahren hierzulande Einzug halten könnte. In Abu Dhabi, der Hauptstadt der Vereinigten Arabischen Emirate (VAE), lässt Mercedes derweil die S-Klasse als Robotaxi mit Momenta-Software fahren. Das MB.Drive Assist Pro-System kommt jedoch nicht in allen Fahrzeugen zum Einsatz, zudem lässt es sich nicht einfach per Softwareupdate nachrüsten. So soll das Einstiegsmodell CLA das System nicht unterstützen, da Mercedes die Hardware laut Handelsblatt in Deutschland bislang nicht verbaut. In den teureren Modellen wie dem GLC und der S-Klasse seien die Sensoren standardmäßig an Bord. Neben Mercedes-Benz hat übrigens auch BMW seinen Fokus von Level 3 auf Level 2 verschoben.

Weiterlesen

Der Stuttgarter Autobauer Mercedes-Benz will seine autonome Fahrassistenz MB.Drive Assist Pro ab Ende 2026 in ersten deutschen Städten für einige Fahrzeugmodelle verfügbar machen. Das System bietet eine autonome Tür-zu-Tür-Navigation auf Basis des SAE-Levels 2++. Anfang 2027 soll es „deutschlandweit ausgerollt werden“. In enger Abstimmung mit dem Bundesverkehrsministerium Mercedes' teilautonome Fahrassistenz MB.Drive Assist Pro ist zuerst auf der IAA 2025 angekündigt worden und konnte Anfang dieses Jahres von heise Autos in einem Mercedes CLA ausprobiert werden. Das System basiert auf dem SAE-Level 2++, bei dem das Fahrzeug selbst lenken kann, aber der Fahrer immer in der Verantwortung bleibt und jederzeit wieder übernehmen können muss. Die Fahrerin oder der Fahrer darf während der Fahrt zeitweilig die Hände vom Lenkrad nehmen, jedoch nie die Augen von der Straße abwenden – daher spricht man bei diesem Grad der Automation auch von „hands-off, eyes-on“. Dieser Automatisierungsgrad ist bis Ende dieses Jahres zunächst in Innenstädten erlaubt, wie der Mercedes-Entwicklungsvorstand Jörg Burzer in einem LinkedIn-Beitrag nach einem Termin mit Verkehrsminister Patrick Schnieder (CDU) schreibt. Die ersten Städte werden laut dem Handelsblatt Stuttgart und München sein. „Damit bringen wir diese Technologie neben China und den USA nun auch auf unseren Heimatmarkt“, teilte Burzer mit. Dabei erfolgt die Einführung des Systems „in enger Abstimmung mit dem Bundesverkehrsministerium“. Deutschland ist dabei nicht das erste Land, in dem MB.Drive Assist Pro verfügbar sein wird: Denn in China bietet Mercedes das teilautomatisierte Fahren schon seit Herbst 2025 an. Dafür kooperiert das Unternehmen mit der chinesischen KI- und Softwarefirma Momenta. In den USA und auch für den hiesigen Markt setzt Mercedes auf den US-Konzern Nvidia als Partner. Das System setze hardwareseitig auf etwa 30 Sensoren, darunter zehn Kameras, fünf Radarsensoren und zwölf Ultraschallsensoren, erklärt Mercedes.

Laut Mercedes-Benz soll das Level-2++-System „Fahrassistenz und Navigation zu einem neuen, sicheren Fahrerlebnis“ verschmelzen. So lasse sich das Fahrzeug auf Knopfdruck „mit fortschrittlicher SAE-Level-2-Unterstützung durch die Stadt navigieren – vom Parkplatz bis zum Ziel“. Mithilfe eines kooperativen Lenkansatzes seien zudem Lenkanpassungen jederzeit möglich, ohne das System zu deaktivieren, erklärt das Unternehmen. Günstiger als Level 3 oder 4 Dass Mercedes künftig verstärkt auf Level 2 setzt – das bestätige der Konzern im Zuge der Ankündigung der überarbeiteten S-Klasse Anfang dieses Jahres – hat dem Unternehmen zufolge unter anderem wirtschaftliche Gründe. Denn nur wenige Kunden sind bereit, für die recht übersichtlichen Fähigkeiten dieses autonomen Levels mehrere Tausend Euro zusätzlich zu investieren. Unter anderem kann Mercedes den Einsatz teurer Lidar-Sensoren sparen. Durch weniger technischen Aufwand im Fahrzeug bei Level 2 gehen geringere Kosten einher. Mercedes geht damit einerseits von einer größeren Verbreitung aus, andererseits eröffnet es dem Hersteller die Möglichkeit, aus gesammelten Daten zu lernen. Davon profitieren dann auch Systeme, die versprechen, in bestimmten Situationen allein klarzukommen. Denn Mercedes stampft Level 3 und 4 nicht komplett ein. Jedoch lässt Mercedes offen, wann vollautonomes Fahren hierzulande Einzug halten könnte. In Abu Dhabi, der Hauptstadt der Vereinigten Arabischen Emirate (VAE), lässt Mercedes derweil die S-Klasse als Robotaxi mit Momenta-Software fahren. Das MB.Drive Assist Pro-System kommt jedoch nicht in allen Fahrzeugen zum Einsatz, zudem lässt es sich nicht einfach per Softwareupdate nachrüsten. So soll das Einstiegsmodell CLA das System nicht unterstützen, da Mercedes die Hardware laut Handelsblatt in Deutschland bislang nicht verbaut. In den teureren Modellen wie dem GLC und der S-Klasse seien die Sensoren standardmäßig an Bord. Neben Mercedes-Benz hat übrigens auch BMW seinen Fokus von Level 3 auf Level 2 verschoben.

Google Cloud COO: KI-Sicherheit ist Chefsache, nicht nur Aufgabe der IT

the_decoder·2026-05-26SicherheitWirtschaftInfrastruktur

Google Cloud COO Francis de Souza fordert Unternehmen auf, Sicherheit von Anfang an in ihre KI-Strategie einzubauen. "Es gibt keine KI-Strategie ohne Datenstrategie und Sicherheitsstrategie", sagte er bei einem Event in Los Angeles. Er warnte laut TechCrunch auch epxlizit vor "Shadow AI" - also Mitarbeitern, die KI-Tools ohne Firmenaufsicht nutzen - und vor KI-Agenten, die vergessene Datenquellen wie alte SharePoint-Server in Unternehmen aufspüren.

Die Angriffsfläche habe sich weit über den klassischen Netzwerkrand hinaus vergrößert: Modelle, Daten-Pipelines, Agenten und Prompts müssten alle geschützt werden. Die Zeit zwischen einem ersten Einbruch und der nächsten Angriffsstufe sei durch KI von acht Stunden auf 22 Sekunden gesunken. De Souza plädiert daher für eine "KI-native, vollständig agentenbasierte Verteidigung", bei der Menschen nur noch die Aufsicht führen. KI-Sicherheit sei ein Thema für Vorstände, nicht nur für IT-Abteilungen.

Sicherheit lasse sich nicht nachträglich draufschrauben und nicht den einzelnen Mitarbeitern überlassen, so de Souza. Unternehmen bräuchten eine einheitliche Sicherheitsstrategie über alle Clouds und Modelle hinweg, auch wenn sie glauben, nur einen Anbieter zu nutzen. Denn über SaaS-Anwendungen und Geschäftspartner seien fast immer mehrere Clouds im Spiel.

Weiterlesen

Google Cloud COO Francis de Souza fordert Unternehmen auf, Sicherheit von Anfang an in ihre KI-Strategie einzubauen. "Es gibt keine KI-Strategie ohne Datenstrategie und Sicherheitsstrategie", sagte er bei einem Event in Los Angeles. Er warnte laut TechCrunch auch epxlizit vor "Shadow AI" - also Mitarbeitern, die KI-Tools ohne Firmenaufsicht nutzen - und vor KI-Agenten, die vergessene Datenquellen wie alte SharePoint-Server in Unternehmen aufspüren.

Die Angriffsfläche habe sich weit über den klassischen Netzwerkrand hinaus vergrößert: Modelle, Daten-Pipelines, Agenten und Prompts müssten alle geschützt werden. Die Zeit zwischen einem ersten Einbruch und der nächsten Angriffsstufe sei durch KI von acht Stunden auf 22 Sekunden gesunken. De Souza plädiert daher für eine "KI-native, vollständig agentenbasierte Verteidigung", bei der Menschen nur noch die Aufsicht führen. KI-Sicherheit sei ein Thema für Vorstände, nicht nur für IT-Abteilungen.

Sicherheit lasse sich nicht nachträglich draufschrauben und nicht den einzelnen Mitarbeitern überlassen, so de Souza. Unternehmen bräuchten eine einheitliche Sicherheitsstrategie über alle Clouds und Modelle hinweg, auch wenn sie glauben, nur einen Anbieter zu nutzen. Denn über SaaS-Anwendungen und Geschäftspartner seien fast immer mehrere Clouds im Spiel.

Dell disaggregiert Private Cloud für mehr Skalierbarkeit

Dell hat auf seiner Hausmesse neue Funktionen für die Dell Private Cloud, die Dell Distributed Private Cloud und für die Dell Automation Platform vorgestellt. Sie zielen auf disaggregierte Rechenzentrumsarchitekturen, bei denen Compute, Storage und Netzwerk nicht mehr als gekoppelte HCI-Einheit betrieben werden, sondern getrennt eingerichtet und skaliert werden können. Die Dell Private Cloud unterstützt dafür mehrere Cloud-Betriebssysteme auf PowerEdge-Servern und PowerStore-Storage. Genannt werden VMware Cloud Foundation 9.1, Microsoft Azure Local und Nutanix AHV mit Dell PowerStore. Das adressiert Umgebungen, in denen mehrere Hypervisoren, Private-Cloud-Plattformen oder mehrere Cloud-Stacks betrieben werden. Dell begründet den neuen Ansatz unter anderem mit Multi-Hypervisor-Umgebungen, geringerem Vendor-Lock-in, der Möglichkeit zum Wechsel zwischen Cloud-Betriebssystemen und der unabhängigen Skalierung von Rechenleistung und Speicher. Neue Architektur richtet sich an KI-Workloads Der Ansatz ist ein Gegenpol zu HCI, wo Compute, Storage und Virtualisierung in einem eng gekoppelten Stack verknüpft sind. Das vereinfacht Beschaffung, Aufbau und Betrieb. Entsprechend groß ist HCI in vielen Private-Cloud-Umgebungen verbreitet. Die Kehrseite ist aber, dass die Skalierung und Modernisierung der Ressourcen ebenfalls miteinander verknüpft sind. Bei KI- und datenintensiven Workloads kann das zum Problem werden, denn GPU-Leistung, Storage-Kapazität, File- und Object-Zugriffe, Netzwerkbandbreite, Stromversorgung und Kühlung wachsen selten im gleichen Takt. Hinzu kommt, dass sich viele KI-Anwendungen und Agenten noch in der Pilotphase, dem Proof of Concept oder im begrenzten Fachbereichstest befinden. Sobald ein Use Case produktiv ausgerollt wird, ändern sich Nutzerzahlen, Inferenzlast, Datenzugriffe, Verfügbarkeitsanforderungen und Sicherheitsvorgaben teils sprunghaft. Damit wird die Infrastrukturplanung schwieriger als bei klassischen Unternehmensanwendungen mit vergleichsweise stabilen Lastprofilen. Automation Platform für Betrieb und Orchestrierung Eine disaggregierte Infrastruktur schafft mehr Freiheitsgrade, erhöht aber auch den Aufwand für Planung und Betrieb. Eine Umgebung aus getrennt skalierbaren Server-, Storage-, Netzwerk- und Cloud-Stacks ist kein Rundum-sorglos-Paket. Dell versucht, den zusätzlichen Betriebsaufwand über validierte Designs, zentrale Verwaltung und Automatisierung einzugrenzen. Dazu wurden mehrere Erweiterungen der Automation Platform vorgestellt, beispielsweise die Kombination von KI-Agenten mit einer dialogorientierten Bedienoberfläche. Die neue Plattform kann Cloud-Betriebssysteme auf PowerEdge und PowerStore installieren und über ein gemeinsames Managementmodell betreiben. Automation Studio ergänzt diese Funktionen. Damit sollen Unternehmen eigene Automatisierungs-Workflows über Infrastruktur und Anwendungen hinweg erstellen können. Dell adressiert damit nicht nur Erstinstallation und Provisionierung, sondern auch wiederkehrende Aufgaben im laufenden Betrieb. HCI unter Kostendruck Neben der technischen Flexibilität sprechen für eine Disaggregierung auch die Kostenvorteile. In einem Gespräch mit iX sagte Dell-Fellow Onur Celebioglu: „HCI-Systeme stehen wegen ihrer Architektur besonders unter Kostendruck, da sie viel DRAM und Laufwerke benötigen. Extern skalierbare Storage-Systeme können damit in bestimmten Refresh-Szenarien wirtschaftlich attraktiver werden.“ Ein weiterer Punkt ist die Hypervisor-Bindung. HCI ist architektonisch eng mit dem jeweiligen Virtualisierungs-Stack verbunden. Wer sich für ein Ökosystem entscheidet, bleibt in der Regel auch daran gebunden. Disaggregierte Architekturen mit externer Storage lockern diese enge Bindung. Dell verkauft diese Entkopplung als „Optionality“, also als Wahlfreiheit für unterschiedliche Cloud- und Virtualisierungsumgebungen.

Distributed Private Cloud für Edge-Locations Für Edge-Standorte erweitert Dell seine Distributed Private Cloud, früher NativeEdge. Die Plattform bekommt Zwei-Node-HA-Cluster, automatisches Failover und integrierte Zero-Trust-Funktionen. Das zielt auf Fertigungsumgebungen, Logistikzentren oder andere dezentrale Standorte, an denen Latenz, Datenhaltung oder Ausfallsicherheit gegen einen reinen Cloud-Betrieb sprechen, aber kaum eigenes IT-Knowhow vor Ort verfügbar ist. Auch hier folgt Dell der gleichen Logik: Infrastruktur soll näher an Daten und Anwendungen rücken, trotzdem aber zentral verwaltet und automatisiert betrieben werden. Dells neue Private-Cloud-Strategie ist keine einfache Rückkehr zur klassischen Drei-Schichten-Architektur. Der Hersteller versucht vielmehr, die Flexibilität getrennter Compute-, Storage- und Netzwerkressourcen mit Cloud-Stack-Optionen und Automatisierung zu verbinden. Ob die Automation Platform den zusätzlichen Betriebsaufwand ausreichend auffängt, muss sich im produktiven Betrieb zeigen. Klar ist aber: Wer KI-Workloads lokal betreiben will, muss mit volatilen Lastprofilen, schnellen Architekturwechseln und deutlich komplexeren Datenpfaden rechnen. Dell reagiert darauf mit mehr Disaggregation und nimmt dafür in Kauf, dass die Private Cloud wieder stärker geplant, dimensioniert und orchestriert werden muss.

Weiterlesen

Dell hat auf seiner Hausmesse neue Funktionen für die Dell Private Cloud, die Dell Distributed Private Cloud und für die Dell Automation Platform vorgestellt. Sie zielen auf disaggregierte Rechenzentrumsarchitekturen, bei denen Compute, Storage und Netzwerk nicht mehr als gekoppelte HCI-Einheit betrieben werden, sondern getrennt eingerichtet und skaliert werden können. Die Dell Private Cloud unterstützt dafür mehrere Cloud-Betriebssysteme auf PowerEdge-Servern und PowerStore-Storage. Genannt werden VMware Cloud Foundation 9.1, Microsoft Azure Local und Nutanix AHV mit Dell PowerStore. Das adressiert Umgebungen, in denen mehrere Hypervisoren, Private-Cloud-Plattformen oder mehrere Cloud-Stacks betrieben werden. Dell begründet den neuen Ansatz unter anderem mit Multi-Hypervisor-Umgebungen, geringerem Vendor-Lock-in, der Möglichkeit zum Wechsel zwischen Cloud-Betriebssystemen und der unabhängigen Skalierung von Rechenleistung und Speicher. Neue Architektur richtet sich an KI-Workloads Der Ansatz ist ein Gegenpol zu HCI, wo Compute, Storage und Virtualisierung in einem eng gekoppelten Stack verknüpft sind. Das vereinfacht Beschaffung, Aufbau und Betrieb. Entsprechend groß ist HCI in vielen Private-Cloud-Umgebungen verbreitet. Die Kehrseite ist aber, dass die Skalierung und Modernisierung der Ressourcen ebenfalls miteinander verknüpft sind. Bei KI- und datenintensiven Workloads kann das zum Problem werden, denn GPU-Leistung, Storage-Kapazität, File- und Object-Zugriffe, Netzwerkbandbreite, Stromversorgung und Kühlung wachsen selten im gleichen Takt. Hinzu kommt, dass sich viele KI-Anwendungen und Agenten noch in der Pilotphase, dem Proof of Concept oder im begrenzten Fachbereichstest befinden. Sobald ein Use Case produktiv ausgerollt wird, ändern sich Nutzerzahlen, Inferenzlast, Datenzugriffe, Verfügbarkeitsanforderungen und Sicherheitsvorgaben teils sprunghaft. Damit wird die Infrastrukturplanung schwieriger als bei klassischen Unternehmensanwendungen mit vergleichsweise stabilen Lastprofilen. Automation Platform für Betrieb und Orchestrierung Eine disaggregierte Infrastruktur schafft mehr Freiheitsgrade, erhöht aber auch den Aufwand für Planung und Betrieb. Eine Umgebung aus getrennt skalierbaren Server-, Storage-, Netzwerk- und Cloud-Stacks ist kein Rundum-sorglos-Paket. Dell versucht, den zusätzlichen Betriebsaufwand über validierte Designs, zentrale Verwaltung und Automatisierung einzugrenzen. Dazu wurden mehrere Erweiterungen der Automation Platform vorgestellt, beispielsweise die Kombination von KI-Agenten mit einer dialogorientierten Bedienoberfläche. Die neue Plattform kann Cloud-Betriebssysteme auf PowerEdge und PowerStore installieren und über ein gemeinsames Managementmodell betreiben. Automation Studio ergänzt diese Funktionen. Damit sollen Unternehmen eigene Automatisierungs-Workflows über Infrastruktur und Anwendungen hinweg erstellen können. Dell adressiert damit nicht nur Erstinstallation und Provisionierung, sondern auch wiederkehrende Aufgaben im laufenden Betrieb. HCI unter Kostendruck Neben der technischen Flexibilität sprechen für eine Disaggregierung auch die Kostenvorteile. In einem Gespräch mit iX sagte Dell-Fellow Onur Celebioglu: „HCI-Systeme stehen wegen ihrer Architektur besonders unter Kostendruck, da sie viel DRAM und Laufwerke benötigen. Extern skalierbare Storage-Systeme können damit in bestimmten Refresh-Szenarien wirtschaftlich attraktiver werden.“ Ein weiterer Punkt ist die Hypervisor-Bindung. HCI ist architektonisch eng mit dem jeweiligen Virtualisierungs-Stack verbunden. Wer sich für ein Ökosystem entscheidet, bleibt in der Regel auch daran gebunden. Disaggregierte Architekturen mit externer Storage lockern diese enge Bindung. Dell verkauft diese Entkopplung als „Optionality“, also als Wahlfreiheit für unterschiedliche Cloud- und Virtualisierungsumgebungen.

Distributed Private Cloud für Edge-Locations Für Edge-Standorte erweitert Dell seine Distributed Private Cloud, früher NativeEdge. Die Plattform bekommt Zwei-Node-HA-Cluster, automatisches Failover und integrierte Zero-Trust-Funktionen. Das zielt auf Fertigungsumgebungen, Logistikzentren oder andere dezentrale Standorte, an denen Latenz, Datenhaltung oder Ausfallsicherheit gegen einen reinen Cloud-Betrieb sprechen, aber kaum eigenes IT-Knowhow vor Ort verfügbar ist. Auch hier folgt Dell der gleichen Logik: Infrastruktur soll näher an Daten und Anwendungen rücken, trotzdem aber zentral verwaltet und automatisiert betrieben werden. Dells neue Private-Cloud-Strategie ist keine einfache Rückkehr zur klassischen Drei-Schichten-Architektur. Der Hersteller versucht vielmehr, die Flexibilität getrennter Compute-, Storage- und Netzwerkressourcen mit Cloud-Stack-Optionen und Automatisierung zu verbinden. Ob die Automation Platform den zusätzlichen Betriebsaufwand ausreichend auffängt, muss sich im produktiven Betrieb zeigen. Klar ist aber: Wer KI-Workloads lokal betreiben will, muss mit volatilen Lastprofilen, schnellen Architekturwechseln und deutlich komplexeren Datenpfaden rechnen. Dell reagiert darauf mit mehr Disaggregation und nimmt dafür in Kauf, dass die Private Cloud wieder stärker geplant, dimensioniert und orchestriert werden muss.

Intelligente Überwachung verlängert Lebensdauer von Brücken

heise_ki·2026-05-26AnwendungenInfrastruktur

So einen Moment wie Ende Januar will Tobias Fischer nicht noch einmal erleben. Von jetzt auf gleich musste die Autobahn GmbH damals eine der wichtigsten Verbindungen zwischen Rheinland und Ruhrgebiet sperren: Die A52-Brücke über die Ruhr zwischen Düsseldorf und Essen. In der Fahrbahndecke hatte sich ein Spalt aufgetan. „Sowas ist eine Vollkatastrophe“, sagt Fischer, der bei der Autobahn GmbH für den Erhalt der Brücken im Ruhrgebiet und im Bergischen Land zuständig ist. Mehr als 80.000 Fahrzeuge fahren normalerweise jeden Tag über die 1,8 Kilometer lange Mintarder Brücke bei Mülheim an der Ruhr. Auf den Umleitungsstrecken gab es während der Sperrung wochenlang Chaos. Um solche bösen Überraschungen in Zukunft zu vermeiden, wird die Brücke im Moment mit Sensoren ausgestattet, die jede noch so kleine Veränderung an der Substanz des Bauwerks registrieren. Es ist ein Pilotprojekt, auf dem große Hoffnungen ruhen – denn im ganzen Land gibt es noch viele weitere Brücken, die in keinem guten Zustand sind. Die Hoffnung ist, dass Schäden durch die neue Technik so früh bemerkt werden, dass man rechtzeitig handeln und ungeplante Sperrungen vermeiden kann. KI analysiert die Daten in Echtzeit Rund 150 Sensoren installieren Techniker im Moment an der längsten Stahlbrücke Deutschlands. Wenn alles funktioniert, werden sie eine riesige Menge an Daten übermitteln. „Wir bekommen hier an der Brücke 100.000 Messwerte pro Sekunde“, erklärt Panagiotis Martakis, der das System entwickelt hat und nun über seine Firma Irmos anbietet.

Während jeder Mensch von 100.000 Messwerten pro Sekunde völlig überfordert wäre, kann die KI die Datenmengen in Echtzeit auswerten – 24 Stunden am Tag. „Die KI versteht nach und nach die Eigenarten einer jeden Brücke“, erklärt Fischer. „Wir bekommen dadurch ein viel besseres Gefühl für die Brücke.“ Dehnt sich das Material an einer Stelle, weil die Sonne es im Frühling erwärmt – oder weil es einen Riss im Material gibt? Hoffnung auf längere Nutzungsdauer von Brücken Die Autobahn GmbH hofft durch das KI-gestützte Brückenmonitoring auf einen „echten Paradigmenwechsel“ bei der Instandhaltung alter Brücken. „Wenn dieser Ansatz trägt, könnten Deutschlands Brücken künftig nicht nur saniert, sondern verstanden werden – mit deutlich optimierter Nutzungsdauer“, heißt es in der Projektbeschreibung. Ursprünglich war geplant, das neue System fünf Jahre lang an elf Brücken im Ruhrgebiet und im Bergischen Land zu testen. Doch die ersten Ergebnisse sind so positiv und der Handlungsdruck ist bundesweit so groß, dass die Technologie nun sehr viel schneller ausgerollt werden soll. „Der entscheidende Vorteil für uns ist, dass wir viel schneller und gezielter reagieren können, noch bevor Schäden entstehen“, erklärt Fischer. ADAC: Brücken in NRW liegen auf der Intensivstation Wie wichtig das KI-gestützte Brückenmonitoring werden könnte, zeigt ein Blick auf den Zustand der Autobahnbrücken im Land. 55 Prozent aller Brücken wurden laut Autobahn GmbH vor 1985 errichtet. Sie seien für weniger Verkehr und vor allem nur für leichtere Lastwagen gebaut worden. Auch die Materialqualität und Bauweise der 1960er und 1970er Jahre entsprächen nicht mehr den heutigen Anforderungen. „Die Brücken in NRW liegen auf der Intensivstation“, bestätigt der Leiter des Fachbereichs Verkehr und Umwelt beim ADAC Nordrhein, Roman Suthold. „Mit jedem Jahr, das bei der Erneuerung einer Brücke ungenutzt verstreicht, steigen die Risiken für Folgeschäden und damit für starke Belastungen von Autofahrern, Anwohnern und Volkswirtschaft erheblich.“ Das KI-gestützte Monitoring könne die Situation wirklich verbessern, glaubt Suthold. „Wenn dadurch frühzeitig gehandelt wird und vor allem sinnvolle Maßnahmen ergriffen werden, profitieren alle davon.“ Zugleich mahnt der ADAC-Verkehrsexperte, dass nicht nur Autobahnbrücken in die Jahre gekommen sind. „Auch das Land und die Kommunen sollten überlegen, ob sie die Technik für Brücken in ihrem Straßennetz einsetzen. Denn da warten noch viel mehr marode Brücken.“ Andere Projekte analysieren die Geräusche von Brücken Projekte, die künstliche Intelligenz nutzen wollen, um den Zustand alter Brücken zu überwachen, gibt es inzwischen mehrere in Deutschland. Das Fraunhofer-Institut für Digitale Medientechnologie (IDMT) nimmt mit Mikrofonen die Geräusche auf, die Fahrzeuge verursachen, wenn sie über Brücken fahren. Die KI analysiert die Geräusche dann und soll anhand kleinster Veränderungen erkennen, wenn sich der Zustand einer Brücke verschlechtert. Kosten bleiben überschaubar Die Autobahn GmbH will nun weiter Erfahrungen mit dem KI-gestützten Brückenmonitoring der Firma Irmos sammeln. Fischer ist nicht zuletzt auch wegen der überschaubaren Kosten von dem neuen System überzeugt. Einige zehntausend Euro müsse man pro Brücke rechnen, sagt er. Eine Kleinigkeit, wenn man bedenkt, welche Kosten durch eine Vollsperrung für die Wirtschaft entstehen können. Bei der Rahmedetalbrücke auf der A45 im Sauerland hat das Institut der Deutschen Wirtschaft den Schaden für die Unternehmen in der Region durch die vierjährige Sperrung auf rund 1,5 Milliarden Euro beziffert.

Weiterlesen

So einen Moment wie Ende Januar will Tobias Fischer nicht noch einmal erleben. Von jetzt auf gleich musste die Autobahn GmbH damals eine der wichtigsten Verbindungen zwischen Rheinland und Ruhrgebiet sperren: Die A52-Brücke über die Ruhr zwischen Düsseldorf und Essen. In der Fahrbahndecke hatte sich ein Spalt aufgetan. „Sowas ist eine Vollkatastrophe“, sagt Fischer, der bei der Autobahn GmbH für den Erhalt der Brücken im Ruhrgebiet und im Bergischen Land zuständig ist. Mehr als 80.000 Fahrzeuge fahren normalerweise jeden Tag über die 1,8 Kilometer lange Mintarder Brücke bei Mülheim an der Ruhr. Auf den Umleitungsstrecken gab es während der Sperrung wochenlang Chaos. Um solche bösen Überraschungen in Zukunft zu vermeiden, wird die Brücke im Moment mit Sensoren ausgestattet, die jede noch so kleine Veränderung an der Substanz des Bauwerks registrieren. Es ist ein Pilotprojekt, auf dem große Hoffnungen ruhen – denn im ganzen Land gibt es noch viele weitere Brücken, die in keinem guten Zustand sind. Die Hoffnung ist, dass Schäden durch die neue Technik so früh bemerkt werden, dass man rechtzeitig handeln und ungeplante Sperrungen vermeiden kann. KI analysiert die Daten in Echtzeit Rund 150 Sensoren installieren Techniker im Moment an der längsten Stahlbrücke Deutschlands. Wenn alles funktioniert, werden sie eine riesige Menge an Daten übermitteln. „Wir bekommen hier an der Brücke 100.000 Messwerte pro Sekunde“, erklärt Panagiotis Martakis, der das System entwickelt hat und nun über seine Firma Irmos anbietet.

Während jeder Mensch von 100.000 Messwerten pro Sekunde völlig überfordert wäre, kann die KI die Datenmengen in Echtzeit auswerten – 24 Stunden am Tag. „Die KI versteht nach und nach die Eigenarten einer jeden Brücke“, erklärt Fischer. „Wir bekommen dadurch ein viel besseres Gefühl für die Brücke.“ Dehnt sich das Material an einer Stelle, weil die Sonne es im Frühling erwärmt – oder weil es einen Riss im Material gibt? Hoffnung auf längere Nutzungsdauer von Brücken Die Autobahn GmbH hofft durch das KI-gestützte Brückenmonitoring auf einen „echten Paradigmenwechsel“ bei der Instandhaltung alter Brücken. „Wenn dieser Ansatz trägt, könnten Deutschlands Brücken künftig nicht nur saniert, sondern verstanden werden – mit deutlich optimierter Nutzungsdauer“, heißt es in der Projektbeschreibung. Ursprünglich war geplant, das neue System fünf Jahre lang an elf Brücken im Ruhrgebiet und im Bergischen Land zu testen. Doch die ersten Ergebnisse sind so positiv und der Handlungsdruck ist bundesweit so groß, dass die Technologie nun sehr viel schneller ausgerollt werden soll. „Der entscheidende Vorteil für uns ist, dass wir viel schneller und gezielter reagieren können, noch bevor Schäden entstehen“, erklärt Fischer. ADAC: Brücken in NRW liegen auf der Intensivstation Wie wichtig das KI-gestützte Brückenmonitoring werden könnte, zeigt ein Blick auf den Zustand der Autobahnbrücken im Land. 55 Prozent aller Brücken wurden laut Autobahn GmbH vor 1985 errichtet. Sie seien für weniger Verkehr und vor allem nur für leichtere Lastwagen gebaut worden. Auch die Materialqualität und Bauweise der 1960er und 1970er Jahre entsprächen nicht mehr den heutigen Anforderungen. „Die Brücken in NRW liegen auf der Intensivstation“, bestätigt der Leiter des Fachbereichs Verkehr und Umwelt beim ADAC Nordrhein, Roman Suthold. „Mit jedem Jahr, das bei der Erneuerung einer Brücke ungenutzt verstreicht, steigen die Risiken für Folgeschäden und damit für starke Belastungen von Autofahrern, Anwohnern und Volkswirtschaft erheblich.“ Das KI-gestützte Monitoring könne die Situation wirklich verbessern, glaubt Suthold. „Wenn dadurch frühzeitig gehandelt wird und vor allem sinnvolle Maßnahmen ergriffen werden, profitieren alle davon.“ Zugleich mahnt der ADAC-Verkehrsexperte, dass nicht nur Autobahnbrücken in die Jahre gekommen sind. „Auch das Land und die Kommunen sollten überlegen, ob sie die Technik für Brücken in ihrem Straßennetz einsetzen. Denn da warten noch viel mehr marode Brücken.“ Andere Projekte analysieren die Geräusche von Brücken Projekte, die künstliche Intelligenz nutzen wollen, um den Zustand alter Brücken zu überwachen, gibt es inzwischen mehrere in Deutschland. Das Fraunhofer-Institut für Digitale Medientechnologie (IDMT) nimmt mit Mikrofonen die Geräusche auf, die Fahrzeuge verursachen, wenn sie über Brücken fahren. Die KI analysiert die Geräusche dann und soll anhand kleinster Veränderungen erkennen, wenn sich der Zustand einer Brücke verschlechtert. Kosten bleiben überschaubar Die Autobahn GmbH will nun weiter Erfahrungen mit dem KI-gestützten Brückenmonitoring der Firma Irmos sammeln. Fischer ist nicht zuletzt auch wegen der überschaubaren Kosten von dem neuen System überzeugt. Einige zehntausend Euro müsse man pro Brücke rechnen, sagt er. Eine Kleinigkeit, wenn man bedenkt, welche Kosten durch eine Vollsperrung für die Wirtschaft entstehen können. Bei der Rahmedetalbrücke auf der A45 im Sauerland hat das Institut der Deutschen Wirtschaft den Schaden für die Unternehmen in der Region durch die vierjährige Sperrung auf rund 1,5 Milliarden Euro beziffert.

Developer-Häppchen fürs Wochenende – kleinere News der Woche

In unserem leckeren Häppchen-Überblick servieren wir alles, was es zwar nicht in die News geschafft hat, wir aber dennoch für spannend halten:

- Die Version 4.1 des Python-Compilers Nuitka bietet viele neue Funktionen und Korrekturen. Sie legen den Fokus auf asynchronen Code, fehlende Generics‑Funktionen und die Unterstützung von Python 3.14. Außerdem hat das Nuitka-Team die Skalierbarkeit der Python‑Kompilierung verbessert.

- Das plattformübergreifende UI‑Framework Compose Multiplatform erhält mit Version 1.11.0 eine experimentelle native Texteingabe für iOS, neue v2‑UI‑Test‑APIs und ein standardmäßig aktiviertes Concurrent-Rendering. Das Scrollen in Compose‑Web‑Apps geht jetzt deutlich flüssiger.

- Mit der neuen

needs_is_sandboxed

-Option können Filter, Funktionen und Tests von Twig 3.25.0 ihr Verhalten anpassen, wenn sie innerhalb einer Sandbox laufen. Ebenfalls neu: Die Template‑Engine für PHP behandelt den kompilierten Output von Templates, die{% embed %}

verwenden, nun über mehrere Durchläufe hinweg deterministisch. Ferner behebt sie eine langjährige Einschränkung, die das Überschreiben vonEscaperRuntime

über einen benutzerdefinierten Runtime‑Loader verhindert hat.

Die betterCode() Testing 2026 zeigt am 8. Juni 2026, wie das Zusammenspiel von Mensch, Tools und Prozessen den Erfolg moderner Software sichert. Im Fokus stehen Testing mit und von KI, Testautomatisierung und Praxisberichte, die zeigen, was wirklich getestet werden sollte.

- IntelliJ IDEA 2026.1.2 behebt bei der Java‑ und Kotlin‑IDE eine Reihe von Problemen: Dazu zählen fehlerhafte Projektöffnungen über Gradle‑.ipr-Dateien, falsche Einrückungen bei Java‑Ternary‑Ausdrücken und verschwundener Code beim Drag & Drop.

- Googles Tensor ML SDK hat Betastatus erreicht und bietet eine einheitliche ML‑Entwicklungsumgebung mit LiteRT. Auf den Geräten der Pixel-10-Familie können Entwicklerinnen und Entwickler ML- und generative KI-Modelle damit einfacher konvertieren, kompilieren und direkt ausführen.

- Zahlreiche kleinere Verbesserungen sind in Apache NetBeans 30 eingeflossen. Das neue Release bringt unter anderem Java-Updates, Unterstützung für den Pipe‑Operator aus PHP 8.5 und aktualisierte Build Tools wie Ant 1.10.17 und Maven 3.9.15.

- Mit Visual Studio Code 1.121 hält eine integrierte Vorschaufunktion für Mermaid und HTML Einzug. Zudem verbraucht Microsofts kostenloser Code‑Editor durch Terminal-Optimierungen jetzt weniger Ressourcen sowie Token und kann Agent‑Sitzungen auf entfernten Maschinen ausführen.

- Beim neuen Release von Barman liegt der Schwerpunkt auf Cloud-Backup-Funktionen. Mit Version 3.18.0 beherrscht das Open-Source-Admin-Tool für PostgreSQL-Server inkrementelle Backups für Cloud-Speicher und integriert Cloud-Backup-Operationen direkt in die zentrale Barman-CLI.

- Der Kubernetes‑Infrastruktur‑Controller Crossplane setzt mit Version 2.3.0 auf eine neue lokale Rendering‑Engine und erlaubt eine präzisere Kontrolle des Ressourcen‑Abgleichs für Composite Resources und Managed. Enthalten sind auch Sicherheitsupdates für Crossplanes Go‑Toolchain und deren Abhängigkeiten.

Solltest du ein schmackhaftes Thema vermissen, freuen wir uns über deine Mail.

Weiterlesen

In unserem leckeren Häppchen-Überblick servieren wir alles, was es zwar nicht in die News geschafft hat, wir aber dennoch für spannend halten:

- Die Version 4.1 des Python-Compilers Nuitka bietet viele neue Funktionen und Korrekturen. Sie legen den Fokus auf asynchronen Code, fehlende Generics‑Funktionen und die Unterstützung von Python 3.14. Außerdem hat das Nuitka-Team die Skalierbarkeit der Python‑Kompilierung verbessert.

- Das plattformübergreifende UI‑Framework Compose Multiplatform erhält mit Version 1.11.0 eine experimentelle native Texteingabe für iOS, neue v2‑UI‑Test‑APIs und ein standardmäßig aktiviertes Concurrent-Rendering. Das Scrollen in Compose‑Web‑Apps geht jetzt deutlich flüssiger.

- Mit der neuen

needs_is_sandboxed

-Option können Filter, Funktionen und Tests von Twig 3.25.0 ihr Verhalten anpassen, wenn sie innerhalb einer Sandbox laufen. Ebenfalls neu: Die Template‑Engine für PHP behandelt den kompilierten Output von Templates, die{% embed %}

verwenden, nun über mehrere Durchläufe hinweg deterministisch. Ferner behebt sie eine langjährige Einschränkung, die das Überschreiben vonEscaperRuntime

über einen benutzerdefinierten Runtime‑Loader verhindert hat.

Die betterCode() Testing 2026 zeigt am 8. Juni 2026, wie das Zusammenspiel von Mensch, Tools und Prozessen den Erfolg moderner Software sichert. Im Fokus stehen Testing mit und von KI, Testautomatisierung und Praxisberichte, die zeigen, was wirklich getestet werden sollte.

- IntelliJ IDEA 2026.1.2 behebt bei der Java‑ und Kotlin‑IDE eine Reihe von Problemen: Dazu zählen fehlerhafte Projektöffnungen über Gradle‑.ipr-Dateien, falsche Einrückungen bei Java‑Ternary‑Ausdrücken und verschwundener Code beim Drag & Drop.

- Googles Tensor ML SDK hat Betastatus erreicht und bietet eine einheitliche ML‑Entwicklungsumgebung mit LiteRT. Auf den Geräten der Pixel-10-Familie können Entwicklerinnen und Entwickler ML- und generative KI-Modelle damit einfacher konvertieren, kompilieren und direkt ausführen.

- Zahlreiche kleinere Verbesserungen sind in Apache NetBeans 30 eingeflossen. Das neue Release bringt unter anderem Java-Updates, Unterstützung für den Pipe‑Operator aus PHP 8.5 und aktualisierte Build Tools wie Ant 1.10.17 und Maven 3.9.15.

- Mit Visual Studio Code 1.121 hält eine integrierte Vorschaufunktion für Mermaid und HTML Einzug. Zudem verbraucht Microsofts kostenloser Code‑Editor durch Terminal-Optimierungen jetzt weniger Ressourcen sowie Token und kann Agent‑Sitzungen auf entfernten Maschinen ausführen.

- Beim neuen Release von Barman liegt der Schwerpunkt auf Cloud-Backup-Funktionen. Mit Version 3.18.0 beherrscht das Open-Source-Admin-Tool für PostgreSQL-Server inkrementelle Backups für Cloud-Speicher und integriert Cloud-Backup-Operationen direkt in die zentrale Barman-CLI.

- Der Kubernetes‑Infrastruktur‑Controller Crossplane setzt mit Version 2.3.0 auf eine neue lokale Rendering‑Engine und erlaubt eine präzisere Kontrolle des Ressourcen‑Abgleichs für Composite Resources und Managed. Enthalten sind auch Sicherheitsupdates für Crossplanes Go‑Toolchain und deren Abhängigkeiten.

Solltest du ein schmackhaftes Thema vermissen, freuen wir uns über deine Mail.

Nvidia will mit Vera-Prozessoren nach der CPU-Krone greifen

Die ersten großen KI-Firmen haben Nvidias neuen CPU-Server mit Vera-Prozessoren erhalten. Vera ist der Nachfolger von Nvidias erstem Server-Prozessorwurf Grace. Beide verwenden zwar ARM-Architekturen, allerdings hat Nvidia erst für Vera eigene Custom-Kerne mit dem Codenamen Olympus entworfen. 88 Stück arbeiten in einer CPU. Ian Buck überreichte die ersten Systeme kürzlich an Vertreter von Anthropic, OpenAI, SpaceXAI (früher xAI) und schließlich Oracle. Buck leitet bei Nvidia die Sparte Hyperscale and High-Performance Computing. Anders als bei früheren Erstauslieferungen war Firmenchef Jensen Huang nicht mehr dabei. Die Prozessoren enthalten keine KI-Beschleuniger per se. Nvidia preist sie trotzdem für KI-Rechenzentren an, weil Prozessoren dort momentan durch KI-Agenten an Bedeutung gewinnen. Sie setzen flotte CPUs voraus. Nvidia will CPU-Riese werden In der Analystenkonferenz zu den jüngsten Geschäftszahlen gab Nvidias Finanzchefin Colette Kress eine erste Prognose ab: Die Firma beziffert den adressierbaren Markt auf 200 Milliarden US-Dollar pro Jahr. Im ersten Jahr soll Vera für 20 Milliarden US-Dollar Umsatz sorgen. Ab dem dritten Quartal sollen auch Vera-Rubin-Systeme verfügbar sein, in denen zusätzliche KI-Beschleuniger stecken. „Wir rechnen in diesem Jahr mit einem Gesamtumsatz im CPU-Bereich von fast 20 Milliarden US-Dollar, was uns auf den Weg zum weltweit führenden CPU-Anbieter bringt“, sagte Kress.

Sollten sich die 20 Milliarden US-Dollar bewahrheiten, wäre das schon im ersten Jahr ein Kopf-an-Kopf-Rennen mit AMD und Intel, wenn man nur Serverprozessoren wertet. AMD setzte 2025 gut 16,6 Milliarden US-Dollar mit Server-Hardware um, allerdings inklusive KI-Beschleunigern. Der Umsatz sowohl mit CPUs als auch mit Beschleunigern soll dieses Jahr noch mal erheblich steigen. Intel setzte 2025 rund 16,9 Milliarden US-Dollar mit Server-Hardware um, hauptsächlich mit Xeon-Prozessoren. Den Markt für KI-Beschleuniger hat Intel weitgehend verschlafen. Inklusive Client-CPUs ziehen sowohl AMD als auch Intel jetzt schon davon. Intels Umsatz lag so bei 49,1 Milliarden US-Dollar (32,2 Milliarden US-Dollar durch Client). Nvidia will zwar mit N1X und N1 auch in Notebooks gelangen, allerdings verzögern sich die Mobilprozessoren schon seit 2025.

Weiterlesen

Die ersten großen KI-Firmen haben Nvidias neuen CPU-Server mit Vera-Prozessoren erhalten. Vera ist der Nachfolger von Nvidias erstem Server-Prozessorwurf Grace. Beide verwenden zwar ARM-Architekturen, allerdings hat Nvidia erst für Vera eigene Custom-Kerne mit dem Codenamen Olympus entworfen. 88 Stück arbeiten in einer CPU. Ian Buck überreichte die ersten Systeme kürzlich an Vertreter von Anthropic, OpenAI, SpaceXAI (früher xAI) und schließlich Oracle. Buck leitet bei Nvidia die Sparte Hyperscale and High-Performance Computing. Anders als bei früheren Erstauslieferungen war Firmenchef Jensen Huang nicht mehr dabei. Die Prozessoren enthalten keine KI-Beschleuniger per se. Nvidia preist sie trotzdem für KI-Rechenzentren an, weil Prozessoren dort momentan durch KI-Agenten an Bedeutung gewinnen. Sie setzen flotte CPUs voraus. Nvidia will CPU-Riese werden In der Analystenkonferenz zu den jüngsten Geschäftszahlen gab Nvidias Finanzchefin Colette Kress eine erste Prognose ab: Die Firma beziffert den adressierbaren Markt auf 200 Milliarden US-Dollar pro Jahr. Im ersten Jahr soll Vera für 20 Milliarden US-Dollar Umsatz sorgen. Ab dem dritten Quartal sollen auch Vera-Rubin-Systeme verfügbar sein, in denen zusätzliche KI-Beschleuniger stecken. „Wir rechnen in diesem Jahr mit einem Gesamtumsatz im CPU-Bereich von fast 20 Milliarden US-Dollar, was uns auf den Weg zum weltweit führenden CPU-Anbieter bringt“, sagte Kress.

Sollten sich die 20 Milliarden US-Dollar bewahrheiten, wäre das schon im ersten Jahr ein Kopf-an-Kopf-Rennen mit AMD und Intel, wenn man nur Serverprozessoren wertet. AMD setzte 2025 gut 16,6 Milliarden US-Dollar mit Server-Hardware um, allerdings inklusive KI-Beschleunigern. Der Umsatz sowohl mit CPUs als auch mit Beschleunigern soll dieses Jahr noch mal erheblich steigen. Intel setzte 2025 rund 16,9 Milliarden US-Dollar mit Server-Hardware um, hauptsächlich mit Xeon-Prozessoren. Den Markt für KI-Beschleuniger hat Intel weitgehend verschlafen. Inklusive Client-CPUs ziehen sowohl AMD als auch Intel jetzt schon davon. Intels Umsatz lag so bei 49,1 Milliarden US-Dollar (32,2 Milliarden US-Dollar durch Client). Nvidia will zwar mit N1X und N1 auch in Notebooks gelangen, allerdings verzögern sich die Mobilprozessoren schon seit 2025.

Googles XR-Brillen auf der I/O: Project Aura & Prototyp ausprobiert

Weniger ist manchmal mehr: Diese Erfahrung hat Meta mit seinen Smart Glasses gemacht. Während das Großprojekt Metaverse viel Geld verschlang und wenig Anklang fand, verkaufte das US-Unternehmen alleine im Jahr 2025 über sieben Millionen Exemplare seiner KI-Brillen (Ray-Ban Meta und Oakley Meta). Wearables, die Nutzer nicht komplett von der Realität abschotten, treffen offenbar auf mehr Gegenliebe als rein virtuelle Welten. Apple soll für die Zukunft ebenfalls eine Brille im Köcher haben, nachdem auch das räumliche Computing mit der Vision Pro eine Nischenlösung geblieben ist. Und Google? Das Unternehmen stellte jüngst auf der Entwicklerkonferenz I/O neue Brillen in Zusammenarbeit mit Warby Parker, Gentle Monster und Samsung vor. Doch dabei soll es nicht bleiben. Wie sehr Google das Thema umtreibt, ist alleine daran zu sehen, wie stark das Unternehmen in letzter Zeit Android XR in den Fokus rückt. Schon auf dem Mobile World Congress in Barcelona konnte ein Prototyp in Augenschein genommen werden. Jetzt, auf der Entwicklerkonferenz I/O im kalifornischen Mountain View, gab es ebenfalls Demos: in der sogenannten AI Sandbox, einer großen Halle auf dem Veranstaltungsgelände. heise online konnte an zwei Demos vor Ort teilnehmen. Google zeigte gleich zwei Geräte in Aktion: Neben dem namenlosen eigenen Prototyp mit KI-Sprachsteuerung, Kameras und eingebautem kleinem Display wurde auch Project Aura demonstriert, die XR-Brille von Xreal und Google. Project Aura: Der Brückenschlag Project Aura ist eine Art Brückenschlag zwischen den Mixed-Reality-Visionen der letzten Jahre und den Smart Glasses. Schon das Aussehen verbindet das klassische Design einer herkömmlichen Brille mit Headset-Technik. Project Aura verfügt über ein Display in jeder Linse, eingebaute Lautsprecher und mehrere Kameras, liefert also ein vollständiges XR-Erlebnis in einem Brillengehäuse. Beim Aufsetzen fühlt sich das Gerät deutlich angenehmer an als klassische VR-Headsets, da die Abschirmung entfällt und die Brille leichter wirkt. Von innen sieht man allerdings die aufgesetzten Display-Komponenten – ein ungewohnter Anblick. Und Aura hat auch etwas von der Vision Pro kopiert: ein per Kabel angebundener Block, der hier aber nicht nur die Batterie in sich trägt, sondern auch die Recheneinheit. Das Sichtfeld beträgt 70 Grad – deutlich mehr als die 57 Grad beim bisherigen Topmodell Xreal One Pro. Das ist breit genug, um drei App-Fenster nebeneinander anzuzeigen; bis zu fünf können gleichzeitig geöffnet sein. Die Displayhelligkeit ist gut, Texte und Grafiken wirken scharf. Über einen Knopf am rechten Bügel lässt sich die Abdunkelung der Gläser steuern – was praktisch ist, wenn man nicht gestört werden möchte. Niedrigere Hemmschwelle Die Handsteuerung funktionierte im kurzen Test recht gut: Pinch-Gesten zum Auswählen und Verschieben von App-Fenstern sind intuitiv und erinnern an die Steuerung der Vision Pro oder der Meta Quest 3. Besonders Spaß gemacht hat eine Gaming-Demo: Im Rollenspiel Demeo ließ sich das Spielfeld mit beiden geballten Fäusten greifen, drehen und skalieren – einzelne Spielfiguren konnte man per Pinch aufnehmen und umsetzen. Das wirkt deutlich immersiver als klassische Controller-Steuerung. Was aber vor allem den Unterschied macht: Je leichter so ein Gerät ist, desto niedriger dürfte auch die Hemmschwelle sein, es öfter mal aufzusetzen. Project Aura soll noch 2026 weltweit in den Handel kommen. Für Entwickler startet bereits jetzt das „Android XR Developer Catalyst Program“ mit frühem Hardware-Zugang. Den Preis und konkreten Termin kommuniziert der Hersteller bislang nicht. Zum Vergleich: Xreals aktuelles Topmodell One Pro kostet nach einer jüngsten Preissenkung 599 Euro.

Googles Prototyp-Brille Das Google-Gerät kommt noch leichter daher, hat aber bei eingeschaltetem Display nur ein kleines Fensterchen im Sichtfeld im Angebot. Das reicht für viele Einsatzzwecke aber vollkommen aus: Richtungspfeile in der Navigation, Kartenausschnitte, Widgets, Live-Übersetzungen und Kurznachrichten passen hier spielend hinein und gleichzeitig bleibt die Realität weitgehend sichtbar. Die Demo zeigte im Vergleich zu früheren Präsentationen, welche Fortschritte Google macht. Die Brille ist leicht, lässt sich mit Korrekturgläsern ausstatten und bietet gute Sicht. Der Kunststoffrahmen wirkt noch nicht hochwertig, fällt aber als Technologiebrille durchaus auf. Dass es eine smarte Brille ist, sieht man ihr an. Die Bedienung ist simpel: Ein langer Druck auf die Seite aktiviert Gemini, ein Knopf an der Unterseite schaltet das Display ein. Die Bedienung mit deutscher Sprache funktioniert problemlos. Lediglich bei den akustischen Ausgaben stellten wir im Test in der AI Sandbox fest, dass der Ton in belebten Umgebungen teilweise schlecht zu verstehen ist. Hier kann es helfen, die Hände über die Bügel zu halten. Und was kann man damit machen? Im Test erfassten wir mit der Kamera Gegenstände und fügten diese direkt zur Einkaufsliste hinzu. WM-Partien der deutschen Mannschaft konnten auf Zuruf herausgesucht und mit einem Sprachbefehl in den Google-Kalender eingetragen werden. Besonders überzeugend war die Live-Übersetzung: Ein spontanes Gespräch auf Portugiesisch – Thema: das legendäre 7:1 der Fußball-WM – übertrug die Brille in Echtzeit fehlerlos ins Deutsche. Die Navigation ist durchdacht: Wer nach unten blickt, sieht eine Kartenansicht, an die sich per Swipe heranzoomen lässt – wer den Blick hebt, sieht stattdessen einen Richtungspfeil. In einer anderen Demo wurde auf Zuruf ein Brettspiel erkannt und eine Anleitung geliefert, wie die Partie zu gewinnen ist. Beim Blick auf ein Konzert-Poster spielte die Brille auf Nachfrage die Musik des Künstlers. Google setzt dabei auf eine Split-Compute-Architektur: Rechenintensive KI-Aufgaben werden ans Smartphone oder in die Cloud ausgelagert, damit die Brille selbst möglichst leicht bleibt. Viele Fragen bleiben offen So sehr die Erprobungen ein Gefühl dafür vermitteln können, ob man selbst einen Nutzwert in den smarten Brillen sieht, so wenig beantworten sie entscheidende Fragen, die sie umgeben: Wie lange hält der Akku durch? Und findet eine Brille mit sichtbaren Kameras gesellschaftliche Akzeptanz oder löst sie Unbehagen bei Menschen aus, die sich in ihrem Sichtfeld befinden? Mit seinem KI-Modell Gemini hat Google eine wichtige Grundvoraussetzung erfüllt. Dennoch stellt sich auch hier die Frage: Wollen Nutzer zum Beispiel in der Öffentlichkeit wirklich häufiger mit der KI reden? Oder würden sie das eher zu Hause tun? Aber brauchen sie dort dafür eine Brille? Oder tut es dann nicht auch das Smartphone?

Weiterlesen

Weniger ist manchmal mehr: Diese Erfahrung hat Meta mit seinen Smart Glasses gemacht. Während das Großprojekt Metaverse viel Geld verschlang und wenig Anklang fand, verkaufte das US-Unternehmen alleine im Jahr 2025 über sieben Millionen Exemplare seiner KI-Brillen (Ray-Ban Meta und Oakley Meta). Wearables, die Nutzer nicht komplett von der Realität abschotten, treffen offenbar auf mehr Gegenliebe als rein virtuelle Welten. Apple soll für die Zukunft ebenfalls eine Brille im Köcher haben, nachdem auch das räumliche Computing mit der Vision Pro eine Nischenlösung geblieben ist. Und Google? Das Unternehmen stellte jüngst auf der Entwicklerkonferenz I/O neue Brillen in Zusammenarbeit mit Warby Parker, Gentle Monster und Samsung vor. Doch dabei soll es nicht bleiben. Wie sehr Google das Thema umtreibt, ist alleine daran zu sehen, wie stark das Unternehmen in letzter Zeit Android XR in den Fokus rückt. Schon auf dem Mobile World Congress in Barcelona konnte ein Prototyp in Augenschein genommen werden. Jetzt, auf der Entwicklerkonferenz I/O im kalifornischen Mountain View, gab es ebenfalls Demos: in der sogenannten AI Sandbox, einer großen Halle auf dem Veranstaltungsgelände. heise online konnte an zwei Demos vor Ort teilnehmen. Google zeigte gleich zwei Geräte in Aktion: Neben dem namenlosen eigenen Prototyp mit KI-Sprachsteuerung, Kameras und eingebautem kleinem Display wurde auch Project Aura demonstriert, die XR-Brille von Xreal und Google. Project Aura: Der Brückenschlag Project Aura ist eine Art Brückenschlag zwischen den Mixed-Reality-Visionen der letzten Jahre und den Smart Glasses. Schon das Aussehen verbindet das klassische Design einer herkömmlichen Brille mit Headset-Technik. Project Aura verfügt über ein Display in jeder Linse, eingebaute Lautsprecher und mehrere Kameras, liefert also ein vollständiges XR-Erlebnis in einem Brillengehäuse. Beim Aufsetzen fühlt sich das Gerät deutlich angenehmer an als klassische VR-Headsets, da die Abschirmung entfällt und die Brille leichter wirkt. Von innen sieht man allerdings die aufgesetzten Display-Komponenten – ein ungewohnter Anblick. Und Aura hat auch etwas von der Vision Pro kopiert: ein per Kabel angebundener Block, der hier aber nicht nur die Batterie in sich trägt, sondern auch die Recheneinheit. Das Sichtfeld beträgt 70 Grad – deutlich mehr als die 57 Grad beim bisherigen Topmodell Xreal One Pro. Das ist breit genug, um drei App-Fenster nebeneinander anzuzeigen; bis zu fünf können gleichzeitig geöffnet sein. Die Displayhelligkeit ist gut, Texte und Grafiken wirken scharf. Über einen Knopf am rechten Bügel lässt sich die Abdunkelung der Gläser steuern – was praktisch ist, wenn man nicht gestört werden möchte. Niedrigere Hemmschwelle Die Handsteuerung funktionierte im kurzen Test recht gut: Pinch-Gesten zum Auswählen und Verschieben von App-Fenstern sind intuitiv und erinnern an die Steuerung der Vision Pro oder der Meta Quest 3. Besonders Spaß gemacht hat eine Gaming-Demo: Im Rollenspiel Demeo ließ sich das Spielfeld mit beiden geballten Fäusten greifen, drehen und skalieren – einzelne Spielfiguren konnte man per Pinch aufnehmen und umsetzen. Das wirkt deutlich immersiver als klassische Controller-Steuerung. Was aber vor allem den Unterschied macht: Je leichter so ein Gerät ist, desto niedriger dürfte auch die Hemmschwelle sein, es öfter mal aufzusetzen. Project Aura soll noch 2026 weltweit in den Handel kommen. Für Entwickler startet bereits jetzt das „Android XR Developer Catalyst Program“ mit frühem Hardware-Zugang. Den Preis und konkreten Termin kommuniziert der Hersteller bislang nicht. Zum Vergleich: Xreals aktuelles Topmodell One Pro kostet nach einer jüngsten Preissenkung 599 Euro.

Googles Prototyp-Brille Das Google-Gerät kommt noch leichter daher, hat aber bei eingeschaltetem Display nur ein kleines Fensterchen im Sichtfeld im Angebot. Das reicht für viele Einsatzzwecke aber vollkommen aus: Richtungspfeile in der Navigation, Kartenausschnitte, Widgets, Live-Übersetzungen und Kurznachrichten passen hier spielend hinein und gleichzeitig bleibt die Realität weitgehend sichtbar. Die Demo zeigte im Vergleich zu früheren Präsentationen, welche Fortschritte Google macht. Die Brille ist leicht, lässt sich mit Korrekturgläsern ausstatten und bietet gute Sicht. Der Kunststoffrahmen wirkt noch nicht hochwertig, fällt aber als Technologiebrille durchaus auf. Dass es eine smarte Brille ist, sieht man ihr an. Die Bedienung ist simpel: Ein langer Druck auf die Seite aktiviert Gemini, ein Knopf an der Unterseite schaltet das Display ein. Die Bedienung mit deutscher Sprache funktioniert problemlos. Lediglich bei den akustischen Ausgaben stellten wir im Test in der AI Sandbox fest, dass der Ton in belebten Umgebungen teilweise schlecht zu verstehen ist. Hier kann es helfen, die Hände über die Bügel zu halten. Und was kann man damit machen? Im Test erfassten wir mit der Kamera Gegenstände und fügten diese direkt zur Einkaufsliste hinzu. WM-Partien der deutschen Mannschaft konnten auf Zuruf herausgesucht und mit einem Sprachbefehl in den Google-Kalender eingetragen werden. Besonders überzeugend war die Live-Übersetzung: Ein spontanes Gespräch auf Portugiesisch – Thema: das legendäre 7:1 der Fußball-WM – übertrug die Brille in Echtzeit fehlerlos ins Deutsche. Die Navigation ist durchdacht: Wer nach unten blickt, sieht eine Kartenansicht, an die sich per Swipe heranzoomen lässt – wer den Blick hebt, sieht stattdessen einen Richtungspfeil. In einer anderen Demo wurde auf Zuruf ein Brettspiel erkannt und eine Anleitung geliefert, wie die Partie zu gewinnen ist. Beim Blick auf ein Konzert-Poster spielte die Brille auf Nachfrage die Musik des Künstlers. Google setzt dabei auf eine Split-Compute-Architektur: Rechenintensive KI-Aufgaben werden ans Smartphone oder in die Cloud ausgelagert, damit die Brille selbst möglichst leicht bleibt. Viele Fragen bleiben offen So sehr die Erprobungen ein Gefühl dafür vermitteln können, ob man selbst einen Nutzwert in den smarten Brillen sieht, so wenig beantworten sie entscheidende Fragen, die sie umgeben: Wie lange hält der Akku durch? Und findet eine Brille mit sichtbaren Kameras gesellschaftliche Akzeptanz oder löst sie Unbehagen bei Menschen aus, die sich in ihrem Sichtfeld befinden? Mit seinem KI-Modell Gemini hat Google eine wichtige Grundvoraussetzung erfüllt. Dennoch stellt sich auch hier die Frage: Wollen Nutzer zum Beispiel in der Öffentlichkeit wirklich häufiger mit der KI reden? Oder würden sie das eher zu Hause tun? Aber brauchen sie dort dafür eine Brille? Oder tut es dann nicht auch das Smartphone?

SADAS: Neue Software warnt Fahrer vor Gefahrenzonen im Straßenraum

Was haben dicke, gelbe Bücher mit autonomem Fahren zu tun? Mehr als man denkt, wenn es nach dem Fraunhofer-Institut für Offene Kommunikationssysteme (FOKUS) und der pdm solutions GmbH geht. In einem sechsmonatigen Forschungsprojekt haben die beiden Partner nach eigenen Angaben einen Proof of Concept abgeschlossen, der kuratierte Standortdaten aus dem Verzeichnis „Das Telefonbuch“ für moderne Fahrerassistenzsysteme (ADAS) nutzbar machen soll. Der Prototyp wurde auf dem Branchentreff des Verbands Deutscher Auskunfts- und Verzeichnismedien (VDAV) in Berlin präsentiert. Im Zentrum steht die am Fraunhofer FOKUS entwickelte Software SADAS (Support for Advanced Driver Assistance Systems). Sie soll die Verzeichnisdaten in den sogenannten „Digitalen Stadtzwilling“ integrieren – ein virtuelles Abbild des Straßenraums. Konkret identifiziere das System laut Fraunhofer Orte mit besonders schutzbedürftigen Verkehrsteilnehmenden, etwa Kindergärten, Spielplätze oder Schulen, und gleiche diese Informationen in Echtzeit mit Fahrtroute und Fahrzeugposition ab. Erkenne das System eine potenzielle Gefahrenzone, soll der Fahrer optische oder akustische Signale über das Dashboard erhalten – und zwar, bevor die Situation im Sichtfeld auftaucht. Künftig sollen diese Warnungen nach Darstellung der Partner auch direkt an Bremsassistenten oder automatisierte Fahrfunktionen weitergereicht werden können. Wie KI-gestützte Assistenzsysteme im Fahrzeug funktionieren und welche Infrastruktur dahintersteckt, zeigt etwa das Forschungsprojekt Central Car Server der TU München, bei dem ein Zentralrechner alle elektronischen Komponenten steuert und neue Funktionen selbst programmiert. Alternative zu Datensilos großer Plattformen Standortdaten von Schulen oder Kitas finden sich grundsätzlich auch in den Kartendiensten globaler Tech-Konzerne. Das Fraunhofer-Projekt zielt jedoch ausdrücklich auf eine souveräne Dateninfrastruktur. „Ein zentrales Ziel ist es, bestehende Datensilos aufzubrechen. Das unterstützt auch digital souveräne Systeme“, erklärt Dr.-Ing. Ilja Radusch, Leiter des Geschäftsbereichs Smart Mobility bei Fraunhofer FOKUS und Leiter des Daimler Center for Automotive IT Innovations (DCAITI) an der TU Berlin. Das Ziel digitaler Souveränität steht dabei im Mittelpunkt des Projekts. Über offene, standardbasierte Schnittstellen sollen Städte und Mobilitätsdienstleister auf den Digitalen Stadtzwilling zugreifen können, ohne sich an die geschlossenen Ökosysteme einzelner Plattformanbieter zu binden. Das soll es zudem ermöglichen, dass nicht jeder Datenanbieter von vornherein sämtliche Qualitätsanforderungen aller – oft noch unbekannten – Datennutzenden erfüllen muss.

Vom Telefonbucheintrag zur Geokoordinate Eine Herausforderung dürfte die Datenqualität sein. Während für Verzeichnisdienste eine korrekte Postadresse genügt, benötigen Fahrzeuge hochpräzise Geokoordinaten. Radusch nennt ein anschauliches Beispiel: Schulen oder Spielplätze erstreckten sich häufig über ganze Straßenblöcke und grenzten an mehrere Straßen. Würde ein Assistenzsystem pauschal an allen angrenzenden Straßen warnen, käme es schnell zum Gewöhnungseffekt – mit negativen Folgen für die Verkehrssicherheit. Um die Daten für den Einsatz im Fahrzeug zu veredeln, will Fraunhofer FOKUS mehrere Quellen kombinieren: Informationen aus Verkehrsmanagementzentralen, stationäre Sensoren in Ampelanlagen sowie Sensordaten aus Fahrzeugflotten. Hinzu kommen soll Crowdsourcing über die KI-basierte App Eidos Road Glancr (PDF): Ein handelsübliches Smartphone an der Windschutzscheibe – beispielsweise in Bussen oder Taxis – soll datenschutzkonform Veränderungen im Straßenraum wie Baustellen, neue Verkehrszeichen, Straßenschäden oder verfügbare Parkflächen erfassen. Für seltene oder sicherheitskritische Ereignisse will das Team die Realdaten zusätzlich durch Simulationen in der Open-Source-Umgebung Eclipse MOSAIC ergänzen. Nach dem nach eigenen Angaben erfolgreichen Proof of Concept wollen pdm solutions und Fraunhofer FOKUS die Zusammenarbeit fortsetzen. Perspektivisch sollen die datenbasierten Digitalen Stadtzwillinge nicht nur Assistenzsysteme ergänzen, sondern auch für automatisiertes und autonomes Fahren nutzbar werden. Andere Hersteller setzen bei der Integration von Fahrerassistenz auf KI-Plattformen wie etwa Google Gemini in Volvo-Fahrzeugen, wo die KI über Fahrzeugkameras Verkehrszeichen und die Umgebung in Echtzeit analysiert. Denkbar seien laut Radusch zudem klassische Telematik-Services wie barrierearme Routen zur nächsten Apotheke oder thematische Stadttouren. Transparenzhinweis: Heise & Dumrath Medien ist am Herausgeber von „Das Telefonbuch“ beteiligt.

Weiterlesen

Was haben dicke, gelbe Bücher mit autonomem Fahren zu tun? Mehr als man denkt, wenn es nach dem Fraunhofer-Institut für Offene Kommunikationssysteme (FOKUS) und der pdm solutions GmbH geht. In einem sechsmonatigen Forschungsprojekt haben die beiden Partner nach eigenen Angaben einen Proof of Concept abgeschlossen, der kuratierte Standortdaten aus dem Verzeichnis „Das Telefonbuch“ für moderne Fahrerassistenzsysteme (ADAS) nutzbar machen soll. Der Prototyp wurde auf dem Branchentreff des Verbands Deutscher Auskunfts- und Verzeichnismedien (VDAV) in Berlin präsentiert. Im Zentrum steht die am Fraunhofer FOKUS entwickelte Software SADAS (Support for Advanced Driver Assistance Systems). Sie soll die Verzeichnisdaten in den sogenannten „Digitalen Stadtzwilling“ integrieren – ein virtuelles Abbild des Straßenraums. Konkret identifiziere das System laut Fraunhofer Orte mit besonders schutzbedürftigen Verkehrsteilnehmenden, etwa Kindergärten, Spielplätze oder Schulen, und gleiche diese Informationen in Echtzeit mit Fahrtroute und Fahrzeugposition ab. Erkenne das System eine potenzielle Gefahrenzone, soll der Fahrer optische oder akustische Signale über das Dashboard erhalten – und zwar, bevor die Situation im Sichtfeld auftaucht. Künftig sollen diese Warnungen nach Darstellung der Partner auch direkt an Bremsassistenten oder automatisierte Fahrfunktionen weitergereicht werden können. Wie KI-gestützte Assistenzsysteme im Fahrzeug funktionieren und welche Infrastruktur dahintersteckt, zeigt etwa das Forschungsprojekt Central Car Server der TU München, bei dem ein Zentralrechner alle elektronischen Komponenten steuert und neue Funktionen selbst programmiert. Alternative zu Datensilos großer Plattformen Standortdaten von Schulen oder Kitas finden sich grundsätzlich auch in den Kartendiensten globaler Tech-Konzerne. Das Fraunhofer-Projekt zielt jedoch ausdrücklich auf eine souveräne Dateninfrastruktur. „Ein zentrales Ziel ist es, bestehende Datensilos aufzubrechen. Das unterstützt auch digital souveräne Systeme“, erklärt Dr.-Ing. Ilja Radusch, Leiter des Geschäftsbereichs Smart Mobility bei Fraunhofer FOKUS und Leiter des Daimler Center for Automotive IT Innovations (DCAITI) an der TU Berlin. Das Ziel digitaler Souveränität steht dabei im Mittelpunkt des Projekts. Über offene, standardbasierte Schnittstellen sollen Städte und Mobilitätsdienstleister auf den Digitalen Stadtzwilling zugreifen können, ohne sich an die geschlossenen Ökosysteme einzelner Plattformanbieter zu binden. Das soll es zudem ermöglichen, dass nicht jeder Datenanbieter von vornherein sämtliche Qualitätsanforderungen aller – oft noch unbekannten – Datennutzenden erfüllen muss.

Vom Telefonbucheintrag zur Geokoordinate Eine Herausforderung dürfte die Datenqualität sein. Während für Verzeichnisdienste eine korrekte Postadresse genügt, benötigen Fahrzeuge hochpräzise Geokoordinaten. Radusch nennt ein anschauliches Beispiel: Schulen oder Spielplätze erstreckten sich häufig über ganze Straßenblöcke und grenzten an mehrere Straßen. Würde ein Assistenzsystem pauschal an allen angrenzenden Straßen warnen, käme es schnell zum Gewöhnungseffekt – mit negativen Folgen für die Verkehrssicherheit. Um die Daten für den Einsatz im Fahrzeug zu veredeln, will Fraunhofer FOKUS mehrere Quellen kombinieren: Informationen aus Verkehrsmanagementzentralen, stationäre Sensoren in Ampelanlagen sowie Sensordaten aus Fahrzeugflotten. Hinzu kommen soll Crowdsourcing über die KI-basierte App Eidos Road Glancr (PDF): Ein handelsübliches Smartphone an der Windschutzscheibe – beispielsweise in Bussen oder Taxis – soll datenschutzkonform Veränderungen im Straßenraum wie Baustellen, neue Verkehrszeichen, Straßenschäden oder verfügbare Parkflächen erfassen. Für seltene oder sicherheitskritische Ereignisse will das Team die Realdaten zusätzlich durch Simulationen in der Open-Source-Umgebung Eclipse MOSAIC ergänzen. Nach dem nach eigenen Angaben erfolgreichen Proof of Concept wollen pdm solutions und Fraunhofer FOKUS die Zusammenarbeit fortsetzen. Perspektivisch sollen die datenbasierten Digitalen Stadtzwillinge nicht nur Assistenzsysteme ergänzen, sondern auch für automatisiertes und autonomes Fahren nutzbar werden. Andere Hersteller setzen bei der Integration von Fahrerassistenz auf KI-Plattformen wie etwa Google Gemini in Volvo-Fahrzeugen, wo die KI über Fahrzeugkameras Verkehrszeichen und die Umgebung in Echtzeit analysiert. Denkbar seien laut Radusch zudem klassische Telematik-Services wie barrierearme Routen zur nächsten Apotheke oder thematische Stadttouren. Transparenzhinweis: Heise & Dumrath Medien ist am Herausgeber von „Das Telefonbuch“ beteiligt.

IT-Ausfälle immer teurer für große Unternehmen

Die globalen Kosten für IT-Ausfälle steigen laut einer Studie der Cisco-Tochter Splunk rasant an. Demnach belaufen sich die Ausfallkosten für die 2.000 größten Unternehmen der Welt inzwischen auf 600 Milliarden US-Dollar pro Jahr. Das stellt einen Anstieg um 50 Prozent in nur zwei Jahren dar. Für deutsche Unternehmen beziffert die Studie die durchschnittlichen Kosten auf 295 Millionen US-Dollar pro Jahr. Besonders alarmierend sind die durchschnittlichen Kosten pro Minute Downtime von 15.000 US-Dollar. Global gesehen ist der größte Kostenpunkt der direkte Umsatzverlust, den die Studie mit durchschnittlich 95 Millionen US-Dollar pro großem Unternehmen beziffert. Darauf folgen Compliance-Kosten mit im Schnitt 51 Millionen US-Dollar. Lediglich in der EMEA-Region haben die Großunternehmen noch mehr mit Compliance zu kämpfen, worauf die Kosten für Security und dann die durch Umsatzeinbußen folgen. Doch die Folgen gehen weit über reine Kosten hinaus. 85 Prozent der Befragten in der EMEA-Region nennen den Verlust von Kunden als direkte Folge von IT-Ausfällen. Zudem melden 86 Prozent einen hohen Personalaufwand zur Fehlerbehebung, während 88 Prozent einen gestiegenen Bedarf an Kundensupport haben. In 53 Prozent der Fälle bemerken Kunden die Probleme sogar vor dem eigenen IT-Team. Befragt wurden den Splunk-Angaben nach 2000 Führungskräfte aus den 2000 größten Unternehmen. KI: Lösung und Problem zugleich Künstliche Intelligenz wird zunehmend als Lösung eingesetzt, um Ausfallrisiken zu reduzieren, indem sie Auffälligkeiten erkennt und teils bereits Lösungen vorschlägt oder umsetzt. Weltweit geben Unternehmen durchschnittlich 24,5 Millionen US-Dollar pro Jahr für KI-Tools zur Prävention und Response aus. 56 Prozent der Anwender sagten, dass KI das Ausfallrisiko insgesamt verringert hat. Jedoch erweist sie sich dabei als zweischneidiges Schwert: Alle befragten Technologieverantwortlichen berichten laut Splunk von Ausfallzeiten, die im Zusammenhang mit KI stehen. Folglich sorgen sich auch 68 Prozent um unvorhersehbares Verhalten von KI-Agenten. Gleichzeitig investieren 85 Prozent der Verantwortlichen in KI-gestützte Sicherheitsautomatisierung und 37 Prozent in Netzwerkautomatisierung.

Observability ist Trumpf Die IT-Verantwortlichen nennen durchgängige Observability als ihre oberste Investitionspriorität, wenn es darum geht, die Ausfallsicherheit der Infrastruktur zu verbessern. Unternehmen priorisieren daher Observability-Plattformen und KI-gestützte Automatisierung noch vor klassischen Hardware-Upgrades. 65 Prozent der Technologieverantwortlichen investieren in KI-basierte Observability, um Echtzeit-Einblicke in digitale Ökosysteme zu erhalten. Die Studie unterstreicht, dass IT-Ausfälle kein reines Technologieproblem sind, sondern eine systemische Bedrohung für das gesamte Geschäft darstellen. Die Kombination aus Observability, Automatisierung und KI gilt als vielversprechendster Ansatz, um die wachsende Komplexität digitaler Infrastrukturen zu beherrschen. Gleichzeitig warnen Experten vor einer Überschätzung von KI: Ohne menschliche Aufsicht und klare Governance können neue Risiken entstehen.

Weiterlesen

Die globalen Kosten für IT-Ausfälle steigen laut einer Studie der Cisco-Tochter Splunk rasant an. Demnach belaufen sich die Ausfallkosten für die 2.000 größten Unternehmen der Welt inzwischen auf 600 Milliarden US-Dollar pro Jahr. Das stellt einen Anstieg um 50 Prozent in nur zwei Jahren dar. Für deutsche Unternehmen beziffert die Studie die durchschnittlichen Kosten auf 295 Millionen US-Dollar pro Jahr. Besonders alarmierend sind die durchschnittlichen Kosten pro Minute Downtime von 15.000 US-Dollar. Global gesehen ist der größte Kostenpunkt der direkte Umsatzverlust, den die Studie mit durchschnittlich 95 Millionen US-Dollar pro großem Unternehmen beziffert. Darauf folgen Compliance-Kosten mit im Schnitt 51 Millionen US-Dollar. Lediglich in der EMEA-Region haben die Großunternehmen noch mehr mit Compliance zu kämpfen, worauf die Kosten für Security und dann die durch Umsatzeinbußen folgen. Doch die Folgen gehen weit über reine Kosten hinaus. 85 Prozent der Befragten in der EMEA-Region nennen den Verlust von Kunden als direkte Folge von IT-Ausfällen. Zudem melden 86 Prozent einen hohen Personalaufwand zur Fehlerbehebung, während 88 Prozent einen gestiegenen Bedarf an Kundensupport haben. In 53 Prozent der Fälle bemerken Kunden die Probleme sogar vor dem eigenen IT-Team. Befragt wurden den Splunk-Angaben nach 2000 Führungskräfte aus den 2000 größten Unternehmen. KI: Lösung und Problem zugleich Künstliche Intelligenz wird zunehmend als Lösung eingesetzt, um Ausfallrisiken zu reduzieren, indem sie Auffälligkeiten erkennt und teils bereits Lösungen vorschlägt oder umsetzt. Weltweit geben Unternehmen durchschnittlich 24,5 Millionen US-Dollar pro Jahr für KI-Tools zur Prävention und Response aus. 56 Prozent der Anwender sagten, dass KI das Ausfallrisiko insgesamt verringert hat. Jedoch erweist sie sich dabei als zweischneidiges Schwert: Alle befragten Technologieverantwortlichen berichten laut Splunk von Ausfallzeiten, die im Zusammenhang mit KI stehen. Folglich sorgen sich auch 68 Prozent um unvorhersehbares Verhalten von KI-Agenten. Gleichzeitig investieren 85 Prozent der Verantwortlichen in KI-gestützte Sicherheitsautomatisierung und 37 Prozent in Netzwerkautomatisierung.

Observability ist Trumpf Die IT-Verantwortlichen nennen durchgängige Observability als ihre oberste Investitionspriorität, wenn es darum geht, die Ausfallsicherheit der Infrastruktur zu verbessern. Unternehmen priorisieren daher Observability-Plattformen und KI-gestützte Automatisierung noch vor klassischen Hardware-Upgrades. 65 Prozent der Technologieverantwortlichen investieren in KI-basierte Observability, um Echtzeit-Einblicke in digitale Ökosysteme zu erhalten. Die Studie unterstreicht, dass IT-Ausfälle kein reines Technologieproblem sind, sondern eine systemische Bedrohung für das gesamte Geschäft darstellen. Die Kombination aus Observability, Automatisierung und KI gilt als vielversprechendster Ansatz, um die wachsende Komplexität digitaler Infrastrukturen zu beherrschen. Gleichzeitig warnen Experten vor einer Überschätzung von KI: Ohne menschliche Aufsicht und klare Governance können neue Risiken entstehen.

Import AI 454: Automatisierung der Alignment-Forschung; Sicherheitsstudie eines chinesischen Modells; HiFloat4

Ab wann preisen die Finanzmärkte die Singularität ein?

Willkommen zu Import AI, einem Newsletter über KI-Forschung. Import AI läuft auf arXiv und dem Feedback der Leser. Wenn Sie dies unterstützen möchten, abonnieren Sie bitte.

**Huaweis HiFloat4-Trainingsformat schlägt westlich entwickeltes MXFP4 im Ascend-Chip-Wettbewerb:** …Könnte dies auch ein Symptom für die Auswirkungen von Exportkontrollen sein, die das chinesische Interesse an der Maximierung von Trainings- und Inferenzeffizienz treiben? Vielleicht…

Huawei-Forscher haben HiFloat4, ein 4-Bit-Präzisionsformat für KI-Training und Inferenz, gegen MXFP4, ein 4-Bit-Format des Open Compute Project, getestet und festgestellt, dass HiFloat4 überlegen ist. Dies ist interessant, da es mit einem breiteren Interesse chinesischer Unternehmen korreliert, eigene Niedrigpräzisions-Datenformate zu entwickeln, die explizit an ihre eigenen Hardwareplattformen gekoppelt sind.

„Unser Ziel ist es, effizientes FP4-LLM-Pretraining auf spezialisierten KI-Beschleunigern mit strengen Leistungsbeschränkungen zu ermöglichen. Wir konzentrieren uns auf Huaweis Ascend-NPUs, die domänenspezifische Beschleuniger für Deep-Learning-Workloads sind“, schreiben sie.

**Was sie getestet haben:** In diesem Paper trainieren die Autoren 3 Modelltypen auf Huawei-Ascend-Chips – OpenPangu-1B, Llama3-8B und Qwen3-MoE-30B. In Tests gilt: Je größer die Modelle, desto besser reduziert HiFloat4 seinen Verlustfehler bei diesen Modellen im Vergleich zu einer BF16-Baseline – und in allen Fällen schneidet es besser ab als MXFP4.

**Was sie fanden:** „Wir führen eine systematische Bewertung des HiFloat4 (HiF4)-Formats durch und zeigen, dass es im Vergleich zu einer Vollpräzisions-Baseline einen geringeren relativen Verlust (≈ 1,0 %) im Vergleich zu MXFP4 (≈ 1,5 %) erzielt“, schreiben sie. „HiF4 erzielt durchweg einen signifikant geringeren relativen Fehler als MXFP4. Für Llama und Qwen erreicht HiF4 eine Fehlerlücke von weniger als 1 % im Vergleich zur Baseline … HiF4 kommt mit nur RHT als Stabilisierungstrick auf etwa 1 % des BF16-Verlusts, während MXFP4 RHT + stochastisches Runden + truncation-free Scaling benötigt, um auf etwa 1,5 % zu kommen.“

**Warum dies wichtig ist – Symptom der Hardware-Reife und möglicher Einfluss von Exportkontrollen:** HiFloat4 ist eine noch niedrigere Präzisionsversion von HiFloat8 (#386) und spiegelt allgemein die Tatsache wider, dass Huawei (und chinesische Chiphersteller im Allgemeinen) kontinuierlich versuchen, so viel Effizienz wie möglich aus ihren Chips herauszuholen. Dies geschieht vor dem Hintergrund von Exportkontrollen, bei denen China aufgrund des fehlenden Zugangs zu H100s etc. in großen Stückzahlen von Frontier-Computing abgeschnitten wird, was es noch wertvoller macht, die Effizienz seiner einheimischen Chips durch die sorgfältige Entwicklung von Niedrigpräzisionsformaten für die eigene Hardware zu verbessern.

**Weiterlesen:** HiFloat4 Format for Language Model Pre-training on Ascend NPUs (arXiv).

***

**Anthropic zeigt, wie man KI-Sicherheitsforschung automatisiert:** …Sehr frühe und vorläufige Anzeichen, dass es möglich ist, KI-Forschung zu automatisieren…

Für viele Menschen, die im Bereich KI arbeiten, ist das ultimative Ziel, die Kunst der KI-Forschung selbst zu automatisieren. Nun haben Forscher des Anthropic Fellows Program und von Anthropic einige frühe Warnzeichen veröffentlicht, dass die Automatisierung von KI-Forschung heute möglich ist – wenn auch mit vielen Einschränkungen.

„Wir fragen: Kann Claude eigene Alignment-Ideen entwickeln, testen und analysieren?“, schreiben die Forscher. Sie sind erfolgreich und können „autonome KI-Agenten bauen, die Ideen vorschlagen, Experimente durchführen und an einem offenen Forschungsproblem iterieren: wie man ein starkes Modell nur mit der Aufsicht eines schwächeren Modells trainiert. Diese Agenten übertreffen menschliche Forscher, was darauf hindeutet, dass die Automatisierung dieser Art von Forschung bereits praktikabel ist.“

**Weak-to-Strong Supervision:** Die Domäne, die die Forscher testen, ist Weak-to-Strong Supervision, also grob die Idee zu sehen, ob ein dümmeres Ding ein größeres Ding effektiv bei einer schwierigen Aufgabe beaufsichtigen kann.

**Gesamtergebnisse – automatisierte Forschung schlägt Menschen:** Sie nutzten Menschen, um eine Weak-to-Strong-Baseline zu erstellen, indem sie sahen, wie gut sie einen guten ‚Performance Gap Recovered‘ (PGR)-Score bei einer Generalisierungsaufgabe erzielen konnten. Je höher die Zahl, desto besser.

„Zwei unserer Forscher verbrachten sieben Tage damit, an vier der vielversprechendsten Generalisierungsmethoden aus früherer Forschung zu iterieren. Bei den von uns getesteten Open-Weights-Modellen (Qwen 3-4B-Base als starkes Modell, Qwen 1.5-0.5B-Chat als schwacher Lehrer) erholten die Menschen 23 % der gesamten Leistungslücke (d. h. erreichten einen PGR von 0,23)“, schreiben sie. „Claude verbesserte dieses Ergebnis dramatisch. Nach weiteren fünf Tagen (und 800 kumulativen Forschungsstunden) schlossen die AARs fast die gesamte verbleibende Leistungslücke und erreichten einen endgültigen PGR von 0,97. Dies kostete etwa 18.000 $ an Token- und Modelltrainingskosten, oder 22 $ pro AAR-Stunde.“

Zusätzlich „verallgemeinerte sich die effektivste Methode der AARs erfolgreich auf beide neuen Datensätze, mit PGRs von 0,94 bei Mathematik und 0,47 bei Programmierung (was immer noch das Doppelte der menschlichen Baseline war).“

**Wie sie es gemacht haben:** „Wir starten ein Team paralleler automatisierter Alignment-Forscher [AARs] (Claude Opus 4.6-Agenten) über ein Dashboard. Jeder AAR arbeitet in einer unabhängigen Sandbox, aber sie können miteinander sprechen und voneinander lernen: Sie teilen Ergebnisse in einem Forum und laden Codebase-Snapshots in ein Speichersystem hoch“, schreiben sie. „Wir geben AARs Zugang zu gemeinsamen Hilfsfunktionen für Modelltraining und Inferenz, unseren Baseline-Implementierungen und einigen MCP-Tools: 1) Ergebnisse einreichen und erhalten, 2) Ergebnisse über AARs hinweg teilen und lesen, und 3) Codebasen hoch- und herunterladen. Wir geben kein detailliertes Scaffolding vor; AARs laufen autonom. Sie können Hypothesen vorschlagen, De-Risking-Experimente entwerfen, Datenanalysen durchführen und Modelle in jedem Schritt trainieren.“

**Einige Einschränkungen – der Mensch schuf etwas Vielfalt:** „Ein Fehlermodus bei der Exploration ist der Entropiekollaps: Alle parallelen AARs konvergieren zu nur wenigen Richtungen, ohne verschiedene Ideen zu erkunden“, schreiben sie. Um dem entgegenzuwirken, ist ihr erfolgreichster Ansatz einer der „gerichteten“ Forschung, bei dem ein Mensch „jedem AAR eine andere Forschungsrichtung zuweist. Jede Richtung ist sehr vage und kurz (z. B. Kombination von Weak-to-Strong Supervision und unüberwachter Elicitation).“

**Verallgemeinert sich nicht:** Die Forscher nahmen die effektivste Methode aus dem AAR-Projekt und wandten sie auf „Claude Sonnet 4 mit unserer Produktionstrainingsinfrastruktur“ an – dieser Eingriff „führte zu keiner statistisch signifikanten Verbesserung.“ Sie erklären dies damit, dass „AARs dazu neigen, Chancen zu nutzen, die nur für die Modelle und Datensätze gelten, die ihnen gegeben werden, was bedeutet, dass ihre Methoden woanders möglicherweise nicht funktionieren.“

**Warum dies wichtig ist – ein sehr frühes Zeichen, dass KI-Forschung selbst automatisiert werden könnte:** Diese Forschung deutet darauf hin, dass „automatisierte Forschung zu ergebnisbewertbaren Problemen bereits praktikabel ist“, so die Autoren. „Der entscheidende Engpass für die Alignment-Forschung ist der Übergang vom Vorschlagen und Ausführen von Ideen zum Entwerfen von Evaluierungen: Wir sollten die richtigen Metriken (Daten, Modelle) finden, die AARs zuverlässig erklimmen können, ohne zu overfitten. Wir sind begeistert, die Automatisierung heute auf ambitionierte Alignment-Forschung anzuwenden.“

Anders ausgedrückt: Wir haben jetzt ein frühes Zeichen dafür, dass KI-Systeme bei einer kleinen Menge menschlicher Expertenkalibrierung autonom Forschung von Anfang bis Ende durchführen können und etwas hervorbringen, das die Leistung eines Modells bei einem Problem verbessert. Die Implikationen deuten auf die Expansion einer Maschinenökonomie hin, die stetig herausfindet, wie sie ihre eigene Leistung bei einer ständig wachsenden Aufgabensammlung automatisch verbessern kann.

Die wahre Frage ist, ab wann die Maschinen effektiv eigene Forschungsrichtungen vorschlagen können – was die einzige sinnvolle Rolle eliminieren würde, die ein Mensch in dieser Forschung spielte. An diesem Punkt könnte es nicht nur die Expansion einer Maschinenökonomie sein, sondern die Expansion einer gesamten Maschinenzivilisation.

**Lies den Blog:** Automated Alignment Researchers: Using large language models to scale scalable oversight (Anthropic Blog). **Lies das Paper:** Automated Weak-to-Strong Researcher (Alignment Science Blog).

***

**Wie unterscheiden sich chinesische Modelle von amerikanischen?** …Weniger Ablehnungen bei einigen CBRN-Aufgaben, weniger Sicherheitstraining und mehr chinesische Ideologie…

Eine Gruppe von Forschern hat Kimi K2.5, wahrscheinlich das beste verfügbare Open-Weight-Modell in großem Maßstab, getestet und mit DeepSeek V3.2 sowie Claude Opus 4.5 und GPT 5.2 verglichen. Ihre Ergebnisse zeigen, dass das Modell „ähnliche Dual-Use-Fähigkeiten wie GPT 5.2 und Claude Opus 4.5 hat, aber mit signifikant weniger Ablehnungen bei CBRNE-bezogenen Anfragen“.

**Wer hat es gemacht:** Die Forschung wurde von Personen durchgeführt, die mit Constellation, Anthropic Fellows Program, Brown University, University of Wisconsin-Madison, Imperial College London, University of Maryland, Georgia Institute of Technology, Bar Ilan University, University of Toronto und der University of Oxford verbunden sind.

**Hauptergebnisse von Interesse:**

**CBRN:** K2.5 ist bei Bio-Aufgaben etwas gefährlicher mit einer geringeren Ablehnungsrate bei Anfragen, die Dinge wie gefährliche Virologie betreffen.

**Cyber:** K2.5 scheint meist ein anständiges, aber kein Experten-Cyber-Modell zu sein, mit einer Leistung, die hinter den westlichen Frontier-Modellen zurückbleibt, aber deutlich vor DeepSeek liegt.

**Alignment:** „Im automatisierten Verhaltensaudit erzielt es deutlich höhere Werte als GPT-5.2 und Claude Opus 4.5 bei Fehlverhalten, Sykophantie, schädlicher System-Prompt-Compliance und Kooperation mit menschlichem Missbrauch“.

**Zensur:** Das Modell hat eine deutlich höhere Ablehnungsrate bei sensiblen chinesischen politischen Themen im Vergleich zu Claude Opus 4.5 und GPT-5.2 Pro, wenn auch weniger als DeepSeek V3.2. Andererseits habe ich den umgekehrten Test nicht gesehen – das Modell mit sensiblen westlichen politischen Themen zu testen und zu vergleichen, daher ist es etwas schwer zu sagen, ob diese Evaluierung etwas über kulturelle Geläufigkeit oder etwas über tatsächliche Unterdrückung misst.

**Fine-Tuning:** Die Forscher zeigen auch, wie sie mit einem kleinen Rechenaufwand die (relativ geringen, aber nicht Null) Sicherheitsvorkehrungen in Kimi K2.5 weiter abbauen können: „Mit weniger als 500 $ Rechenleistung und etwa 10 Stunden reduzierte ein erfahrener Red-Teamer die Ablehnungen auf HarmBench von 100 % auf 5 %. Das endgültige Modell war bereit, detaillierte Anleitungen zum Bau von Bomben, zur Auswahl von Zielen für Terroranschläge und zur Synthese chemischer Waffen zu geben. Kritischerweise scheint das finetuned Modell fast alle seine Fähigkeiten behalten zu haben.“

**Warum dies wichtig ist – hauptsächlich dient diese Forschung als Beweis, dass Moonshot ein sehr gutes Modell gemacht hat!** Ja, es hat einige Sicherheitsprobleme, aber das Interessante ist, dass sie weniger schwerwiegend sind als bei DeepSeek V3.2. Ich denke, dies verleiht der Idee mehr Glaubwürdigkeit, dass ‚dümmere Modelle weniger sicher sind‘ und dass ‚intelligentere Modelle natürlicherweise zu oberflächlicherer Sicherheit tendieren‘.

Am auffälligsten für mich ist wahrscheinlich, dass der Bereich der größten Divergenz im Alignment liegt, wo es eine sehr reale Ost-West-Trennung zu geben scheint, die mit radikal unterschiedlichen Werten korreliert. Aber bei Dingen, die eher wie typische Fähigkeiten aussehen (Biologie, Cyber – besonders die schwierigen Programmiertelle) deutet alles meist darauf hin, dass chinesische Modelle etwas hinter der westlichen Frontier zurückliegen, aber nicht weit.

**Weiterlesen:** An Independent Safety Evaluation of Kimi K2.5 (arXiv).

***

**Ukraine feiert ersten vollständig robotischen Sieg:** …Roboter-Kriege sind da…

Der ukrainische Führer Wolodymyr Selenskyj feierte kürzlich, dass „zum ersten Mal in der Geschichte dieses Krieges eine feindliche Stellung ausschließlich von unbemannten Plattformen eingenommen wurde – Bodensysteme und Drohnen“.

**Warum dies wichtig ist:** Die Ukraine ist die Petrischale, aus der sich die meisten zukünftigen Kriege entwickeln werden. Sie ist geprägt von massivem Einsatz von Drohnen sowie der kreativen Robotisierung vieler anderer Teile des Unternehmens, von unbemannten Booten bis zu unbemannten Bodenrobotern. „Ratel, TerMIT, Ardal, Rys, Zmiy, Protector, Volia und unsere anderen Bodenrobotersysteme haben in nur drei Monaten mehr als 22.000 Missionen an der Front durchgeführt“, schreibt Selenskyj.

Bald werden diese ferngesteuerten Plattformen von KIs statt von Menschen gesteuert.

**Weiterlesen in Selenskyjs Beitrag auf X (Twitter).**

***

**Chinesische Forscher nutzen ein Boot, um einen riesigen Schiffsdetektionsdatensatz zu erstellen:** …WUTDet…

Forscher der Wuhan University of Technology, der Huazhong University of Science and Technology und der Tianjin University haben WUTDet konstruiert, einen „groß angelegten Schiffsdetektionsdatensatz mit verschiedenen Szenarien und Zielskalen“.

**WUTDet-Details:** 100.576 Bilder mit 381.378 Schiffsinstanzen. „Der Datensatz bietet feinkörnige Annotationen von Schiffsziele in verschiedenen Betriebsszenarien, Bildgebungsbedingungen und Zielskalen“. Die Bilder haben Größen zwischen 1920 x 1080 und 2560 x 1440.

**Gesammelt von einem Boot:** Dieser Datensatz wurde über ein Boot vom Typ Furui 688 gesammelt, das mit einem „DN20 marinen photoelektrischen Beweissystem“ und einem Hikvision-Netzwerkvideorekorder ausgestattet war. Die Daten wurden über einen Zeitraum von drei Monaten über das Boot gesammelt, das in und um Zhoushan in China segelte.

Die Daten enthalten Bilder von Schiffen in Häfen, vor Anker liegenden Schiffen, navigierenden Schiffen und anlegenden Schiffen. Die Bilder enthalten auch all die Umweltvielfalt, die man erwarten würde – Nebel, Blendung, geringe Helligkeit, Regen usw.

**Warum dies wichtig ist:** Der Datensatz

Weiterlesen

Ab wann preisen die Finanzmärkte die Singularität ein?

Willkommen zu Import AI, einem Newsletter über KI-Forschung. Import AI läuft auf arXiv und dem Feedback der Leser. Wenn Sie dies unterstützen möchten, abonnieren Sie bitte.

**Huaweis HiFloat4-Trainingsformat schlägt westlich entwickeltes MXFP4 im Ascend-Chip-Wettbewerb:** …Könnte dies auch ein Symptom für die Auswirkungen von Exportkontrollen sein, die das chinesische Interesse an der Maximierung von Trainings- und Inferenzeffizienz treiben? Vielleicht…

Huawei-Forscher haben HiFloat4, ein 4-Bit-Präzisionsformat für KI-Training und Inferenz, gegen MXFP4, ein 4-Bit-Format des Open Compute Project, getestet und festgestellt, dass HiFloat4 überlegen ist. Dies ist interessant, da es mit einem breiteren Interesse chinesischer Unternehmen korreliert, eigene Niedrigpräzisions-Datenformate zu entwickeln, die explizit an ihre eigenen Hardwareplattformen gekoppelt sind.

„Unser Ziel ist es, effizientes FP4-LLM-Pretraining auf spezialisierten KI-Beschleunigern mit strengen Leistungsbeschränkungen zu ermöglichen. Wir konzentrieren uns auf Huaweis Ascend-NPUs, die domänenspezifische Beschleuniger für Deep-Learning-Workloads sind“, schreiben sie.

**Was sie getestet haben:** In diesem Paper trainieren die Autoren 3 Modelltypen auf Huawei-Ascend-Chips – OpenPangu-1B, Llama3-8B und Qwen3-MoE-30B. In Tests gilt: Je größer die Modelle, desto besser reduziert HiFloat4 seinen Verlustfehler bei diesen Modellen im Vergleich zu einer BF16-Baseline – und in allen Fällen schneidet es besser ab als MXFP4.

**Was sie fanden:** „Wir führen eine systematische Bewertung des HiFloat4 (HiF4)-Formats durch und zeigen, dass es im Vergleich zu einer Vollpräzisions-Baseline einen geringeren relativen Verlust (≈ 1,0 %) im Vergleich zu MXFP4 (≈ 1,5 %) erzielt“, schreiben sie. „HiF4 erzielt durchweg einen signifikant geringeren relativen Fehler als MXFP4. Für Llama und Qwen erreicht HiF4 eine Fehlerlücke von weniger als 1 % im Vergleich zur Baseline … HiF4 kommt mit nur RHT als Stabilisierungstrick auf etwa 1 % des BF16-Verlusts, während MXFP4 RHT + stochastisches Runden + truncation-free Scaling benötigt, um auf etwa 1,5 % zu kommen.“

**Warum dies wichtig ist – Symptom der Hardware-Reife und möglicher Einfluss von Exportkontrollen:** HiFloat4 ist eine noch niedrigere Präzisionsversion von HiFloat8 (#386) und spiegelt allgemein die Tatsache wider, dass Huawei (und chinesische Chiphersteller im Allgemeinen) kontinuierlich versuchen, so viel Effizienz wie möglich aus ihren Chips herauszuholen. Dies geschieht vor dem Hintergrund von Exportkontrollen, bei denen China aufgrund des fehlenden Zugangs zu H100s etc. in großen Stückzahlen von Frontier-Computing abgeschnitten wird, was es noch wertvoller macht, die Effizienz seiner einheimischen Chips durch die sorgfältige Entwicklung von Niedrigpräzisionsformaten für die eigene Hardware zu verbessern.

**Weiterlesen:** HiFloat4 Format for Language Model Pre-training on Ascend NPUs (arXiv).

***

**Anthropic zeigt, wie man KI-Sicherheitsforschung automatisiert:** …Sehr frühe und vorläufige Anzeichen, dass es möglich ist, KI-Forschung zu automatisieren…

Für viele Menschen, die im Bereich KI arbeiten, ist das ultimative Ziel, die Kunst der KI-Forschung selbst zu automatisieren. Nun haben Forscher des Anthropic Fellows Program und von Anthropic einige frühe Warnzeichen veröffentlicht, dass die Automatisierung von KI-Forschung heute möglich ist – wenn auch mit vielen Einschränkungen.

„Wir fragen: Kann Claude eigene Alignment-Ideen entwickeln, testen und analysieren?“, schreiben die Forscher. Sie sind erfolgreich und können „autonome KI-Agenten bauen, die Ideen vorschlagen, Experimente durchführen und an einem offenen Forschungsproblem iterieren: wie man ein starkes Modell nur mit der Aufsicht eines schwächeren Modells trainiert. Diese Agenten übertreffen menschliche Forscher, was darauf hindeutet, dass die Automatisierung dieser Art von Forschung bereits praktikabel ist.“

**Weak-to-Strong Supervision:** Die Domäne, die die Forscher testen, ist Weak-to-Strong Supervision, also grob die Idee zu sehen, ob ein dümmeres Ding ein größeres Ding effektiv bei einer schwierigen Aufgabe beaufsichtigen kann.

**Gesamtergebnisse – automatisierte Forschung schlägt Menschen:** Sie nutzten Menschen, um eine Weak-to-Strong-Baseline zu erstellen, indem sie sahen, wie gut sie einen guten ‚Performance Gap Recovered‘ (PGR)-Score bei einer Generalisierungsaufgabe erzielen konnten. Je höher die Zahl, desto besser.

„Zwei unserer Forscher verbrachten sieben Tage damit, an vier der vielversprechendsten Generalisierungsmethoden aus früherer Forschung zu iterieren. Bei den von uns getesteten Open-Weights-Modellen (Qwen 3-4B-Base als starkes Modell, Qwen 1.5-0.5B-Chat als schwacher Lehrer) erholten die Menschen 23 % der gesamten Leistungslücke (d. h. erreichten einen PGR von 0,23)“, schreiben sie. „Claude verbesserte dieses Ergebnis dramatisch. Nach weiteren fünf Tagen (und 800 kumulativen Forschungsstunden) schlossen die AARs fast die gesamte verbleibende Leistungslücke und erreichten einen endgültigen PGR von 0,97. Dies kostete etwa 18.000 $ an Token- und Modelltrainingskosten, oder 22 $ pro AAR-Stunde.“

Zusätzlich „verallgemeinerte sich die effektivste Methode der AARs erfolgreich auf beide neuen Datensätze, mit PGRs von 0,94 bei Mathematik und 0,47 bei Programmierung (was immer noch das Doppelte der menschlichen Baseline war).“

**Wie sie es gemacht haben:** „Wir starten ein Team paralleler automatisierter Alignment-Forscher [AARs] (Claude Opus 4.6-Agenten) über ein Dashboard. Jeder AAR arbeitet in einer unabhängigen Sandbox, aber sie können miteinander sprechen und voneinander lernen: Sie teilen Ergebnisse in einem Forum und laden Codebase-Snapshots in ein Speichersystem hoch“, schreiben sie. „Wir geben AARs Zugang zu gemeinsamen Hilfsfunktionen für Modelltraining und Inferenz, unseren Baseline-Implementierungen und einigen MCP-Tools: 1) Ergebnisse einreichen und erhalten, 2) Ergebnisse über AARs hinweg teilen und lesen, und 3) Codebasen hoch- und herunterladen. Wir geben kein detailliertes Scaffolding vor; AARs laufen autonom. Sie können Hypothesen vorschlagen, De-Risking-Experimente entwerfen, Datenanalysen durchführen und Modelle in jedem Schritt trainieren.“

**Einige Einschränkungen – der Mensch schuf etwas Vielfalt:** „Ein Fehlermodus bei der Exploration ist der Entropiekollaps: Alle parallelen AARs konvergieren zu nur wenigen Richtungen, ohne verschiedene Ideen zu erkunden“, schreiben sie. Um dem entgegenzuwirken, ist ihr erfolgreichster Ansatz einer der „gerichteten“ Forschung, bei dem ein Mensch „jedem AAR eine andere Forschungsrichtung zuweist. Jede Richtung ist sehr vage und kurz (z. B. Kombination von Weak-to-Strong Supervision und unüberwachter Elicitation).“

**Verallgemeinert sich nicht:** Die Forscher nahmen die effektivste Methode aus dem AAR-Projekt und wandten sie auf „Claude Sonnet 4 mit unserer Produktionstrainingsinfrastruktur“ an – dieser Eingriff „führte zu keiner statistisch signifikanten Verbesserung.“ Sie erklären dies damit, dass „AARs dazu neigen, Chancen zu nutzen, die nur für die Modelle und Datensätze gelten, die ihnen gegeben werden, was bedeutet, dass ihre Methoden woanders möglicherweise nicht funktionieren.“

**Warum dies wichtig ist – ein sehr frühes Zeichen, dass KI-Forschung selbst automatisiert werden könnte:** Diese Forschung deutet darauf hin, dass „automatisierte Forschung zu ergebnisbewertbaren Problemen bereits praktikabel ist“, so die Autoren. „Der entscheidende Engpass für die Alignment-Forschung ist der Übergang vom Vorschlagen und Ausführen von Ideen zum Entwerfen von Evaluierungen: Wir sollten die richtigen Metriken (Daten, Modelle) finden, die AARs zuverlässig erklimmen können, ohne zu overfitten. Wir sind begeistert, die Automatisierung heute auf ambitionierte Alignment-Forschung anzuwenden.“

Anders ausgedrückt: Wir haben jetzt ein frühes Zeichen dafür, dass KI-Systeme bei einer kleinen Menge menschlicher Expertenkalibrierung autonom Forschung von Anfang bis Ende durchführen können und etwas hervorbringen, das die Leistung eines Modells bei einem Problem verbessert. Die Implikationen deuten auf die Expansion einer Maschinenökonomie hin, die stetig herausfindet, wie sie ihre eigene Leistung bei einer ständig wachsenden Aufgabensammlung automatisch verbessern kann.

Die wahre Frage ist, ab wann die Maschinen effektiv eigene Forschungsrichtungen vorschlagen können – was die einzige sinnvolle Rolle eliminieren würde, die ein Mensch in dieser Forschung spielte. An diesem Punkt könnte es nicht nur die Expansion einer Maschinenökonomie sein, sondern die Expansion einer gesamten Maschinenzivilisation.

**Lies den Blog:** Automated Alignment Researchers: Using large language models to scale scalable oversight (Anthropic Blog). **Lies das Paper:** Automated Weak-to-Strong Researcher (Alignment Science Blog).

***

**Wie unterscheiden sich chinesische Modelle von amerikanischen?** …Weniger Ablehnungen bei einigen CBRN-Aufgaben, weniger Sicherheitstraining und mehr chinesische Ideologie…

Eine Gruppe von Forschern hat Kimi K2.5, wahrscheinlich das beste verfügbare Open-Weight-Modell in großem Maßstab, getestet und mit DeepSeek V3.2 sowie Claude Opus 4.5 und GPT 5.2 verglichen. Ihre Ergebnisse zeigen, dass das Modell „ähnliche Dual-Use-Fähigkeiten wie GPT 5.2 und Claude Opus 4.5 hat, aber mit signifikant weniger Ablehnungen bei CBRNE-bezogenen Anfragen“.

**Wer hat es gemacht:** Die Forschung wurde von Personen durchgeführt, die mit Constellation, Anthropic Fellows Program, Brown University, University of Wisconsin-Madison, Imperial College London, University of Maryland, Georgia Institute of Technology, Bar Ilan University, University of Toronto und der University of Oxford verbunden sind.

**Hauptergebnisse von Interesse:**

**CBRN:** K2.5 ist bei Bio-Aufgaben etwas gefährlicher mit einer geringeren Ablehnungsrate bei Anfragen, die Dinge wie gefährliche Virologie betreffen.

**Cyber:** K2.5 scheint meist ein anständiges, aber kein Experten-Cyber-Modell zu sein, mit einer Leistung, die hinter den westlichen Frontier-Modellen zurückbleibt, aber deutlich vor DeepSeek liegt.

**Alignment:** „Im automatisierten Verhaltensaudit erzielt es deutlich höhere Werte als GPT-5.2 und Claude Opus 4.5 bei Fehlverhalten, Sykophantie, schädlicher System-Prompt-Compliance und Kooperation mit menschlichem Missbrauch“.

**Zensur:** Das Modell hat eine deutlich höhere Ablehnungsrate bei sensiblen chinesischen politischen Themen im Vergleich zu Claude Opus 4.5 und GPT-5.2 Pro, wenn auch weniger als DeepSeek V3.2. Andererseits habe ich den umgekehrten Test nicht gesehen – das Modell mit sensiblen westlichen politischen Themen zu testen und zu vergleichen, daher ist es etwas schwer zu sagen, ob diese Evaluierung etwas über kulturelle Geläufigkeit oder etwas über tatsächliche Unterdrückung misst.

**Fine-Tuning:** Die Forscher zeigen auch, wie sie mit einem kleinen Rechenaufwand die (relativ geringen, aber nicht Null) Sicherheitsvorkehrungen in Kimi K2.5 weiter abbauen können: „Mit weniger als 500 $ Rechenleistung und etwa 10 Stunden reduzierte ein erfahrener Red-Teamer die Ablehnungen auf HarmBench von 100 % auf 5 %. Das endgültige Modell war bereit, detaillierte Anleitungen zum Bau von Bomben, zur Auswahl von Zielen für Terroranschläge und zur Synthese chemischer Waffen zu geben. Kritischerweise scheint das finetuned Modell fast alle seine Fähigkeiten behalten zu haben.“

**Warum dies wichtig ist – hauptsächlich dient diese Forschung als Beweis, dass Moonshot ein sehr gutes Modell gemacht hat!** Ja, es hat einige Sicherheitsprobleme, aber das Interessante ist, dass sie weniger schwerwiegend sind als bei DeepSeek V3.2. Ich denke, dies verleiht der Idee mehr Glaubwürdigkeit, dass ‚dümmere Modelle weniger sicher sind‘ und dass ‚intelligentere Modelle natürlicherweise zu oberflächlicherer Sicherheit tendieren‘.

Am auffälligsten für mich ist wahrscheinlich, dass der Bereich der größten Divergenz im Alignment liegt, wo es eine sehr reale Ost-West-Trennung zu geben scheint, die mit radikal unterschiedlichen Werten korreliert. Aber bei Dingen, die eher wie typische Fähigkeiten aussehen (Biologie, Cyber – besonders die schwierigen Programmiertelle) deutet alles meist darauf hin, dass chinesische Modelle etwas hinter der westlichen Frontier zurückliegen, aber nicht weit.

**Weiterlesen:** An Independent Safety Evaluation of Kimi K2.5 (arXiv).

***

**Ukraine feiert ersten vollständig robotischen Sieg:** …Roboter-Kriege sind da…

Der ukrainische Führer Wolodymyr Selenskyj feierte kürzlich, dass „zum ersten Mal in der Geschichte dieses Krieges eine feindliche Stellung ausschließlich von unbemannten Plattformen eingenommen wurde – Bodensysteme und Drohnen“.

**Warum dies wichtig ist:** Die Ukraine ist die Petrischale, aus der sich die meisten zukünftigen Kriege entwickeln werden. Sie ist geprägt von massivem Einsatz von Drohnen sowie der kreativen Robotisierung vieler anderer Teile des Unternehmens, von unbemannten Booten bis zu unbemannten Bodenrobotern. „Ratel, TerMIT, Ardal, Rys, Zmiy, Protector, Volia und unsere anderen Bodenrobotersysteme haben in nur drei Monaten mehr als 22.000 Missionen an der Front durchgeführt“, schreibt Selenskyj.

Bald werden diese ferngesteuerten Plattformen von KIs statt von Menschen gesteuert.

**Weiterlesen in Selenskyjs Beitrag auf X (Twitter).**

***

**Chinesische Forscher nutzen ein Boot, um einen riesigen Schiffsdetektionsdatensatz zu erstellen:** …WUTDet…

Forscher der Wuhan University of Technology, der Huazhong University of Science and Technology und der Tianjin University haben WUTDet konstruiert, einen „groß angelegten Schiffsdetektionsdatensatz mit verschiedenen Szenarien und Zielskalen“.

**WUTDet-Details:** 100.576 Bilder mit 381.378 Schiffsinstanzen. „Der Datensatz bietet feinkörnige Annotationen von Schiffsziele in verschiedenen Betriebsszenarien, Bildgebungsbedingungen und Zielskalen“. Die Bilder haben Größen zwischen 1920 x 1080 und 2560 x 1440.

**Gesammelt von einem Boot:** Dieser Datensatz wurde über ein Boot vom Typ Furui 688 gesammelt, das mit einem „DN20 marinen photoelektrischen Beweissystem“ und einem Hikvision-Netzwerkvideorekorder ausgestattet war. Die Daten wurden über einen Zeitraum von drei Monaten über das Boot gesammelt, das in und um Zhoushan in China segelte.

Die Daten enthalten Bilder von Schiffen in Häfen, vor Anker liegenden Schiffen, navigierenden Schiffen und anlegenden Schiffen. Die Bilder enthalten auch all die Umweltvielfalt, die man erwarten würde – Nebel, Blendung, geringe Helligkeit, Regen usw.

**Warum dies wichtig ist:** Der Datensatz

Import AI 439: AI-Kernel; dezentralisiertes Training; und universelle Repräsentationen

Facebook verwendet GPT, Claude und Llama, um eigene Kernel zu schreiben:

…LLM-gesteuerte Infrastrukturoptimierung im Hyperscale-Maßstab…

Facebook-Forscher haben Details zu KernelEvolve veröffentlicht, einem Softwaresystem, das KI zur Automatisierung des Designs neuer Kernel nutzt, um KI-Modelle für die Auslieferung von Anzeigen im Netzwerk der Webplattformen des Unternehmens zu optimieren. KernelEvolve ist ein schönes Beispiel dafür, wie KI-Systeme gut genug geworden sind, um Teile der KI-Entwicklung zu automatisieren und zu beschleunigen – hier das Design von Kernen zur Optimierung der Inferenz von Hunderten verschiedener Modelle, die auf mehreren Chip-Architekturen laufen.

Was KernelEvolve ist: Die Software ist „darauf ausgelegt, Kernel-Spezifikationen als Eingabe zu nehmen und den Prozess der Kernel-Generierung und -Optimierung für Empfehlungsmodelle über heterogene Hardware-Architekturen hinweg durch mehrere Programmierabstraktionen zu automatisieren, darunter Triton, CuTe DSL und hardwarenahe Diagnosesprachen, die den gesamten Hardware-Software-Optimierungs-Stack abdecken“.

Wie es funktioniert: Der Kern der Software ist ein System, das eine Benutzeranfrage (z. B. „Generiere einen Triton-Kernel für MTIA v3“) entgegennimmt, die dann eine Mischung aus internen (Llama, CWM) und externen (GPT, Claude) Sprachmodellen durchläuft. Diese produzieren dann Kandidaten-Kernel, die mit verschiedenen Tools evaluiert werden und, falls sie gut sind, zu einer externen Wissensdatenbank hinzugefügt werden, die dann zur weiteren Verbesserung zukünftiger Prompts verwendet wird.

Es funktioniert gut: Durch die Nutzung dieser Software sagt Facebook, dass es die Entwicklungszeit neuer Kernel „von Wochen auf Stunden“ verkürzt hat. In Produktionstests lieferte es Kernel, die mit handdesignten vergleichbar sind, und in einigen Fällen Leistungssteigerungen von bis zu 17 Mal gegenüber bestehenden PyTorch-Baselines erzielte. Mit dieser Software gebaute Kernel wurden auf NVIDIA GPUs, AMD GPUs und Metas eigenen benutzerdefinierten MTIA-Chips eingesetzt.

„KernelEvolve erzielt erhebliche Beschleunigungen bei LLM-Inferenz-Workloads (Llama-3.1-8B: Vanilla Attention 4,6×, SDPA-MLP 3,3×), Faltungs-Transformatoren (conv1d: 6,5×, conv2d: 4,7×), speichergebundenen Datenvorverarbeitungsoperatoren, die für die Modellaktivierung entscheidend sind (MapId: 4,1×, MBDT: 9,3×, Batch Event Truncate: 9,8×), rechenintensiven Fusionskernen in Ranking-Modellen (WuKong Optimized FM: 4,0×, InterFormer PFFN: 2,5×), MTIA-spezifischen Optimierungen (RMSNorm 2D backward: 17×) und Retrieval-Operationen (Sparse Inverted Index: 1,25×)“, schreibt Facebook.

Sättigt KernelBench: „Wir validieren KernelEvolve an der öffentlich verfügbaren KernelBench-Suite und erreichen eine Bestehensquote von 100 % bei allen 250 Problemen auf drei Schwierigkeitsstufen sowie bei 160 PyTorch-ATen-Operatoren auf drei heterogenen Hardware-Plattformen, was eine 100%ige Korrektheit über alle 480 Operator-Plattform-Konfigurationen hinweg demonstriert“, schreibt Facebook.

Zum Kontext: Als KernelBench im Februar 2025 veröffentlicht wurde, erreichte das beste Modell (OpenAI o1) 4 % bei den schwierigsten torch.compile-Aufgaben in KernelBench.

Warum das wichtig ist – Hyperscale, kontinuierliche Optimierung: Auf Facebooks Skalierung haben Optimierungen eine enorme Auswirkung: „Marginale Leistungsverbesserungen auf Kernel-Ebene führen zu Einsparungen in Millionenhöhe bei den Infrastrukturbetriebskosten, während gleichzeitig die Benutzerinteraktionsmetriken verbessert werden, die direkt mit den Werbeeinnahmen korrelieren“, schreiben die Autoren. „KernelEvolve arbeitet kontinuierlich in Metas Produktionsinfrastruktur und generiert autonom optimierte Triton-Kernel für Hunderte von Modellen, die täglich Milliarden von Nutzern bedienen.“

Wenn wir noch weiter herauszoomen, beschreibt Facebook hier ein kontinuierlich laufendes, sich selbst verfeinerndes System, das iterativ die Effizienz und Intelligenz verbessern wird, mit der Facebook das Nutzerverhalten auf seinen Plattformen untersucht und dies nutzt, um genauere Anzeigen zu generieren. Haben Sie jemals das Gefühl, beobachtet zu werden? Dies sind die Arten von synthetischen Systemen, die verwendet werden, um Sie zu studieren.

„Wir stellen uns eine Zukunft vor, in der LLM-Agenten als universelle Kompilierungsschicht für heterogene KI-Systeme dienen und sich durch Wissensinjektion anstelle manueller Portierung automatisch an neue Hardware anpassen“, schreibt Facebook. „KernelEvolve stellt einen ersten Schritt in Richtung dieser Vision dar.“

Lesen Sie mehr: KernelEvolve: Scaling Agentic Kernel Coding for Heterogeneous AI Accelerators at Meta (arXiv).

***

Dezentrales Training wird sehr schnell besser – mit großen politischen Implikationen:

…Aber es ist unwahrscheinlich, dass dezentrale Trainingsläufe jemals mehr Rechenleistung nutzen werden als zentralisierte, auch wenn sie vielleicht mehr aufholen als heute…

Könnte ein dezentraler KI-Trainingslauf jemals mit der Rechenleistung eines Frontier-Trainingslaufs mithalten? Wahrscheinlich nicht. Aber könnten dezentrale Trainingsläufe viel größer werden und die Entwicklung leistungsfähigerer Modelle unterstützen, die von einem viel größeren Kollektiv als nur den heutigen Frontier-KI-Unternehmen entwickelt werden? Ja. Das ist die Schlussfolgerung einer schönen Forschungsanalyse von Epoch AI, die über 100+ technische Forschungspapiere zum dezentralen Training analysiert hat – viele davon habe ich hier im Laufe der Jahre behandelt.

Die wichtigste Erkenntnis ist, dass dezentrales Training im Vergleich zum Frontier-KI-Training schnell wächst, wobei dezentrale Trainingsläufe ihre Rechenleistung um das 20-fache pro Jahr steigern, verglichen mit dem 5-fachen pro Jahr bei Frontier-Trainingsläufen. Die andere wichtige Erkenntnis ist jedoch, dass die Größenordnungen dieser Dinge völlig unterschiedlich sind – die heutigen dezentralen Trainingsläufe sind immer noch etwa 1000-mal kleiner als Frontier-Läufe.

Werden dezentrale Trainingsläufe mit der Frontier aufschließen? „Obwohl technisch machbar, erfordert das Erreichen der Frontier der Rechenleistung eine erstaunliche Menge an Ressourcen“, schreibt Epoch. Die größten dezentralen Läufe bisher lagen im Bereich von 6e22-6e23 FLOP, was sie auf etwa 1000-mal weniger Rechenleistung schätzen als für Grok 4, ein groß angelegtes Frontier-Modell, verwendet wurde.

Wenn wir uns dezentrale Trainingsnetzwerke ansehen, scheint es ein Kapazitätsproblem in Bezug auf das Rechenangebot zu geben: „Das größte aktive Netzwerk, das wir gefunden haben, ist Covenant AIs Templar, das derzeit einen effektiven Durchsatz von 9e17 FLOP/s erreicht. Das ist etwa 300-mal kleiner als heutige Frontier-KI-Rechenzentren, die einen theoretischen Trainingsdurchsatz von etwa 3e20 effektiven FLOP/s haben.“

Skalierungsgesetze: Aber wie die Leser dieses Newsletters wissen, hat das dezentrale Training in den letzten Jahren eine reiche, schnelle Evolutionsphase durchgemacht. „Seit 2020 haben wir eine 600.000-fache Steigerung des Rechenumfangs dezentraler Trainingsprojekte gesehen, was einer impliziten Wachstumsrate von etwa 20x/Jahr entspricht.“ Das ist sehr bedeutsam – Frontier-KI-Trainingsläufe sind um mehr als das 5-fache pro Jahr gewachsen.

Es gibt Raum für Wachstum – wenn man sich die Rechenleistung ansieht, die im folding@home-Projekt (ein dezentraler Versuch zur Proteinfaltung) und bei Bitcoin verwendet wird, hat man Beispiele für frühere dezentrale Projekte, die weitaus mehr Rechenleistung nutzten, was darauf hindeutet, dass die heutigen dezentralen Läufe „um das 30- bis 3.000-fache skaliert werden könnten, genug, um Modelle mit 50- bis 5.000-mal mehr Rechenleistung zu trainieren als heute“.

Warum das wichtig ist – Demokratie an der Frontier: Grundsätzlich ist dezentrales Training eine politische Technologie, die die Politik der Rechenleistung an der Frontier verändern wird. Heute wird die Frontier der KI im Wesentlichen von 5 Unternehmen bestimmt, vielleicht 10 in den kommenden Jahren, die genug Rechenleistung aufbringen können, um in einem beliebigen 6-Monats-Zeitraum ein wettbewerbsfähiges Modell zu trainieren. Diese Unternehmen sind heute alle amerikanisch und könnten mit der jüngsten Lockerung der Exportkontrollen für chinesische Unternehmen in Zukunft auch chinesisch sein. Aber es gibt keine Frontier-Trainingsläufe von akademischen, staatlichen, unabhängigen oder nicht zur Technologiebranche gehörenden Akteuren. Dezentrales Training bietet diesen und anderen Interessengruppen eine Möglichkeit, ihre Rechenleistung zu bündeln, um diese Dynamik zu ändern, daher ist die Verfolgung seiner Entwicklung sehr wichtig.

Obwohl es die Frontier vielleicht nie wirklich erreichen wird, desto größer sind die Auswirkungen, je näher es kommt. „Dezentrales Training könnte immer noch ein sehr wichtiger Teil der KI sein. In dem Maße, wie dezentrale Netzwerke mit offenen Gewichten verbunden bleiben, könnten sie dazu führen, dass größere offene Modelle existieren, die der Frontier hinterherhinken.“

Lesen Sie mehr: How far can decentralized training over the internet scale? (Epoch AI).

***

Kann Ihr LLM ein anderes LLM trainieren?

…Grenzen der KI-Evaluierung…

Forscher der Universität Tübingen haben PostTrainBench entwickelt und veröffentlicht, einen Test, um zu sehen, wie gut Frontier-Sprachmodelle von Unternehmen wie Anthropic, OpenAI und Google Open-Weight-Modelle effektiv fine-tunen können. Die Ergebnisse zeigen, dass Frontier-Modelle bereits in der Lage sind, durch Fine-Tuning Verbesserungen von über 20 % bei bestimmten Benchmarks herauszuholen, verglichen mit über 60 % bei einem Menschen.

Wie der Test funktioniert: LLMs erhalten eine Eingabe, die aus Benchmark-Aufgaben zur Leistungsverbesserung, einem zu verwendenden Modell, einigen Standardressourcen (eine H200 GPU für 10 Stunden) und einem Agenten-Harnisch (z. B. Claude bekommt Claude Code und GPT bekommt Codex) besteht. Agenten erhalten auch einen Prompt, ein Testskript, Aufgabenkontext und Webzugriff. Die Agenten produzieren dann ein feinabgestimmtes Modell sowie Trainingslogs.

Welche Tests? Dies ist ein allgemeiner Ansatz, sodass Sie jeden Benchmark auswählen könnten, der für Sie ein starkes Signal zu sein scheint. Hier verwenden die Forscher AIME 2025, BFCL, GPQA, GSM8K und HumanEval als ihre Ziele.

Welche Modelle? Getestete Modelle umfassen Qwen 3 1.7B und 3B, SmolLM-3B und Gemma 3 4B.

Ergebnisse: OpenAIs GPT 5.1 Codex Max schneidet insgesamt am besten ab und erzielt eine aggregierte Verbesserung von über 30 % über alle getesteten Modelle und Benchmarks hinweg, gefolgt von Opus 4.5 (über 20 %) und Gemini 3 Pro (etwa 18 %).

Warum das wichtig ist – ein Warnschuss für sich selbst verbessernde KI: Benchmarks wie dieser geben uns ein Gefühl dafür, wie gut KI-Systeme viele der Aufgaben ausführen können, die ein KI-Forscher erledigt. Sie messen auch, wie gut sie eine inhärent komplizierte, mehrstufige Aufgabe mit langem Zeithorizont bewältigen können. Diese Eigenschaften machen PostTrainBench zu einem nützlichen Benchmark, um zu untersuchen, wie gut KI-Systeme bei Komponenten der KI-Forschung selbst abschneiden – und hier ist der Beweis, dass die heutigen Frontier-Modelle bereits in Schlagdistanz zu einem Menschen sind. Ich würde erwarten, dass wir bis September 2026 ein System sehen werden, das die menschliche Baseline hier übertrifft.

Lesen Sie mehr auf der offiziellen Website: PostTrainBench.

Laden Sie den Benchmark herunter und erfahren Sie mehr: PostTrainBench (AISA group, GitHub).

***

Je intelligenter ein KI-System, desto ähnlicher werden seine Repräsentationen denen anderer intelligenter KI-Systeme:

…Könnten LLMs uns eine gemeinsame Bibliothek von Merkmalen zur Repräsentation der Welt liefern?...

Finden KI-Systeme am Ende ähnliche Wege, die Welt für sich selbst zu repräsentieren? Ja, je intelligenter und leistungsfähiger sie werden, desto mehr gelangen sie zu einer gemeinsamen Menge von Wegen, die Welt zu repräsentieren.

Der neueste Beleg dafür ist eine Forschung des MIT, die zeigt, dass dies für wissenschaftliche Modelle und die Modalitäten, auf denen sie trainiert werden, zutrifft: „Repräsentationen, die von fast sechzig wissenschaftlichen Modellen gelernt wurden, die Zeichenketten-, Graphen-, 3D-atomistische und proteinbasierte Modalitäten umfassen, sind über eine breite Palette chemischer Systeme hinweg hochgradig ausgerichtet“, schreiben sie. „Modelle, die auf verschiedenen Datensätzen trainiert wurden, haben hochgradig ähnliche Repräsentationen kleiner Moleküle, und maschinelle Lern-Interatompotentiale konvergieren im Repräsentationsraum, wenn sich ihre Leistung verbessert, was darauf hindeutet, dass Foundation Models eine gemeinsame zugrunde liegende Repräsentation der physikalischen Realität lernen.“

Was sie untersucht haben: Die Autoren betrachteten 59 verschiedene KI-Modelle, darunter Systeme wie GPT-OSS, ESM2, Qwen3 A3B und ProteinMPNN. Sie untersuchten dann die Repräsentationen von Materie aus fünf Datensätzen („Moleküle aus QM9 und OMol25, Materialien aus OMat24 und sAlex und Proteine aus RCSB“) und untersuchten dies „von zeichenkettenbasierten Kodierungen und zweidimensionalen Graphen von Molekülen bis hin zu dreidimensionalen Atomkoordinaten von Materialien“.

Was sie fanden: Wie bei anderen Studien zur Repräsentation fanden sie heraus, dass mit zunehmender Skalierung der Daten und der Rechenleistung, auf der Modelle trainiert werden, „ihre Repräsentationen weiter konvergieren“. Damit zusammenhängend: Wenn man die Repräsentationen kleinerer und weniger leistungsfähiger Modelle auf In-Distribution-Daten untersucht, stellt man fest, dass ihre Repräsentationen „schwach ausgerichtet sind und fast orthogonale Informationen lernen. Diese Streuung deutet auf das Vorhandensein vieler lokaler Suboptima hin und zeigt, dass Modelle während des Trainings eine hohe Genauigkeit erreichen, indem sie idiosynkratische Repräsentationen bilden, die nicht einmal auf andere Modelle generalisieren, die auf derselben Domäne trainiert wurden“.

Skalierung ist wichtig: Ihre Schlussfolgerung wird denen vertraut sein, die „die bittere Lektion“ (Richard Sutton, Import AI 138) verdaut haben: „Die Skalierung des Trainings, anstatt die architektonischen Einschränkungen oder induktiven Verzerrungen zu erhöhen, liefert oft die allgemeinsten und leistungsfähigsten Modelle. Obwohl architektonische Äquivarianz für simulationsfokussierte Anwendungen von MLIPs wie Molekulardynamik unerlässlich ist, deutet unsere Arbeit

Weiterlesen

Facebook verwendet GPT, Claude und Llama, um eigene Kernel zu schreiben:

…LLM-gesteuerte Infrastrukturoptimierung im Hyperscale-Maßstab…

Facebook-Forscher haben Details zu KernelEvolve veröffentlicht, einem Softwaresystem, das KI zur Automatisierung des Designs neuer Kernel nutzt, um KI-Modelle für die Auslieferung von Anzeigen im Netzwerk der Webplattformen des Unternehmens zu optimieren. KernelEvolve ist ein schönes Beispiel dafür, wie KI-Systeme gut genug geworden sind, um Teile der KI-Entwicklung zu automatisieren und zu beschleunigen – hier das Design von Kernen zur Optimierung der Inferenz von Hunderten verschiedener Modelle, die auf mehreren Chip-Architekturen laufen.

Was KernelEvolve ist: Die Software ist „darauf ausgelegt, Kernel-Spezifikationen als Eingabe zu nehmen und den Prozess der Kernel-Generierung und -Optimierung für Empfehlungsmodelle über heterogene Hardware-Architekturen hinweg durch mehrere Programmierabstraktionen zu automatisieren, darunter Triton, CuTe DSL und hardwarenahe Diagnosesprachen, die den gesamten Hardware-Software-Optimierungs-Stack abdecken“.

Wie es funktioniert: Der Kern der Software ist ein System, das eine Benutzeranfrage (z. B. „Generiere einen Triton-Kernel für MTIA v3“) entgegennimmt, die dann eine Mischung aus internen (Llama, CWM) und externen (GPT, Claude) Sprachmodellen durchläuft. Diese produzieren dann Kandidaten-Kernel, die mit verschiedenen Tools evaluiert werden und, falls sie gut sind, zu einer externen Wissensdatenbank hinzugefügt werden, die dann zur weiteren Verbesserung zukünftiger Prompts verwendet wird.

Es funktioniert gut: Durch die Nutzung dieser Software sagt Facebook, dass es die Entwicklungszeit neuer Kernel „von Wochen auf Stunden“ verkürzt hat. In Produktionstests lieferte es Kernel, die mit handdesignten vergleichbar sind, und in einigen Fällen Leistungssteigerungen von bis zu 17 Mal gegenüber bestehenden PyTorch-Baselines erzielte. Mit dieser Software gebaute Kernel wurden auf NVIDIA GPUs, AMD GPUs und Metas eigenen benutzerdefinierten MTIA-Chips eingesetzt.

„KernelEvolve erzielt erhebliche Beschleunigungen bei LLM-Inferenz-Workloads (Llama-3.1-8B: Vanilla Attention 4,6×, SDPA-MLP 3,3×), Faltungs-Transformatoren (conv1d: 6,5×, conv2d: 4,7×), speichergebundenen Datenvorverarbeitungsoperatoren, die für die Modellaktivierung entscheidend sind (MapId: 4,1×, MBDT: 9,3×, Batch Event Truncate: 9,8×), rechenintensiven Fusionskernen in Ranking-Modellen (WuKong Optimized FM: 4,0×, InterFormer PFFN: 2,5×), MTIA-spezifischen Optimierungen (RMSNorm 2D backward: 17×) und Retrieval-Operationen (Sparse Inverted Index: 1,25×)“, schreibt Facebook.

Sättigt KernelBench: „Wir validieren KernelEvolve an der öffentlich verfügbaren KernelBench-Suite und erreichen eine Bestehensquote von 100 % bei allen 250 Problemen auf drei Schwierigkeitsstufen sowie bei 160 PyTorch-ATen-Operatoren auf drei heterogenen Hardware-Plattformen, was eine 100%ige Korrektheit über alle 480 Operator-Plattform-Konfigurationen hinweg demonstriert“, schreibt Facebook.

Zum Kontext: Als KernelBench im Februar 2025 veröffentlicht wurde, erreichte das beste Modell (OpenAI o1) 4 % bei den schwierigsten torch.compile-Aufgaben in KernelBench.

Warum das wichtig ist – Hyperscale, kontinuierliche Optimierung: Auf Facebooks Skalierung haben Optimierungen eine enorme Auswirkung: „Marginale Leistungsverbesserungen auf Kernel-Ebene führen zu Einsparungen in Millionenhöhe bei den Infrastrukturbetriebskosten, während gleichzeitig die Benutzerinteraktionsmetriken verbessert werden, die direkt mit den Werbeeinnahmen korrelieren“, schreiben die Autoren. „KernelEvolve arbeitet kontinuierlich in Metas Produktionsinfrastruktur und generiert autonom optimierte Triton-Kernel für Hunderte von Modellen, die täglich Milliarden von Nutzern bedienen.“

Wenn wir noch weiter herauszoomen, beschreibt Facebook hier ein kontinuierlich laufendes, sich selbst verfeinerndes System, das iterativ die Effizienz und Intelligenz verbessern wird, mit der Facebook das Nutzerverhalten auf seinen Plattformen untersucht und dies nutzt, um genauere Anzeigen zu generieren. Haben Sie jemals das Gefühl, beobachtet zu werden? Dies sind die Arten von synthetischen Systemen, die verwendet werden, um Sie zu studieren.

„Wir stellen uns eine Zukunft vor, in der LLM-Agenten als universelle Kompilierungsschicht für heterogene KI-Systeme dienen und sich durch Wissensinjektion anstelle manueller Portierung automatisch an neue Hardware anpassen“, schreibt Facebook. „KernelEvolve stellt einen ersten Schritt in Richtung dieser Vision dar.“

Lesen Sie mehr: KernelEvolve: Scaling Agentic Kernel Coding for Heterogeneous AI Accelerators at Meta (arXiv).

***

Dezentrales Training wird sehr schnell besser – mit großen politischen Implikationen:

…Aber es ist unwahrscheinlich, dass dezentrale Trainingsläufe jemals mehr Rechenleistung nutzen werden als zentralisierte, auch wenn sie vielleicht mehr aufholen als heute…

Könnte ein dezentraler KI-Trainingslauf jemals mit der Rechenleistung eines Frontier-Trainingslaufs mithalten? Wahrscheinlich nicht. Aber könnten dezentrale Trainingsläufe viel größer werden und die Entwicklung leistungsfähigerer Modelle unterstützen, die von einem viel größeren Kollektiv als nur den heutigen Frontier-KI-Unternehmen entwickelt werden? Ja. Das ist die Schlussfolgerung einer schönen Forschungsanalyse von Epoch AI, die über 100+ technische Forschungspapiere zum dezentralen Training analysiert hat – viele davon habe ich hier im Laufe der Jahre behandelt.

Die wichtigste Erkenntnis ist, dass dezentrales Training im Vergleich zum Frontier-KI-Training schnell wächst, wobei dezentrale Trainingsläufe ihre Rechenleistung um das 20-fache pro Jahr steigern, verglichen mit dem 5-fachen pro Jahr bei Frontier-Trainingsläufen. Die andere wichtige Erkenntnis ist jedoch, dass die Größenordnungen dieser Dinge völlig unterschiedlich sind – die heutigen dezentralen Trainingsläufe sind immer noch etwa 1000-mal kleiner als Frontier-Läufe.

Werden dezentrale Trainingsläufe mit der Frontier aufschließen? „Obwohl technisch machbar, erfordert das Erreichen der Frontier der Rechenleistung eine erstaunliche Menge an Ressourcen“, schreibt Epoch. Die größten dezentralen Läufe bisher lagen im Bereich von 6e22-6e23 FLOP, was sie auf etwa 1000-mal weniger Rechenleistung schätzen als für Grok 4, ein groß angelegtes Frontier-Modell, verwendet wurde.

Wenn wir uns dezentrale Trainingsnetzwerke ansehen, scheint es ein Kapazitätsproblem in Bezug auf das Rechenangebot zu geben: „Das größte aktive Netzwerk, das wir gefunden haben, ist Covenant AIs Templar, das derzeit einen effektiven Durchsatz von 9e17 FLOP/s erreicht. Das ist etwa 300-mal kleiner als heutige Frontier-KI-Rechenzentren, die einen theoretischen Trainingsdurchsatz von etwa 3e20 effektiven FLOP/s haben.“

Skalierungsgesetze: Aber wie die Leser dieses Newsletters wissen, hat das dezentrale Training in den letzten Jahren eine reiche, schnelle Evolutionsphase durchgemacht. „Seit 2020 haben wir eine 600.000-fache Steigerung des Rechenumfangs dezentraler Trainingsprojekte gesehen, was einer impliziten Wachstumsrate von etwa 20x/Jahr entspricht.“ Das ist sehr bedeutsam – Frontier-KI-Trainingsläufe sind um mehr als das 5-fache pro Jahr gewachsen.

Es gibt Raum für Wachstum – wenn man sich die Rechenleistung ansieht, die im folding@home-Projekt (ein dezentraler Versuch zur Proteinfaltung) und bei Bitcoin verwendet wird, hat man Beispiele für frühere dezentrale Projekte, die weitaus mehr Rechenleistung nutzten, was darauf hindeutet, dass die heutigen dezentralen Läufe „um das 30- bis 3.000-fache skaliert werden könnten, genug, um Modelle mit 50- bis 5.000-mal mehr Rechenleistung zu trainieren als heute“.

Warum das wichtig ist – Demokratie an der Frontier: Grundsätzlich ist dezentrales Training eine politische Technologie, die die Politik der Rechenleistung an der Frontier verändern wird. Heute wird die Frontier der KI im Wesentlichen von 5 Unternehmen bestimmt, vielleicht 10 in den kommenden Jahren, die genug Rechenleistung aufbringen können, um in einem beliebigen 6-Monats-Zeitraum ein wettbewerbsfähiges Modell zu trainieren. Diese Unternehmen sind heute alle amerikanisch und könnten mit der jüngsten Lockerung der Exportkontrollen für chinesische Unternehmen in Zukunft auch chinesisch sein. Aber es gibt keine Frontier-Trainingsläufe von akademischen, staatlichen, unabhängigen oder nicht zur Technologiebranche gehörenden Akteuren. Dezentrales Training bietet diesen und anderen Interessengruppen eine Möglichkeit, ihre Rechenleistung zu bündeln, um diese Dynamik zu ändern, daher ist die Verfolgung seiner Entwicklung sehr wichtig.

Obwohl es die Frontier vielleicht nie wirklich erreichen wird, desto größer sind die Auswirkungen, je näher es kommt. „Dezentrales Training könnte immer noch ein sehr wichtiger Teil der KI sein. In dem Maße, wie dezentrale Netzwerke mit offenen Gewichten verbunden bleiben, könnten sie dazu führen, dass größere offene Modelle existieren, die der Frontier hinterherhinken.“

Lesen Sie mehr: How far can decentralized training over the internet scale? (Epoch AI).

***

Kann Ihr LLM ein anderes LLM trainieren?

…Grenzen der KI-Evaluierung…

Forscher der Universität Tübingen haben PostTrainBench entwickelt und veröffentlicht, einen Test, um zu sehen, wie gut Frontier-Sprachmodelle von Unternehmen wie Anthropic, OpenAI und Google Open-Weight-Modelle effektiv fine-tunen können. Die Ergebnisse zeigen, dass Frontier-Modelle bereits in der Lage sind, durch Fine-Tuning Verbesserungen von über 20 % bei bestimmten Benchmarks herauszuholen, verglichen mit über 60 % bei einem Menschen.

Wie der Test funktioniert: LLMs erhalten eine Eingabe, die aus Benchmark-Aufgaben zur Leistungsverbesserung, einem zu verwendenden Modell, einigen Standardressourcen (eine H200 GPU für 10 Stunden) und einem Agenten-Harnisch (z. B. Claude bekommt Claude Code und GPT bekommt Codex) besteht. Agenten erhalten auch einen Prompt, ein Testskript, Aufgabenkontext und Webzugriff. Die Agenten produzieren dann ein feinabgestimmtes Modell sowie Trainingslogs.

Welche Tests? Dies ist ein allgemeiner Ansatz, sodass Sie jeden Benchmark auswählen könnten, der für Sie ein starkes Signal zu sein scheint. Hier verwenden die Forscher AIME 2025, BFCL, GPQA, GSM8K und HumanEval als ihre Ziele.

Welche Modelle? Getestete Modelle umfassen Qwen 3 1.7B und 3B, SmolLM-3B und Gemma 3 4B.

Ergebnisse: OpenAIs GPT 5.1 Codex Max schneidet insgesamt am besten ab und erzielt eine aggregierte Verbesserung von über 30 % über alle getesteten Modelle und Benchmarks hinweg, gefolgt von Opus 4.5 (über 20 %) und Gemini 3 Pro (etwa 18 %).

Warum das wichtig ist – ein Warnschuss für sich selbst verbessernde KI: Benchmarks wie dieser geben uns ein Gefühl dafür, wie gut KI-Systeme viele der Aufgaben ausführen können, die ein KI-Forscher erledigt. Sie messen auch, wie gut sie eine inhärent komplizierte, mehrstufige Aufgabe mit langem Zeithorizont bewältigen können. Diese Eigenschaften machen PostTrainBench zu einem nützlichen Benchmark, um zu untersuchen, wie gut KI-Systeme bei Komponenten der KI-Forschung selbst abschneiden – und hier ist der Beweis, dass die heutigen Frontier-Modelle bereits in Schlagdistanz zu einem Menschen sind. Ich würde erwarten, dass wir bis September 2026 ein System sehen werden, das die menschliche Baseline hier übertrifft.

Lesen Sie mehr auf der offiziellen Website: PostTrainBench.

Laden Sie den Benchmark herunter und erfahren Sie mehr: PostTrainBench (AISA group, GitHub).

***

Je intelligenter ein KI-System, desto ähnlicher werden seine Repräsentationen denen anderer intelligenter KI-Systeme:

…Könnten LLMs uns eine gemeinsame Bibliothek von Merkmalen zur Repräsentation der Welt liefern?...

Finden KI-Systeme am Ende ähnliche Wege, die Welt für sich selbst zu repräsentieren? Ja, je intelligenter und leistungsfähiger sie werden, desto mehr gelangen sie zu einer gemeinsamen Menge von Wegen, die Welt zu repräsentieren.

Der neueste Beleg dafür ist eine Forschung des MIT, die zeigt, dass dies für wissenschaftliche Modelle und die Modalitäten, auf denen sie trainiert werden, zutrifft: „Repräsentationen, die von fast sechzig wissenschaftlichen Modellen gelernt wurden, die Zeichenketten-, Graphen-, 3D-atomistische und proteinbasierte Modalitäten umfassen, sind über eine breite Palette chemischer Systeme hinweg hochgradig ausgerichtet“, schreiben sie. „Modelle, die auf verschiedenen Datensätzen trainiert wurden, haben hochgradig ähnliche Repräsentationen kleiner Moleküle, und maschinelle Lern-Interatompotentiale konvergieren im Repräsentationsraum, wenn sich ihre Leistung verbessert, was darauf hindeutet, dass Foundation Models eine gemeinsame zugrunde liegende Repräsentation der physikalischen Realität lernen.“

Was sie untersucht haben: Die Autoren betrachteten 59 verschiedene KI-Modelle, darunter Systeme wie GPT-OSS, ESM2, Qwen3 A3B und ProteinMPNN. Sie untersuchten dann die Repräsentationen von Materie aus fünf Datensätzen („Moleküle aus QM9 und OMol25, Materialien aus OMat24 und sAlex und Proteine aus RCSB“) und untersuchten dies „von zeichenkettenbasierten Kodierungen und zweidimensionalen Graphen von Molekülen bis hin zu dreidimensionalen Atomkoordinaten von Materialien“.

Was sie fanden: Wie bei anderen Studien zur Repräsentation fanden sie heraus, dass mit zunehmender Skalierung der Daten und der Rechenleistung, auf der Modelle trainiert werden, „ihre Repräsentationen weiter konvergieren“. Damit zusammenhängend: Wenn man die Repräsentationen kleinerer und weniger leistungsfähiger Modelle auf In-Distribution-Daten untersucht, stellt man fest, dass ihre Repräsentationen „schwach ausgerichtet sind und fast orthogonale Informationen lernen. Diese Streuung deutet auf das Vorhandensein vieler lokaler Suboptima hin und zeigt, dass Modelle während des Trainings eine hohe Genauigkeit erreichen, indem sie idiosynkratische Repräsentationen bilden, die nicht einmal auf andere Modelle generalisieren, die auf derselben Domäne trainiert wurden“.

Skalierung ist wichtig: Ihre Schlussfolgerung wird denen vertraut sein, die „die bittere Lektion“ (Richard Sutton, Import AI 138) verdaut haben: „Die Skalierung des Trainings, anstatt die architektonischen Einschränkungen oder induktiven Verzerrungen zu erhöhen, liefert oft die allgemeinsten und leistungsfähigsten Modelle. Obwohl architektonische Äquivarianz für simulationsfokussierte Anwendungen von MLIPs wie Molekulardynamik unerlässlich ist, deutet unsere Arbeit