Die Sprache der Daten: Universelle Wheeler-Sprachen

Stell dir vor, du könntest Daten so effizient speichern, dass sie immer schnell zugänglich sind. Forschende haben herausgefunden, wie das geht.

Hast du schon mal von Datenkompression gehört? Das ist eine Methode, um große Datenmengen so zu speichern, dass sie weniger Platz brauchen. Stell dir vor, du hast ein riesiges Buch, das du in einen kleinen Koffer packen möchtest. Genau das machen Datenkompressionsmethoden. Eine besonders interessante Methode ist die Burrows-Wheeler-Transformation, kurz BWT. Sie hilft dabei, Daten so zu ordnen, dass sie schnell gefunden und gelesen werden können.

Was die Forschenden herausgefunden haben

Forschende haben eine neue Art von Sprachen entdeckt, die sie Universelle Wheeler-Sprachen nennen. Diese Sprachen haben besondere Eigenschaften, die sie sehr nützlich machen. Zum Beispiel sind sie unabhängig von der Reihenfolge der Buchstaben, die in den Daten vorkommen. Das bedeutet, dass sie immer gleich gut funktionieren, egal wie die Daten angeordnet sind. Außerdem haben die Forschenden herausgefunden, dass diese Sprachen eng mit anderen bekannten Sprachklassen verbunden sind.

Wie haben sie das gemacht?

Um diese neuen Sprachen zu untersuchen, haben die Forschenden verschiedene mathematische Methoden verwendet. Sie haben gezeigt, dass bestimmte Sprachklassen, wie die streng lokal testbaren Sprachen, in den Universellen Wheeler-Sprachen enthalten sind. Sie haben auch herausgefunden, dass diese Sprachen nicht immer geschlossen sind, wenn man das Gegenteil der Sprache betrachtet. Das bedeutet, dass nicht immer die gesamte Sprache und ihr Gegenteil gleichzeitig in den Universellen Wheeler-Sprachen enthalten sind.

Warum ist das wichtig?

Diese Entdeckung ist wichtig, weil sie uns hilft, Daten besser zu speichern und schneller zu finden. Stell dir vor, du suchst ein bestimmtes Wort in einem riesigen Buch. Mit den Universellen Wheeler-Sprachen kannst du das Wort viel schneller finden, weil die Daten so geordnet sind, dass sie leicht zugänglich sind. Das ist besonders nützlich für große Datenbanken und Suchmaschinen, die jeden Tag Millionen von Anfragen bearbeiten müssen.

Du willst mehr über die Studie wissen?

Die Forschenden, die diese Entdeckung gemacht haben, sind Ruben Becker, Giuseppa Castiglione, Giovanna D’Agostino, Alberto Policriti, Nicola Prezza, Antonio Restivo und Brian Riccardi. Ihre Arbeit wurde im Jahr 2025 veröffentlicht.

Zum Original-Paper auf ArXiv