Stell dir vor, du könntest in riesigen Texten blitzschnell nach bestimmten Wörtern suchen. Forschende haben eine neue Methode entwickelt, die das möglich macht.
Stell dir vor, du hast einen riesigen Text, so groß wie ein ganzes Buch, und du möchtest schnell herausfinden, wo bestimmte Wörter oder Sätze vorkommen. Das ist wie die Suche nach einer Nadel im Heuhaufen. Forschende haben eine neue Art von Suchmethode entwickelt, die das viel einfacher macht. Sie nennen diese Methode „lange LEMs“. LEM steht für „lokal maximale exakte Übereinstimmungen“. Das klingt kompliziert, ist aber eigentlich ganz einfach.
Was die Forschenden herausgefunden haben
Die Forschenden haben herausgefunden, dass es in großen Texten viele kleine Übereinstimmungen gibt, die zwar nicht die längsten sind, aber trotzdem wichtig sind. Diese Übereinstimmungen nennen sie „lange LEMs“. Sie haben auch eine Methode entwickelt, um diese langen LEMs schnell zu finden. Das ist besonders nützlich, wenn man große Datenmengen durchsuchen muss, wie zum Beispiel in der Genforschung.
Wie haben sie das gemacht?
Um diese langen LEMs zu finden, haben die Forschenden eine spezielle Art von Datenstruktur verwendet, die „BWT-Runs“ genannt wird. Das klingt wie ein Tanz, ist aber eine Methode, um Texte zu komprimieren und gleichzeitig schnell durchsuchbar zu machen. Sie haben eine Algorithmus entwickelt, der in kurzer Zeit alle langen LEMs in einem Text findet. Dieser Algorithmus arbeitet so schnell, weil er die Wiederholungen im Text nutzt.
Warum ist das wichtig?
Diese Methode ist besonders wichtig, weil sie es ermöglicht, große Textmengen schnell zu durchsuchen. Das ist nützlich in vielen Bereichen, zum Beispiel in der Genforschung, wo man große Mengen an genetischen Daten durchsuchen muss. Auch in der Medizin oder bei der Analyse von großen Textdatenbanken kann diese Methode helfen, wichtige Informationen schneller zu finden.
Du willst mehr über die Studie wissen?
Die Forschenden, die diese Methode entwickelt haben, heißen Ahsan Sanaullah, Degui Zhi und Shaojie Zhang. Ihr Artikel trägt den Titel „Long LEM Query in BWT-Runs Space“ und wurde 2025 veröffentlicht.