banner
Heim / Nachricht / Maschinelles Lernen spielt eine Hauptrolle bei der Erforschung des Universums
Nachricht

Maschinelles Lernen spielt eine Hauptrolle bei der Erforschung des Universums

Sep 06, 2023Sep 06, 2023

Astronomen der Penn State University – und Mitarbeiter des Institute for Computational and Data Sciences – nutzen maschinelle Lernalgorithmen, um den Datenschatz des James Webb-Weltraumteleskops zu untersuchen. Sie sagen, dass diese Informationen bereits unser Verständnis des Universums verändern. Bildnachweis: NASA und das Space Telescope Science Institute. Alle Rechte vorbehalten.

16. März 2023

Von Matt Swayne

UNIVERSITY PARK – Die komplexen, wunderschönen Bilder des Universums, die vom James Webb Space Telescope (JWST) gestreamt werden, sind mehr als nur hübsche Pixel, die ihren Weg auf Computer- oder Smartphone-Bildschirme finden. Diese Bilder stellen Daten dar – viele, viele Daten; Tatsächlich liefert das JWSTtäglich ca. 235 Gigabyte wissenschaftliche Daten– ungefähr die gleiche Datenmenge wie bei einer 10-tägigen Binge-Watching-Sitzung für HD-Filme.

JWST und andere Teleskope und Sensoren haben den heutigen Astronomen einen ständig wachsenden Datenstrom geliefert. Diese Quellen geben Astronomen die beispiellose Möglichkeit, tiefer in den Weltraum und weiter in die Zeit zurückzublicken als je zuvor – um neue Entdeckungen zu machen, einschließlich der Untersuchung, wie Sterne sterben. Aktuelle Penn State-Arbeiten unter Verwendung von Daten von JWST möglicherweisedie Art und Weise verändern, wie Wissenschaftler den Ursprung von Galaxien verstehen.

Die Verwaltung all dieser Daten ist jedoch nicht unproblematisch. Astronomen müssen sich auf Supercomputer und fortschrittliche Algorithmen verlassen, die als maschinelles Lernen bezeichnet werden, um aus dieser Datenflut genaue Modelle der Weiten des Weltraums zu erstellen, Entdeckungen zu enthüllen und neue Fragen anzuregen sowie atemberaubende Bilder des Universums zu erstellen.

Joel LejaUndV. Ashley Villar, beide Assistenzprofessoren für Astronomie und Astrophysik und Mitangestellte des ICDS, gehören zu den Wissenschaftlern, die Penn State als führend bei der Nutzung maschineller Lerntechniken zur besseren Bewältigung riesiger Datenströme etabliert haben.

Laut Leja ermöglichen maschinelle Lernansätze Forschern, Zahlen effizienter und genauer zu berechnen als frühere Methoden. In einigen Fällen, etwa bei der Interpretation von Galaxienbildern, könnten diese Techniken des maschinellen Lernens fast eine Million Mal schneller sein als herkömmliche Analysen, fügte er hinzu.

Vor dem Aufkommen des maschinellen Lernens umfasste die Verarbeitung von Daten die Verwendung analytischer Gleichungen und das Zusammenstellen großer Datenmengen in Tabellen. Forscher – oft Doktoranden – würden viel Zeit damit verbringen, Daten zu sammeln und zu analysieren. Ohne maschinelles Lernen waren Berechnungen oft repetitiv und zeitaufwändig, und es gab keine effiziente Möglichkeit, den Prozess zu beschleunigen.

Leja sagte, es sei so, als würde man eine äußerst komplizierte Reise planen.

„Nehmen wir an, Sie versuchen, den besten Weg von Los Angeles nach San Francisco zu finden“, sagte Leja. „Mit den alten Techniken würden wir eine Liste von Straßen erstellen, jede einzelne Route ausprobieren, die gesamte Entfernung für jede kleine Straße berechnen – die kleinen Straßen, die großen Autobahnen, Kreisverkehre – und wir müssten dabei jede Route kartieren Eines nach dem anderen. Das ist keine sehr gute Methode. Normalerweise erhalten Sie damit die richtige Antwort, aber maschinelles Lernen versucht, dies auf eine viel intelligentere Art und Weise mithilfe von Daten zu tun – es könnte beispielsweise stattdessen Millionen früherer Reiserouten verwenden und Fragen Sie einfach schnell, wer am schnellsten ist.

Maschinelles Lernen reduziert nicht nur den menschlichen Arbeitsaufwand, die Ansätze können auch den Rechenaufwand reduzieren, was wiederum Energie spart, so Villar.

„Das Problem der menschlichen Arbeit ist wichtig, aber wir müssen auch das Problem der Computerarbeit berücksichtigen“, sagte Villar. „Es verbraucht so viele Stunden Rechenzeit, was auch bedeutet, dass es viel Energie verbraucht.“

Das James-Webb-Weltraumteleskop macht mehr als nur schöne Bilder – es sammelt Daten, die uns helfen könnten, das Universum besser zu verstehen. Maschinelles Lernen hilft Astronomen bei der Untersuchung dieser Daten. Bildnachweis: NASA und das Space Telescope Science Institute (STScI). Alle Rechte vorbehalten.

Feldwechsler

Diese Recheneinsparungen sind oft schwer zu verstehen, aber sie schaffen ein neues Paradigma in der astronomischen Entdeckung, so die Astronomen.

„Maschinelles Lernen verändert mein Fachgebiet völlig“, sagte Leja. „Es verarbeitet enorme Datenmengen und führt komplexe Modelle sehr schnell aus, was gut für astronomische Daten geeignet ist, die unsere Systeme derzeit überschwemmen.“

Das alte Verfahren sei auch rechnerisch unnachgiebig gewesen, erklärte Leja seine Erfahrungen als Postdoc in Harvard.

„Es war ein besonderer Zugang erforderlich – und ich musste viel Zeit damit verbringen, mich für diese Simulationen zu bewerben und sie dann durchzuführen“, sagte Leja. „Und ich konnte es nur einmal durchführen, was für die Wissenschaft sehr beängstigend sein kann. Idealerweise möchte man Berechnungen viele Male durchführen, um Dinge zu testen, neue Fragen auszuprobieren und sicherzustellen, dass man es richtig macht.“

Jetzt können Astronomen Techniken des maschinellen Lernens nutzen – wie Emulatoren neuronaler Netze, die auf einem Computer das Verhalten eines neuronalen Netzwerks simulieren, eine vom menschlichen Gehirn inspirierte Methode, um Computern beizubringen, Daten zu verarbeiten –, um in wenigen Wochen auf einem Laptop zu erreichen, was Noch vor wenigen Jahren hat es enorm viel Zeit und enorme Rechenressourcen gekostet.

Da Computer immer schneller und leistungsfähiger werden und sich die Ansätze des maschinellen Lernens verbessern, gehen die Forscher davon aus, dass Astronomen in Zukunft eine Woche auf einem Laptop als etwas langsam betrachten könnten.

„In meinem Bereich hat es eine Geschwindigkeitssteigerung um etwa das Millionenfache gegeben“, sagte Leja. „Es haut mich jedes Mal um, wenn ich darüber nachdenke, und es lässt uns neue wissenschaftliche Fragen stellen.“

Wie ICDS bei der Rechenleistung hilft

ICDS unterstützt die Astronomen, indem es seine Rechenleistung in die Verarbeitung riesiger Datenmengen einbringt, die von immer leistungsfähigeren Sensoren gesammelt werden. Das Institut bereitet sich darauf vor, Wissenschaftlern zu helfen, sobald diese noch größeren Datenquellen online gehen.

Laut Leja wird die Legacy Survey in Space or Time – oder LSST – eine Umfrage der nächsten Generation über einen Zeitraum von 10 Jahren jede Nacht etwa 15 Terabyte an Daten produzieren. Beispielsweise könnte eine Disc mit einem Terabyte Speicherplatz etwa 200.000 Songs enthalten. Das LSST lädt vielleicht nicht 3 Millionen Songs pro Nacht herunter, aber die Daten, die es letztendlich liefert, werden Musik in den Ohren der Astrophysiker sein.

„Wenn wir versuchen würden, Standardtechniken zu verwenden, um diese Bilder von Galaxien zu interpretieren und den vollständigen Datensatz zu nutzen, würde es auf dem (ICDS) Roar-Cluster etwa 380 Jahre oder 100 Milliarden CPU-Stunden dauern“, sagte Leja. „Aber mit den maschinellen Lerntechniken, die wir entwickelt haben – dies wurde direkt von ICDS unterstützt – können wir es, wenn wir Roar vollständig haben, in etwa dreieinhalb Stunden schaffen.“

Villar sagte, sie sei bestrebt, diese Kraft zu nutzen, um Licht auf Sternexplosionen zu werfen, einem ihrer Forschungsgebiete.

„Viele dieser LSST-Daten werden online verfügbar sein und etwa 5 Milliarden Galaxien umfassen“, sagte Villar. „Eine Sache, die mich interessiert, ist, diese Daten zu nutzen, um Sterne zu untersuchen, wenn sie explodieren. Eine Sache, die wirklich hilfreich wäre, wäre, wenn wir sehr, sehr schnell eine Vorstellung von der Geschichte dieser Galaxie bekommen könnten, um zu verstehen, In gewissem Sinne ist es die Geschichte des Sterns, der explodierte. Und das ist mit herkömmlichen Methoden rechnerisch einfach nicht durchführbar. Aber mit diesen neuen Methoden sollte es buchstäblich Sekunden dauern, bis alles erledigt ist.“

Sowohl Leja als auch Villar sind sich einig, dass ICDS-Ressourcen – wie der Zugang zum Roar-Supercomputer und das Fachwissen der Mitarbeiter – für die Durchführung dieser Art von Forschung wichtig sind.

„Die ICDS-Ressourcen sind für die Beantwortung dieser Fragen absolut unerlässlich“, sagte Leja. „Einer der Gründe, warum ich denke, dass Penn State ein ausgezeichneter Ort für diese Forschung ist, sind die großartigen Rechenressourcen und das Team von Roar. Wir nutzen den Cluster, um das gesamte Training unserer Modelle durchzuführen. Dort testen wir unsere Modelle im Kampf.“ Bereiten Sie sie auf die reale Welt vor. Hier generieren wir auch alle unsere Scheindaten, die wir kennenlernen, oder trainieren unsere Algorithmen darauf. Roar ist ein wesentlicher Teil des Arbeitsablaufs für mein Team.“

Villar und Leja wurden kürzlich mit einem ausgezeichnetICDS-Seed-Stipendium zur Erforschung des Einsatzes von maschinellem Lernen in der Astronomie.

Matt Swayne

Erhalten Sie die Neuigkeiten per E-Mail

Ungefähr 235 Gigabyte an wissenschaftlichen Daten verändern täglich die Art und Weise, wie Wissenschaftler den Ursprung von Galaxien verstehen. Joel Leja V. Ashley Villar Feldwechsler Wie ICDS mit „Computational Muscle“ hilft ICDS-Seed-Grant zur Erforschung des Einsatzes von maschinellem Lernen in der Astronomie