Erdbeben multi
Wissenschaftliche Berichte Band 12, Artikelnummer: 21200 (2022) Diesen Artikel zitieren
1378 Zugriffe
2 Zitate
4 Altmetrisch
Details zu den Metriken
Erdbeben gehören zu den Naturkatastrophen, die große Auswirkungen auf die Gesellschaft haben. Derzeit gibt es viele Studien zur Erdbebenerkennung. Bei den von Sensoren erfassten Vibrationen handelte es sich jedoch nicht nur um Vibrationen, die durch das Erdbeben verursacht wurden, sondern auch um andere Vibrationen. Daher wurde in dieser Studie eine Erdbeben-Mehrfachklassifizierungserkennung mit maschinellen Lernalgorithmen vorgeschlagen, die Erdbeben und Nicht-Erdbeben sowie Vandalismusvibrationen mithilfe seismischer Beschleunigungswellen unterscheiden kann. Darüber hinaus wurden Geschwindigkeit und Verschiebung als Integrationsprodukte der Beschleunigung als zusätzliche Merkmale zur Verbesserung der Leistung von Algorithmen für maschinelles Lernen angesehen. Mehrere Algorithmen für maschinelles Lernen wie Support Vector Machine (SVM), Random Forest (RF), Decision Tree (DT) und Artificial Neural Network (ANN) wurden verwendet, um den besten Algorithmus für die Erdbeben-Mehrfachklassifizierungserkennung zu entwickeln. Die Ergebnisse dieser Studie zeigen, dass der ANN-Algorithmus der beste Algorithmus ist, um zwischen Erdbeben und Nicht-Erdbeben sowie Vandalismus-Vibrationen zu unterscheiden. Darüber hinaus ist es auch widerstandsfähiger gegenüber verschiedenen Eingabefunktionen. Darüber hinaus steigert die Verwendung von Geschwindigkeit und Verschiebung als zusätzliche Funktionen nachweislich die Leistung jedes Modells.
Indonesien liegt zwischen drei großen Zusammenflüssen tektonischer Platten, nämlich der Eurasischen Platte, der Indo-Australischen Platte und der Pazifischen Platte1. Basierend auf den Aufzeichnungen des Meteorologischen, Klimatologischen und Geophysikalischen Amtes (BMKG) gab es in den Jahren 2008–2018 etwa 5.000–6.000 Erdbeben. Und im Jahr 2019 gab es 15 zerstörerische Erdbeben2. Die Erdbebenerkennung mithilfe von Beschleunigungssensoren wurde von mehreren Forschern durchgeführt3,4,5,6. Bei den Vibrationen, die der Sensor erkennt, handelt es sich nicht nur um Vibrationen, die durch das Erdbeben verursacht werden, sondern auch um andere Vibrationen, z. B. Vibrationen, die durch auf den Boden fallengelassene schwere Gegenstände verursacht werden. B. schwere vorbeifahrende Fahrzeuge, Explosionen oder wenn jemand versucht, die Kiste zu zerbrechen. Aufgrund der Ähnlichkeit der Erdbebenwellen und dieser seismischen Geräusche werden Erdbebenfrühwarnsysteme manchmal versehentlich ausgelöst und lösen Fehlalarme aus. Daher ist es notwendig, Erdbeben und seismischen Lärm zu klassifizieren, um Erkennungsfehler zu vermeiden7,8.
Mehrere Forscher haben auch Studien zum Einsatz von maschinellem Lernen im seismischen Bereich durchgeführt. Laut Nishita Narvekar9 sind die an den Erdbebenstationen aufgezeichneten seismischen Signale oft mit Rauschen vermischt. Daher ist es notwendig, mithilfe von Filtertechniken Rauschen zu entfernen, bevor die Daten dem Algorithmus für maschinelles Lernen zugeführt werden. Darüber hinaus kann die Anwendung der Fast-Fourier-Transformation (FFT) als eine der in der Welt der Seismologie weit verbreiteten Methoden auf das seismische Signal zur Verkürzung der Rechenzeit genutzt werden10,11. Die Kombination mit maschinellen Lernalgorithmen liefert nachweislich die besten Ergebnisse. Darüber hinaus zeigt das Experiment zum Vergleich von SVM-, DT- und RF-Algorithmen zur Unterscheidung zwischen Erdbebenvibrationen und Geräuschen, dass RF-Algorithmen basierend auf dieser Untersuchung eine bessere Leistung erbringen.
Einige Forscher12 schlugen ein seismisches Erkennungssystem vor, das an der seismischen Station mithilfe von ANN und SVM implementiert werden kann und lokale Erdbeben und andere mögliche Vibrationen klassifizieren kann. Die Daten wurden von der PVAQ-Station in Portugal gesammelt. Die Daten verteilen sich auf 60 % Trainingsdaten, 20 % Testdaten und 20 % Validierungsdaten. Die Leistungen des Modells zeigen, dass ANN einen Wert von mehr als 95 % erreichen konnte, während SVM in der Lage ist, eine nahezu perfekte Klassifizierung zu erreichen.
In einer anderen Studie13 wird DT zur Lösung zweier Klassifizierungsprobleme im Zusammenhang mit Signalen verwendet. Der Zweck besteht darin, die zeitliche Signallogik (STL) zu erlernen, um ein Muster in Daten zu finden, das nicht dem erwarteten Verhalten entspricht (Anomalieerkennung). Das Ergebnis zeigt, dass DT gute Leistungen bietet und über bestimmte Anwendungsdomänen hinweg interpretiert werden kann. In einem anderen Fall14 wird DT verwendet, um den Zustand eines Windturbinenblatts durch Auswertung des Turbinenvibrationssignals zu klassifizieren. Es gibt 600 Datenproben, von denen 100 von Klingen in gutem Zustand stammten. Der für dieses Problem verwendete DT-Klassifikator hat sich bei der Diagnose dieses Problems als sehr effektiv erwiesen. Basierend auf diesen Studien zeigt sich, dass der DT-Algorithmus gut für die Signal- und Vibrationsklassifizierung geeignet ist.
Laut Saman Yaghmaei-Sabegh15 sind die Eigenschaften der Erdbeben-Bodenbewegung ungewiss. In seiner Studie wurde vorgeschlagen, Erdbeben-Bodenbewegungen mithilfe von K-Means-Clustering und Self-Organizing Map (SOM)-Netzwerk als zwei leistungsstarke unbeaufsichtigte Clustering-Techniken zu klassifizieren, indem sechs verschiedene Skalarfrequenzinhaltsindikatoren verwendet werden. In dieser Studie werden zwei synthetisierte und reale Datensätze verwendet. Das Ergebnis zeigt, dass der Parameter T0 (die geglättete spektrale vorherrschende Periode) die beste Leistung unter allen Skalarindikatoren zeigte. Darüber hinaus erzielte K-Means-Clustering eine bessere Leistung als SOM bei Mustererkennungs- und Klassifizierungsverfahren.
Unter den verschiedenen Arten von Algorithmen für maschinelles Lernen, die von mehreren Forschern verwendet wurden, wurden kürzlich in verschiedenen Studien in einem breiten Spektrum von Ingenieurbereichen unterschiedliche Modelle für maschinelles Lernen eingesetzt. Basierend auf ihren Erkenntnissen sind die zuverlässigsten Modelle Support Vector Machine (SVM), Random Forest (RF), Decision Tree (DT) und Artificial Neural Network (ANN). Daher wird in dieser Studie die Zuverlässigkeit dieser Modelle zur Erdbebenerkennung untersucht. Diese Modelle werden als Vergleich verwendet, um den besten Algorithmus für die Erkennung mehrerer Erdbebenklassifizierungen zu finden. Der verwendete Beschleunigungsdatensatz basiert auf seismischen Ereignissen in der Region Indonesien, insbesondere auf der Insel Java, die an drei verschiedenen Stationen aufgezeichnet wurden und aus der ESM-Datenbank (Engineering Strong Motion)16 stammen. Ein Beschleunigungsmesser allein kann kein Erschütterungsmuster des Bodens erkennen7. Um dieses Problem zu lösen, wurde in dieser Studie daher vorgeschlagen, Beschleunigungsdatensätze zu integrieren, um Geschwindigkeit und Verschiebung als zusätzliche Merkmale zu erhalten, um die Leistung jedes Algorithmus zu verbessern. Daher kann die Erdbebenerkennung genauer erfolgen. Die Analysemethoden, die in dieser Studie zur Analyse der Leistung maschinellen Lernens verwendet werden, sind Genauigkeit, Präzision, Rückruf und F1.
Das Gebiet dieser Studie ist Indonesien mit Schwerpunkt auf der Insel Java. Die Insel Java gilt als die viertgrößte Insel Indonesiens mit der höchsten Bevölkerungsdichte. Es ist Teil der komplexen Konvergenzzone zwischen der Eurasischen Platte und der Indo-Australischen Platte. Aus diesem Grund kam es in der Java-Region zu zahlreichen seismischen und vulkanischen Aktivitäten. Zwischen 2006 und 2020 verursachten Erdbeben und andere Geogefahren auf der von Vulkanen übersäten Insel Java etwa 7000 Todesopfer, weitere 1,8 Millionen Menschen wurden verletzt, vertrieben oder obdachlos17,18.
Daten zur Beschleunigung seismischer Wellen wurden aus der ESM-Datenbank an drei verschiedenen Stationen gesammelt, nämlich CISI, SMRI und UGM, die sich auf der Insel Java befinden, wie in Abb. 1 zu sehen ist.
© 2021 TerraMetrics, Kartendaten© 2022 Google].
Karte der Insel Java mit den Standorten der Stationen. (A). CISI, (b). SMRI, (c). UGM [Bilder
Diese Stationen zeichnen Erdbebenereignisse auf, die sich in den Jahren 2006–2009 rund um die Insel Java ereigneten. Es gibt 33 Aufzeichnungen von CISI, 8 Aufzeichnungen von SMRI und 17 Aufzeichnungen von UGM, was insgesamt 58 Erdbebenereignisse ergibt, die rund um die Insel Java aufgetreten sind und von diesen Stationen aufgezeichnet wurden. Diese Aufzeichnungen enthalten drei verschiedene Kanäle: HLE, HLN und HLZ mit Informationen zur seismischen Beschleunigungswelle für jeden Kanal, wie in Abb. 2 dargestellt. Die seismische Beschleunigungswelle wird integriert, um seismische Geschwindigkeits- und Verschiebungswellen zu erhalten, die als Merkmale verwendet werden können die Leistung der Modelle verbessern. Beschleunigungs-, Geschwindigkeits- und Wegbeziehungen können mit der mathematischen Gleichung19 beschrieben werden:
Beschleunigung:
Geschwindigkeit:
Verschiebung:
wobei \({v}_{0}\) der Anfangswert der Geschwindigkeit und \({r}_{0}\) die Anfangsposition ist, wenn \(t=t-{t}_{0} \). Das Integrationsergebnis der seismischen Beschleunigungswelle ist in Abb. 3 zu sehen.
Unverarbeiteter Datensatz für jeden Kanal für 1 Ereignis.
Integrationsergebnis.
Die Daten aus der ESM-Datenbank liegen in Form einer ASCII-Datei vor, die detaillierte Ereignisinformationen sowie die Beschleunigungsdaten der seismischen Welle für das Ereignis enthält. Alle Daten durchlaufen den FFT-Prozess, um den Frequenzbereich der seismischen Welle zu erhalten, und dann wird die Frequenz für den Filterprozess unter Verwendung eines Butterworth-Bandpassfilters mit der Ordnung Filter = 2, minimaler Frequenz = 0,1 Hz und maximaler Frequenz = verwendet 30 Hz, um die Geräusche zu reduzieren. Abbildung 4 zeigt das Ergebnis des Datenfilterungsprozesses in Abb. 2.
Verarbeiteter Datensatz für jeden Kanal für 1 Ereignis.
Nach dem Filtervorgang wird der Datenabtastvorgang durchgeführt. Bei der Datenerfassung werden die Beschleunigungsdaten der seismischen Welle in Erdbeben- und Nicht-Erdbebendaten aufgeteilt. Die Erdbebendaten und Nicht-Erdbeben-Daten enthalten jeweils 200 Daten für 1 seismisches Ereignis (entspricht 1 s, da die Abtastfrequenz = 0,005 s), wobei die Erdbebendaten-Abtastungen ab Beginn der P-Welle und des Nicht-Erdbebens erfasst werden Datenproben werden vom Beginn der Welle bis zum Eintreffen der P-Welle erfasst. Es gibt insgesamt 58 seismische Ereignisse, sodass jeder Erdbeben- und Nicht-Erdbeben-Datensatz drei Spalten (HLE, HLZ und HLZ) mit 11.600 Datenzeilen für jede Spalte hat [11600, 3]. Als Nächstes werden die drei Spalten mithilfe resultierender Formeln zu 1 [11600, 1] zusammengeführt, sodass nur die Amplitudenbeschleunigung als Merkmal verwendet wird. Das resultierende Amplitudenergebnis der gesamten seismischen Ereignisse ist in Abb. 5 sowohl für Erdbeben als auch für Nicht-Erdbeben zu sehen. Danach werden den Datensätzen Beschriftungsinformationen hinzugefügt, wobei 0 für Nicht-Erdbebendaten und 1 für Erdbebendaten steht.
Resultierendes Ergebnis.
Für die Vandalismus-Vibration wurden 2 Vandalismus-Datensätze mit einem Beschleunigungssensor aufgezeichnet. Beide Vandalismus-Datensätze werden genauso behandelt wie Erdbeben- und Nicht-Erdbeben-Datensätze. Die ersten Vandalismus-Datensätze enthalten 11.600 Daten und sind mit 2 gekennzeichnet. Sie werden durch Schütteln des Tisches erfasst, während sich der Sensor darauf befindet (erfundenes Erdbeben). Die anderen Datensätze enthalten 750 mit 3 gekennzeichnete Daten, die vom Sensor erfasst werden, wenn ein schweres Fahrzeug vorbeifährt. Es gibt 4 Datensätze mit einer Gesamtmenge von 35.550 Daten. Die statistische Analyse für jeden Datensatz ist in Tabelle 1 dargestellt. Abschließend werden Integrationsformeln auf alle Amplitudenbeschleunigungsdatensätze angewendet, um die Amplitude von Geschwindigkeit und Verschiebung zu erhalten, die als zusätzliche Merkmale verwendet werden können.
Mehrere überwachte Algorithmen für maschinelles Lernen, die in dieser Studie verwendet werden, sind Support Vector Machine (SVM), Random Forest (RF), Decision Tree (DT) und Artificial Neural Network (ANN). SVM ist ein überwachter Lernalgorithmus, der zum Finden von Mustern aus einem komplexen Datensatz verwendet werden kann. SVM ist ein sehr leistungsfähiges und vielfältiges Modell für maschinelles Lernen, das lineare, nichtlineare, Regressions-, Klassifizierungs- und Ausreißererkennung durchführen kann. Als die SVM-Theorie 1995 von Vapnik und Cortes eingeführt wurde, war die SVM für die Zweigruppenklassifizierung (binäre Klassifizierung) konzipiert. Die Idee hinter SVM wurde zuvor für den eingeschränkten Fall implementiert, bei dem die Trainingsdaten fehlerfrei getrennt werden können. In der Praxis wurde die SVM zur Muster- und Ziffernerkennung eingesetzt. Dieses Experiment zeigt, dass SVM mit anderen Klassifizierungsmethoden wie Entscheidungsbäumen und neuronalen Netzen konkurrieren kann20. Der binäre SVM-Ansatz kann jedoch für Mehrklassenszenarien erweitert werden. Dies wird erreicht, indem das Mehrklassenproblem in eine Reihe binärer Analysen zerlegt wird. Dies kann mit einer binären SVM angegangen werden, indem entweder die Eins-gegen-eins- oder die Eins-gegen-alle-Strategie21 befolgt wird.
Im SVM,
Eingabe: \({x}_{i}\in {\mathbb{R}}^{D}\), mit D = Merkmalsdimension,
Ausgabe: \(w\) (Gewichte), eine für jedes Merkmal, dessen lineare Kombination y ergibt (die endgültige Ausgabe des SVM-Modells ist eine Entscheidung aus den Eingabedaten).
mit b ist Bias.
Um den Spielraum zu maximieren, muss der Abstand der Datenpunkte zur Hyperebene minimiert werden. Wenn die Hyperebene die beiden Klassen nicht perfekt trennen kann, müssen eine Slack-Variable (\({\xi }_{i}\)) und ein Hyperparameter C hinzugefügt werden. Die Funktion des Hyperparameters besteht darin, die Verwendung von Slack-Variablen zu regulieren. Wenn C zu klein ist, kann das Modell zu wenig angepasst sein, und wenn C zu groß ist, kann es zu einer Überanpassung des Modells kommen.
Wenn die Eingabedaten nicht linear getrennt werden können, müssen die Daten einem höherdimensionalen Raum zugeordnet werden. Wenn die neue Dimension sehr groß ist, dauert die Zuordnung lange. Kernel-Tricks können dieses Problem lösen, indem sie angeblich Funktionen hinzufügen. In dieser Forschung wird die Kernel Gaußsche RBF (Radiale Basisfunktionen) verwendet.
wobei: x = Merkmalsvektor.
l = Wahrzeichen
Der DT-Algorithmus kann zur Klassifizierung und Regression verwendet werden. Dieser Algorithmus kann auch für Daten mit mehreren Ausgaben verwendet werden. Es führt eine Datenklassifizierung durch, indem es einen Baum bildet. Vom Wurzelknoten bis zum Blattknoten. An jedem Knoten gibt es Informationen zu den Merkmalen, die als Bedingungen für die Bestimmung der Richtung des Datenflusses, der Gini-Verunreinigung, der Anzahl der am Knoten ankommenden Stichproben, des Klassenvorhersagewerts und der Klasse der Daten an diesem Knoten verwendet werden .
Bei der Bestimmung der Verzweigung auf dem DT werden Informationen über die Gini-Verunreinigung der Daten benötigt. Gini-Unreinheit bewertet einen Wert im Bereich zwischen 0 und 1, wobei 0 bedeutet, dass alle Beobachtungen zu einer Klasse gehören, und 1 eine zufällige Verteilung der Elemente innerhalb der Klassen ist. Das Merkmal mit der geringsten Verunreinigung wird als nächster Zweig ausgewählt22. In diesem Fall gilt: Je geringer die Gini-Verunreinigung, desto besser ist die Aufteilung und desto geringer ist die Wahrscheinlichkeit einer Fehlklassifizierung. Gleichung 7 ist eine Gini-Verunreinigungsgleichung, wobei \({p}_{i}\) die Wahrscheinlichkeit der Klasse k am Knoten i und n die Anzahl der Klassen ist.
RF ist eine Ensemble-Lerntechnik, die aus der Aggregation einer großen Anzahl T von Entscheidungsbäumen besteht. Diese Technik verwendet die Abstimmungsmethode zur Bestimmung der Klassifizierungsergebnisse. Die Klassifizierung jedes DT wird verwendet, um die endgültige Klassifizierung zu bestimmen. RF verwendet Zeilen- und Spaltenstichproben der Daten für jeden Baum. Auf diese Weise wird jeder Baum mit unterschiedlichen Daten trainiert. Dieser Algorithmus kann die Varianz reduzieren, ohne den Bias zu erhöhen. Darüber hinaus kann die Genauigkeit dieses Modells durch die Vergrößerung des CART (ntree)-Modellensembles23 verbessert werden.
Ein künstliches neuronales Netzwerk (KNN) ist ein Informationsverarbeitungssystem, das bestimmte Leistungsmerkmale mit biologischen neuronalen Netzwerken gemeinsam hat. KNNs werden als statistische Modelle zur Vorhersage komplexer Systeme im Ingenieurwesen eingesetzt. Ihre enorm parallele Struktur mit einer hohen Anzahl einfach verbundener Verarbeitungseinheiten, die Neuronen genannt werden, ermöglicht die Nutzung des KNN für komplexe, lineare sowie nichtlineare Eingabe-Ausgabe-Zuordnungen24,25,26.
Die gebräuchlichste ANN-Trainingsmethode ist der Backpropagation-Algorithmus. Um Fehler zu reduzieren, werden dadurch die Gewichte zwischen Neuronen geändert. Dieses Modell ist sehr effektiv bei der Identifizierung von Mustern. Das System kann eine träge Konvergenz aufweisen und Gefahr laufen, ein lokales Optimum zu erreichen, kann sich aber schnell an neue Datenwerte anpassen. Eine große Herausforderung besteht darin, herauszufinden, wie viele Schichten es gibt, wie viele Neuronen sich in der verborgenen Schicht befinden und wie diese Neuronen miteinander verbunden sind. Die Leistung des künstlichen neuronalen Netzwerks hängt stark von diesen Faktoren und Fragestellungen ab. Jedes dieser Elemente könnte die Ergebnisse erheblich verändern. Für unterschiedliche Probleme werden unterschiedliche ANN-Architekturen unterschiedliche Lösungen hervorbringen27.
Alle Modelle werden zur Klassifizierung von Erdbeben-, Nicht-Erdbeben- und Vandalismusschwingungen anhand von Trainings- und Testdaten im Verhältnis 70:30 verwendet. Als nächstes wird die Leistung der Modelle bestimmt, indem die Verwirrungsmatrix als eine der gängigen Methoden zur Klassifizierung analysiert wird. Tabelle 2 zeigt die Struktur der Verwirrungsmatrix. Aus der Verwirrungsmatrix können einige Informationen abgerufen werden, z. B.28,29:
Genauigkeit:
Präzision:
Abrufen:
F1:
Diese Leistungen werden als Vergleich herangezogen, um festzustellen, ob die Hinzufügung von Geschwindigkeit und Verschiebung als zusätzliche Merkmale einen Effekt hat.
Eine Korrelationsmatrix ist eine (K x K) quadratische und symmetrische Matrix, die den Korrelationskoeffizienten zwischen den Spalten i und j des Datensatzes30 zeigt. Abbildung 6 zeigt die Korrelationsmatrix zwischen Beschleunigung, Geschwindigkeit, Verschiebung und Beschriftungen. Das auf Abb. 6 basierende beobachtbare Ergebnis zeigt, dass Beschleunigung, Geschwindigkeit und Verschiebung eine ziemlich enge Korrelation aufweisen, insbesondere zwischen Geschwindigkeit und Verschiebung, die einen Wert von 0,94 hat (1 ist eine perfekte lineare Beziehung), während Beschriftungen die geringste Korrelation mit Beschleunigung und Geschwindigkeit aufweisen und Verschiebung.
Korrelationsmatrix.
Die Datenverteilung ist eine Funktion, die alle möglichen Werte für eine Variable angibt und außerdem die relative Häufigkeit (Wahrscheinlichkeit, wie oft sie auftreten) quantifiziert. Datenverteilungen werden in der Statistik häufig verwendet. Abbildung 7 zeigt die Datenverteilung für den Datensatz. Die Verteilungsdaten für jedes Feature sehen gut aus. Es gibt nur einen kleinen Teil der Daten, die in isolierten Daten enthalten sind, die den Datensatz für die Eingabe in die Algorithmen für maschinelles Lernen bereit machen.
Datenverteilung. (A). Beschleunigung versus Geschwindigkeit, (b) Beschleunigung versus Verschiebung, (c) Geschwindigkeit versus Verschiebung.
Die Analyse der Modellleistung erfolgt durch Vergleich der Werte für Genauigkeit, Präzision, Rückruf und F1 für jeden Algorithmus. Basierend auf den experimentellen Daten in Tabelle 3 liegt die Genauigkeit im Bereich von 0,673230 – 0,965400, die Präzision im Bereich von 0,656123 – 0,974964, der Rückruf im Bereich von 0,673230 – 0,974589 und F1 im Bereich von 0,65009 – 0,97458 . Die beiden höchsten Werte der Modelle in allen Möglichkeiten der Eingabemerkmale werden von ANN dominiert, gefolgt von RF, aber ANN zeigt eine bessere Resistenz gegenüber verschiedenen Eingabemerkmalen als RF. Das Experiment zeigt, dass mit der Beschleunigung als Merkmal die Leistung aller Modelle gut aussieht, aber wenn Geschwindigkeit und Verschiebung allein als Merkmal stehen, weist jedes Modell eine geringe Leistung auf. Wenn jedoch Geschwindigkeit und Verschiebung zusammen als Merkmal verwendet werden, erhöht sich die Leistung aller Modelle erheblich. Darüber hinaus wurden in diesem Experiment alle Möglichkeiten der Eingabemerkmale genutzt. Die Kombination von Beschleunigung mit Geschwindigkeit und Beschleunigung mit Verschiebung verbessert nachweislich die Leistung von Modellen, basierend auf experimentellen Daten in Tabelle 3, wie in Abb. 8 zu sehen ist. Darüber hinaus zeigen drei von vier Modellen eine Leistungsverbesserung, wenn drei davon verwendet werden Als Feature weist nur SVM einen Leistungsabfall auf. Aus Abb. 8 ist ersichtlich, dass die beste SVM-Leistung für die Verwendung einer einzelnen Funktion erzielt wurde, wenn Beschleunigung verwendet wurde. Gefolgt von Verschiebung und Geschwindigkeit. Dies ist auf die Tatsache zurückzuführen, dass es beim Hinzufügen weiterer Feature-Daten, die weniger empfindlich auf die gewünschte Ausgabe reagieren, zu einer Redundanz in den Eingabedaten kommen kann. Infolgedessen übersetzt das Modell die zusätzlichen Informationen möglicherweise als falsche Informationen, was dazu führt, dass das tatsächliche Muster der Daten nur schwer erkannt werden kann und daher eine geringe Genauigkeit erreicht wird. Daher kann der Schluss gezogen werden, dass nur die Beschleunigung das am stärksten korrelierte und wichtige Merkmal ist. Und das kann bestätigt werden, wenn Beschleunigung als eines von zwei oder drei Merkmalen verwendet wurde. Daher kann der Schluss gezogen werden, dass das Hinzufügen von Geschwindigkeit und Verschiebung als zusätzliche Merkmale die Leistung von Modellen verbessern kann. Um ein hohes Maß an Genauigkeit zu erreichen, muss daher die Beschleunigung als Merkmal jedes Modells zur besseren Erdbebenerkennung einbezogen werden.
Genauigkeitstabelle der Modelle.
Diese Forschung konzentrierte sich auf die Mehrfachklassifizierung von Erdbeben- und Nicht-Erdbeben-Schwingungen durch die Anwendung von maschinellem Lernen. Es wurden drei verschiedene weit verbreitete Algorithmen entwickelt: Support Vector Machine (SVM), Random Forest (RF), Decision Tree (DT) und Artificial Neural Network (ANN). Diese Modelle wurden zur Erkennung mehrerer Vibrationsklassifizierungen verwendet, nämlich Erdbeben, Nicht-Erdbeben, erfundene Erdbeben und vorbeifahrende schwere Fahrzeuge. Die Ergebnisse der Modelle wurden anhand von vier verschiedenen Leistungskriterien bewertet: Genauigkeit, Präzision, Rückruf und F1-Score. Durch den Vergleich dieser Leistungskriterien von SVM, RF, DT und ANN kommt diese Studie zu dem Schluss, dass ANN andere Algorithmen für maschinelles Lernen bei 6 von 7 Möglichkeiten der Eingabemerkmale übertrifft. Darüber hinaus zeigt ANN eine bessere Resistenz gegenüber verschiedenen Eingabemerkmalen. Daher wurde ANN als der beste Algorithmus vorgeschlagen, der auf der Grundlage dieses Experiments für die Erdbebenerkennung mit mehreren Klassifizierungen verwendet werden kann. Darüber hinaus zeigen Beschleunigung, Geschwindigkeit und Verschiebung eine gute Korrelation mit dem Ergebnis, dass die Kombination von Beschleunigung, Geschwindigkeit und Verschiebung nachweislich zur Verbesserung der Modellleistung verwendet werden kann. Zusammenfassend lässt sich sagen, dass die Kombination dieser Funktionen die Genauigkeit von RF- und ANN-Modellen auf 0,974589 bzw. 0,965400 verbessert. Für die zukünftige Forschung sollten zukünftige Studien zur Erdbebenerkennung mit mehreren Klassifizierungen speziell unter Verwendung von ANN durchgeführt und in Hardware implementiert werden, um seine Fähigkeit zur Erdbebenerkennung mit mehreren Klassifizierungen in Echtzeit weiter zu beweisen. Obwohl es einen akzeptablen Genauigkeitswert zur Klassifizierung der Erdbebenerkennung gibt, bestehen weiterhin Mängel und Einschränkungen. Es besteht die Notwendigkeit, das Modell umzustrukturieren, um das bestmögliche und optimale Architekturmodell zu erreichen, damit das Modell Vibrationen genauer unterscheiden kann. Und die Zuverlässigkeit der vorgeschlagenen Modelle könnte in Zukunft durch die Verwendung weiterer verfügbarer Daten validiert werden.
Die während der aktuellen Studie generierten Datensätze sind nicht öffentlich verfügbar, was als Urheberrecht zwischen der finanzierten Agentur und der Universität gilt, aber auf begründete Anfrage beim entsprechenden Autor erhältlich ist.
InaTEWS, Indonesien Tsunami-Frühwarnsystem. http://inatews2.bmkg.go.id/new/tentang_eq.php..
CNN Indonesien, Erdbeben in Indonesien haben in den letzten 5 Jahren zugenommen, 01.12.2019. https://www.cnnindonesia.com/teknologi/20191201065329-199-453026/gempa-di-indonesia-meningkat-dalam-5-tahun-terakhir.
Priyana, Y., Laumal, F., Husni, E. Entwicklung eines Erdbebenfrühwarnsystems unter Verwendung des Beschleunigungsmessers ADXL335. 27. März 2018. https://osf.io/preprints/inarxiv/sq9xr/.
Groover, V., Sharma, A. (2015) Vorhersage von Erdbeben mit 3-Achsen-Beschleunigungssensor (ADXL335) und ARDUINO UNO. Int. J. Sci. Forschung (IJSR) ISSN. https://www.ijsr.net/archive/v6i9/ART20176803.pdf
Sinha, PK, Saraiyan, S., Ghosh, M. & Nath, V. Entwurf eines Erdbebenindikatorsystems mit ATmega328p und ADXL335 für das Katastrophenmanagement. In Lecture Notes in Electrical Engineering (Hrsg. Nath, V. & KumarMandal, J.) (Springer, Singapur, 2019). https://doi.org/10.1007/978-981-13-0776-8_53.
Kapitel Google Scholar
Wu, Y.-M. & Lin, T.-L. Ein Test eines Erdbeben-Frühwarnsystems mit einem kostengünstigen Beschleunigungsmesser in Hualien, Taiwan (Springer, Berlin, 2014). https://doi.org/10.1007/978-3-642-12233-0_13.
Buchen Sie Google Scholar
Duggal, R. et al. Gebäudestrukturanalyse basierend auf dem Internet der Dinge, netzwerkgestützte Erdbebenerkennung. Internet Things 19, 100561. https://doi.org/10.1016/j.iot.2022.100561 (2022).
Artikel Google Scholar
Li, Z., Meier, M.-A., Hauksson, E., Zhan, Z. & Andrews, J. Seismische Wellenunterscheidung durch maschinelles Lernen: Anwendung auf die Erdbebenfrühwarnung. Geophys. Res. Lette. 45(10), 4773–4779. https://doi.org/10.1029/2018GL077870 (2018).
Artikel ADS Google Scholar
Narvekar, N. Unterscheidung von Erdbeben und Lärm mithilfe des Random-Forest-Algorithmus (San Jose State University, Washington, 2018).
Buchen Sie Google Scholar
Cooley, JW, Lewis, PAW & Welch, PD Die schnelle Fourier-Transformation und ihre Anwendungen. IEEE Trans. Educ. 12(1), 27–34. https://doi.org/10.1109/TE.1969.4320436 (1969).
Artikel Google Scholar
Cochran, WT et al. Was ist die schnelle Fourier-Transformation? Proz. IEEE 55(10), 1664–1674. https://doi.org/10.1109/PROC.1967.5957 (1967).
Artikel Google Scholar
Madureira, G. und Ruano, A. (2009) Ein seismischer Detektor mit neuronalem Netzwerk. IFAC Proc. Bd. (IFAC-PapersOnline), 2 https://doi.org/10.3182/20090921-3-TR-3005.00054.
Bombara, G., Vasile, CI, Penedo, F., Yasuoka, H., Belta, C. (2016) Ein Entscheidungsbaumansatz zur Datenklassifizierung unter Verwendung zeitlicher Signallogik. https://doi.org/10.1145/2883817.2883843
Joshuva, A. & Sugumaran, V. Fehlerdiagnose an Rotorblättern von Windkraftanlagen mithilfe von Vibrationssignalen durch einen Entscheidungsbaumalgorithmus. Indian J. Sci. Technol. 9(48), 107936. https://doi.org/10.17485/ijst/2016/v9i48/107936 (2016).
Artikel Google Scholar
Yaghmaei-Sabegh, S. Ein neuartiger Ansatz zur Klassifizierung von Erdbeben-Bodenbewegungsaufzeichnungen. J. Seismol. 21(4), 885–907. https://doi.org/10.1007/s10950-017-9642-8 (2017).
Artikel ADS Google Scholar
Puglia, R. et al. Verarbeitungsdienst für starke Bewegungen: Ein Tool zum Zugriff auf und zur Analyse der Wellenformen starker Bewegungen bei Erdbeben. Stier. Earthq. Ing. 16(7), 2641–2651. https://doi.org/10.1007/s10518-017-0299-zS (2018).
Artikel Google Scholar
Pasari, S., Simanjuntak, AVH, Mehta, A., Neha, N. & Sharma, Y. Der aktuelle Stand des Erdbebenpotenzials auf der Insel Java, Indonesien. Reine Appl. Geophys. 178(8), 2789–2806. https://doi.org/10.1007/s00024-021-02781-4 (2021).
Artikel ADS Google Scholar
Marfai, MA et al. Naturgefahren in der Provinz Zentral-Java, Indonesien: Ein Überblick. Umgebung. Geol. 56(2), 335–351. https://doi.org/10.1007/s00254-007-1169-9 (2008).
Artikel ADS Google Scholar
Nave, R. (2000) Hyperphysikalisch-konstante Beschleunigungsbewegung. 2000. [Online]. Verfügbar: http://hyperphysics.phy-astr.gsu.edu/hbase/acons.html.
Cortes, C. & Vapnik, V. Support-Vektor-Netzwerke. Mach. Lernen. 20(3), 273–297. https://doi.org/10.1023/A:1022627411411 (1995).
Artikel MATH Google Scholar
Mathur, A. & Foody, GM Multiklassen- und binäre SVM-Klassifizierung: Implikationen für Schulungs- und Klassifizierungsbenutzer. IEEE Geosci. Remote Sens. Lett. 5(2), 241–245. https://doi.org/10.1109/LGRS.2008.915597 (2008).
Artikel ADS Google Scholar
Arabshahi, H. & Fazlollahtabar, H. Klassifizierung innovativer Aktivitäten mithilfe von Entscheidungsbaum und Gini-Index. Int. J. Innov. Technol. Geschäftsführer 15(3), 1850025. https://doi.org/10.1142/S0219877018500256 (2018).
Artikel Google Scholar
Marhain, S., Ahmed, AN, Murti, MA, Kumar, P. & El-Shafie, A. Untersuchung der Anwendung künstlicher Intelligenz zur Erdbebenvorhersage in Terengganu. Nat. Gefahr. 108(1), 977–999. https://doi.org/10.1007/s11069-021-04716-7 (2021).
Artikel Google Scholar
Böse, M. (2006) Earthquake early warning for istanbul using artificial neural networks. Entwicklung eines Erdbeben-Frühwarnsystems für Istanbul unter Verwendung Künstlicher Neuronaler Netze https://doi.org/10.5445/IR/1000005845
Yaghmaei-Sabegh, S. Eine neue Methode zur Einstufung und Gewichtung von Erdbeben-Bodenbewegungsvorhersagemodellen. Bodendyn. Earthq. Ing. 39, 78–87. https://doi.org/10.1016/j.soildyn.2012.03.006 (2012).
Artikel Google Scholar
Essam, Y., Kumar, P., Ahmed, AN, Murti, MA und El-Shafie, A. Untersuchung der Zuverlässigkeit verschiedener Techniken der künstlichen Intelligenz bei der Erdbebenvorhersage für Malaysia. Bodendyn. Earthq. Eng 147, 106826. https://doi.org/10.1016/j.soildyn.2021.106826 (2021).
Artikel Google Scholar
Saritas, MM & Yasar, A. Leistungsanalyse des Ann- und Naive-Bayes-Klassifizierungsalgorithmus zur Datenklassifizierung. Int. J. Intell. Syst. Appl. Ing. 7(2), 88–91 (2019).
Artikel Google Scholar
Grandini, M., Bagli, E., Visani, G. (2020) Metriken für die Klassifizierung mehrerer Klassen: Ein Überblick. arXiv https://doi.org/10.48550/arXiv.2008.05756.
Ting, KM Verwirrungsmatrix. In Encyclopedia of Machine Learning (Hrsg. Sammut, C. & Webb, GI) 209 (Springer, US, Boston MA, 2010).
Google Scholar
Ferré, J. Regressionsdiagnostik. In Comprehensive Chemometrics Vol. 3 (Hrsg. Brown, SD et al.) (Elsevier, Amsterdam, 2009).
Google Scholar
Referenzen herunterladen
Diese Studie wird finanziell durch den Zuschuss DRTPM PTUPT Nr. 019/SP2H/RT-JAMAK/LL4/2022 des indonesischen Ministeriums für Bildung, Kultur, Forschung und Technologie unterstützt.
Telkom University, Bandung, 40257, Indonesien
Muhammad Ary Murti & Rio Junior
Institut für Energieinfrastruktur (IEI) und Abteilung für Bauingenieurwesen, College of Engineering, National Energy University (UNITEN), 43000, Kajang, Selangor, Malaysia
Ali Najah Ahmed
Fakultät für Bauingenieurwesen, Universität Malaya (UM), 50603, Kuala Lumpur, Malaysia
Ahmed Elshafie
Nationales Wasser- und Energiezentrum, Universität der Vereinigten Arabischen Emirate, 15551, Al Ain, Vereinigte Arabische Emirate
Ahmed Elshafie
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
MAM: Konzeptualisierung, Validierung, Datenkuration, Schreiben – Überprüfung und Bearbeitung, Überwachung und Finanzierung; RJ: Visualisierung, formale Analyse, Schreiben – Originalentwurfsvorbereitung; ANA: Visualisierung, formale Analyse, Schreiben – Überprüfung und Bearbeitung und AE: Schreiben – Vorbereitung des Originalentwurfs und Schreiben – Überprüfung und Bearbeitung.
Korrespondenz mit Ali Najah Ahmed.
Die Autoren geben an, dass keine Interessenkonflikte bestehen.
Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.
Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.
Nachdrucke und Genehmigungen
Murti, MA, Junior, R., Ahmed, AN et al. Erdbeben-Mehrfachklassifizierungserkennung basierend auf Geschwindigkeits- und Verschiebungsdatenfilterung mithilfe von Algorithmen für maschinelles Lernen. Sci Rep 12, 21200 (2022). https://doi.org/10.1038/s41598-022-25098-1
Zitat herunterladen
Eingegangen: 14. September 2022
Angenommen: 24. November 2022
Veröffentlicht: 08. Dezember 2022
DOI: https://doi.org/10.1038/s41598-022-25098-1
Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:
Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.
Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt
Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.