Eine vergleichende Studie zur Vorhersage der Verfügbarkeit von Stromleitungskommunikationsknoten mithilfe maschinellen Lernens
Scientific Reports Band 13, Artikelnummer: 12658 (2023) Diesen Artikel zitieren
1 Altmetrisch
Details zu den Metriken
Die Power Line Communication-Technologie nutzt Stromkabel zur Datenübertragung. Das Wissen, ob ein Knoten im Voraus ohne Tests funktioniert, spart Zeit und Ressourcen und führt zum vorgeschlagenen Modell. Das Modell wurde auf drei dominante Merkmale trainiert: SNR (Signal-Rausch-Verhältnis), RSSI (Received Signal Strength Indicator) und CINR (Carrier to Interference plus Noise Ratio). Der Datensatz bestand aus 1000 Messwerten, davon 90 % im Trainingssatz und 10 % im Testsatz. Darüber hinaus gehören 50 % des Datensatzes zur Klasse 1, was anzeigt, ob die Knotenwerte optimal sind. Das Modell wird mit mehrschichtiger Wahrnehmung, K-Nearest Neighbors, Support Vector Machine mit linearen und nichtlinearen Kerneln, Random Forest und adaptiven Boosting-Algorithmen (ADA) trainiert, um zwischen statistischen, vektorbasierten, Regressions-, Entscheidungs- und anderen Algorithmen zu vergleichen Vorhersagealgorithmen. ADA Boost hat die beste Genauigkeit, den besten F-Score, die beste Präzision und den besten Rückruf erreicht, nämlich 87 %, 0,86613, 0,9 bzw. 0,8646.
Power Line Communication (PLC) ist eine Kommunikationstechnologie, die vorhandene Stromkabel zur Datenübertragung nutzt. Daher ist die SPS eine attraktive und kostengünstige Methode zur Datenübertragung aller an den Netzsteckern angeschlossenen Geräte wie Sensoren und Aktoren. Daher vermeidet der Einsatz von SPS als Kommunikationstechnologie die Hinzufügung einer weiteren Infrastruktur für den Datenaustausch durch die Nutzung der Stromleitung1,2,3. Die Stromleitungskommunikation wird basierend auf der Datenrate in zwei Kategorien unterteilt; Schmalband-Stromleitungs- und Breitband-Stromleitungskommunikation4,5. Schmalband-SPS wird häufig im Smart Grid, bei Elektrizitätsunternehmen und in Heimnetzwerken für Smart-Home-Anwendungen eingesetzt. Darüber hinaus wird SPS in fahrzeuginternen und Fahrzeug-zu-Infrastruktur-Systemen sowie in Batteriemanagementsystemen der nächsten Generation6,7 eingesetzt. Andererseits wird die Breitband-Powerline-Kommunikation in der Multimedia-Kommunikation eingesetzt. Solche Anwendungen zeichnen sich häufig durch viele verbundene Knoten aus, die mit der Ausbreitung des Internets der Dinge (IoT) zunehmen.
Die gemeinsame Umgebung der SPS bringt viele Herausforderungen für den Kommunikationsprozess mit sich, beispielsweise die variablen Medieneigenschaften. Ein Problem betrifft die Impedanzanpassung sowohl am Sender (TX) als auch am Empfänger (RX) für das SPS-Frontend. Die Anpassung wirkt sich auf die Selbstinterferenz und das Signal-zu-Selbstinterferenz-plus-Rausch-Verhältnis (SSINR) aus. Typische SPS-Modems verwenden einen Tx-Pfad mit niedriger Impedanz und einen Rx-Pfad mit höherer Impedanz im analogen Front-End für einen effizienten Betrieb mit harmonischer Verzerrung5,7,8,9. Für die Impedanzanpassung des PLC10 wurden große Anstrengungen unternommen. Aufgrund der variablen Belastung gibt es jedoch immer noch Herausforderungen bei der Impedanzanpassung der Stromleitung.
Die Leistung moderner SPS-Netzwerke nimmt mit zunehmender Vernetzung der Knoten ab. Ebenso verschlechtert die Koexistenz mit benachbarten DSL-Netzen die Verbindungsqualität. Daher empfiehlt das Europäische Institut für Telekommunikationsnormen (ETSI) die Verwendung eines dynamischen Spektralanpassungsansatzes11. Breitband-PLC-Modems schätzen die DSL-zu-PLC-Kanalinterferenz und passen die spektrale Sendeleistungsdichte der PLC entsprechend an. Darüber hinaus wurden bei der SPS erhebliche Anstrengungen unternommen, um sich auf die physikalische Ebene zu konzentrieren und Probleme wie das zeitlich veränderliche Verhalten von Lasten in Stromversorgungssystemen zu lösen. Daher gibt es Dynamik und Vielfalt der Lasten, die zu einem zeitlich und frequenzveränderlichen Verhalten und einer Signaldämpfung führen, wenn die Frequenz und/oder der Abstand zunimmt. Verschiedene Impedanzanpassungstechniken wurden in 10 dargestellt. Darüber hinaus beeinträchtigen Impulsrauschen bei hoher Leistung, Impedanzfehlanpassung, die weitverbreitete Verwendung ungeschirmter Stromkabel und Kopplungsverluste die Verbindungsqualität1,4,6,11,12. Darüber hinaus beeinflussen Impulsgeräusche hoher Leistung, die durch das Anschließen und Trennen von Lasten, Geräten, Wechselstrom-/Gleichstrom-Wandlern (AC/DC) entstehen, sowie elektromagnetische Störungen aufgrund ungeschirmter Stromleitungen und Kopplungsprobleme die Leistung der Kommunikationsmedien im Laufe der Zeit dynamisch.
Die Forschung im Bereich SPS ist noch im Gange, um diese Probleme anzugehen. Communities wie PRIME und G3 entwickeln fortschrittliche Tools, Techniken, Methoden und Ansätze, wie zum Beispiel unterschiedliche Implementierungen für die MAC- und PHY-Schichten, die sich mit unterschiedlichen Herausforderungen befassen5,9,10,11. Darüber hinaus wurden diese Fragen in Feldstudien erörtert9,13. Eine andere Technik zur Behebung dieser Probleme ist die Verwendung eines anderen Kommunikationsmediums, beispielsweise RF, in Regionen, in denen die SPS instabil ist. Beispielsweise hat die Verwendung von PLC (G3-basiert) mit RF-Technologie wie 6LowPAN14 oder LoRA eine bessere Leistung erbracht13,15,16. Der Einsatz einer anderen Technologie verstößt jedoch gegen den Hauptvorteil der SPS-Nutzung: die Nutzung der vorhandenen Infrastruktur ohne zusätzliche Kosten. Darüber hinaus wurden weitere Anstrengungen unternommen, um die Kommunikationsleistung auf Basis künstlicher Intelligenz (KI) zu verbessern. Daher wird KI verwendet, um die Verbindungsqualität und die Qualität der Kommunikationsmedien zu bestimmen. KI wurde hauptsächlich für RF-basierte Technologien wie 4G/5G, optische Netzwerke und die Datenanalyse von Smart Cities eingesetzt17,18,19,20,21. Daher konzentriert sich diese Arbeit auf die Verwendung von KI zur Vorhersage der Verbindungsqualität für ein PLC-basiertes Netzwerk und die Bestimmung des optimalen Zeitfensters für die Kommunikation mit dem Knoten über das PLC-Netzwerk. Die verwendeten Daten werden von einem Feld gesammelt, das für die Zusammenarbeit mit einem PRIME-basierten SPS-Netzwerk konfiguriert ist.
Diese Arbeit verwendet den PRIME-Standard, um ein SPS-Netzwerk vor Ort aufzubauen. Die Knoten werden mit dem PL360 PLC-Transceiver von Microchip Technology implementiert. Das Netzwerk besteht aus 500 SPS-Knoten, während sich die Datenkonzentratoreinheit (DCU) am Transformatorstandort befindet. Dann lokalisierte ein SPS-Sniffer einen Knoten nach dem DCU-Punkt. Der Datensatz wurde gesammelt und besteht aus 1000 Fällen der Zeit, in der ein PLC-Knoten optimale Werte für das Signal-Rausch-Verhältnis (SNR), den Empfangssignalstärkeindikator (RSSI) und den Träger-Interferenz-plus-Rauschen (CINR) aufweist. Der Datensatz trainierte sechs Modelle, die statistische, vektorbasierte, Regressions-, Entscheidungs- und Vorhersagealgorithmen darstellen. Der trainierte statistische Algorithmus ist adaptives Boosting. Die vektorbasierten Algorithmen sind der lineare Support Vector Machine (SVM)-Kernel und der nichtlineare SVM-Kernel. Entscheidungsalgorithmen sind Zufallswälder und Entscheidungsbäume. Schließlich ist der Vorhersagealgorithmus K-Nearest Neighbors.
Im weiteren Verlauf des Beitrags wird KI in der Kommunikation in Abschn. 2, und die Algorithmen und die Datensatzdetails werden in Abschn. 2 besprochen. 3. Anschließend werden die Verhaltensweisen der trainierten Modelle in Abschnitt gezeigt. 4, mit einer Diskussion der Ergebnisse in Abschn. 5, und die Arbeit wird in Abschnitt abgeschlossen. 6.
KI ist der Bereich, der es Computern ermöglicht, intelligent zu sein und Aufgaben auszuführen, die zuvor nur Menschen erledigten. Es wurde in den vergangenen Jahren umfassend weiterentwickelt und in verschiedenen Anwendungen eingesetzt. Beispielsweise wird KI verwendet, um einige Ereignisse in der Zukunft auf der Grundlage ihrer historischen Leistung vorherzusagen, was Zeit spart22.
SPS wird in letzter Zeit häufiger eingesetzt. Es handelt sich um eine Datenübertragung über ein Power Line Network (PLN). Das Problem bei der SPS besteht darin, dass PLN nicht für diese Übertragung ausgelegt ist, sodass die SPS mit großem Rauschen konfrontiert ist23,24.
Die Arbeit in25 hat maschinelles Lernen verwendet, um das Mehrleiterrauschen in SPSen zu gruppieren, um festzustellen, ob automatisches Clustering für dieses Thema hilfreich ist oder nicht. Sie haben die MIMO NB-Lärmdatenbank verwendet. Sie haben die Datenbank vorverarbeitet, um die Feature-Bibliothek zu erstellen, eine Tabelle bestehend aus den Zeitsegmenten von 5 bis 500 \(\mu s\) und zwei Arten von Features. Die erste bestand darin, das Signal zu extrahieren, und die andere darin, die Beziehung zwischen den beiden Mehrleiter-Signalspuren zu ermitteln. Die Funktionen wurden evaluiert, um zu ermitteln, welche vorteilhaft zu berücksichtigen sind. Die Autoren haben die Hauptkomponentenanalyse (PCA) und Boxplots zur Merkmalsbewertung verwendet. PCA reduziert die Größe des Datensatzes und behält die meisten Informationen bei. Ein Boxplot zeigt die Daten in einem standardisierten Diagramm abhängig von sechs Metriken an: Median, 25. Perzentil, 75. Perzentil, Ausreißer, Minimum und Maximum. Die PCA zeigt, dass die Merkmale 5 (Skewness der Stichproben), 7 (Pearson-Korrelation der Stichproben) und 9 (Abstandskorrelation) die aussagekräftigsten Merkmale sind, und das Boxplot zeigt auch, dass die Merkmale 5 und 7 eine sichtbare Datentrennung aufweisen25,26. Beim Clustering wurden drei Methoden verwendet: hierarchisches Clustering, selbstorganisierende Karte (SOM) und Clustering mithilfe von Repräsentanten (CURE). Hierarchische Clustering-Sets für jeden Punkt eines Clusters, Berechnen der Abstände zwischen den Clustern, Kombinieren der nächsten beiden Cluster zu einem Cluster und Wiederholen des Vorgangs, bis alle Cluster zu einem Cluster zusammengefasst sind, wodurch ein Dendrogramm entsteht, das den Clusterbaum27 darstellt. Andererseits wird in CURE eine Teilmenge der Daten ausgewählt, die C-Cluster darstellen. Für jeden Cluster werden einige weit voneinander entfernte Punkte ausgewählt, dann werden sie um 20 % zum Clusterschwerpunkt verschoben, dann führt der Algorithmus alle zwei Cluster mit zwei benachbarten repräsentativen Punkten zusammen und gruppiert dann alle Datenpunkte28. Schließlich ist SOM ein Netzwerk kartierter Einheiten, wobei sich jede Einheit auf einen Cluster bezieht, sodass die Trennung der Daten umso genauer ist, je größer die Anzahl der Einheiten ist29. Die Cluster wurden gemäß den Wahrscheinlichkeitsdichtefunktionen (PDFs) gekennzeichnet, was dazu führte, dass 35 % der Daten normal waren, 23 % Middleton-Klasse-A-Daten, 27 % Alpha-STable-Daten, 13 % generalisierte Extremwerte und 2 % unbekannte Daten Klassen. Es ist erwähnenswert, dass mehr als fünf herkömmliche Rauschklassen erforderlich waren, um die Art des Rauschens darzustellen, insbesondere in einem verrauschten Netzwerk wie einer SPS-Umgebung29.
Das Rauschen wirkt sich auf den SPS-Knoten aus und beeinträchtigt die Zuverlässigkeit der Datenübertragung. Mithilfe von KI lässt sich erkennen, ob ein Knoten zu einem bestimmten Zeitpunkt funktioniert oder nicht. Dies kann dadurch erreicht werden, dass die Messwerte des Knotens in der Vergangenheit bekannt sind und das KI-Modell anhand dieser Messwerte trainiert wird, was zur Vorhersage der Zeitintervalle führt, in denen die Messwerte der PLC-Knoten nicht optimal sind. Diese Vorhersage wird dazu führen, dass frühzeitig andere Knoten für die Übertragung ausgewählt werden, anstatt jeden Knoten zu testen, um die funktionierenden Knoten zu bestimmen30.
In diesem Abschnitt werden die trainierten Algorithmen für maschinelles Lernen, nämlich Multi-Layer Perception, K-Nearest Neighbour, Support Vector Machine, Random Forest und Adaptive Boosting, zusammen mit den Schlüsselinformationen der gesammelten Daten besprochen.
Multi-Layer Perception (MLP) ist ein neuronales Netzwerk, das eine überwachte Lerntechnik darstellt. Das MLP besteht aus sechs Schichten: der Eingabeschicht, vier verborgenen Schichten und der Ausgabeschicht, wie in Abb. 1 dargestellt. Alle Nicht-Eingabeknoten sind Neuronen, die eine nichtlineare Aktivierungsfunktion verwenden.
Beziehung zwischen verschiedenen Schichten des MLP.
K-Nearest Neighbor (KNN) ist ein Algorithmus, der die Eingabeklasse basierend auf der Abstimmung für die Trainingsdateninstanzen vorhersagt, die der Eingabe am ähnlichsten sind. Dies nimmt die Mehrheitsklasse der K nächsten ähnlichen Nachbarn ohne einen Lernprozess. Wie in Abb. 2 dargestellt, ist der grüne Kreis neben dem Fragezeichen die Eingabe, die nicht beschriftet ist. Die beiden roten Dreiecke und ein blaues Quadrat befinden sich neben dem Eingabekreis, da sie ähnlich sind. Mit anderen Worten: Ihre Merkmale ähneln den Merkmalen der Eingabe. In diesem Beispiel wird der Wert von K mit drei gewählt, sodass der schwarze Kreis die drei Instanzen enthält, die der Eingabe am nächsten liegen. Nachdem wir die Abstimmungsteilnehmer kennen, ist die Mehrheitsklasse die Klasse der Eingabe, sodass die Vorhersage der Eingabeklasse die Klasse des roten Dreiecks ist
K-Nearest Neighbors, das die Auswahl der k Punkte anzeigt, die dem Eingabepunkt am ähnlichsten sind.
Dabei ist das blaue Quadrat Klasse 1, das rote Dreieck Klasse 0 und der grüne Kreis die Eingabe.
SVM trennt die Datenpunkte mithilfe eines Kernels in eine andere, leicht trennbare Dimension. Wie in Abb. 3 gezeigt, gibt es beispielsweise zwei Merkmale, x1 und x2, und zwei Klassen, schwarze und weiße Punkte. Um identifizieren zu können, welche Kombination der Merkmalswerte sich auf die Klasse beziehen würde, wurden die Merkmalswerte jeder Instanz grafisch dargestellt und die Teile unter Verwendung eines nichtlinearen Kernels als Teil (a) und eines linearen Kernels als Teil (b) erstellt des Diagramms, das angibt, dass jede Klasse bekannt sein könnte. Die Hyperebene ist die Ebene, die die Klassen im n-dimensionalen Raum trennt. Je weiter es von den Datenpunkten entfernt ist, desto genauer ist die Klassifizierung31,32,33.
Diagramm für die Support Vector Machine, das die Klassifizierung anhand der nichtlinearen und linearen Kernel34 zeigt.
Der Random Forest-Algorithmus ist eine Gruppe von Entscheidungsbäumen, wie in Abb. 4 dargestellt. Jeder dieser Entscheidungsbäume wird auf einer Teilmenge des Datensatzes trainiert. Diese Anteile werden gleichmäßig verteilt. Wenn dem Random-Forest-Algorithmus eine Eingabe gegeben wird, gibt jeder Baum basierend auf seinem Training eine Klassifizierung für diese Eingabe vor. Die Klasse mit den meisten Vorhersagen ist die Eingabevorhersageklasse35,36.
Zufälliger Wald35,37.
Ein Ensemble-Lernalgorithmus passt die Gewichte des schwachen Klassifikators an, indem er diese iteriert, um die Leistung zu verbessern und einen robusteren Klassifikator zu erstellen. Wie in Abb. 5 dargestellt, beginnt der Algorithmus damit, das Modell an den Datensatz anzupassen und einige Ergebnisse zu erzielen. Anschließend passt er einige Gewichte im schwachen Klassifikator an und testet das Modell. Wenn es sich um einen schwachen Klassifikator handelt, passt er seine Gewichte an, bis er zu einem robusteren Klassifikator wird.
Es gibt Boost38.
Knotenaktivität im Zeitverlauf.
Abbildung 6 zeigt die Anzahl der registrierten Knoten in einer Zeitinstanz, sodass, wie Teil (a) und Teil (b) zeigen, mit zunehmender Variation der Anzahl registrierter Knoten die Variation der Anzahl der Switch-Knoten in einer Zeitinstanz zunimmt Zunahme.
In dieser Arbeit werden Daten aus einem Testfeld, das aus 400 SPS-Modems besteht, gesammelt. Die SPS-Daten basieren auf dem PL360-Chipsatz von Microchip und das für die Kommunikation verwendete Protokoll ist PRIME-Standard. Die Daten werden mithilfe eines PLC-Sniffers von Microchip erfasst, da der Sniffer einen Knoten nach der Data Concentrator Unit (DCU) platziert wird. Zunächst wurden die Daten analysiert und gefiltert, um sie gleichmäßig zu machen. Anschließend wurden die Parameter, die die Kanalqualität repräsentieren, basierend auf der Literatur5,16 ausgewählt.
Histogrammverteilung der wichtigsten Parameter des Datensatzes.
Der Datensatz besteht aus 1000 Messwerten der wichtigsten Parameter: Signal-Rausch-Verhältnis (SNR), Empfangssignalstärkeindikator (RSSI) und Träger-Interferenz-plus-Rauschen (CINR); Dies sind die wichtigsten Parameter, wie in Abb. 7 dargestellt. Tabelle 1 zeigt ein Beispiel für den Datensatz. 50 % der Messwerte für Label 0 weisen darauf hin, dass der Kanal bei diesen Werten nicht funktioniert. Andererseits funktioniert der Kommunikationskanal für die Bezeichnung 1 und ist für den Datenaustausch geeignet. Mithilfe der Messwerte konnte festgestellt werden, welcher Zeitstempel der Knoten funktionierte und welcher nicht. Dies half bei der Bestimmung der Wahrscheinlichkeit, dass ein Knoten zu einem bestimmten Zeitpunkt funktionierte oder nicht. Der Datensatz wurde zu 90 % für das Training und zu 10 % zum Testen aufgeteilt. In den folgenden Abbildungen werden Beispiele der Daten für einen bestimmten Knoten angezeigt. Abb. 8 zeigt beispielsweise die SNR-Werte im Zeitverlauf, während Abb. 9 den RSSI des Kanals für einen bestimmten Knoten im Netzwerk darstellt. Die Diagramme zeigen, dass die Änderung der Parameter über die Zeit des Schnüffelns zufällig erfolgt. Darüber hinaus ist das CINR in Abb. 10 dargestellt. Die erfassten Daten zeigen, dass die Signalqualität im Laufe der Zeit variiert.
SNR-Werte im Zeitverlauf.
RSSI-Werte im Zeitverlauf.
CINR-Werte im Zeitverlauf.
Unsere Daten wurden analysiert, um die Beziehung zwischen Merkmalen zu ermitteln und zu ermitteln, wie sich diese Parameter auf die Knotenleistung auswirken können. Zur Vereinfachung wurde eine Teilmenge der Daten herangezogen, um alle Merkmale im Zeitverlauf zu visualisieren und so Abbildung 11 zu erstellen. Dieses Diagramm zeigt deutlich die hohe Korrelation zwischen allen Merkmalen. Wenn beispielsweise das SNR zu einem bestimmten Zeitpunkt ansteigt, nimmt der Bersoft ab, sodass zwischen diesen eine hohe negative Korrelation auftritt zwei Funktionen.
Alle Qualitätsmerkmale im Laufe der Zeit.
Eine andere Art der Visualisierung zum Nachweis der Korrelation ist eine Korrelationsmatrix, die auf Pearson-Korrelationsberechnungen wie in Abbildung 12 basiert. Wie gezeigt, zeigt sich eine sehr hohe Korrelation zwischen allen Qualitätsmerkmalen. Außerdem erscheint in der Auf- und Ab-Spalte eine hohe Korrelation mit Pdutype und Level. Dies kann dadurch erklärt werden, dass eine geringere Qualität auftritt, was zu einer geringeren Leistung führt, wenn sich der Knoten tendenziell auf einem hohen Niveau befindet.
Korrelationsmatrix aller Qualitätsmerkmale.
Ein Histogramm aller Merkmale kann auch in Abbildung 13 dargestellt werden. Dies zeigt, dass der häufigste Wert im SNR 4 ist, was auf eine schlechte Qualität von fast 75 % der Daten hinweist. Darüber hinaus zeigen Bersoft und Bersoft max die gleiche Verteilung, was ihre hohe Korrelation von 1 beweist, die in der Korrelationsmatrix erscheint.
Ein Histogramm aller Qualitätsmerkmale.
In diesem Abschnitt wurden sechs KI-Modelle mit den gesammelten Daten verwendet, um das Kanalverhalten vorherzusagen. Daher werden die Ergebnisse dieser Modelle und ihre Auswirkungen auf die Netzwerkleistung diskutiert. Anschließend wird ein Vergleich zwischen diesen Ergebnissen durchgeführt. Zur Bewertung der Modelle werden vier Metriken verwendet; Genauigkeit, F1-Score, Präzision und Rückruf. Darüber hinaus wurde für jedes Modell eine Verwirrungsmatrix erstellt. Die Verwirrungsmatrix ist eine zweidimensionale Matrix, deren Zeilen sich auf die wahren Etiketten beziehen und deren Spalten sich auf die vorhergesagten Etiketten beziehen. Die Verwirrungsmatrix zeigt, wie viele vorhergesagte Instanzen es für jede Klasse gibt, und gibt damit die Modellleistung an39.
Die Gleichungen der Metriken sind in Gleichung 1 dargestellt. Die Genauigkeit wird anhand von (1a) bewertet, dem Verhältnis zwischen der Summe aller korrekten Vorhersagen. Welche sind die wirklich vorhergesagte positive Klasse (TP) und die wirklich vorhergesagte negative Klasse (TN) für alle Vorhersagen, welche sind die wahren Vorhersagen der positiven Klasse (TP) und der negativen Klasse (TN) und die falsch vorhergesagte positive Klasse (FP) und die fälschlicherweise vorhergesagte negative Klasse (FN). Wie (1b) zeigt, ist die Präzision, wie groß die tatsächlich vorhergesagte positive Klasse (TP) in Bezug auf alle vorhergesagten positiven Klassen ist, entweder wirklich vorhergesagt (TP) oder falsch vorhergesagt (FP). Der Rückruf gibt an, wie viele tatsächlich vorhergesagte positive Klassen für die Anzahl positiver Klasseninstanzen im Testdatensatz vorhanden sind, unabhängig davon, ob sie wirklich vorhergesagt (TP) oder falsch vorhergesagt (FN) sind, wie in (1c) gezeigt. Der F1-Score ist das Verhältnis zwischen der doppelten Multiplikation der Präzision und dem Rückruf zu ihrer Summierung, wie in (1d)40 gezeigt. Abb. 14 zeigt die Verwirrungsmatrizen für die vorgeschlagenen Modelle. Die Verwirrungsmatrix vergleicht die Vorhersagen jedes Modells mit den tatsächlichen Vorhersagen, sodass die Zeilen die tatsächliche Klasse und die Spalten die vorhergesagte Klasse darstellen, sodass die Diagonale die korrekt klassifizierten Instanzen zeigt.
MLP wurde an 100 Instanzen getestet und erreichte eine Genauigkeit von 84 %, so dass, wie Abb. 14 - a zeigt, 47 von 52 Instanzen korrekt als Klasse „1“ und 37 von 48 Instanzen korrekt als Klasse „0“ klassifiziert wurden. . Das Modell ergab eine Präzision von 0,8456, einen Recall von 0,8373 und einen F1-Score von 0,8384.
Die Genauigkeit der KNN-Vorhersage variiert je nach K, wie in Abschn. 2. Daher wurde das Modell getestet, um die Testsatzinstanzen mit unterschiedlichen Ks vorherzusagen und den Wert mit den besten Ergebnissen zu bestimmen, sodass das Modell bei K gleich 15 die besten Ergebnisse erzielt. Abb. 14 – b zeigt die Vorhersagen des KNN-Modells beim Testen an 100 Instanzen. Das Modell sagt 35 von 48 für die 0-Klasse und 32 von 52 für die 1-Klasse korrekt voraus, was einer Genauigkeit von 67 %, einem F1-Score von 0,6697, einer Genauigkeit von 0,6737 und einem Recall-Wert von 0,6723 entspricht.
Das Modell hat korrekt vorhergesagt, dass 49 von 52 Instanzen der Klasse „1“ und 36 von 48 der Klasse „0“ angehören, wie in Abb. 14 - c dargestellt, mit einer Genauigkeit von 85 %, F1-Score gleich 0,8465, die Genauigkeit beträgt 0,8698 und Rückruf von 0,8454.
Die Genauigkeit des Modells beträgt 86 %, wobei 50 von 52 Instanzen der Klasse „1“ und 36 von 48 der Klasse „0“ zugeordnet wurden, wie in Abb. 14 – d dargestellt, mit einem F1-Score von 0,8572 und einer Genauigkeit von 0,8769 Rückruf von 0,8558
Das Random Forest-Modell wurde mit mehreren Schätzern im Bereich von 1 bis 100 getestet. Die Anzahl der Schätzer ist die Anzahl der Bäume in einem Zufallswald. Dies wurde durchgeführt, um herauszufinden, mit welcher Anzahl von Schätzern die besten Ergebnisse erzielt werden. Die Anzahl der Schätzer mit der höchsten Genauigkeit beträgt 34. Abb. 14 – e zeigt, dass das Modell 50 von 52 Instanzen erfolgreich korrekt als Klasse 1 und 35 von 48 Instanzen als Klasse 0 vorhergesagt hat. Das Modell verfügt über eine Genauigkeit gleich 85 %, F1-Score von 0,8465, Präzision gleich 0,8698 und Recall von 0,8454.
Das Modell wurde mit mehreren Schätzern getestet, sodass die Schätzer ab 12 die besten Ergebnisse erzielen. Abb. 14 – f zeigt, dass das Modell 52 von 52 Instanzen erfolgreich als Klasse 1 und 35 von 48 Instanzen als Klasse 0 vorhergesagt hat. Das Modell hat eine Genauigkeit von 87 %, F1-Score von 0,8661, Präzision gleich 0,9 und Rückruf von 0,8646. Wie in Tabelle 2 gezeigt, war der ADA Boost mit einer Genauigkeit von 87 % der beste Algorithmus in Bezug auf Genauigkeit, F1-Score, Präzision und Rückruf, um vorherzusagen, zu welchem Zeitpunkt ein PLC-Knoten optimal ist, während er das am wenigsten genaue Modell war war KNN mit einer Genauigkeit von 67 %.
Verwirrungsmatrizen für trainierte Modelle.
In letzter Zeit wird SPS in verschiedenen IoT-Anwendungen eingesetzt. Allerdings ist die SPS-Umgebung anfällig für Rauschquellen, was sich negativ auf die Netzwerkqualität auswirkt. Tatsächlich wurden im letzten Jahrzehnt erhebliche Anstrengungen unternommen, um das Netzwerk und die Verbindungsqualität zu verbessern10,12. Einige Forscher zielten beispielsweise auf unterschiedliche MAC- und PHY-Layer-Implementierungen ab, um die Netzwerkzuverlässigkeit zu verbessern. Darüber hinaus wurden einige Anstrengungen auf der Ebene der Implementierung elektronischer Schaltkreise unternommen10. Trotz der bisherigen Arbeiten zur Verbesserung der Netzwerkqualität benötigen SPS-basierte Netzwerke jedoch aufgrund der sich im Laufe der Zeit ändernden Bedingungen immer noch mehr Stabilität. Daher nutzt diese Arbeit KI, um die Netzwerkstabilität und Verbindungsqualität vorherzusagen. Sechs KI-Techniken wurden verwendet, um die Netzwerkqualität und das optimale Zeitfenster für die Kommunikation vorherzusagen. Tabelle 2 zeigt einen Vergleich zwischen den verschiedenen Techniken. Der ADA Boost ergab eine Genauigkeit von 87 % für das Erreichen des optimalen Kommunikationsschlitzes, während KNN die schlechteste Genauigkeit von 67 % ergab. Allerdings ist KNN die schnellste Ausführungszeit (0,0039 Sek.) für 21 Threads. Andererseits benötigt ADA Boost während der Trainingszeit (0,02 Sek.) für 25 Threads. Das bedeutet, dass der KNN während des Trainingsprozesses weniger CPU-Ressourcen benötigt als ADA Boost. Dies ermöglicht das Konzept, Schulungen in einer Umgebung mit begrenzten Ressourcen zu ermöglichen. Darüber hinaus ergab der nichtlineare SVM-Kernel eine Genauigkeit von 86 % bei einer Trainingszeit von 0,043 Sekunden. für 23 Fäden. Der lineare SVM-Kernel erreicht jedoch eine Genauigkeit von 85 % bei einer Trainingszeit von 0,024 Sekunden. Der wesentliche Vorteil der Wahl des optimalen Zeitschlitzes für die Kommunikation besteht in der Steigerung der Effizienz der Kommunikationsverbindung. Dadurch erhöht sich auch die Anzahl der Knoten, die dasselbe DCU-Gerät bedienen kann. Darüber hinaus minimiert die Erhöhung der Verbindungseffizienz die Anzahl der Versuche, den Messwert für den SPS-Knoten zu erhalten. Daher kann das System die Anzahl der Knoten erhöhen
von der gleichen DCU bedient.
Die frühere Vorhersage der Verfügbarkeit eines SPS-Knotens verbessert die Netzwerkleistung. MLP-, KNN-, lineare und nichtlineare SVM-Kernel-, Random Forest- und AdaBoost-Algorithmen wurden trainiert und getestet, um vorherzusagen, ob ein PLC-Knoten zu einem bestimmten Zeitpunkt verfügbar war oder nicht. Sie stellen statistische, vektorbasierte, Regressions-, Entscheidungs- und Vorhersagealgorithmen dar. Die Messwerte Signal-Rausch-Verhältnis (SNR), Empfangssignalstärkeanzeige (RSSI) und Träger-Interferenz-plus-Rauschen (CINR) wurden verwendet, um anhand eines Datensatzes von 1000 zu bestimmen, ob ein PLC-Knoten für die Verwendung zu einem bestimmten Zeitpunkt optimal war Instanzen wurden so verwendet, dass 90 % davon für das Training des Modells verwendet wurden. Das Modell hat für den AdaBoost-Algorithmus eine Genauigkeit, einen F1-Score, eine Präzision und einen Rückruf von 87 %, 0,86613, 0,9 bzw. 0,8646 erreicht, was die anderen Algorithmen übertrifft.
Die während der aktuellen Studie generierten und/oder analysierten Datensätze sind auf begründete Anfrage beim jeweiligen Autor erhältlich.
Mlỳnek, P., Rusz, M., Benešl, L., Sláčik, J. & Musil, P. Möglichkeiten der Breitband-Stromleitungskommunikation für Smart Home- und Smart Building-Anwendungen. Sensoren 21(1), 240 (2021).
Artikel ADS PubMed PubMed Central Google Scholar
Al-Fuqaha, A., Guizani, M., Mohammadi, M., Aledhari, M. & Ayyash, M. Internet der Dinge: Eine Umfrage zu grundlegenden Technologien, Protokollen und Anwendungen. IEEE-Komm. Überleben. Tutor. 17(4), 2347–2376 (2015).
Artikel Google Scholar
González-Ramos, J. et al. Modernisierung der Stromnetzfunktionalitäten durch breitbandige Powerline-Kommunikation: Grundlagen, Anwendungen, aktuelle Trends und Herausforderungen. Sensoren 22(12), 4348. https://doi.org/10.3390/s22124348 (2022).
Artikel ADS PubMed PubMed Central Google Scholar
Ghasempour, A. Internet der Dinge im Smart Grid: Architektur, Anwendungen, Dienste, Schlüsseltechnologien und Herausforderungen. Erfindungen 4(1), 22 (2019).
Artikel Google Scholar
Hamamreh, JM, Furqan, HM & Arslan, H. Klassifizierungen und Anwendungen von Sicherheitstechniken der physikalischen Schicht für die Vertraulichkeit: Eine umfassende Übersicht. IEEE-Komm. Überleben. Tutor. 21(2), 1773–1828 (2018).
Artikel Google Scholar
Vincent, TA, Gulsoy, B., Sansom, JE & Marco, J. Entwicklung eines fahrzeuginternen Stromleitungskommunikationsnetzwerks mit vor Ort instrumentierten intelligenten Zellen. Transp. Ing. 6, 100098 (2021).
Artikel Google Scholar
Brandl, M. & Kellner, K. Leistungsbewertung von Powerline-Kommunikationssystemen für die Lin-Bus-basierte Datenübertragung. Elektronik 10(1), 85 (2021).
Artikel Google Scholar
Prasad, G. & Lampe, L. Vollduplex-Stromleitungskommunikation: Design und Anwendungen von Multimedia bis Smart Grid. IEEE-Komm. Magazin. 58(2), 106–112 (2019).
Artikel Google Scholar
Rocha Farias, L., Monteiro, LF, Leme, MO & Stevan, SL Jr. Empirische Analyse der Kommunikation in industriellen Umgebungen basierend auf g3-Stromleitungskommunikation und Einflüssen aus dem Stromnetz. Elektronik 7(9), 194 (2018).
Artikel Google Scholar
Wang, B. & Cao, Z. Ein Überblick über Impedanzanpassungstechniken in der Stromleitungskommunikation. Elektronik 8(9), 1022 (2019).
Artikel Google Scholar
Oliveira, RM, Vieira, AB, Latchman, HA & Ribeiro, MV Medium-Zugriffskontrollprotokolle für die Stromleitungskommunikation: Eine Umfrage. IEEE-Komm. Überleben. Tutor. 21(1), 920–939 (2018).
Artikel Google Scholar
Appasani, B. & Mohanta, DK Ein Überblick über das Synchrophasor-Kommunikationssystem: Kommunikationstechnologien, Standards und Anwendungen. Schützen. Steuermod. Stromversorgungssystem. 3(1), 1–17 (2018).
Google Scholar
Sanz, A., Sancho, D. und Ibar, JC. Leistungen von G3-PLC-RF-Hybrid-Kommunikationssystemen. In: 2021 IEEE International Symposium on Power Line Communications and Its Applications (ISPLC), S. 67–72 (2021). IEEE
Deru, L., Dawans, S., Ocaña, M., Quoitin, B. & Bonaventure, O. Redundante Grenzrouter für geschäftskritische 6Lowpan-Netzwerke. In Real-world Wireless Sensor Networks (Hrsg. Dev, T.) 195–203 (Springer, 2014).
Kapitel Google Scholar
Kassab, AS, Seddik, KG, Elezabi, A. und Soltan, A. Realistische drahtlose Smart-Meter-Netzwerkoptimierung unter Verwendung der zusammengesetzten RPL-Metrik. In: 2020 8th International Conference on Smart Grid (icSmartGrid), S. 109–114 (2020). IEEE
Stiri, S. et al. Hybrid-PLC- und Lorawan-Smart-Metering-Netzwerke: Modellierung und Optimierung. IEEE Trans. Indus. Inf. 18(3), 1572–1582 (2021).
Artikel Google Scholar
Ullah, Z., Al-Turjman, F., Mostarda, L. & Gagliardi, R. Anwendungen von künstlicher Intelligenz und maschinellem Lernen in Smart Cities. Berechnen. Komm. 154, 313–323 (2020).
Artikel Google Scholar
Mata, J. et al. Methoden der künstlichen Intelligenz (KI) in optischen Netzwerken: Eine umfassende Übersicht. Optik. Schalter. Netw. 28, 43–57 (2018).
Artikel Google Scholar
Fu, Y., Wang, S., Wang, C.-X., Hong, X. & McLaughlin, S. Künstliche Intelligenz zur Verwaltung des Netzwerkverkehrs von 5G-Funknetzwerken. IEEE Netw. 32(6), 58–64 (2018).
Artikel Google Scholar
Yang, H. et al. Auf künstlicher Intelligenz basierende intelligente 6G-Netzwerke. IEEE Netw. 34(6), 272–280 (2020).
Artikel Google Scholar
Shi, Y., Yang, K., Jiang, T., Zhang, J. & Letaief, KB Kommunikationseffiziente Edge-KI: Algorithmen und Systeme. IEEE-Komm. Überleben. Tutor. 22(4), 2167–2191 (2020).
Artikel Google Scholar
Zhang, C. & Lu, Y. Studie zu künstlicher Intelligenz: Stand der Technik und Zukunftsaussichten. J. Indus. Inf. Integr. 23, 100224. https://doi.org/10.1016/j.jii.2021.100224 (2021).
Artikel Google Scholar
Balada, C. et al. Fühler-im-netz: Ein Datensatz zur Smart Grid- und Stromleitungskommunikation. IET Smart Gridhttps://doi.org/10.1049/stg2.12093 (2022).
Artikel Google Scholar
R̃ighini, D., Tonello, AM Rauschdeterminismus in Mehrleiter-Schmalband-SPS-Kanälen. In: 2018 IEEE International Symposium on Power Line Communications and its Applications (ISPLC) (2018) https://doi.org/10.1109/isplc.2018.8360239
Righini, D., Tonello, AM: Automatische Clusterung von Rauschen in Mehrleiter-Schmalband-PLC-Kanälen. In: 2019 IEEE International Symposium on Power Line Communications and its Applications (ISPLC) (2019) https://doi.org/10.1109/isplc.2019.8693272
Reyes, DMA, Souza, RMCR & Oliveira, ALI Ein dreistufiger Ansatz zur Modellierung mehrerer Zeitreihen, angewendet auf symbolische Quartildaten. Exp. Syst. Appl. 187, 115884. https://doi.org/10.1016/j.eswa.2021.115884 (2022).
Artikel Google Scholar
Bade, K. & Nürnberger, A. Personalisiertes hierarchisches Clustering. In: 2006 IEEE/WIC/ACM International Conference on Web Intelligence (WI 2006 Main Conference Proceedings)(WI'06) (2006) https://doi.org/10.1109/wi.2006.131
Leskovec, J., Rajaraman, A. & Ullman, JD Mining of Massive Datasets (Cambridge University Press, 2014).
Buchen Sie Google Scholar
Vesanto, J. & Alhoniemi, E. Clustering der selbstorganisierenden Karte. IEEE Trans. Neuronales Netz. 11(3), 586–600. https://doi.org/10.1109/72.846731 (2000).
Artikel CAS PubMed Google Scholar
Dubey, A., Mallik, RK & Schober, R. Leistungsanalyse eines Multi-Hop-Stromleitungskommunikationssystems über logarithmisch normales Fading bei impulsivem Rauschen. IET-Komm. 9(1), 1–9. https://doi.org/10.1049/iet-com.2014.0464 (2015).
Artikel Google Scholar
Hossam, M., Afify, AA, Rady, M., Nabil, M., Moussa, K., Yousri, R. & Darweesh, MS Eine vergleichende Studie verschiedener Techniken zur Gesichtsformklassifizierung. In: 2021 International Conference on Electronic Engineering (ICEEM), S. 1–6 (2021). https://doi.org/10.1109/ICEEM52022.2021.9480638
Prajapati, GL, & Patle, A. Zur Durchführung einer Klassifizierung mithilfe von SVM mit radialen Basis- und Polynomkernfunktionen. In: 2010 3rd International Conference on Emerging Trends in Engineering and Technology (2010) https://doi.org/10.1109/icetet.2010.134
Almaiah, MA et al. Leistungsuntersuchung der Hauptkomponentenanalyse für Intrusion-Detection-Systeme unter Verwendung verschiedener Support-Vektor-Maschinenkerne. Elektronik 11(21), 3571 (2022).
Artikel Google Scholar
Verma, AR, Singh, SP, Mishra, RC und Katta, K. Leistungsanalyse der Sprecheridentifikation unter Verwendung eines Gaußschen Mischungsmodells und einer Support-Vektor-Maschine. In: 2019 IEEE International WIE Conference on Electrical and Computer Engineering (WIECON-ECE) (2019) https://doi.org/10.1109/wiecon-ece48653.2019.9019970
Khan, MY et al. Automatisierte Vorhersage guter Wörterbuchbeispiele (gdex): Ein umfassendes Experiment mit Fernüberwachung, maschinellem Lernen und auf Worteinbettung basierenden Deep-Learning-Techniken. Komplexitäthttps://doi.org/10.1155/2021/2553199 (2021).
Artikel Google Scholar
Liu, P., Zhang, Y., Wu, H. & Fu, T. Optimierung der Edge-PLC-basierten Fehlerdiagnose mit Random Forest im industriellen Internet der Dinge. IEEE Internet Things J. 7(10), 9664–9674. https://doi.org/10.1109/jiot.2020.2994200 (2020).
Artikel Google Scholar
Bhushan, S. et al. Eine experimentelle Analyse verschiedener maschineller Lernalgorithmen zur Handgestenerkennung. Electronics 11(6), 968. https://doi.org/10.3390/electronics11060968 (2022).
Artikel Google Scholar
Abirami, SP, Kousalya, G. & Karthick, R. Abwechslungsreiche Ausdrucksanalyse von Kindern mit ASD unter Verwendung multimodaler Deep-Learning-Technik. Tiefgreifendes Lernen. Paralleles Rechnen. Umgebung. Bioeng. Syst.https://doi.org/10.1016/b978-0-12-816718-2.00021-x (2019).
Artikel Google Scholar
Heydarian, M., Doyle, TE & Samavi, R. Mlcm: Multi-Label-Verwirrungsmatrix. IEEE Access 10, 19083–19095. https://doi.org/10.1109/access.2022.3151048 (2022).
Artikel Google Scholar
Abdulhammed, R., Musafer, H., Alessa, A., Faezipour, M. & Abuzneid, A. Bietet Ansätze zur Dimensionsreduzierung für die auf maschinellem Lernen basierende Erkennung von Netzwerkeinbrüchen. Electronics 8(3), 322. https://doi.org/10.3390/electronics8030322 (2019).
Artikel Google Scholar
Referenzen herunterladen
Dieses Papier basiert auf einer Arbeit, die von der Information Technology Academia Collaboration (ITAC) of Egypt unter der Fördernummer CFP 207 unterstützt wird.
Open-Access-Finanzierung durch die Science, Technology & Innovation Funding Authority (STDF) in Zusammenarbeit mit der Egyptian Knowledge Bank (EKB).
Wireless Intelligent Networks Center (WINC), Nile University, Gizeh, 12677, Ägypten
Kareem Moussa & M. Saeed Darweesh
School of Engineering and Applied Sciences, Nile University, Gizeh, 12677, Ägypten
Kareem Moussa, Mennatullah Mahmoud Amin, M. Saeed Darweesh, Lobna A. Said und Ahmed Soltan
Nanoelectronics Integrated Systems Center (NISC), Nile University, Gizeh, 12677, Ägypten
Mennatullah Mahmoud Amin, Lobna A. Said und Ahmed Soltan
El Sewedy Electrometer Group, Stadt des 6. Oktober, Ägypten
Abdelmoniem Elbaz
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
In dieser Arbeit verwenden wir KI, um die Verbindungsverfügbarkeit für das Power Line Communication (PLC)-Netzwerk vorherzusagen. Wir haben Daten vor Ort gesammelt und verschiedene KI-Algorithmen angewendet, um die Linkverfügbarkeit im Zeitverlauf vorherzusagen. Die Algorithmen zeigten eine Vorhersagegenauigkeit von mehr als 85. Der Beitrag des Autors lautet wie folgt: Eng. KM hat die Algorithmusimplementierung zur Optimierung und Vorhersage übernommen. Eng. MMA hat die Zahlengenerierung und das erste Schreiben übernommen Sammlung und Feldtests Dr. Ahmed Soltan Projekt-PI und Initiator der Idee und er hat das endgültige Schreiben verfasst.
Korrespondenz mit Ahmed Soltan.
Die Autoren geben an, dass keine Interessenkonflikte bestehen.
Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.
Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.
Nachdrucke und Genehmigungen
Moussa, K., Amin, MM, Darweesh, MS et al. Eine vergleichende Studie zur Vorhersage der Verfügbarkeit von Stromleitungskommunikationsknoten mithilfe maschinellen Lernens. Sci Rep 13, 12658 (2023). https://doi.org/10.1038/s41598-023-39120-7
Zitat herunterladen
Eingegangen: 02. Mai 2023
Angenommen: 20. Juli 2023
Veröffentlicht: 04. August 2023
DOI: https://doi.org/10.1038/s41598-023-39120-7
Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:
Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.
Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt
Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.