banner
Nachrichtenzentrum
Wir versprechen erstklassige Ware, pünktlichen Versand und gewissenhafte Unterstützung.

Identifizierung der Wachstumsjahre für Puerariae Thomsonii Radix basierend auf hyperspektraler Bildgebungstechnologie und Deep-Learning-Algorithmus

Jul 24, 2023

Scientific Reports Band 13, Artikelnummer: 14286 (2023) Diesen Artikel zitieren

Details zu den Metriken

Puerariae Thomsonii Radix (PTR) wird nicht nur häufig zur Vorbeugung und Behandlung von Krankheiten eingesetzt, sondern ist auch ein wichtiger Rohstoff als Quelle für Stärke und andere Nahrungsmittel. Die Wachstumsjahre von PTR hängen eng mit seiner Qualität zusammen. Die schnelle und zerstörungsfreie Identifizierung des Wachstumsjahres ist für die Qualitätskontrolle von PTR und anderen traditionellen chinesischen Arzneimitteln von entscheidender Bedeutung. In dieser Studie haben wir ein auf Convolutional Neural Network (CNN) basierendes Klassifizierungsrahmenwerk in Verbindung mit Hyperspectral Imaging (HSI)-Technologie zur schnellen Identifizierung der Wachstumsjahre von PTRs vorgeschlagen. Als Basismodelle wurden traditionelle Behandlungsmethoden (z. B. multiplikative Streukorrektur, Standardnormalvariate und Savitzky-Golay-Glättung) in Kombination mit maschinellen Lernalgorithmen (z. B. Random Forest, logistische Regression, naive Bayes und eXtreme Gradient Boost) verwendet. Unter ihnen lag der F1-Score der CNN-basierten Modelle, die auf den Außenflächen von PTRs basieren, bei über 90 % und übertraf damit alle anderen Basismodelle. Diese Ergebnisse zeigten, dass es möglich war, einen Deep-Learning-Algorithmus in Verbindung mit der HSI-Technologie zu verwenden, um die Wachstumsjahre von PTR zu identifizieren. Diese Methode bietet eine schnelle, zerstörungsfreie und einfache Methode zur Identifizierung der Wachstumsjahre von PTR. Es kann problemlos auf andere Szenarien angewendet werden, beispielsweise zur Identifizierung des Standorts oder der Wachstumsjahre anderer traditioneller chinesischer Kräuter.

Pueraria Thomsonii Benth (PTB) ist eine mehrjährige Rebsorte, deren Wurzel im Chinesischen Arzneibuch unter dem Namen Puerariae Thomsonii Radix (PTR) aufgeführt ist. PTRs sind mit einer Vielzahl chemischer Komponenten wie Isoflavonen, Terpenoiden und Cumarinen angereichert. PTRs werden seit langem als eine Art traditionelle chinesische Medizin eingesetzt. Sie haben eine offensichtliche therapeutische Wirkung und verbessern nachweislich Herz-Kreislauf-Erkrankungen, wirken entzündungshemmend und schmerzlindernd, haben eine antidiabetische Wirkung, reduzieren die Auswirkungen von Alkohol, schützen die Leber, hellen die Haut auf und vergrößern die Brüste1,2,3,4. 5,6. Sie sind auch in China und Südostasien ein gesundes und beliebtes Lebensmittel. PTRs haben einen hohen wirtschaftlichen Wert und eine hohe Marktnachfrage.

Nach Angaben des Chinesischen Arzneibuchs beeinflusst der Pueraringehalt (C21H20O9) die Qualität und den medizinischen Wert von PTR. Je höher der Pueraringehalt in einem PTR, desto höher ist die Qualität des PTR. PTRs mit unterschiedlichem Wachstumsalter unterscheiden sich im Pueraringehalt. Der Pueraringehalt in PTR steht in direktem Zusammenhang mit der Anzahl der Wachstumsjahre. Xiong et al.7 fanden heraus, dass ein Jahr altes PTB einen niedrigen Puerarinspiegel aufweist, der weit unter den Arzneibuchstandards liegt, was bedeutet, dass es nur als Lebensmittel oder als Rohstoff verwendet werden kann. Im Gegensatz dazu erreicht PTB im Alter von zwei Jahren oder älter normalerweise den Standardgehalt an Puerarin und kann in der traditionellen chinesischen Medizin verwendet werden. Diese Ergebnisse zeigen, wie wichtig es ist, die Wachstumsjahre von PTRs zu ermitteln, da Wachstumsjahre in direktem Zusammenhang mit der Qualität und dem wirtschaftlichen und medizinischen Wert von PTRs stehen.

Das Wachstumsjahr der PTR wird in der Regel anhand objektiver Erfahrungen oder anhand physikalischer und chemischer Tests ermittelt. PTRs mit unterschiedlichem Wachstumsalter sehen jedoch ähnlich aus; Daher ist es schwierig, ihre Eigenschaften und Farben auf der Grundlage einer objektiven Beurteilung zu unterscheiden. In der Vergangenheit wurde die chemische Identifizierung von PTR hauptsächlich mithilfe der Hochleistungsflüssigkeitschromatographie (HPLC)8,9 durchgeführt, was zeitaufwändig, mühsam, kostspielig und zerstörerisch ist. Daher scheint es, dass die beiden oben genannten Methoden nicht zur Identifizierung der Wachstumsjahre von PTRs mit hoher Genauigkeit und Effizienz verwendet werden können und den Anforderungen der industriellen Produktion nicht gerecht werden können.

Im Vergleich zur herkömmlichen Spektraltechnologie kann die Hyperspektralbildgebungstechnologie (HSI) verwendet werden, um gleichzeitig Oberflächenbildinformationen und Spektralinformationen einer getesteten Probe zu erfassen. Viele Forscher haben HSI verwendet, um Wachstumsjahre zu identifizieren und die Qualität traditioneller chinesischer Arzneimittel zu kontrollieren. In den letzten Jahren erreichte die Genauigkeit der Identifizierung der Wachstumsjahre für Glycyrrhizae Radix et Rhizoma10, Ophiopogonis Radix11, Ziziphi Spinosae Semen12 und Atractylodis Rhizoma13 97,53 %, 99,1 %, 99,14 % bzw. 97,3 %. Zheng et al.14 untersuchten die Authentifizierung von Armeniacae Semen Amarum und Persicae Semen basierend auf der HSI-Technologie. Basierend auf der vergleichenden Analyse verschiedener Vorverarbeitungsmethoden und Identifikationsmodelle stellten die Forscher fest, dass das Vorverarbeitungsmodell der zweiten Ableitung und die partielle Diskriminanzanalyse der kleinsten Quadrate die beste Modellkombination waren. Die Klassifizierungsgenauigkeit erreichte 100 %. Cheng et al.15 untersuchten 20 charakteristische Wellenlängen mithilfe des Algorithmus für sukzessive Projektionen und erstellten mehrere Modelle zur Identifizierung des Ursprungs von Weihrauch. Die Ergebnisse zeigten, dass die Genauigkeiten der extrem lernenden Maschine und der linearen Diskriminanzanalyse 100 % betrugen. Nach unserem besten Wissen haben sich keine Berichte auf die Anwendung der HSI-Technologie bei der Identifizierung der Wachstumsjahre von PTR konzentriert. Deep-Learning-Methoden wie herkömmliche neuronale Netze (CNNs) werden in vielen Bereichen wie der Bildklassifizierung16, der Inhaltsvorhersage17 usw. häufig eingesetzt und zeigen eine hohe Leistung und gute Generalisierung. In dieser Studie haben wir einen CNN-basierten Klassifizierungsrahmen vorgeschlagen, um Wachstumsjahre von PTRs basierend auf hyperspektralen Bildern zu identifizieren. Dabei wurden traditionelle Behandlungsmethoden (d. h. multiplikative Streukorrektur (MSC), Standardnormalvariate (SNV) und Savitzky-Golay-Glättung (SG)) in Verbindung mit mehreren hochmodernen Modellen des maschinellen Lernens als Basismethoden verwendet um die Wirksamkeit und Überlegenheit der vorgeschlagenen Methode zu demonstrieren.

Das in dieser Studie verwendete HSI-System war die HySpex-Serie von Norsk Elektro Optikk AS (Norwegen). Das System besteht aus zwei Linsen, zwei Halogen-Wolframlampen, einem CCD-Detektor, einer mobilen Plattform sowie dem unterstützenden Computersystem und der Software (Abb. 1). Die beiden Linsen im Instrument sind eine Linse für sichtbares und nahes Infrarot (VNIR) SN0605 VNIR (Spektralbereich 410–990 nm) und eine Linse für kurzwelliges Infrarot (SWIR) N3124 SWIR (Spektralbereich 950–2500 nm). Das VNIR-Objektiv verfügt über insgesamt 108 Bänder und das SWIR-Objektiv über 288 Bänder. Die beiden Linsen werden vertikal auf einer Halterung 30 cm von der beweglichen Plattform entfernt befestigt. Die Bewegungsgeschwindigkeit der Plattform beträgt 1,5 mm/s. Der Winkel zwischen Lichtquelle und Plattform beträgt 45°. Die Kamera kann über ein Kabel mit einem Computer verbunden werden, um hyperspektrale Bilder zu erhalten. Die Integrationszeit und die Bildperiode des VNIR-Objektivs und des SWIR-Objektivs betragen 9000 μs und 3500 μs; und 41.501 μs bzw. 108.199 μs.

Hyperspektrales Bildgebungssystem. VNIR-Linse für sichtbares und nahes Infrarot, SWIR-Linse für kurzwelliges Infrarot. Das HSI-System besteht hauptsächlich aus Linsen, Lichtquellen, einer mobilen Plattform und einem Computersystem.

Die Qualität der gescannten Bilder kann durch einen Dunkelstrom in der Linse und durch Rauschen aufgrund einer ungleichmäßigen Lichtquellenverteilung beeinträchtigt werden. Daher wurde als Referenz hinter der Probe ein sauberes Whiteboard mit Standardreflexion angebracht. Anschließend wurde ein Tafel-Referenzbild im vollständig schwarzen Modus erstellt. Das ursprüngliche Hyperspektralbild wurde mit dem erhaltenen Schwarzweiß-Referenzbild korrigiert18,19. Die Kalibrierungsformel ist wie folgt definiert:

Dabei ist R das kalibrierte Reflexionsbild, R0 das Rohreflexionsbild, Rw das weiße Referenzbild und Rb das dunkle Referenzbild. Vor der Bildaufnahme haben wir die Parameter des HSI-Systems wiederholt getestet und angepasst, um den Belichtungsgrad sicherzustellen und das Rauschen zu reduzieren, wobei die Objektivhöhe und die Beleuchtungsposition auf 30 cm bzw. 45° festgelegt wurden.

Aufgeblasene Wurzelknollen der kultivierten PTRs wurden im April 2021 gesammelt. Insgesamt 75 gesunde PTRs mit unterschiedlichen Wachstumsjahren wurden auf der Puerariae Cultivation Demonstration Base (117° 39′ 19″ E, 28° 59′ 46″ N) in Sizhou gesammelt Stadt (Jiangxi, China). Die Basis pflegt eine langjährige Beziehung zu unserem Forschungsteam; Daher wurden alle Pflanzen mit Genehmigung gesammelt. Wir haben zunächst die hyperspektralen Bilder basierend auf den Außenflächen von 75 PTRs gesammelt (Abb. 2a). Beachten Sie, dass ein PTR manchmal mehr als eine Wurzel gleichzeitig wachsen ließ und diese Wurzeln aufgrund ihrer Größe geteilt werden mussten. Daher wurden einige zu große Pflanzen in mehrere Teile geteilt, was in dieser Studie zu 120 unabhängigen Proben führte. Anschließend wurden diese Proben in quer verlaufende Scheiben mit einer Dicke von 4 mm geschnitten, um Querschnittsbilder zu sammeln (Abb. 2b). Insgesamt wurden 120 Außenflächenproben und 1350 Querschnittsproben erhalten (Tabelle 1). Die chemischen Bestandteile hätten oxidieren können, wenn der Querschnitt der Probe längere Zeit der Luft ausgesetzt gewesen wäre. Daher wurden Querschnittsbilder jeder Probe unmittelbar nach dem Schneiden jeder Probe aufgenommen.

Vorbereitung von Puerariae Thomsonii Radix-Proben. (a) Außenfläche von Puerariae Thomsonii Radix-Proben; (b) Querschnitte von Puerariae Thomsonii Radix-Proben.

Die traditionelle Methode zur Identifizierung der Wachstumsjahre von PTRs umfasste vier Schritte: (i) Auswahl mehrerer Interessenregionen (ROIs); (ii) Berechnen der mittleren Wellenlänge für jeden ROI; (iii) Vorverarbeitung von Wellenlängeninformationen; (iv) Identifizieren von Wachstumsjahren basierend auf den berechneten Wellenlängeninformationen (Abb. 3).

Der Prozess traditioneller Methoden zur Identifizierung von Wachstumsjahren. MSC multiplikative Streuungskorrektur, SNV-Standardnormalvariable, SG Savitzky-Golay-Glättung, RF Random Forest, LR logistische Regression, NB Nave Bayesian, XGBoost eXtreme Gradient Boost. Der Prozess besteht aus vier Schritten: Auswahl von ROIs, Berechnung von Mittelwerten, Datenvorverarbeitung und Erstellung von Modellen.

Die ersten beiden Schritte wurden mit der ENVI-Software (Exelis Visual Information Solutions, Inc., USA) durchgeführt. Aus jedem Bild der Außenflächenprobe wurden insgesamt 10 ROIs zufällig ausgewählt. Daher wurden 1200 (= 120 × 10) außenflächenbasierte ROIs erhalten. Basierend auf den Querschnittsproben wurde jede in Abb. 2b gezeigte Schicht als einzelne ROI genommen. Somit wurden 1350 Querschnitts-ROIs extrahiert (Abb. 3a). Anschließend haben wir mit der ENVI-Software die mittlere Wellenlänge des extrahierten ROI berechnet und den Mittelwert in den Liniendiagrammen angezeigt, wie in Abb. 3b dargestellt. Wir haben den Reflexionsgrad aller drei Wachstumsjahre erfasst und dann den Mittelwert jedes einzelnen berechnet, wie in Abb. 4 dargestellt.

Der Mittelwert des Reflexionsgrads für Außenflächenproben (a,b) und Querschnittsproben (c,d) basierend auf der VNIR-Linse (a,c) und der SWIR-Linse (b,d).

Zu den zur Vorverarbeitung der Wellenlängeninformationen verwendeten Methoden gehörten MSC, SNV und SG-Glättung10,13,20. MSC kann verwendet werden, um Spiegelreflexions- und Streufehler in hyperspektralen Bildern zu beseitigen und die Rauschvarianz in Daten effektiv zu reduzieren21. Es wird häufig bei der Kalibrierungsmodellierung mit mehreren Wellenlängen verwendet22. SNV kann additive und multiplikative Effekte in Spektren entfernen23. Nach der SNV-Verarbeitung werden die Störungen durch Lichtstreuung und Basislinienverschiebung eliminiert24. SG ist eine gewichtete Durchschnittsmethode, die den Verlust wertvoller Informationen minimieren kann25. Es kann den Einfluss von Rauschen reduzieren und das Signal-Rausch-Verhältnis eines Spektrums effektiv verbessern12. In dieser Studie haben wir diese drei häufigsten Methoden als Vorbehandlungsmethoden verwendet. Der letzte Schritt bestand darin, die Wachstumsjahre von PTRs basierend auf den berechneten Wellenlängeninformationen von ROIs mithilfe von Methoden des maschinellen Lernens zu klassifizieren. In dieser Studie wurden Random Forest (RF), logistische Regression (LR), naive Bayesian (NB) und eXtreme Gradient Boost (XGBoost) verwendet, um die Wachstumsjahre von PTR vorherzusagen. In dieser Studie haben wir die Anzahl der Entscheidungsbäume für RF auf 500 festgelegt. Darüber hinaus haben wir zwei Strategien verwendet, um die Informationen ausgewählter ROIs eines Bildes in Modelle für maschinelles Lernen einzuspeisen: Der Mittelwert der Wellenlänge der ausgewählten ROIs oder alle Wellenlängen der ROIs wurden in jedes Modell eingegeben (d. h. RF, LR, NB usw.). XGBoost). Das Basismodell mit der höheren Leistung für die beiden oben genannten Strategien wurde gemeldet und mit unseren Deep-Learning-basierten Modellen verglichen.

Die oben genannte traditionelle Methode, die handgefertigte Merkmale erfordert, ist sehr zeitaufwändig und bei der Auswahl von ROIs und der Berechnung von Wellenlängen schwierig anzuwenden. Darüber hinaus ist dieser Prozess objektiv und es gehen Informationen verloren. Daher haben wir eine neue Methode vorgeschlagen, die auf Deep Learning ohne manuellen Vorverarbeitungsschritt basiert (Abb. 5). Die CNN-Architektur umfasste vier Faltungsschichten, wobei die Stapelgröße, die Anzahl der Epochen und die Lernrate auf 4, 100 bzw. 0,003 eingestellt waren. Das CNN wurde mit einem adaptiven Momentschätzungsoptimierer mit einer Aktivierungsfunktion für gleichgerichtete lineare Einheiten (ReLU) trainiert. Wir haben die Verlustfunktionen als Kreuzentropie definiert.

Das CNN-basierte Klassifizierungsrahmenwerk (VGG1626).

Zusätzlich zum CNN-basierten Netzwerk haben wir hier auch VGG1626 verwendet, um die Wachstumsjahre von PTRs zu identifizieren. VGG16 ist ein spezielles Faltungs-Neuronales Netzwerkmodell mit insgesamt 16 Schichten, darunter 13 Faltungsschichten und 3 vollständig verbundenen Schichten. Im Vergleich zu anderen Netzwerkmodellen verwendet VGG16 im gesamten Prozess einen einheitlichen 3 × 3-Faltungskern. Eine solch relativ kleine Kernelgröße trägt dazu bei, die Tiefe der Netzwerkstruktur zu erhöhen, und eine ausreichend große Anzahl von Parametern kann verwendet werden, um komplexere Muster zu lernen und bessere Klassifizierungseffekte zu erzielen.

Nachdem die Probeninformationen vom Hyperspektralgerät erfasst wurden, werden hyperspektrale Bildinformationen generiert. Ausgabe der Hyperspektralbilder von 108 und 288 Kanälen als einzelne RGB-Bilder. Die Funktion „Multibandread“ ist eine integrierte Funktion zum Lesen hyperspektraler Daten in der MATLAB-Software. In dieser Studie verwenden wir diese Funktion, um hyperspektrale Daten zu lesen und ein Einzelbandbild zu erhalten, das als PNG-Bild mit einer Bittiefe von 24 gespeichert wird. Anschließend wurden alle diese Bilder gemäß [B, C, H, W] (B: Stapelgröße, C: RGB-Dreikanal, H: Höhe, B: Breite).

Die hyperspektralen Bilder wurden zunächst entsprechend den Bändern in eine Liste zweidimensionaler Bilder unterteilt. Jede VNIR- und SWIR-Objektivdatei enthielt 108 und 288 Bänder. Somit wurde ein hyperspektrales Bild in 108 und 288 zweidimensionale Bilder aufgeteilt. Wir führten eine fünffache Kreuzvalidierung durch und teilten den Trainingssatz und den Testsatz für jedes Band (nicht nur 459,2 nm) im Verhältnis 7:3 auf. Die Wellenlänge von 459,2 nm ist ein hier vorgestelltes Beispiel. Beispielsweise wurden von den 120 Außenflächenbildern, die bei 459,2 nm basierend auf VNIR erstellt wurden (die entsprechende Wellenlänge betrug 459,2 nm), 83 (70 %) Bilder für das Training und 37 (30 %) Bilder für Testzwecke verwendet. Die Daten für die drei verschiedenen Wachstumsjahre enthielten 29, 27 und 27 Bilder im Trainingssatz und 13, 12 bzw. 12 Bilder im Testsatz (Tabelle 2). Grundlage für die Wellenlängenauswahl waren die Klassifizierungsergebnisse (d. h. F1-Score). In dieser Studie wurden die Wellenlängen ausgewählt, auf deren Grundlage Vorhersagemodelle eine hohe Leistung zeigten.

Wir haben diese Methoden auf einem Computer trainiert und getestet (Intel (R) Core (TM) i9-12900K CPU@3,19 GHz, GeForce RTX 3090, 64 GB RAM, Windows 11–64-Bit, Python 3.8, PyTorch). Während der fünffachen Kreuzvalidierung wurde das trainierte Modell auf die Testdaten angewendet, um die Modellleistung zu quantifizieren. Präzision, Rückruf und F1-Score wurden als Hauptmetriken zum Vergleich der Modellleistung in dieser Studie verwendet. Die Identifizierung des Wachstumsjahrs der PTRs war eine ternäre Klassifizierungsaufgabe, bei der wir den Makrodurchschnitt zur Berechnung der Präzision, des Rückrufs und des F1-Scores verwendeten.

Im Allgemeinen umfassten die Vorhersageergebnisse positive und negative Ergebnisse, und entsprechend der Beziehung zwischen den Vorhersageergebnissen und der Realität erhielten wir Kombinationen aus wahr positiv (TP), wahr negativ (TN), falsch positiv (FP) und falsch negativ ( FN). Präzision bezieht sich darauf, wie viele echte Positive in allen positiven Vorhersageergebnissen vorhanden sind, und Erinnerung bezieht sich darauf, wie viele echte Positive in den korrekten Vorhersageergebnissen enthalten sind. Präzision und Rückruf sind wie folgt definiert:

Der F1-Score wird mit Präzision (P) und Rückruf (R) berechnet. Je näher sein Wert bei 1 liegt, desto besser ist das Vorhersageergebnis. Der F1-Score ist wie folgt definiert:

Alle Pflanzenmaterialien im Manuskript wurden von der Puerariae Cultivation Demonstration Base gesammelt. Diese Basis hat eine langfristige Beziehung zu uns und wir haben die Erlaubnis, Puerariae Thomsonii Radix zu sammeln. Darüber hinaus versprechen wir, dass alle Eingriffe gemäß den einschlägigen Richtlinien durchgeführt wurden.

Der Trainingsverlust von CNN und VGG16 nahm im Frühstadium allmählich ab und blieb mit zunehmender Anzahl der Trainingsepochen stabil (Abb. 6), was darauf hinweist, dass die Modelle vollständig trainiert waren. Am Ende des 100-Epochen-Trainings erreichten wir einen Kreuzentropieverlust von 0,2801 bzw. 0,4505 für CNN und VGG16. Anschließend wurden die vollständig trainierten CNN- und VGG16-Werte mithilfe eines Testsatzes geschätzt. Tabelle 3 zeigt die höchste Vorhersageleistung eines Modells, das auf Bildern von 108 Bändern (VNIR-Objektiv) und 288 Bändern (SWIR-Objektiv) trainiert wurde.

Die Verlustfunktionen von (a) CNN und (b) VGG16.

In Tabelle 2 haben wir ein Band als Beispiel genommen, um die Stichprobengröße darzustellen. Jede Gruppe in dieser Studie hatte die gleiche Stichprobengröße. Das Ergebnis des Modells (von den 108/288 erstellten Modellen basierend auf 108/288 Bändern) mit der höchsten Leistung ist in Tabelle 3 dargestellt. Unter der VNIR-Linse schnitt das CNN mit dem F1-Score von 90,15 % basierend auf am besten ab Der Außenflächendatensatz. Unter der SWIR-Linse schnitt VGG16 mit einem F1-Score von 84,80 % basierend auf dem Außenflächendatensatz am besten ab. Unter den herkömmlichen Methoden erreichte die NB + MSC-Kombination den höchsten F1-Score von 65,17 %, trainiert am Außenflächendatensatz unter der VNIR-Linse. Im Vergleich dazu betrugen die höchsten F1-Werte der Deep-Learning-Methoden für die Außenfläche und den Querschnitt 90,15 % für CNN und 69,93 % für VGG16, beide mit der VNIR-Linse. Bemerkenswert ist, dass der Wert von 90,15 %, der mit der Kombination CNN + Außenfläche + VNIR erreicht wurde, auch der beste F1-Score von allen war und die Verbesserung der Unterscheidungsgenauigkeit 38,33 % im Vergleich zu dem Wert betrug, der mit den herkömmlichen Methoden erreicht wurde.

Merkmale sind der Schlüssel zum Lernen herkömmlicher Modelle für maschinelles Lernen. Bei der ROI-Auswahl kann es zu einer geringen Anzahl von Merkmalen und einem hohen Maß an Informationsverlust kommen. Alle diese Faktoren wirken sich auf die Identifizierungsergebnisse aus. Im Gegensatz dazu verfügt Deep Learning über die Fähigkeit des End-to-End-Lernens, wodurch Voreingenommenheit wirksam reduziert und somit die Genauigkeit verbessert werden kann. Die Ergebnisse zeigen, dass es möglich ist, ein Deep-Learning-basiertes Modell zu etablieren, um unterschiedliche Wachstumsjahre von PTRs zu identifizieren, insbesondere basierend auf Außenflächen unter einer VNIR-Linse.

Anschließend haben wir CNN und VGG16 verwendet, die bei der ternären Klassifizierungsaufgabe am besten abgeschnitten haben, um zu ermitteln, ob ein PTR in der traditionellen chinesischen Medizin verwendet werden kann (d. h. ob ein PTR 1 Jahr alt war oder nicht). Wie in Tabelle 4 gezeigt, erreichten die F1-Werte von CNN und VGG16, basierend auf dem Querschnittsdatensatz unter der VNIR-Linse, jeweils über 88 %. Basierend auf dem Außenflächendatensatz erreichten die F1-Werte von CNN und VGG16 93,51 % und 92,90 %. Dieses Ergebnis zeigt die Machbarkeit der Qualitätskontrolle für PTRs mithilfe von Deep-Learning-Algorithmen. Es wird darauf hingewiesen, dass in Tabelle 4 lediglich die höchste Vorhersageleistung eines Modells dargestellt ist, das auf Bildern von 108 Bändern (VNIR-Linse) oder 288 Bändern (SWIR-Linse) trainiert wurde.

Darüber hinaus stellten wir fest, dass die Leistung von Modellen, die auf den Außenflächen basieren, höher und robuster war als die von Modellen, die auf Querschnittsbildern basieren. Der höchste F1-Score erreichte 93,51 %, wenn Wachstumsjahre anhand der Außenfläche identifiziert wurden, während der beste F1-Score 88,60 % basierend auf Querschnittsbildern betrug. Dieses Ergebnis zeigte, dass die Wachstumsjahre von PTRs mithilfe des HSI-Systems auf Außenflächen identifiziert werden können, ohne Proben zu zerstören.

In früheren Untersuchungen zur Identifizierung von Alter oder Jahren verwendeten Duan et al.27 sechs Modelle zur Identifizierung des Alters von Baumwollsamen, wobei CNN- und SVM-Modelle zufriedenstellende Ergebnisse erzielten und die Identifizierungsgenauigkeit über 98 % lag. Wang et al.28 schlugen eine Identifizierungsmethode zur Identifizierung der geografischen Herkunft und der Wachstumsjahre von Maissamen basierend auf dem PLSDA-Modell vor. Die Genauigkeit des Testsatzes erreichte 98,39 %. Bao et al.29 erstellten ein nichtlineares ELM-Modell, das auf effektiven Wellenlängen basiert, um die verschiedenen Produktionsjahre getrockneter Mandarinenschalen zu klassifizieren und eine Genauigkeit von 93,33 % zu erreichen. Es ist ersichtlich, dass die HSI-Technologie bei der Identifizierung von Wachstumsjahren wirksam ist, und die Ergebnisse dieser Studie stimmen mit anderen Forschungsergebnissen überein. Im Bereich der Qualitätskontrolle der traditionellen chinesischen Medizin wurden auf HSI basierende Modelle in Kombination mit Deep-Learning-Algorithmen auf die Klassifizierung und Komponentenforschung angewendet, was hervorragende Ergebnisse erzielte30,31. Dank der herausragenden Leistungen der Deep-Learning-Algorithmen in Verbindung mit HSI gelang es ihnen, die Wachstumsjahre von PTRs erfolgreich zu identifizieren. In der zukünftigen HSI-Forschung könnten wir versuchen, Deep Learning auf andere Aspekte der PTR-Qualitätskontrolle anzuwenden.

Vollwellenlängendaten enthalten eine große Menge redundanter Informationen. Eines der Ziele dieser Forschung bestand darin, die Wellenlänge zu finden, anhand derer die Deep-Learning-basierten Modelle PTRs mit hoher Leistung identifizierten. Dann könnte diese ausgewählte Wellenlänge in der zukünftigen HSI-Technologie verwendet werden, um Schnellidentifikationsgeräte für PTR zu entwickeln.

Die auf Bildern im CNN und VGG16 basierenden Bänder, die einen F1-Score von mehr als 90 % zeigten, wurden alle herausgefiltert. In der binären Klassifizierungsaufgabe, die identifizierte, ob ein PTR ein Jahr alt war oder nicht, zeigten die CNN- und VGG16-Modelle gleichzeitig F1-Werte von mehr als 90 %, basierend auf 48 Bändern unter der VNIR-Linse und 174 Bändern unter der SWIR-Linse. Die ausgewählten Bänder sind in Abb. 7 dargestellt. Diese ausgewählten Bänder können die zukünftige Identifizierung von Wachstumsjahren von PTRs basierend auf dem HSI-System leiten.

Die Bänder mit F1-Werten über 90 %, bezogen auf die Außenfläche. (a) Die ausgewählten Bänder der binären Klassifizierungsaufgabe unter VNIR-Linse; (b) die ausgewählten Bänder der binären Klassifizierungsaufgabe unter Verwendung einer SWIR-Linse. Insgesamt wurden 48 bzw. 174 Bänder unter VNIR- bzw. SWIR-Objektiven ausgewählt.

Bei den effektiven Wellenlängen 540, 605, 1450 und 2371 nm entsprechen sie den charakteristischen Absorptionsbanden der funktionellen Gruppen der Stärke. Unter diesen entsprachen die Wellenlängen bei 540 nm und 605 nm dem vierten und fünften Obertonbereich von -O–H aus Stärke30. Die Wellenlänge bei 1450 nm entsprach dem Spektrum der ersten Oktave der Grundfrequenz der Streckschwingung von –O–H aus Stärke32. Die Wellenlänge bei 2371 nm entsprach der zweiten Obertonkombination –C–H und der Obertonkombination –CH2 mit Deformationsschwingung von Amylose30. Es wurde festgestellt, dass sich während des Wachstums von PTR die chemische Zusammensetzung von Jahr zu Jahr ansammelte und der Gehalt stark schwankte, insbesondere in den ersten Jahren. In Verbindung mit der chemischen Zusammensetzung, die den effektiven Wellenlängen entspricht, ist es wahrscheinlich, dass Stärke die wichtigste chemische Komponente bei der Identifizierung der Wachstumsjahre von PTRs ist.

Im Vergleich zu den Vorhersageergebnissen des Querschnitts ist die Genauigkeit der Außenfläche offensichtlich höher und relativ stabil. Dies kann mit der Anreicherung chemischer Komponenten während des Wachstums von PTR zusammenhängen. Mit zunehmender Wachstumszeit bildet sich eine spindelförmige Wurzel, die in der Mitte dick und an beiden Enden dünn ist. Dies ist das Speicherorgan der Pueraria-Wurzel, die einen essbaren und medizinischen Wert hat. Ähnlich wie bei anderen Pflanzen derselben Gattung besteht die anatomische Querschnittsstruktur von PTR hauptsächlich aus Periderm, mehrschichtigem Gefäßgewebe und sekundärem Xylem von außen nach innen. Jede Gefäßgewebeschicht enthält Phloem und Xylem, und je dicker die Stelle, desto mehr Es gibt noch mehr Schichten. Die Forscher33,34 bestätigten, dass das Periderm und das äußerste Phloem die Hauptansammlungsorte für Chemikalien, insbesondere Flavonoide, waren und der Gehalt von der äußeren Schicht zur inneren Schicht allmählich abnimmt. Wenn das Spektrum die Probe bestrahlt, kann es nicht nur die Informationen auf der Probenoberfläche sammeln, sondern auch in eine bestimmte Tiefe eindringen, um die Informationen im Inneren der Probe zu sammeln. Aus diesem Grund kann die hyperspektrale Bildgebung für die zerstörungsfreie Prüfung eingesetzt werden. Bei den Experimenten zur Eindringtiefe von nIR-Spektren verschiedener landwirtschaftlicher Produkte stellten die Forscher fest, dass die maximale Eindringtiefe von nIR-Spektren landwirtschaftlicher Produkte etwa 2 cm betrug24,35, was mit den Hauptanreicherungsstellen chemischer Komponenten von PTR übereinstimmt. Daher kann die HSI-Technologie zur Identifizierung der Wachstumsjahre von PTR nur durch das Sammeln von Oberflächeninformationen von Proben verwendet werden, ohne dass Proben überhaupt zerstört werden.

In dieser Studie haben wir eine Deep-Learning-basierte Methode in Verbindung mit HSI-Technologie verwendet, um Wachstumsjahre von PTR zu identifizieren. Die VNIR- und SWIR-Linsen von HSI-Geräten wurden verwendet, um Informationen über die Außenfläche und den Querschnitt des PTR zu sammeln. Das CNN-Modell erreichte die höchste Erkennungsgenauigkeit von 90,15 % bzw. 93,51 % sowohl für die ternäre Klassifizierungsaufgabe mit unterschiedlichen Wachstumsjahren als auch für die binäre Klassifizierungsaufgabe „ob ein PTR in der traditionellen chinesischen Medizin verwendet werden könnte“. Darüber hinaus war die Genauigkeit der Außenfläche im Allgemeinen höher als die des Querschnitts, was möglicherweise mit dem Ort der Ansammlung chemischer Zusammensetzungen während des Wachstums von PTR zusammenhängt. Die Ergebnisse zeigten, dass die vorgeschlagene Methode zerstörungsfrei, schnell und effektiv für die Qualitätskontrolle von PTR ist. Darüber hinaus kann diese Methode problemlos zur Identifizierung von Wachstumsjahren und zur Qualitätskontrolle für andere traditionelle chinesische Arzneimittel eingesetzt werden.

Alle während dieser Studie generierten oder analysierten Daten sind in diesem veröffentlichten Artikel enthalten.

Pueraria Thomsonius-Wurzel

Pueraria Thomsonii Benth

Hyperspektrale Bildgebung

Multiplikative Streukorrektur

Standardnormalvariable

Savitzky-Golay-Glättung

Zufälliger Wald

Logistische Regression

Naive Bayes

EXtrem-Steigungsschub

Faltungs-Neuronale Netze

Visuelles Geometrie-Gruppennetzwerk 16

Interessante Regionen

Hochleistungsflüssigkeitschromatographie

Sichtbare und nahinfrarote Linse

Kurzwellen-Infrarotlinse

Shuang, J., Yanxing, H., Jiandong, J. & Yuhong, W. Die antiatherosklerotische Wirkung und der Mechanismus von Puerarin. Acta Pharm. Sünde. 56(04), 966–971 (2021).

Google Scholar

Xiangwei, Z., Qian, F., Yingying, Z., Fengming, Z. & Xiuqin, Z. Der Forschungsfortschritt bei der Behandlung von Myokardfibrose durch Regulierung des TGF-β1/Smads-Signalwegs. Kinn. Pharmakol. Stier. 34(01), 8–11 (2018).

Google Scholar

Hui, G., Ting, T., Hang, Y. & Zhijun, L. Aufhellende Wirkung von Flavonoidmaterialien in Radix puerariae. China Tensidwaschmittel. Kosmetik. 43(04), 290–293 (2013).

Google Scholar

Yan, F. & Jun, P. Kudzuvine-Wurzel der chinesischen Kräutermedizin in der modernen Schönheitsanwendung, Forschungsfortschritt. Kinn. J. Aesthet. Med. 21(17), 2311–2312 (2012).

Google Scholar

Yuan, Y., Yongqiang, G., Tiejun, C., Zhe, W., Meizi, P. Vergleich der leberschützenden Wirkung der wilden Kudzu-Wurzel (Pueraria lobata Ohwi) und der kultivierten Kudzu-Wurzel bei Mäusen mit chronischem Alkoholismus. Lebensmittelwissenschaft. http://kns.cnki.net/kcms/detail/11.2206.TS.20220110.1042.013.html.

Kingsley, CD et al. Antidiabetische Wirkung von Isoflavon-reichem Kudzu-Wurzelextrakt bei experimentell induzierten diabetischen Ratten. J. Funktion. Lebensmittel. 68(C), 103922 (2020).

Google Scholar

Huijiang, J. Med. Pharm. Kinn. Minderheit. 15(07), 45 (2009).

Google Scholar

Xiaoke, H. et al. Studie zu den Unterschieden der HPLC-charakteristischen Spektren zwischen Puerariae Lobatae Radix und Puerariae thomsonii radix. J. Chin. Med. Mater. 43(11), 2724–2728 (2020).

Google Scholar

Jinhua, W. & Zhongqing, Y. Studien zu chromatographischen Fingerabdrücken von Pueraria lobata und Pueraria thomsonii. Herald Med. 32(04), 525–529 (2013).

Google Scholar

Wenjun, Y. et al. Fusion von Spektrum und Bildmerkmalen zur Identifizierung von Glycyrrhizae Radix et Rhizoma unterschiedlicher Herkunft auf Basis hyperspektraler Bildgebungstechnologie. China J. Chin. Mater. Med. 46(04), 923–930 (2021).

Google Scholar

Zhengyan, Int. J. Anal. Chem. 2017, 1–11 (2017).

Google Scholar

Lu, Z. et al. Identifizierung von Ziziphi Spinosae-Sperma aus verschiedenen Lebensräumen basierend auf hyperspektraler Nahinfrarot-Bildgebungstechnologie und Wassereinzugsgebietsalgorithmus. Kinn. J. Pharm. Anal. 41(04), 726–734 (2021).

Google Scholar

Chenlei, R., Zhenhao, L. & Renzhong, T. Ein hyperspektraler Bildgebungsansatz zur Klassifizierung der geografischen Herkunft von Rhizoma Atractylodis Macrocephalae unter Verwendung der Fusion von Spektrumbildern im VNIR- und SWIR-Bereich (VNIR-SWIR-FuSI). Sensoren. 19(9), 2045 (2019).

Artikel Google Scholar

Jie, Z. et al. Identifizierung von Armeniacae-Samen Amarum und Persicae-Samen unterschiedlicher Herkunft auf der Grundlage der Nahinfrarot-Hyperspektralbildgebungstechnologie. China J. Chin. Mater. Med. 46(10), 2571–2577 (2021).

Google Scholar

Jiehong, C. & Zhengguang, C. Schnelle Identifizierung der Herkunft von Weihrauch basierend auf hyperspektralen Daten. J. Heilongjiang Bayi Agric. Univ. 33(04), 93–98 (2021).

Google Scholar

Ying W. et al. Pathologische Bildklassifizierung basierend auf harten Beispielen von CNN. IEEE-Zugriff. PP(99) (2020).

Padarian, J., Minasny, B. & McBratney, AB Verwenden von Deep Learning zur Vorhersage von Bodeneigenschaften aus regionalen Spektraldaten. Geoderma Reg. 16, e00198 (2018).

Artikel Google Scholar

Tao, L., Yuqin, Z. & Mingliang, Q. Methode zur Erkennung neuronaler Netzwerkmuster der Sorte Rhodiola basierend auf hyperspektraler Bildgebungstechnologie. J. Sichuan-Norm. Univ. Nat. Wissenschaft. 44(04), 546–554 (2021).

Google Scholar

Bo, L. et al. Anwendung der hyperspektralen Bildgebung zur zerstörungsfreien Messung von Pflaumenqualitätsmerkmalen. Nachernte Biol. Technol. 141, 8–15 (2018).

Artikel Google Scholar

Xiaozhong, S., Yu, H., Weiwei, S., Xinghai, C. & Suixu, C. Studie zur schnellen Identifizierung von Pummelo Peel basierend auf hyperspektralen Bildern. Lishizhen Med. Mater. Med. Res. 30(06), 1391–1396 (2019).

Google Scholar

Geladi, P., MacDougall, D. & Martens, H. Linearisierung und Streukorrektur für Nahinfrarot-Reflexionsspektren von Fleisch. Appl. Spectrosc. 39(3), 491–500 (1985).

Artikel ADS Google Scholar

Yanwu, C. et al. Verbesserung der Genauigkeit und Stabilität bei der Identifizierung von Fleischarten durch multiplikative Streukorrektur und laserinduzierte Zerfallsspektroskopie. Opt. Äußern. 26(8), 10119 (2018).

Artikel Google Scholar

Yiming, B. et al. Eine lokale Vorverarbeitungsmethode für Nahinfrarotspektren, kombiniert mit spektraler Segmentierung und standardmäßiger normaler Variablentransformation. Anal. Chim. Acta. 909, 30–40 (2016).

Artikel ADS Google Scholar

Mei, Y. et al. Identifizierung verschiedener Ursprünge von Citri Reticulatae Pericarpium mittels Nahinfrarotspektroskopie in Kombination mit optimierten spektralen Vorbehandlungen. J. Instrument. Anal. 40(01), 65–71 (2021).

Google Scholar

Wubin, H. Schnellbestimmungsmethoden und -geräte, die für Feldbodeneigenschaften mithilfe der Spektroskopie im sichtbaren Nahinfrarotbereich entwickelt wurden (Zhejiang-Universität, 2020).

Karen, S., Andrew, Z. Sehr tiefe Faltungsnetzwerke für die Bilderkennung im großen Maßstab. AdR. abs/1409.1556 (2014).

Long, D. et al. Kombinieren Sie hyperspektrale Bildgebung und maschinelles Lernen, um das Alter von Baumwollsamen zu bestimmen. Spectrosc. Spektraler Analsex. 41(12), 3857–3863 (2021).

Google Scholar

Qingguo, W., Min, H., Qibing, Z. & Qun, S. Geografische Herkunft und Jahre, Identifizierung von Maissamen basierend auf dem Hyperspektralbild. J. Lebensmittelwissenschaft. Biotechnologie. 33(02), 163–170 (2014).

Google Scholar

Yidan, B., Yangyang, L., Hongyan, Z., Yanru, Z. & Yong, H. Identifizierung und Klassifizierung verschiedener Produktionsjahre getrockneter Mandarinen mithilfe der Hyperspektraltechnik mit chemometrischen Modellen. Spectrosc. Spectr. Anal. 37(6), 1866–1871 (2017).

Google Scholar

Youyou, W. et al. Die Anwendung hyperspektraler Bildgebung unterstützte integrierte Deep-Learning-Ansätze bei der Identifizierung geografischer Herkunft und der Vorhersage des Nährstoffgehalts von Coix-Samen. Lebensmittelchem. 404(PA), 134503 (2023).

Google Scholar

Chu, Z. et al. Entwicklung von Deep-Learning-basierten Regressionsansätzen zur Bestimmung der chemischen Zusammensetzung in trockenen schwarzen Goji-Beeren (Lycium ruthenicum Murr.) mithilfe von hyperspektraler Nahinfrarot-Bildgebung. Lebensmittelchem. 319, 126536 (2020) (Vorveröffentlichung).

Artikel Google Scholar

Workman, J., Weyer, L. Praktischer Leitfaden zur interpretierenden Nahinfrarotspektroskopie. 222 (Chemical Industry Press, 2009).

Zhenguo, W. & Bingqun, C. Studie zu Extraktionsbedingungen und Stabilität der Gesamtflavone aus frischen Puerariae-Radixschalen. Lebensmittelwissenschaft. Technol. 34(6), 210–213 (2009).

Google Scholar

Haiyan, D. Studie zur mikroskopischen Anatomie abnormaler Struktur in Wurzelknollen und zur Ansammlung von Isoflavonoiden von Pueraria lobata. (Anhui Universität für Chinesische Medizin, 2016).

Xinxin, Z. et al. Studien zur Durchdringungsfähigkeit von diffusem Nahinfrarotlicht auf Früchten. J . Kinn. Inst. Lebensmittelwissenschaft. Technol. 22(1), 298–305 (2022).

Referenzen herunterladen

Diese Studie wurde von der Science Research Foundation von SINOMACH [Grant No. ZDZX2022-2] und dem National Key Research and Development Program of China [Grant No. 2017YFC1702901] unterstützt.

Wissenschaftliche Forschungsstiftung von SINOMACH, ZDZX2022-2, Xiaobin Zhang. National Key Research and Development Program of China, 2017YFC1702901, Yuping Zhao.

China Academy of Chinese Medical Sciences, No.16, Nanxiao Street, Dongzhimen, Dongcheng District, Peking, 100700, Volksrepublik China

Lei Zhang, Yan Zhang und Yuping Zhao

School of Pharmacy, Jiangxi University of Chinese Medicine, Nanchang, 300004, Volksrepublik China

Lei Zhang, Fei Ge und Yuping Zhao

GAP Center, Heilongjiang University of Chinese Medicine, Harbin, 150040, Volksrepublik China

Yu Guan

School of Materials Science and Engineering, Zhejiang University, No.866, Yuhangtang, Xihu District, Hangzhou, 310058, Volksrepublik China

Das ist Wang

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

LZ und YZ sammeln Proben, LZ, YPZ und FG erfassen hyperspektrale Bilder und organisieren Daten, NW erstellt Identifikationsmodelle. LZ, YG und NW schreiben Manuskripte und zeichnen die Bilder.

Korrespondenz mit Ni Wang oder Yuping Zhao.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Zhang, L., Guan, Y., Wang, N. et al. Identifizierung der Wachstumsjahre für Puerariae Thomsonii Radix basierend auf hyperspektraler Bildgebungstechnologie und Deep-Learning-Algorithmus. Sci Rep 13, 14286 (2023). https://doi.org/10.1038/s41598-023-40863-6

Zitat herunterladen

Eingegangen: 11. Oktober 2022

Angenommen: 17. August 2023

Veröffentlicht: 31. August 2023

DOI: https://doi.org/10.1038/s41598-023-40863-6

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.