Εκτίμηση περιεχομένου και σκληρότητας σε διαλυτά στερεά ντομάτας και εικόνες βαθιάς μάθησης και υπερφασματικών εικόνων
- 1 Institute of Cyberspace Security, Zhejiang University of Technology, Hangzhou, Κίνα
- 2 Institute of Vegetables, Zhejiang Academy of Agricultural Sciences, Hangzhou, Κίνα
Το ντοματίνι (Solanum lycopersicum) είναι δημοφιλές στους καταναλωτές σε όλο τον κόσμο λόγω της ιδιαίτερης γεύσης του. Η περιεκτικότητα σε διαλυτά στερεά (SSC) και η σταθερότητα είναι δύο βασικές μετρήσεις για την αξιολόγηση των ιδιοτήτων του προϊόντος. Σε αυτήν την εργασία, αναπτύσσουμε μη καταστροφικές τεχνικές δοκιμών για το SSC και τη σφριγηλότητα των φρούτων με βάση υπερφασματικές εικόνες και το αντίστοιχο μοντέλο παλινδρόμησης βαθιάς μάθησης. Οι εικόνες υπερφασματικής ανάκλασης περισσότερων από 200 καρπών τομάτας προέρχονται με το φάσμα που κυμαίνεται από 400 έως 1.000 nm. Οι ληφθείσες υπερφασματικές εικόνες διορθώνονται και οι φασματικές πληροφορίες εξάγονται. Ένα νέο μονοδιάστατο (1D) συνελικτικό ResNet (Con1dResNet) μοντέλο παλινδρόμησης προτείνεται και συγκρίνεται με τις σύγχρονες τεχνικές. Τα πειραματικά αποτελέσματα δείχνουν ότι, με σχετικά μεγάλο αριθμό δειγμάτων, η τεχνική μας είναι 26. 4% καλύτερη από την τεχνική τελευταίας τεχνολογίας για SSC και 33,7% για σταθερότητα. Τα αποτελέσματα αυτής της μελέτης υποδεικνύουν τη δυνατότητα εφαρμογής της τεχνικής υπερφασματικής απεικόνισης στο SSC και την ανίχνευση σκληρότητας, η οποία παρέχει μια νέα επιλογή για μη καταστροφική δοκιμή της ποιότητας των καρπών ντομάτας στο μέλλον.
1. Εισαγωγή
Η ντομάτα είναι ένα πολύ δημοφιλές φρούτο παγκοσμίως και η ετήσια παραγωγή της φτάνει τους 186,82 εκατομμύρια τόνους το 2020 (FAO, 2021). Οι ντομάτες περιέχουν πλούσια θρεπτικά συστατικά όπως λυκοπένιο, β-καροτίνη και βιταμίνες (Sainju et al., 2003; Gao et al., 2020) κ.λπ. Για να διευκολυνθεί η παραγωγή, η επεξεργασία και η εμπορία της τομάτας, πρέπει να αξιολογηθεί ο βαθμός και η ωριμότητά της. Γενικά, τα διαλυτά στερεά και η σταθερότητα είναι δύο βασικοί δείκτες (Beckles, 2012). Το SSC μπορεί να χρησιμοποιηθεί για την ταξινόμηση της ποιότητας της τομάτας και η σκληρότητα μπορεί να χρησιμοποιηθεί για τον προσδιορισμό της ωριμότητας των καρπών (Peng and Lu, 2008). Οι υπάρχουσες τεχνικές μέτρησης που βασίζονται σε αντιδράσεις χημείας μπορούν να εξαγάγουν την τιμή SSC με ακρίβεια. Ωστόσο, οι καταστροφικές μέθοδοι δεν μπορούν να εφαρμοστούν σε μετρήσεις μεγάλου όγκου. Επιπλέον, υπάρχουν σημαντικές παραλλαγές έτσι ώστε η δειγματοληψία να μπορεί να είναι αναποτελεσματική και ανακριβής (Li et al., 2013). Επομένως,
Η φασματοσκοπία είναι μια ευρέως χρησιμοποιούμενη μη καταστροφική μέθοδος δοκιμών για την επιθεώρηση φρούτων. Περιλαμβάνει διάφορες τεχνικές απεικόνισης, όπως ορατή, εγγύς υπέρυθρη, φασματοσκοπία terahertz, φασματοσκοπία Rama, και υπερφασματική απεικόνιση κ.λπ. Η φασματοσκοπία ορατής και σχεδόν υπέρυθρης ακτινοβολίας είναι γρήγορη, βολική και χαμηλού κόστους. Ωστόσο, περιορίζονται από περιορισμένη φασματική ζώνη (Yin et al., 2019). Η ακτινοβολία Terahertz (THz) έχει ιδιότητες μικροκυμάτων και υπέρυθρων και είναι σε θέση να διεισδύσει και να αλληλεπιδράσει με πολλά κοινά υλικά, ο εξοπλισμός της είναι πολύ ακριβός (Afsah-Hejri et al., 2019). Η φασματοσκοπία Raman είναι εύκολη στη χρήση, γρήγορη μέτρηση και περιέχει πλούσιες πληροφορίες. Ωστόσο, η απόδοσή του είναι κατώτερη όσον αφορά τη σταθερότητα και την ευαισθησία (Weng et al., 2019). Η τεχνολογία υπερφασματικής απεικόνισης μπορεί ταυτόχρονα να ανιχνεύσει τις δισδιάστατες χωρικές πληροφορίες και τις 1D φασματικές πληροφορίες, επομένως συνδυάζει εικόνα και φασματικά χαρακτηριστικά (Adão et al., 2017). Μπορεί να αντλήσει τις συνολικές χωρικές φασματικές πληροφορίες της ντομάτας και έτσι επιλέγεται ως μέθοδος απεικόνισης.
Η υπερφασματική απεικόνιση έχει χρησιμοποιηθεί ευρέως για μη καταστροφικές δοκιμές σε διάφορους τομείς, όπως η ανίχνευση του στρες των φυτικών ασθενειών (Lowe et al., 2017), η βιομηχανική συσκευασία τροφίμων (Medus et al., 2021), η ταξινόμηση ιατρικών εικόνων (Jeyaraj and Nadar , 2019) και κηπευτικών προϊόντων (Huang et al., 2017). Οι υπερφασματικές εικόνες είναι επίσης αποτελεσματικές για ποιοτική ανάλυση φρούτων. Rahman et al. (2017) χρησιμοποιούν υπερφασματική απεικόνιση για να εκτιμήσουν μετρήσεις όπως η περιεκτικότητα σε νερό και οι μετρήσεις του PH. Οι Zhou et al. (2020) το χρησιμοποιούν για να ταξινομήσουν τους σπόρους αραβοσίτου. Fan et al. (2015) το χρησιμοποιούν για να προβλέψουν το SSC και τη σταθερότητα στα αχλάδια. Συνδυάζουν την ανταγωνιστική προσαρμοστική επανασταθμισμένη δειγματοληψία και τον αλγόριθμο διαδοχικής προβολής για την επιλογή των μεταβλητών όπως στην παλινδρόμηση μερικών ελαχίστων τετραγώνων (PLSR). Rahman et al. (2018) ταιριάζει γλυκύτητα και σφριγηλότητα ντομάτας. Lu et al. (2017) κάνει μια επισκόπηση της εφαρμογής των πρόσφατων υπερφασματικών τεχνικών. Επομένως, οι τεχνικές υπερφασματικής απεικόνισης μπορούν να μετρήσουν ή να ταξινομήσουν αποτελεσματικά τα φρούτα και τα λαχανικά.
Οι υπάρχουσες τεχνικές φασματικής ανάλυσης απαιτούν συνήθως ένα μοντέλο παλινδρόμησης για να ταιριάζει στα φασματικά δεδομένα (Jiang and Chen, 2015), τα οποία έχουν χρησιμοποιηθεί ευρέως σε τομείς όπως τα τρόφιμα, τα πετροχημικά και τα φαρμακευτικά πεδία (Chen et al., 2018). Γενικά, χρησιμοποιούνται διάφοροι αλγόριθμοι που βασίζονται στη μηχανική μάθηση για τη δημιουργία μοντέλων ταξινόμησης και παλινδρόμησης για υπερφασματικές εικόνες. Οι Li et al. (2016) χρησιμοποιούν το PLSR για να δημιουργήσουν ένα μοντέλο υπερφασματικής παλινδρόμησης για να προβλέψουν την κατάσταση του νερού των αμπελιών. Guo C. et al. (2016) ανέπτυξαν ένα μοντέλο SVM για την αξιολόγηση της ωριμότητας των φραουλών. Οι Abdulridha et al. (2019) συνδυάζουν υπερφασματική απεικόνιση και αλγόριθμο KNN για να διαφοροποιήσουν τα φρούτα που έχουν μολυνθεί από έλκος. Οι Ji et al. (2019) χρησιμοποιήστε τον αλγόριθμο AdaBoost για να αναγνωρίσετε το ποσοστό ζημιάς της πατάτας.
Τα μοντέλα βαθιάς μάθησης, π.χ. συνελικτικό νευρωνικό δίκτυο (CNN), μπορούν να μάθουν χαρακτηριστικά αυτόματα από μεγάλο όγκο δεδομένων (Guo Y. et al., 2016). Χρησιμοποιείται ευρέως στους γιατρούς (Esteva et al., 2019), στη βιομηχανία (Hossain et al., 2018), στη γεωργία (Kamilaris and Prenafeta-Boldú, 2018), στην ανίχνευση αντικειμένων (Zou et al., 2019) και στην επεξεργασία σημάτων (Yu and Deng, 2010) κ.λπ. Αυτή η τεχνική χρησιμοποιείται επίσης στην κατασκευή μοντέλων διόρθωσης υπερφασμάτων για ταξινόμηση και πρόβλεψη. Paoletti et al. (2019) συνοψίζουν την εφαρμογή της βαθιάς μάθησης για την ταξινόμηση υπερφασματικών εικόνων και καταλήγουν στο συμπέρασμα ότι τα μοντέλα που βασίζονται στο CNN είναι γενικά πιο αποτελεσματικά λόγω της ικανότητάς τους να εξάγουν ιδιαίτερα διακριτικά χαρακτηριστικά και να αξιοποιούν τις χωρικές και φασματικές πληροφορίες. Qiu et al. (2018) καταδεικνύουν ότι το CNN υπερέχει άλλων μεθόδων μηχανικής μάθησης για την εφαρμογή αναγνώρισης ποικιλίας ρυζιού. Οι Kong et al. (2014) παρακολουθούν τη δραστηριότητα της υπεροξειδάσης σε υπερφασματικές εικόνες τομάτας χρησιμοποιώντας γενετικό αλγόριθμο και ακραία μηχανή εκμάθησης. Rahman et al. (2018) ανέπτυξαν ένα μοντέλο παλινδρόμησης σε υπερφασματικές εικόνες 1.000–1.550 nm χρησιμοποιώντας τη μέθοδο PLSR για την εκτίμηση της γλυκύτητας και της σταθερότητας με το R2 από 0,672 και 0,548, αντίστοιχα.
Σε αυτή την εργασία, προτείνουμε μια τεχνική βασισμένη σε βαθιά μάθηση και υπερφασματική απεικόνιση για την εκτίμηση των μετρήσεων μέσα στο ντοματίνι. Συγκεκριμένα, έχουμε κάνει τις ακόλουθες συνεισφορές.
1. Δείχνουμε την αποτελεσματικότητα των τεχνικών που βασίζονται σε βαθιά μάθηση και προτείνουμε ένα τέτοιο μοντέλο για την εκτίμηση του SSC και της σφριγηλότητας των φρούτων.
2. Εξερευνούμε την αντιστάθμιση μεταξύ του αριθμού δείγματος και της ακρίβειας του μοντέλου.
3. Συλλέγουμε δεδομένα πεδίου πραγματικού κόσμου και αξιολογούμε την απόδοση της τεχνικής μας.
Τα πειραματικά αποτελέσματα δείχνουν ότι η τεχνική μας είναι 26,4% καλύτερη από την τεχνική τελευταίας τεχνολογίας στην εκτίμηση SSC και 33,4% στην εκτίμηση σταθερότητας.
2. Υλικά και μέθοδοι
Σε αυτή την ενότητα, περιγράφουμε την προετοιμασία του δείγματος, τη λήψη υπερφασματικής εικόνας και τη βαθμονόμηση, και τις μετρήσεις αληθείας εδάφους για μεθόδους SSC και σταθερότητας. Συγκεκριμένα, αναπτύσσουμε το Con1dResNet, μια τεχνική εκτίμησης σταθερότητας και SSC που βασίζεται σε βαθιά μάθηση και υπερφασματική εικόνα. Εν τω μεταξύ, εισάγονται επίσης τέσσερις τεχνικές σύγκρισης βασικής γραμμής.
2.1. Η προετοιμασία των δειγμάτων
Το φυτό δείγμα είναι ένα τοπικό κύριο ντοματίνι (καλλιέργεια: Zheyingfen-1), το οποίο κυριαρχεί περισσότερο στην τοπική αγορά με μερίδιο 70%. Οι σπόροι φυτρώνουν πρώτα στο εργαστήριο με αυστηρό περιβαλλοντικό έλεγχο για ένα μήνα. Στη συνέχεια, τα σπορόφυτα μεταφυτεύονται στο θερμοκήπιο της ακαδημίας γεωργικών επιστημών Zhejiang, Hangzhou, Κίνα (ανατολικό γεωγραφικό μήκος 120°2′, βόρειο γεωγραφικό πλάτος 30°27′) στις 2 Απριλίου (αρχές άνοιξης), 2021. Η διαχείριση πεδίου υλοποιείται σύμφωνα με τυπικές εμπορικές διαδικασίες. Οι καρποί της ντομάτας συλλέγονται τον Ιούνιο του 2021. Συλλέγονται διακόσιοι πλήρως ώριμοι καρποί από 50 διαφορετικά φυτά για την απόκτηση υπερφασματικής εικόνας. Η σκληρότητα και η περιεκτικότητα σε διαλυτά στερεά κάθε φρούτου μετράται χρησιμοποιώντας φορητό ελεγκτή σκληρότητας και διαθλασίμετρο χειρός μετά τη λήψη εικόνας, αντίστοιχα.
2.1.1. Λήψη Υπερφασματικής Εικόνας
Χρησιμοποιείται σύστημα υπερφασματικής απεικόνισης για την εξαγωγή των καθαρών και μη θολών υπερφασματικών εικόνων όπως φαίνεται στο Σχήμα 1. Χρησιμοποιούμε μια υπερφασματική κάμερα push-broom (PIKA XC, Resonon Inc., Bozeman, MT, ΗΠΑ) τοποθετημένη 20 cm πάνω από τα δείγματα τομάτας. Οι υπερφασματικές εικόνες αποκτώνται με χωρική ανάλυση 50 pixel ανά mm 2κάτω από τεχνητό φωτισμό (τέσσερις λαμπτήρες 15 W 12 V με δύο σε κάθε πλευρά του φακού). Οι κύριες προδιαγραφές της υπερφασματικής κάμερας ήταν: διεπαφή, Firewire (IEEE 1394b), ψηφιακή έξοδος (14 bit) και γωνιακό οπτικό πεδίο 7°. Ο αντικειμενικός φακός είχε εστιακό μήκος 17 mm (μέγιστο διάφραγμα F1,4), βελτιστοποιημένο για το υπερφασματικό. Αποκτούμε δεδομένα ανάκλασης σε 462 φασματικές ζώνες από 386 έως 1.004 nm με φασματική ανάλυση 1,3 nm. Λόγω της κυρτής επιφάνειας των δειγμάτων, η ανομοιόμορφη ανάκλαση δημιουργεί μια τονισμένη περιοχή κοντά στον κατακόρυφο άξονα όπως φαίνεται στο Σχήμα 2Α. Έτσι, χρησιμοποιούμε το ENVI5.3 (ITT, Visual Information Solutions, Boulder, CO, USA) (Su et al., 2021) για να αποφύγουμε την περιοχή επισήμανσης και να εξαγάγουμε την τιμή ανάκλασης για κάθε ζώνη από την περιοχή ενδιαφέροντος (Xue, 2010 Fu et al., 2021, Σχήμα 2Β). Τα επεξεργασμένα δείγματα ντομάτας και οι αντίστοιχες υπερφασματικές εικόνες χωρίζονται σε σετ εκπαίδευσης, σετ επικύρωσης και σετ δοκιμής με αναλογία 7:1:2, αντίστοιχα. Χρησιμοποιούμε ποικίλο μέγεθος δεδομένων, με ένα μικρό σύνολο 50 δειγμάτων και ένα μεγάλο σύνολο 200 δειγμάτων.
Εικόνα 1 . Σχηματική απεικόνιση του συστήματος υπερφασματικής απεικόνισης για τη λήψη εικόνων φασματικής σκέδασης από ντοματίνια.
Εικόνα 2. (Α) αρχική υπερφασματική εικόνα ENVI. (Β) Χάρτης περιοχής του ROI που αποκτήθηκε από την ENVI.
2.1.2. Βαθμονόμηση Υπερφασματικής Εικόνας
Στη βαθμονόμηση ανάκλασης, η λαμβανόμενη υπερφασματική εικόνα πρέπει να βαθμονομηθεί για τη φασματική απόκριση φόντου του οργάνου και το θερμικό σκοτεινό ρεύμα της κάμερας. Τα φασματικά δεδομένα που συλλέγονται από τη συσκευή CCD περιέχουν μόνο την τιμή της έντασης του σήματος του ανιχνευτή (Elmasry et al., 2012). Επομένως, απαιτείται η μετατροπή των ακατέργαστων δεδομένων σε τιμές ανακλαστικότητας ή απορροφητικότητας συγκρίνοντας με τα φάσματα των τυπικών ουσιών αναφοράς (Burger and Geladi, 2005) όπως φαίνεται στο Σχήμα 3. Η ανακλαστικότητα μπορεί να εξαχθεί χρησιμοποιώντας την ακόλουθη εξίσωση.
Rc=Rori-RdarkRwhite-Rdark,
όπου Rc είναι η διορθωμένη υπερφασματική ανάκλαση, Rori είναι η αρχική τιμή ανάκλασης που εξάγεται από το ENVI5.3, Rdark είναι η τιμή ανάκλασης υπερφασματικής εικόνας σκοτεινού περιβάλλοντος, η οποία αποκτάται χρησιμοποιώντας ένα αδιαφανές κάλυμμα φακού που καλύπτει τον υπερφασματικό φακό και Rwhite είναι η τιμή ανάκλασης του ένα κομμάτι λευκό τεφλόν (100% ανάκλαση, K-Mac Plastics, MI, ΗΠΑ).
Εικόνα 3 . Σχηματικό διάγραμμα της δομής και των δεδομένων της διορθωμένης υπερφασματικής εικόνας: χωρικός άξονας x, y και ζώνες κύματος.
2.1.3. Βασική Μέτρηση
Η βασική σταθερότητα και το SSC των ντοματίνων μετρώνται στο εργαστήριο. Για τη μέτρηση της σκληρότητας, τα ντοματίνια στερεώνονται σε φορητό εξοπλισμό μέτρησης σκληρότητας (GY-4, Zhejiang Top Cloud-Agri Technology Co., Ltd, China). Ο εξοπλισμός είναι μηδενικός. Ξεκινώντας από την επαφή του ανιχνευτή με την επιφάνεια ντομάτας, η πίεση 10 mm προς τα κάτω θεωρείται ως τιμή σκληρότητας.
Οι μετρήσεις SSC ακολουθούν τις μετρήσεις σταθερότητας. Τα ντοματίνια κόβονται κατά μήκος του κάθετου άξονα και τυλίγονται χρησιμοποιώντας μια γάζα. Στη συνέχεια πιέζονται με το χέρι για να εξαναγκαστεί να βγει το διάλυμα. Περίπου ένα χιλιοστόλιτρο διάλυμα ντομάτας τοποθετείται στο πρίσμα ενός φορητού ψηφιακού διαθλασίμετρου (PAL-1, ATAGO CHINA Guangzhou Co., Ltd, Κίνα) για να εξαχθούν οι μετρήσεις SSC βάσης. Κάθε διάλυμα δείγματος ντομάτας κερασιού μετράται τρεις φορές και υπολογίζεται ο μέσος όρος των αποτελεσμάτων για να μειωθεί η επίδραση τυχαίων περιβαλλοντικών γεγονότων.
2.2. Υπερφασματική Προεπεξεργασία
2.2.1. Διόρθωση πολλαπλής σκέδασης
Η διόρθωση πολλαπλής σκέδασης (MSC) είναι ένας ευρέως χρησιμοποιούμενος αλγόριθμος για την προεπεξεργασία υπερφασματικών δεδομένων (Zhang et al., 2012). Το MSC μπορεί να εξαλείψει αποτελεσματικά τις φασματικές διαφορές που οφείλονται στα διαφορετικά επίπεδα σκέδασης, ενισχύοντας έτσι τη συσχέτιση μεταξύ του φάσματος και των δεδομένων. Αυτή η μέθοδος μπορεί να διορθώσει τη μετατόπιση και τη λοξή γραμμή βάσης χρησιμοποιώντας ιδανικά φάσματα. Η συγκεκριμένη υλοποίηση έχει ως εξής:
1. Εκχωρήστε τον μέσο όρο όλων των υπερφασματικών δεδομένων ως «ιδανικό φάσμα».
2. Χρησιμοποιήστε τη μέθοδο μονοδιάστατης γραμμικής παλινδρόμησης και ελαχίστου τετραγώνου για να εξαγάγετε τις τιμές μετατόπισης και λοξής γραμμής βάσης για κάθε δείγμα.
3. αφαιρέστε την τιμή μετατόπισης γραμμής βάσης και διαιρέστε το αποτέλεσμα χρησιμοποιώντας την τιμή λοξής για να δημιουργήσετε το διορθωμένο φάσμα.
2.2.2. Φασματικές Διαφορικές Τεχνικές
Η τεχνική φασματικής διαφοροποίησης περιλαμβάνει μαθηματική προσομοίωση του φάσματος ανάκλασης και υπολογισμό διαφορικών τιμών διαφορετικών τάξεων για τον προσδιορισμό του φασματικού σημείου κάμψης και του μήκους κύματος για τη μέγιστη και την ελάχιστη ανάκλαση. Τα δεδομένα που υποβάλλονται σε επεξεργασία χρησιμοποιώντας διαφοροποίηση δεύτερης τάξης μπορούν να αντικατοπτρίζουν τη διακύμανση του φάσματος που προκαλείται από την απορρόφηση βιοχημικών στοιχείων όπως η φυτική χλωροφύλλη, το νερό και το άζωτο (Liu, 2020).
2.3. Μοντέλα Επεξεργασίας Εικόνας
2.3.1. Μοντέλο Deep Learning
Τα μοντέλα βαθιάς μάθησης χρησιμοποιούνται ευρέως στην επεξεργασία ιατρικών εικόνων (Kiranyaz et al., 2015). Ωστόσο, σε αυτή την εργασία, απαιτείται η κατασκευή κατάλληλων μοντέλων παλινδρόμησης. Γενικά, προτείνουμε το μοντέλο Con1dResNet για την εκτίμηση του SSC και της σκληρότητας της ντομάτας.
Το ResNet (He et al., 2016), ένα δημοφιλές μοντέλο ταξινόμησης εικόνων, μπορεί να λύσει το πρόβλημα υποβάθμισης των βαθιών δικτύων. Έτσι, το ResNet34 υλοποιείται ως η βασική δομή του δικτύου και το αρχικό συνελικτικό επίπεδο ανακατασκευάζεται ώστε να είναι μονοδιάστατο, ανάλογα. Χρησιμοποιούμε τη συνάρτηση βελτιστοποίησης Adam και μέσης τετραγωνικής απώλειας σφάλματος. Αλλάζουμε τον αριθμό των κατηγοριών που εξάγονται από το τελευταίο πλήρως συνδεδεμένο επίπεδο σε μία, έτσι ώστε το δίκτυο να εξάγει απευθείας τις εκτιμώμενες τιμές SSC και σταθερότητας.
Η συγκεκριμένη δομή δικτύου φαίνεται στο Σχήμα 4. Στο σχήμα, η είσοδος είναι οι τιμές ανάκλασης των επεξεργασμένων 462 φασματικών ζωνών. Υπάρχουν πέντε κύρια μπλοκ. Το πρώτο μπλοκ αποτελείται από ένα στρώμα συνέλιξης 1D και ένα στρώμα μέγιστης συγκέντρωσης και στη συνέχεια συνεχίζει μέσω ενός στρώματος εγκατάλειψης με παράμετρο 0.5. Το δεύτερο blockX περιέχει τρεις υπολειμματικές μονάδες. Το τρίτο blockX περιέχει μία υπομονάδα δειγματοληψίας και τρεις υπολειμματικές μονάδες. Το τέταρτο blockX περνά μέσα από μία υπομονάδα υπολειμματικής μονάδας και πέντε υπολειμματικές μονάδες πριν από ένα στρώμα εγκατάλειψης με παράμετρο 0,5 και, στη συνέχεια, συνεχίζει μέσω τριών υπολειπόμενων λειτουργικών μονάδων. Το πέμπτο μπλοκ αποτελείται από ένα μέσο επίπεδο πισίνας και ένα γραμμικό στρώμα εξόδου. Ο αριθμός των φίλτρων συνέλιξης διπλασιάζεται καθώς το μπλοκ προχωρά πιο βαθιά (ξεκινώντας από 32 και τελειώνοντας με 128). Όλα τα συνελικτικά επίπεδα έχουν μέγεθος πυρήνα 3 και μέγεθος βήματος 3. Συνδέοντας τα συνελικτικά στρώματα μεταξύ τους, βαθύτερα στρώματα μπορούν να συνδεθούν σε μεγαλύτερο τμήμα της αρχικής εισόδου. Έτσι, διαφορετικά επίπεδα βλέπουν την αρχική εισαγωγή και την ικανότητα μάθησης σε διαφορετικά επίπεδα. Το τελευταίο βαθύτερο στρώμα εξάγει την εκτίμηση SSC, η οποία συγκλίνει στη βασική τιμή αλήθειας υπό την προσέγγιση της συνάρτησης απώλειας MSE.
Εικόνα 4 . Σχηματική δομή δικτύου Con1dResNet.
2.3.2. Μοντέλα Μηχανικής Μάθησης
Σε αυτήν την εργασία, επιλέγουμε τέσσερα ευρέως χρησιμοποιούμενα μοντέλα μηχανικής μάθησης ως αναφορές στην τεχνική μας που βασίζεται σε βαθιά μάθηση. Όπως περιγράφεται στον Πίνακα 1, είναι η Υποστήριξη Vactor Regression (SVR) (Castro-Neto et al., 2009), K-Nearest Neighbors Regression (KNNR) (Yao and Ruzzo, 2006), Adaptive Boosting Regression (AdaBoostR) (Freund et al., 1999) και Partial Least Squares Regression (PLSR) (Wold et al., 2001).
Πίνακας 1 . Πλεονεκτήματα, μειονεκτήματα και εφαρμογές των μοντέλων μηχανικής μάθησης στο υπερφάσμα.
2.3.3. Πειραματική Ρύθμιση
Οι αλγόριθμοι εκπαιδεύονται και εκτελούνται σε μια πλατφόρμα με CPU I7-8750H και GPU 1.060. Προγραμματίζονται χρησιμοποιώντας python και tensorflow κ.λπ. Τα σύνολα δεδομένων χωρίζονται όπως περιγράφεται στον Πίνακα 2. Τα επεξεργασμένα φασματικά δεδομένα χρησιμοποιούνται στα μοντέλα μηχανικής εκμάθησης ενώ τα ακατέργαστα φασματικά δεδομένα χρησιμοποιούνται στο δίκτυο Con1dResNet. Δεδομένου ότι το μοντέλο βαθιάς εκμάθησης Con1dResNet μπορεί να εξάγει αυτόματα χαρακτηριστικά χαμηλών έως υψηλών διαστάσεων, χρησιμοποιούμε τα αρχικά φασματικά δεδομένα. Ορίσαμε το Relu ως συνάρτηση ενεργοποίησης, τον Adam ως βελτιστοποιητή, το MSE ως συνάρτηση απώλειας, τον αριθμό των επαναλήψεων σε 50 και το μέγεθος παρτίδας σε 16. Μετά από 50 επαναλήψεις προπόνησης, η απώλεια μειώνεται από 72,86 στην αρχή σε 0,01, υποδεικνύοντας μια σύγκλιση για τον αλγόριθμο.
Πίνακας 2 . Cherry tomato SSC και διαχωρισμός δεδομένων σταθερότητας.
3. Αποτελέσματα
Σε αυτή την ενότητα, αξιολογούμε τις τεχνικές μας στην εκτίμηση SSC και σταθερότητας.
3.1. Χαρακτηριστικά Υπερφασματικής Κυματομορφής
Το σχήμα 5Α δείχνει τα φάσματα ανάκλασης 200 δειγμάτων ντομάτας σε 386–1.004 nm. Οι φασματικές τάσεις είναι παρόμοιες για κάθε δείγμα αφού οι ανακλαστικές ουσίες είναι ίδιες. Τα ντοματίνια έχουν ισχυρή ζώνη απορρόφησης στα 400-550 nm λόγω της παρουσίας καροτενοειδών στις ώριμες ντομάτες (Ecarnot et al., 2013). Στη συνέχεια, τα δεδομένα ανακλαστικότητας επεξεργάζονται χρησιμοποιώντας MSC. Όπως φαίνεται στο Σχήμα 5Β, μπορεί να μειώσει αποτελεσματικά τον θόρυβο και ως εκ τούτου να εξομαλύνει την καμπύλη. Τέλος, χρησιμοποιούμε μέθοδο διαφοροποίησης δεύτερης τάξης (Ichige et al., 2006) για να επεξεργαστούμε τα δεδομένα εξομάλυνσης ανάκλασης και να ανακαλύψουμε καθαρές κορυφές σε θέσεις 580-590, 680-690 και 970-980 nm, όπως φαίνεται στο Σχήμα 5Γ. Οι τρεις κορυφές είναι πιθανό να αποδοθούν στη συνδυασμένη επίδραση του δεύτερου τόνου του κλειδιού ΟΗ, του νερού και του χρώματος της επιφάνειας της ντομάτας (Li et al., 2013; Qiu et al., 2018). Επομένως,
Εικόνα 5. (Α) Διορθωμένος χάρτης φασματικής ανάκλασης. (Β) Προεπεξεργασία MSC. (Γ) Διαφορική προεπεξεργασία δεύτερης τάξης.
3.2. Ανάλυση
Ο Πίνακας 2 συνοψίζει τα χαρακτηριστικά κατανομής του SSC και της σταθερότητας σε διάφορα στάδια. Οι μετρήσεις SSC και σταθερότητας για τα δείγματα 50 και 200 είναι σχεδόν κανονικά κατανεμημένες γύρω από τις μέσες τιμές των 9,11° Brix, 9,04 N/cm 2 και 8,72° Brix, 8,85 N/cm 2 , τυπικές αποκλίσεις (SD) 0,76, 1,35 και 0,66, 1,23, αντίστοιχα.
3.3. Αποτέλεσμα εκτίμησης SSC
Τέσσερα μοντέλα μηχανικής μάθησης εφαρμόζονται και συγκρίνονται με το προτεινόμενο δίκτυο Con1dResNet. Ως μετρήσεις αξιολόγησης χρησιμοποιούμε R 2 και MSE. Υπολογίζονται χρησιμοποιώντας τις παρακάτω εξισώσεις.
R2=1−∑i(yi^−yi)2∑i(yi¯−yi)2MSE=1m∑i=1m(yi-yi^)2
όπου yi^ είναι η εκτιμώμενη τιμή, yi είναι η βασική πραγματική τιμή και yi¯ είναι η βασική πραγματική μέση τιμή. Οι βέλτιστες τιμές R 2 και MSE είναι 1 και 0, αντίστοιχα.
Τα πειραματικά αποτελέσματα φαίνονται στο Σχήμα 6 και στον Πίνακα 3. Γενικά, η δεύτερης τάξης διαφορική επεξεργασία υπερέχει του MSC. Ωστόσο, δεδομένου ότι τα μοντέλα SVR και KNNR δεν διαθέτουν τη δυνατότητα μείωσης των διαστάσεων δεδομένων, ο θόρυβος που προκαλείται από την ανεπιθύμητη ανάκλαση δεν μπορεί να αφαιρεθεί. Όταν το μέγεθος των δεδομένων αυξάνεται, αυξάνεται και ο αριθμός των παρεμβολών. Έτσι, η τιμή R 2 μειώνεται καθώς αυξάνεται το μέγεθος δεδομένων. Όπως ήταν αναμενόμενο, έχουν τη χειρότερη απόδοση με R 2 lt; 0,4. Για τα μοντέλα AdaBoostR, PLSR και Con1dResNet, οι τιμές R 2 αυξάνονται με την αύξηση του μεγέθους των συνόλων δεδομένων. Για σχετικά μικρότερο μέγεθος δεδομένων, το μοντέλο PLSR επιτυγχάνει την καλύτερη απόδοση, με το R 20,577 και MSE 0,055. Καθώς το μέγεθος των δεδομένων αυξάνεται, η απόδοση του μοντέλου Con1dResNet βελτιώνεται σημαντικά, με το R 2 να αυξάνεται από 0,498 σε 0,901 (26,4% καλύτερο από το δεύτερο καλύτερο) και το MSE να μειώνεται από 0,065 σε 0,018.
Εικόνα 6 . Αποτελέσματα εκτίμησης SSC για κάθε μοντέλο. (Α) Αποτελέσματα εκτίμησης SVR σε δεδομένα μικρού δείγματος. (Β) Αποτελέσματα εκτίμησης SVR σε δεδομένα μεγάλου δείγματος. (Γ) Αποτελέσματα εκτίμησης KNNR σε δεδομένα μικρού δείγματος. (Δ) Αποτελέσματα εκτίμησης KNNR σε δεδομένα μεγάλου δείγματος. (Ε) Αποτελέσματα εκτίμησης AdaBoostR σε δεδομένα μικρού δείγματος. (ΣΤ) Αποτελέσματα εκτίμησης AdaBoostR σε μεγάλα δείγματα δεδομένων. (Ζ) Αποτελέσματα εκτίμησης PLSR σε δεδομένα μικρού δείγματος. (Η) Αποτελέσματα εκτίμησης PLSR σε δεδομένα μεγάλου δείγματος. (I) Αποτελέσματα εκτίμησης Con1dResNet σε δεδομένα μικρού δείγματος. (J) Αποτελέσματα εκτίμησης Con1dResNet σε μεγάλα δείγματα δεδομένων.
Πίνακας 3 . R 2 και MSE του εκτιμώμενου SSC για κάθε μοντέλο.
3.4. Αποτέλεσμα εκτίμησης σταθερότητας
Η ίδια πειραματική διάταξη χρησιμοποιείται για την ανίχνευση σταθερότητας. Όπως φαίνεται στο Σχήμα 7 και στον Πίνακα 4, όταν το MSC χρησιμοποιείται για το AdaBoost και το PLSR, οι τιμές R 2 τους μπορούν να βελτιωθούν σημαντικά (Wang et al., 2014). Επομένως, επιλέγουμε το MSC ως μέθοδο προεπεξεργασίας για το AdaBoost και το PLSR και τη διαφορά δεύτερης τάξης ως μέθοδο προεπεξεργασίας για το SVR και το KNNR. Αν και η μέθοδος που αναπτύχθηκε σε αυτή τη μελέτη έχει ορισμένα πλεονεκτήματα στην εξαγωγή χαρακτηριστικών δεδομένων σε σύγκριση με άλλες μεθόδους, το R 2 εξακολουθεί να είναι μόνο 0,53, το οποίο δεν επιτυγχάνει το ακριβές πρότυπο εκτίμησης. Το R 2 των μοντέλων SVR και KNNR είναι αρνητικό, γεγονός που υποδηλώνει ότι η ακρίβεια της εκτίμησης είναι χαμηλότερη από τη μέση τιμή.
Εικόνα 7 . Αποτελέσματα εκτίμησης σταθερότητας για κάθε μοντέλο σε ένα μεγάλο δείγμα δεδομένων. (Α) Αποτελέσματα εκτίμησης SVR σε μεγάλα δείγματα δεδομένων. (Β) Αποτελέσματα εκτίμησης KNNR σε δεδομένα μεγάλου δείγματος. (Γ) Αποτελέσματα εκτίμησης AdaBoostR σε μεγάλα δείγματα δεδομένων. (Δ) Αποτελέσματα εκτίμησης PLSR σε δεδομένα μεγάλου δείγματος. (Ε) Αποτελέσματα εκτίμησης Con1dResNet σε μεγάλα δείγματα δεδομένων.
Πίνακας 4 . R 2 και MSE του εκτιμώμενου SSC για κάθε μοντέλο με όλο το δείγμα.
4. Συζήτηση
Η γεύση της ντομάτας είναι σημαντική. Το SSC, το οποίο αποτελείται κυρίως από διαλυτά σάκχαρα, μπορεί να αντανακλά τη γλυκύτητα της ντομάτας. Η υπερφασματική απεικόνιση έχει θεωρηθεί μια αποτελεσματική τεχνική για την αξιολόγηση SSC και σφριγηλότητας φρούτων (Lu, 2004; Fan et al., 2015). Σε αυτή την εργασία, ανακαλύπτουμε ένα εξαιρετικό αποτέλεσμα εκτίμησης για την εκτίμηση SSC, ενώ ένα κατώτερο αποτέλεσμα για τη σταθερότητα.
Όπως φαίνεται στον Πίνακα 3, η προτεινόμενη μέθοδος μας δεν ταιριάζει τόσο καλά όσο το PLSR και το AdaBoost σε μικρά δείγματα δεδομένων. Αυτό συμβαίνει επειδή το Con1dResNet απαιτεί μεγάλο όγκο δεδομένων για εκπαίδευση. Όταν ο όγκος των δεδομένων είναι μικρός, πολλά μοντέλα, ειδικά για τα μοντέλα που βασίζονται σε βαθιά μάθηση, τείνουν να γίνονται υπερβολικά προσαρμοσμένα, γεγονός που μπορεί να μειώσει σημαντικά την απόδοση. Ωστόσο, για το μοντέλο PLSR, περιλαμβάνει ένα στοιχείο ανάλυσης κύριου στοιχείου, το οποίο εξετάζει πρώτα τη συνεισφορά της ζώνης και στη συνέχεια επιλέγει 5-20 ζώνες χαρακτηριστικών με σχετικά μεγάλα ποσοστά συνεισφοράς για παλινδρόμηση. Σε αυτήν την περίπτωση, μπορεί να έχει σχετικά καλή εφαρμογή για μικρά δείγματα δεδομένων. Επιπλέον, το AdaBoost διορθώνει συνεχώς τα δεδομένα με μεγάλα σφάλματα προσαρμογής και έτσι επιτυγχάνει την αυτοεξέλιξη. Έτσι, το AdaBoost μπορεί επίσης να αντλήσει αξιοπρεπή αποτελέσματα σε μικρά δείγματα δεδομένων.
Τα εξαγόμενα φασματικά χαρακτηριστικά (Guo C. et al., 2016) μπορούν να παράγουν εξαιρετικά αποτελέσματα εκτίμησης για μεγάλο μέγεθος δείγματος. Τα πειραματικά αποτελέσματα δείχνουν ότι το SVR και το KNNR δεν ταιριάζουν καλά τόσο στο μικρό όσο και στο μεγάλο σύνολο δεδομένων δείγματος. Η απόδοση του SVR και του KNNR μειώνεται όταν τα δεδομένα αυξάνονται, καθώς δημιουργείται λίγο νέο «μαθησιακό υλικό» για αυτά τα δύο μοντέλα όταν τα δεδομένα αυξάνονται. Σε αυτήν την περίπτωση, η ικανότητα εκμάθησης των μοντέλων μπορεί να επηρεαστεί πιο εύκολα από τις ζώνες παρεμβολών, γεγονός που δείχνει ότι αυτά τα δύο μοντέλα δεν είναι κατάλληλα για εκτίμηση SSC.
Καθώς ο αριθμός του μεγέθους του δείγματος αυξάνεται, το μοντέλο Con1dResNet σταδιακά ξεπερνά τα άλλα μοντέλα λόγω της βελτιωμένης ικανότητας εξαγωγής χαρακτηριστικών των μοντέλων βαθιάς μάθησης (Dara and Tumma, 2018). Το μοντέλο μας περιλαμβάνει 34 στρώματα νευρώνων, που μπορούν να εξαγάγουν αποτελεσματικά πλούσια χαρακτηριστικά δεδομένων. Η υπολειπόμενη δομή μάθησης μπορεί επίσης να βοηθήσει στην αύξηση της συνολικής απόδοσης. Επομένως, η ακρίβεια της μεθόδου μας υπερέχει όλων των άλλων μεθόδων για δείγματα δεδομένων μεγάλης κλίμακας. Για εφαρμογές με λιγότερα δείγματα, αποδεικνύεται ότι η ακρίβεια της τεχνικής μας εξακολουθεί να είναι σχετικά υψηλή. Επιπλέον, το μοντέλο μας δεν είναι ευαίσθητο σε ανώμαλα δεδομένα. Μπορεί να εκπαιδευτεί χρησιμοποιώντας προεκπαιδευμένα μοντέλα και έτσι, μειώνοντας το κόστος εκπαίδευσης. Τα πειραματικά αποτελέσματα δείχνουν ότι το Con1dResNet μπορεί να ξεπεράσει σημαντικά τις υπάρχουσες τεχνικές που βασίζονται στη μηχανική μάθηση, με το R2 από 0,901 και MSE από 0,018. Πιστεύουμε ότι τα πειραματικά αποτελέσματα αυτής της εργασίας είναι ενδεικτικά και για άλλες κηπευτικές καλλιέργειες.
Για τις υπερφασματικές εικόνες που βασίζονται στη σταθερότητα της ντομάτας, αν και αναφέρεται ότι οι υπερφασματικές εικόνες μπορούν να εκτιμήσουν τη σταθερότητα του καρπού (Lu, 2004; Fan et al., 2015), τα πειραματικά μας αποτελέσματα υποδηλώνουν διαφορετικά. Rahman et al. (2018) χρησιμοποίησε το PLSR για να υπολογίσει τη σταθερότητα της τομάτας χρησιμοποιώντας υπερφασματικές εικόνες στις ζώνες κύματος 1.000–1.550 nm και εξάγει την τιμή R 2 0,6724. Είναι λίγο υψηλότερο από το πείραμά μας λόγω των διαφορών στις χρησιμοποιούμενες υπερφασματικές ζώνες κύματος και στα πειραματικά περιβάλλοντα. Επομένως, σε μελλοντική εργασία, για την εκτίμηση της σταθερότητας, θα πρέπει να διερευνήσουμε ένα ευρύτερο φάσμα ζωνών κύματος υπερφασματικής εικόνας, να βελτιστοποιήσουμε τις παραμέτρους για τα πειράματα σταθερότητας και να βελτιώσουμε τη συνολική ακρίβεια εκτίμησης.
5. Συμπέρασμα
Σε αυτή την εργασία, προτείνουμε το Con1dResNet, μια τεχνική βασισμένη σε βαθιά μάθηση, για την εκτίμηση του SSC και της σκληρότητας των ντοματίνων χρησιμοποιώντας υπερφασματικές εικόνες. Με επαρκές μέγεθος δείγματος, μπορεί να επιτύχει καλύτερα αποτελέσματα από τις παραδοσιακές μεθόδους μηχανικής εκμάθησης. Για την εκτίμηση SSC, η τιμή R 2 του είναι 0,901, που είναι 26,4% υψηλότερη από το PLSR, ενώ το MSE του είναι 0,018, το οποίο είναι 0,046 χαμηλότερο από το PLSR. Για την εκτίμηση της σταθερότητας, η τιμή του R 2 είναι 0,532, που εξακολουθεί να είναι 33,7% καλύτερη από το PLSR. Τα αποτελέσματα υποδεικνύουν ότι η υπερφασματική απεικόνιση σε συνδυασμό με τη βαθιά μάθηση μπορεί να βελτιώσει σημαντικά τις ακρίβειες εκτίμησης SSC και σκληρότητας ντομάτας.
Δήλωση διαθεσιμότητας δεδομένων
Τα ανεπεξέργαστα δεδομένα που υποστηρίζουν τα συμπεράσματα αυτού του άρθρου θα διατεθούν από τους συγγραφείς, χωρίς αδικαιολόγητες επιφυλάξεις.
Συνεισφορές Συγγραφέων
Οι YX, QC, YC, QX και ZS πραγματοποίησαν μια εννοιολογική και επίσημη ανάλυση της μελέτης. Οι QC, YX, ZC και YC έγραψαν το χειρόγραφο. Οι YX, YC, QC, LZ, GZ, ZY και QX σχεδίασαν το πείραμα. Οι QC, LZ και ZS έγραψαν τον πειραματικό κώδικα. Οι YX και QX επαλήθευσαν τα πειραματικά αποτελέσματα. Όλοι οι συγγραφείς συνέβαλαν στο άρθρο και εξέτασαν το χειρόγραφο. Όλοι οι συγγραφείς συνέβαλαν στο άρθρο και ενέκριναν την υποβληθείσα έκδοση.
Χρηματοδότηση
Αυτή η έρευνα υποστηρίχθηκε εν μέρει από το Εθνικό Πρόγραμμα Έρευνας και Ανάπτυξης της Κίνας (2018YFD1000800 και 2017YFE0114500), το Βασικό Πρόγραμμα Έρευνας και Ανάπτυξης της Zhejiang (2021C02052), το Εθνικό Ίδρυμα Φυσικών Επιστημών της Κίνας (32172555), το Zhejiang Provincial Bregetyableing (Vargetyable) Project (2021C02065), China Agriculture Research System of MOF and MARA (CARS-23-G44) και State Key Laboratory Breeding Base for the Zhejiang Sustainable Pest and Disease Control (2010DS700124-ZZ1903).
Σύγκρουση συμφερόντων
Οι συγγραφείς δηλώνουν ότι η έρευνα διεξήχθη απουσία εμπορικών ή οικονομικών σχέσεων που θα μπορούσαν να ερμηνευθούν ως πιθανή σύγκρουση συμφερόντων.
Σημείωση εκδότη
Όλοι οι ισχυρισμοί που εκφράζονται σε αυτό το άρθρο είναι αποκλειστικά εκείνοι των συγγραφέων και δεν αντιπροσωπεύουν απαραιτήτως αυτούς των συνδεδεμένων οργανισμών τους ή του εκδότη, των εκδοτών και των κριτικών. Οποιοδήποτε προϊόν μπορεί να αξιολογηθεί σε αυτό το άρθρο ή ισχυρισμός που μπορεί να προβληθεί από τον κατασκευαστή του, δεν είναι εγγυημένο ή εγκεκριμένο από τον εκδότη.
υπερφασματική απεικόνιση, βαθιά μάθηση, ντοματίνια, περιεκτικότητα σε διαλυτά στερεά, σταθερότητα, μονοδιάστατα συνελικτικά νευρωνικά δίκτυα