Νέο μοντέλο ρομπότ “εκπαίδευσης” από τον αμερικανικό στρατό

Το νέο στρατιωτικό δόγμα του στρατού των ΗΠΑ αφορά επιχειρήσεις πολλαπλών τομέων και απαιτεί αυτόνομους φορείς με μαθησιακές ικανότητες να μπορούν να λειτουργούν παράλληλα με τον στρατό. Σε αυτό το πλαίσιο, η νέα στρατιωτική έρευνα αυξάνει την προβλεψιμότητα των τρεχουσών πολιτικών μάθησης ενίσχυσης, έτσι ώστε να ταιριάζουν περισσότερο σε συστήματα με φυσική παρουσία – όπως τα ρομπότ εδάφους / εδάφους.

Όπως ο Δρ Alec Koppel του Εργαστηρίου Έρευνας Στρατού DEVCOM (Διοίκηση Ανάπτυξης Καταπολέμησης Στρατού των ΗΠΑ), αυτές οι μέθοδοι θα επιτρέψουν σε αυτόνομους φορείς να βγάλουν λογικά συμπεράσματα και να προσαρμοστούν στις μεταβαλλόμενες συνθήκες στο πεδίο της μάχης. Ολόκληρος ο μηχανισμός προσαρμογής και επανασχεδιασμού αποτελείται από πολιτικές που βασίζονται στην ενίσχυση της μάθησης και η δυνατότητα / η διάθεση αυτών των πολιτικών είναι ζωτικής σημασίας για την υλοποίηση του MDO (Multi Domain Operations). Σύμφωνα με τον Kopel, αυτές οι πολιτικές αποτελούν τη βάση για επεκτάσιμους αλγόριθμους, ωστόσο, οι υπάρχουσες τεχνικές δεν μπορούν να ενσωματώσουν ευρύτερους στόχους λήψης αποφάσεων, όπως περιορισμούς ασφαλείας, αντίληψη κινδύνου κ.λπ.

Το ζήτημα του αυτόνομου σχεδιασμού συμπεριφοράς όταν η σχέση μεταξύ δυναμικής και στόχων είναι περίπλοκη μπορεί να λυθεί μέσω της ενίσχυσης της μάθησης, η οποία έχει από καιρό προσελκύσει το ενδιαφέρον για την επίλυση δύσκολων “προβλημάτων”, όπως παιχνίδια στρατηγικής όπως “go” και σκάκι και βιντεοπαιχνίδια όπως το Starcraft II . Ωστόσο, μέχρι στιγμής αυτό ήταν πολύ απαιτητικό, που απαιτεί προσομοίωση χιλιάδων ετών παιχνιδιού. Αυτή η πολυπλοκότητα καθιστά πολλούς μηχανισμούς κατάρτισης ανέφικτους.

Ο Koppel και οι συνεργάτες του ανέπτυξαν νέες μεθόδους γενικού σκοπού, σημειώνοντας ότι μείωσαν τη μεταβλητότητα της συσσώρευσης ανταμοιβών, απέδωσαν καλά αποτελέσματα σε δραστηριότητες εξερεύνησης σε άγνωστα πεδία και παρείχαν έναν μηχανισμό για την ενσωμάτωση προηγούμενης εμπειρίας.

“Αυτές οι καινοτομίες έχουν αντίκτυπο στον αμερικανικό στρατό καθώς επιτρέπουν στόχους μάθησης ενίσχυσης … όπως ευαισθησία κινδύνου, περιορισμοί ασφαλείας, εξερεύνηση”, δήλωσε ο Kopel, προσθέτοντας ότι το μέλλον αυτής της έρευνας φαίνεται ιδιαίτερα φωτεινό: “Είμαι αισιόδοξος ότι αυτόνομα ρομπότ με εκμάθηση ενίσχυσης θα είναι σε θέση να βοηθήσουν τον στρατιώτη στην εξερεύνηση, τον εντοπισμό και την αξιολόγηση του κινδύνου στο μελλοντικό πεδίο μάχης.

.Source