Τεχνητές νοημοσύνες: εντελώς ανθρώπινες, μαθαίνουν από τα λάθη τους!

Οι Τεχνητές Νοημοσύνες (ΑΙ) έκαναν ένα μεγάλο βήμα να γίνουν πιο ανθρώπινες. Τώρα είναι σε θέση να εκπαιδεύουν τους εαυτούς τους και να συνομιλούν με ανθρώπους σαν να είναι άνθρωποι, κλείνοντας ραντεβού στο κομμωτήριο. Μετάφραση – επιμέλεια Θωμάς Αργυρέας

 

AISelfLearning_1024

Τους τελευταίους μήνες, οι ερευνητές του OpenAI (Ανοιχτού κώδικα Τεχνητής Νοημοσύνης) εστιάζουν την έρευνά τους στην ανάπτυξη τεχνητής νοημοσύνης (AI) αποτελεσματικότερης εκμάθησης.Οι αλγόριθμοι εκμάθησης των μηχανών τους είναι πλέον ικανοί να εκπαιδεύονται οι ίδιοι, για παράδειγμα, χάρις στις μεθόδους ενίσχυσης εκμάθησης  OpenAI Baselines. (https://tpc.googlesyndication.com/safeframe/1-0-16/html/container.html)

Τώρα, ένας νέος αλγόριθμος επιτρέπει στην AI να μάθει από τα δικά της λάθη, σχεδόν όπως κάνουν τα ανθρώπινα όντα.

Η ανάπτυξη προέρχεται από έναν νέο αλγόριθμο ανοιχτού κώδικα που ονομάζεται Hindsight Experience Replay (HER), τον οποίο οι ερευνητές του OpenAI κυκλοφόρησαν δύο μήνες.

Όπως υποδηλώνει το όνομά του, ο HER βοηθά μια τεχνητή νοημοσύνη (AI) να “κάνει μια αναδρομή” θα λέγαμε, όταν ολοκληρώνει μια εργασία. Συγκεκριμένα, η AI επαναλαμβάνει τις αποτυχίες ως επιτυχίες, σύμφωνα με το ιστολόγιο του OpenAI.

“Η βασική ιδέα για την δημιουργία του HER είναι αυτό που οι άνθρωποι κάνουν διαισθητικά: Παρόλο που δεν επιτύχαμε έναν συγκεκριμένο στόχο, έχουμε τουλάχιστον επιτύχει ένα διαφορετικό στόχο”, γράφουν οι ερευνητές.

“Γιατί λοιπόν να μην προσποιούμαστε ότι θέλαμε να επιτύχουμε αυτό το στόχο, αντί για εκείνον που ξεκινήσαμε αρχικά;”

Με απλά λόγια, αυτό σημαίνει ότι κάθε αποτυχημένη απόπειρα, μιας ΑΙ που εργάζεται προς την κατεύθυνση επίτευξης ενός στόχου, αντί για αποτυχία, την μετράει σαν επιτυχία ενός άλλου, ακούσιου “εικονικού” στόχου.

Θυμηθείτε όταν μαθαίνατε πώς να οδηγείτε ένα ποδήλατο. Στις πρώτες δύο προσπάθειες, στην πραγματικότητα, δεν αποτύχατε, αλλά πετύχατε να μην εξισορροπήσετε σωστά.

Ακόμα κι έτσι, αυτές οι προσπάθειες σας διδάσκουν πώς να μην οδηγείτε σωστά και τελικά, τι πρέπει να αποφύγετε όταν εξισορροπείτε σε ποδήλατο. Κάθε αποτυχία, σας έφερνε πιο κοντά στον στόχο σας, γιατί αυτός είναι ο τρόπος που μαθαίνουν τα ανθρώπινα όντα.

https://tpc.googlesyndication.com/safeframe/1-0-16/html/container.html

Επιβραβεύοντας κάθε αποτυχία.

Με τον HER, η OpenAI θέλει τις τεχνητές νοημοσύνες (AI) να διδάσκονται με τον ίδιο τρόπο.

Ταυτόχρονα, αυτή η μέθοδος θα γίνει μια εναλλακτική λύση στο συνηθισμένο σύστημα ανταμοιβής που εμπλέκεται στα μοντέλα αυτοενισχυόμενης μάθησης. Για να μάθει η AI να διδάσκεται από μόνη της, πρέπει να συνδεθεί με ένα σύστημα ανταμοιβών: είτε η ΑΙ φτάνει στο στόχο της και παίρνει έναν αλγόριθμο “cookie” ως αμοιβή είτε δεν παίρνει.

Ένα άλλο μοντέλο δίνει τα cookies ανάλογα με το πόσο κοντά είναι μια AI στην επίτευξη ενός στόχου.

Και οι δύο μέθοδοι δεν είναι τέλειες. Η πρώτη πάσχει ως προς την εκμάθηση, επειδή η AI είτε παίρνει αμοιβή είτε όχι.

Η δεύτερη, από την άλλη πλευρά, μπορεί να είναι αρκετά δύσκολο να εφαρμοστεί, σύμφωνα με το IEEE Spectrum.

Αντιμετωπίζοντας κάθε προσπάθεια ως στόχο του παρελθόντος, η HER δίνει στην τεχνητή νοημοσύνη ανταμοιβή, ακόμα και όταν δεν κατάφερε να ολοκληρώσει την καθορισμένη εργασία. Αυτό βοηθά την AI να μάθει γρηγορότερα και με υψηλότερη ποιότητα.

“Κάνοντας αυτή την υποκατάσταση, ο αλγόριθμος αυτοενισχυόμενης μάθησης μπορεί να κερδίσει μια μαθησιακή επιβεβαίωση αφού θα έχει επιτύχει κάποιο στόχο, ακόμα κι αν δεν ήταν αυτός που αρχικά επεδίωξε. Αν επαναλάβει αυτή τη διαδικασία, τελικά θα μάθει πώς να πετύχει αυθαίρετους στόχους, συμπεριλαμβανομένων των στόχων που θέλει πραγματικά να επιτύχει», σύμφωνα με το ιστολόγιο του OpenAI.

Ακολουθεί ένα παράδειγμα του τρόπου με τον οποίο λειτουργεί ο HER με την προσομοίωση του OpenAI Fetch.


Αυτή η μέθοδος δεν σημαίνει ότι ο HER καθιστά παντελώς απλό για τα συστήματα τεχνητής νοημοσύνης να μάθουν συγκεκριμένες εργασίες.

“Η μάθηση με τον HER για τα πραγματικά ρομπότ εξακολουθεί να είναι δύσκολη, αφού συνεχίζει να απαιτεί ένα μεγάλο αριθμό δειγμάτων”, δήλωσε ο Matthias Plappert του OpenAI στο IEEE Spectrum.

Σε κάθε περίπτωση, όπως έδειξαν οι προσομοιώσεις του OpenAI, ο HER μπορεί να είναι πολύ χρήσιμος για να «ενθαρρύνει» τις AI να μαθαίνουν ακόμη και από τα λάθη τους, όπως ακριβώς κάνουμε όλοι – η μεγάλη διαφορά είναι ότι οι AI δεν απογοητεύονται όπως εμείς οι υπόλοιποι αδύναμοι άνθρωποι.

Αυτό το άρθρο δημοσιεύθηκε αρχικά από τον Futurism. Διαβάστε εδώ το αρχικό άρθρο.

Πηγή: DOM GALEON, FUTURISM, 4 MAR 2018


Όταν η μηχανή υποκαθιστά πλήρως τον άνθρωπο και σας κλείνει ραντεβού στο κομμωτήριο

Μήπως μόλις πέρασε το τεστ του Turing;

Η τεχνητή νοημοσύνη -βοηθός AI- της Google βελτιώνεται κάθε χρόνο. Μπορεί να σας πει τον καιρό, ή ίσως να σας εξηγήσει ένα τρομερό αστείο, αν αυτό ξεπερνά την ταχύτητα της αντίληψής σας. Δώστε του άλλα ένα – δύο χρόνια, και θα είναι σε θέση να προ-παραγγείλει το μεσημεριανό γεύμα που θα σας αρέσει προτού καν πιείτε τον πρωινό σας καφέ.

Αλλά πιο άμεσα, είναι σε θέση να κάνει κλήσεις και να κλείνει τα ραντεβού σας με μια πολύ φυσική ανθρώπινη φωνή, αν πιστέψουμε ένα πρόσφατο demo.

Στη φετινή διάσκεψη προγραμματιστών του Google I/O στο Mountain View, η Google παρουσίασε την Google Assistant, με έναν πολύ φυσικό ήχο, να κλείνει ραντεβού στο τηλέφωνο – μια λειτουργία που την ονομάζουν Google Duplex.

Δεν ήταν μόνο αυτόματη συμπλήρωση μιας ηλεκτρονικής φόρμας – σύμφωνα με διάφορες ηχογραφήσεις από το συνέδριο- ήταν μια τηλεφωνική κλήση μεταξύ της Βοηθού AI της Google και ενός ανθρώπου που εργαζόταν σε κομμωτήριο.

Παρατηρείστε ότι η AI της Google φάνηκε να ανταποκρίνεται στη συνομιλία αβίαστα, με σχεδόν καθόλου καθυστέρηση.

Αλλά είναι απολαυστικό να την ακούσετε. Οι διαχωριστικές γραμμές μεταξύ ανθρώπου και ΑΙ έχουν πλέον εντελώς ξεθωριάσει και είναι σχεδόν αδύνατον να πείσετε την χαρούμενη εργαζόμενο του κομμωτηρίου ότι συνομιλεί με την βοηθό ΑΙ της Google. Ο ήχος ήταν μακράν ανθρώπινη από μονότονη, ή ρομποτική.

Η AI μάλιστα έριξε και μερικά “uh’s” και “hmm’s”, πριν απαντήσει, με τον τρόπο που θα ανταποκρινόταν ένας πραγματικός άνθρωπος.

Μια μηχανή που παίζει το ρόλο ενός ανθρώπου; Καλά, κάποιος να σπρώξει προς τα εμπρός το ρολόι της καταστροφής (Doomsday clock). Η “στιγμή μηδέν” είναι σχεδόν εδώ.

Πηγή: VICTOR TANGERMANN, FUTURISM, 9 ΜΑΪΟΥ 2018

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

w

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.