Η Meta λανσάρει "Human-Like" μοντέλο παραγωγής εικόνων τεχνητής νοημοσύνης

Η Meta λανσάρει “Human-Like” μοντέλο παραγωγής εικόνων τεχνητής νοημοσύνης

22nd Ιούνιος 2023

Η Meta ανακοίνωσε ένα μοντέλο δημιουργίας εικόνων τεχνητής νοημοσύνης (AI) που μοιάζει με τον άνθρωπο, το I-JEPA, ενώ ταυτόχρονα παρέχει στατιστικά σε ερευνητές.

Η εταιρεία λέει ότι το μοντέλο θα είναι πιο αποτελεσματικό από τα μοντέλα γεννητικής ΤΝ χάρη στο ότι βασίζεται στη γνώση του υποβάθρου και το πλαίσιο, μιμούμενο την τυπική ανθρώπινη νόηση.

Το Reuters αναφέρει ότι το I-JEPA “χρησιμοποιεί γνώσεις υποβάθρου σχετικά με τον κόσμο για να συμπληρώσει τα κομμάτια που λείπουν από τις εικόνες, αντί να εξετάζει τα κοντινά εικονοστοιχεία όπως άλλα μοντέλα γεννητικής τεχνητής νοημοσύνης”.

Σε μια ερευνητική ανάρτηση, η Meta περιγράφει πώς το I-JEPA βασίζεται στο όραμα του επικεφαλής επιστήμονα AI της Meta, Yann LeCun, για “πιο ανθρώπινη AI”.

“Είμαστε ενθουσιασμένοι που παρουσιάζουμε το πρώτο μοντέλο τεχνητής νοημοσύνης που βασίζεται σε ένα βασικό στοιχείο του οράματος της LeCun. Αυτό το μοντέλο, η Image Joint Embedding Predictive Architecture (I-JEPA), μαθαίνει δημιουργώντας ένα εσωτερικό μοντέλο του εξωτερικού κόσμου, το οποίο συγκρίνει αφηρημένες αναπαραστάσεις εικόνων (αντί να συγκρίνει τα ίδια τα εικονοστοιχεία). Το I-JEPA παρέχει ισχυρές επιδόσεις σε πολλαπλές εργασίες υπολογιστικής όρασης και είναι πολύ πιο αποδοτικό από υπολογιστική άποψη από άλλα ευρέως χρησιμοποιούμενα μοντέλα υπολογιστικής όρασης”, εξηγεί η Meta.

Η Meta υπογραμμίζει επίσης την αποτελεσματικότητα της εκπαίδευσης του I-JEPA, υποσχόμενη ότι ένα μοντέλο οπτικού μετασχηματιστή 632 εκατομμυρίων παραμέτρων μπορεί να εκπαιδευτεί με τη χρήση 16 GPU A100 σε λιγότερο από 72 ώρες, κάτι που η εταιρεία ισχυρίζεται ότι είναι δύο έως 10 φορές ταχύτερο από άλλες μεθόδους, ενώ παρέχει λιγότερα σφάλματα.

“Η εργασία μας πάνω στην I-JEPA (και γενικότερα στα μοντέλα JEPA – Joint Embedding Predictive Architecture) βασίζεται στο γεγονός ότι οι άνθρωποι μαθαίνουν ένα τεράστιο ποσό γνώσεων υποβάθρου για τον κόσμο απλά παρατηρώντας τον παθητικά. Έχει διατυπωθεί η υπόθεση ότι αυτές οι πληροφορίες κοινής λογικής είναι το κλειδί για να καταστεί δυνατή η ευφυής συμπεριφορά, όπως η δειγματοληπτικά αποδοτική απόκτηση νέων εννοιών, η θεμελίωση και ο σχεδιασμός”, αναφέρει η Meta, μιλώντας για τη σημασία της γνώσης υποβάθρου στο πλαίσιο της ανθρώπινης νοημοσύνης.

Για να ενσωματωθεί αποτελεσματικά η μάθηση που μοιάζει με την ανθρώπινη στους αλγορίθμους τεχνητής νοημοσύνης, η Meta λέει ότι τα συστήματα πρέπει να κωδικοποιήσουν τις πληροφορίες υποβάθρου της κοινής λογικής σε μια ψηφιακή αναπαράσταση, στην οποία ένας αλγόριθμος μπορεί να έχει πρόσβαση αργότερα. Περαιτέρω, η Meta λέει ότι ένα σύστημα πρέπει να μαθαίνει αυτές τις αναπαραστάσεις με αυτοεπιβλεπόμενο τρόπο.

Η Meta υποστηρίζει ότι με την “πρόβλεψη αναπαραστάσεων σε υψηλό επίπεδο αφαίρεσης αντί της απευθείας πρόβλεψης τιμών εικονοστοιχείων”, το I-JEPA μπορεί να “αποφύγει τους περιορισμούς των γενετικών προσεγγίσεων”.

Ορισμένοι από αυτούς τους περιορισμούς είναι καλά τεκμηριωμένοι, συμπεριλαμβανομένων των προβλημάτων που αντιμετωπίζουν τα παραγωγικά μοντέλα με τα χέρια. Η Meta λέει ότι αυτά τα ζητήματα προκύπτουν επειδή οι γενετικές μέθοδοι προσπαθούν να συμπληρώσουν “κάθε κομμάτι ελλιπούς πληροφορίας”, οδηγώντας σε σφάλματα εικονοστοιχείων που οι άνθρωποι δεν θα έκαναν. Η Meta λέει ότι οι γενετικές μέθοδοι εστιάζουν σε “άσχετες λεπτομέρειες” αντί να “αποτυπώνουν υψηλού επιπέδου προβλέψιμες έννοιες”.

“Η ιδέα πίσω από το I-JEPA είναι να προβλέψουμε τις πληροφορίες που λείπουν σε μια αφηρημένη αναπαράσταση που μοιάζει περισσότερο με τη γενική κατανόηση που έχουν οι άνθρωποι. Σε σύγκριση με τις παραγωγικές μεθόδους που προβλέπουν στο χώρο εικονοστοιχείων/σημείων, το I-JEPA χρησιμοποιεί αφηρημένους στόχους πρόβλεψης για τους οποίους οι περιττές λεπτομέρειες σε επίπεδο εικονοστοιχείου ενδεχομένως εξαλείφονται, οδηγώντας έτσι το μοντέλο να μάθει περισσότερα σημασιολογικά χαρακτηριστικά”, εξηγεί η Meta.

Ενώ τα μοντέλα JEPA της Meta παραμένουν υπό ανάπτυξη, η Meta έχει τονίσει τη σημασία της κοινής χρήσης συστατικών στοιχείων των μοντέλων τεχνητής νοημοσύνης της με τους ερευνητές, μια κίνηση που πιστεύει ότι θα βοηθήσει την καινοτομία.

Οι πλήρεις λεπτομέρειες του JEPA περιγράφονται σε ένα νέο ερευνητικό έγγραφο, το οποίο η Meta θα παρουσιάσει στο ετήσιο συνέδριο Computer Vision Foundation’s Computer Vision and Pattern Recognition Conference αυτή την εβδομάδα.

Αναζητήστε όλα τα νέα προϊόντα στο κατάστημα
Ρεπέλλα Φωτογραφικά.

To pttlgr στηρίζεται για την λειτουργία του στους αναγνώστες του!
Μπορείς να βοηθήσεις με μία μικρή δωρεά!
Υποστηρίξτε το pttlgr ακόμα και με μόλις 1€ – χρειάζεται μόνο ένα λεπτό. Εάν μπορείτε, σκεφτείτε να μας υποστηρίξετε με ένα ποσό κάθε μήνα.
Σας ευχαριστούμε.

Στηρίξτε το pttlgr και την προσπάθεια μας για έγκυρη και άμεση ενημέρωση ακολουθώντας μας
σε Instagram, YouTube και Facebook!

Ακολουθήστε το pttlgr στα Google News, εδώ!