Η κινεζική εκκίνηση AI Deepseek δεν είναι στο εγγύς μέλλον δεν αναστατώνει την ώθηση του.
Λίγα λεπτά μετά τη Δευτέρα τη Δευτέρα, η εταιρεία κυκλοφόρησε το ChatGPT από την πρώτη θέση στο κατάστημα εφαρμογών για τις περισσότερες εφαρμογές που έχουν μεταφορτωθεί, η εταιρεία δημοσίευσε το μοντέλο AI στο κείμενο του κειμένου στην εικόνα Janus-Pro τη Δευτέρα. Όπως το R1, το μοντέλο ναυαρχίδας Deepseek, το Janus-Pro είναι μια ανοιχτή πηγή στην άδεια MIT (το καθιστά εμπορικά βιώσιμο) και φορτώνεται μέσω αγκαλιά και GitHub.
Επίσης: Έλεγξα τις δεξιότητες της κωδικοποίησης R1 και V3 Deepseek – και δεν είμαστε όλοι καταδικασμένοι (για τώρα)
Όπως και η απελευθέρωση του R1, η Deepseek κυκλοφόρησε αρκετές εκδόσεις του Janus-Pro, σε ποσότητα παραμέτρων 1B έως 7B. Οι ισχυρισμοί του Depseek ισχυρίζονται ότι ο Janus-Pro-7B, μεγαλύτερος από τους δύο, χτυπάει τις εγκατεστημένες γεννήτριες εικόνων, όπως η σταθερή διάχυση και το Dall-e στη γλώσσα και ο πάγκος DPG.
Ο Deepseek λέει ότι το μοντέλο χρησιμοποιεί τα “αυτόματη δομή” και “ξεπερνά” τα ενοποιημένα μοντέλα.
Ο Janus-Pro βασίζεται στον Janus, την αρχική του έκδοση που κυκλοφόρησε πέρυσι και μπορεί να δημιουργήσει και να αναλύσει εικόνες. Τα μοντέλα μιας μικρότερης παραμέτρου στην οικογένεια περιορίζονται από την ανάλυση των εικόνων των αναλύσεων 384 x 384, που είναι ένα μειονέκτημα.
Παρόλα αυτά, τα αποτελέσματα του Janus-Pro εξακολουθούν να είναι ανταγωνιστικά, ειδικά λαμβάνοντας υπόψη ότι η Deepseek αναφέρεται ότι το χαμηλότερο κόστος κατάρτισης σε σύγκριση με εκείνα των αμερικανικών εταιρειών που ασχολούνται με τεχνητές πνευματικές εταιρείες. Τον Δεκέμβριο, το ερευνητικό έγγραφο της εταιρείας ισχυρίστηκε ότι το μοντέλο V3 κοστίζει μόνο 5,6 εκατομμύρια δολάρια, γεγονός που θα αποτελέσει μέρος του γεγονότος ότι η Google και η OpenAI δαπάνησαν στα μοντέλα αστέρων τους. Ορισμένοι εξέφρασαν την ανησυχία τους ότι ο αριθμός αυτός είναι ελλιπής (αφήνοντας το κόστος Ε & Α, Δεδομένα και Κόστος Προσωπικού) ή δύσκολο να πιστέψει.
Η Nvidia είπε ακόμη και το CNBC ότι το μοντέλο είναι “εξαιρετική ανάπτυξη του AI”. Στο πλαίσιο άλλων γρήγορης πυρκαγιάς από το Deepseek, οι πρώτες εντυπώσεις της οικογένειας μοντέλων είναι μικτές, αλλά γενικά θετικές. Μπορούν να αλλάξουν, καθώς όλο και περισσότεροι χρήστες δοκιμάζουν το Janus-Pro για τον εαυτό τους έναντι άλλων μοντέλων εικόνων.
Επίσης: Οι ερευνητές της Apple αποκαλύπτουν τη μυστική σάλτσα που στέκεται πίσω από το Deepseek AI
Η ZDNET θεωρεί επίσης αναφορές ότι η προσέγγιση του Deepseek είναι πιο ενεργειακά αποδοτική από τους Αμερικανούς συναδέλφους της, οι οποίοι θα είναι μια άλλη σημαντική κούνημα για τη βιομηχανία AI και τις επενδύσεις στο διάστημα. Η απελευθέρωση του Janus-Pro δημιουργεί ερωτήσεις, όπως η Stargate, πρωτοβουλία 500 δισεκατομμυρίων δολαρίων μεταξύ αρκετών AI Giants και της διοίκησης Trump, δεδομένου ότι το ανταγωνιστικό AI μπορεί να μην απαιτεί την ενέργεια και την κλίμακα των προτεινόμενων κέντρων επεξεργασίας πρωτοβουλίας.