Ο Jensen Juang, συνιδρυτής και διευθύνων σύμβουλος της Nvidia Corp., κατά τη διάρκεια συνέντευξης Τύπου στην Ταϊβία, Ταϊβάν, Τρίτη 4 Ιουνίου 2024. Μνήμη μνήμης, το τελευταίο απαραίτητο βήμα πριν η κορεατική εταιρεία μπορεί να αρχίσει να παρέχει το στοιχείο που είναι απαραίτητο για τη διδασκαλία των πλατφορμών AI.
Annabel Chih | Bloomberg | Getty εικόνες
Nvidia Η “εξαιρετική ανάπτυξη του AI” που ονομάστηκε R1 της Deepseek, παρά την εμφάνιση μιας κινεζικής εκκίνησης, η οποία οδηγεί στο γεγονός ότι η τιμή των μετοχών της Chips τη Δευτέρα μειώθηκε κατά 17%.
“Το Deepseek είναι μια εξαιρετική προώθηση AI και ένα καλό παράδειγμα κλιμάκωσης του χρόνου δοκιμής”, δήλωσε ο εκπρόσωπος της Nvidia στο CNBC. “Το έργο του Deepseek δείχνει πώς μπορούν να δημιουργηθούν νέα μοντέλα χρησιμοποιώντας αυτήν την τεχνική χρησιμοποιώντας ευρέως προσβάσιμα μοντέλα και υπολογισμό, τα οποία συμμορφώνονται πλήρως με τη διαχείριση των εξαγωγών”.
Τα σχόλια εμφανίστηκαν μετά την κυκλοφορία του R1, το οποίο είναι ένα μοντέλο συζητήσεων ανοιχτού κώδικα, οι οποίες, όπως αναφέρθηκε, ξεπέρασε τα καλύτερα μοντέλα από αμερικανικές εταιρείες όπως η OpenAI. Το ανεξάρτητο κόστος της κατάρτισης R1 ανήλθε σε λιγότερο από 6 εκατομμύρια δολάρια, το οποίο αποτελεί μέρος των δισεκατομμυρίων που οι εταιρείες της Silicon Valley δαπανούν για τη δημιουργία των μοντέλων τεχνητής νοημοσύνης.
Η δήλωση NVIDIA δείχνει ότι βλέπει την επανάσταση Deepseek ως δημιουργία μεγαλύτερης εργασίας για γραφικές μονάδες του κατασκευαστή αμερικανικών τσιπς ή γραφικών επεξεργαστών.
“Το συμπέρασμα απαιτεί σημαντικό αριθμό γραφικών επεξεργαστών NVIDIA και δίκτυα υψηλής απόδοσης”, πρόσθεσε ο εκπρόσωπος. “Τώρα έχουμε τρεις νόμους κλιμάκωσης: προκαταρκτική εκπαίδευση και μετά την κατάρτιση που συνεχίζονται και μια νέα κλιμάκωση του χρόνου δοκιμής”.
Η NVIDIA δήλωσε επίσης ότι οι χρησιμοποιημένοι γραφικοί επεξεργαστές που χρησιμοποιούνται από την Deepseek εξάγονται πλήρως εξαγωγής. Την περασμένη εβδομάδα πίστευε ότι ο γενικός διευθυντής του AI Alexander Van στο CNBC την περασμένη εβδομάδα πίστευε ότι η Deepseek χρησιμοποίησε τα μοντέλα GPU NVIDIA, τα οποία απαγορεύονται στην ηπειρωτική Κίνα. Ο Deepseek λέει ότι χρησιμοποίησε ειδικές εκδόσεις γραφικών επεξεργαστών NVIDIA που έχουν σχεδιαστεί για την κινεζική αγορά.
Οι αναλυτές αναρωτιούνται τώρα εάν υπάρχουν επενδύσεις κεφαλαίου πολλαπλών δισεκατομμυρίων δολαρίων από εταιρείες όπως εταιρείες όπως MicrosoftΣΕ Google Και Μετάτα Για την NVIDIA, η υποδομή AI χάνεται όταν τα ίδια αποτελέσματα μπορούν να επιτευχθούν φθηνότερα.
Νωρίτερα αυτό το μήνα, η Microsoft δήλωσε ότι μόνο το 2025 ξοδεύει 80 δισεκατομμύρια δολάρια για την υποδομή AI, ενώ ο μετα -γενικός διευθυντής Mark Zuckerberg δήλωσε την περασμένη εβδομάδα ότι η εταιρεία των κοινωνικών δικτύων σχεδίαζε να επενδύσει από 60 δισεκατομμύρια σε 65 δισεκατομμύρια δολάρια σε κεφαλαιακά έξοδα το 2025 ως μέρος της στρατηγικής AI.
“Εάν το κόστος μοντελοποίησης της κατάρτισης αποδειχθεί σημαντικά χαμηλότερο, αναμένουμε ότι τα οφέλη για τις πωλήσεις που σχετίζονται με τη διαφήμιση, τους τουριστικούς και άλλες εταιρείες που χρησιμοποιούν τις υπηρεσίες τεχνητής νοημοσύνης, στις εγγενείς δαπάνες, ενώ τα μακροπρόθεσμα έσοδα που σχετίζονται με το AI σχετίζονται με ένα hyper -account και το κόστος που σχετίζεται με το AI. Nizhny, “έγραψε η BofA Securities Justin Post Analyst σε σημείωμα τη Δευτέρα.
Το σχόλιο της NVIDIA αντικατοπτρίζει επίσης το νέο θέμα ότι η Nvidia Jensen Huang, γενικός διευθυντής του OpenAI, Sam Altman και Microsoft General, έχει συζητηθεί τους τελευταίους μήνες.
Το μεγαλύτερο μέρος της έκρηξης AI και η ζήτηση για τους γραφικούς επεξεργαστές NVIDIA οφείλονταν στον «νόμο περί κλιμάκωσης», στην έννοια της ανάπτυξης τεχνητής νοημοσύνης που πρότεινε οι ερευνητές της OpenAI το 2020. Αυτή η έννοια υποδηλώνει ότι τα καλύτερα συστήματα AI μπορούν να αναπτυχθούν με σημαντική επέκταση του αριθμού των υπολογισμών και υπολογισμών και υπολογισμών και υπολογισμών. Τα δεδομένα που πήγαν για να δημιουργήσουν ένα νέο μοντέλο, απαιτώντας όλο και περισσότερες μάρκες.
Από τον Νοέμβριο, ο Juan και ο Altman επικεντρώνονται σε μια νέα ρυτίδα στο νόμο της κλιμάκωσης, τον οποίο ο Juang ονομάζει “κλιμάκωση του χρόνου δοκιμής”.
Αυτή η ιδέα δηλώνει ότι εάν ένα πλήρως εκπαιδευμένο μοντέλο AI ξοδεύει περισσότερο χρόνο χρησιμοποιώντας την πρόσθετη δύναμη του υπολογιστή κατά τη δημιουργία προβλέψεων ή τη δημιουργία κειμένου ή εικόνων για να το επιτρέψει “μυαλό”, θα παράσχει τις καλύτερες απαντήσεις από ό, τι θα ήταν αν είχε κερδίσει Λιγότερο χρόνο.
Οι μορφές του νόμου σχετικά με την κλιμάκωση του χρόνου της ζύμης χρησιμοποιούνται σε ορισμένα μοντέλα OpenAI, όπως το O1, καθώς και το μοντέλο R1 του Deepseek.