
Κατά τη διάρκεια της εκδήλωσής του, το Google Cloud στην επόμενη εκδήλωση την Τετάρτη, ο γίγαντας αναζήτησης δημοσίευσε την τελευταία έκδοση της μονάδας επεξεργασίας Tenzor (TPU), ενός τσιπ χρήστη που δημιουργήθηκε για να ξεκινήσει τεχνητή διανοητική στροφή.
Για πρώτη φορά, η Google τοποθετεί το τσιπ για την έξοδο, τη δημιουργία προβλέψεων για τη διαβίωση αναγκών σε εκατομμύρια ή ακόμα και δισεκατομμύρια χρήστες, σε αντίθεση με την κατάρτιση, την ανάπτυξη νευρωνικών δικτύων που διεξάγονται από ομάδες τεχνητής νοημοσύνης και επιστημόνων για δεδομένα.
Επίσης: Γιατί το Google Code Assist μπορεί τελικά να είναι ένα εργαλείο ενεργειακού λογισμικού που χρειάζεστε
Το TPU Ironwood, όπως ονομάζεται το νέο τσιπ, φτάνει στο σημείο της οικονομικής περίσσειας στο AI. Η βιομηχανία αναμένει σαφώς ότι η AI θα προχωρήσει για να μην είναι λιγότερο σε επιστημονικά έργα, αλλά περισσότερο για την πραγματική χρήση μοντέλων εταιρειών AI.
Και την ανάπτυξη του συμπυκνωμένου τοίχου Deepseek AI -με την καταπολέμηση του τοίχου περισσότερο από ό, τι όταν το μεγάλο κόστος της οικοδόμησης του AI για την Google και τους ανταγωνιστές της.
Η ανάπτυξη μοντέλων “συλλογισμού”, όπως το Google Gemini, το οποίο αυξάνει σημαντικά τον αριθμό των χειριστών που παράγονται από ένα μεγάλο γλωσσικό μοντέλο, δημιουργεί μια ξαφνική αύξηση του συνολικού αριθμού υπολογισμών που απαιτούνται για την πρόβλεψη. Όπως ανέφερε η Google στην περιγραφή του Ironwood, “η συλλογιστική και το συμπέρασμα πολλαπλών σταδίων μεταβάλλουν τη σταδιακή ζήτηση υπολογισμού, επομένως, το κόστος της κατάρτισης στην εποχή της παραγωγής (κλιμάκωση του χρόνου δοκιμής.)
Έτσι, το Ironwood είναι μια δήλωση Google ότι η προσοχή της στην παραγωγικότητα και την αποτελεσματικότητα αλλάζει ώστε να αντικατοπτρίζει το αυξανόμενο κόστος της παραγωγής σε σύγκριση με την περιοχή κατάρτισης.
Επίσης: Πιστεύετε ότι η Deepseek μείωσε το κόστος του AI; Ξανασκεφτώ
Η Google αναπτύσσει την οικογένεια TPU πάνω από δέκα έως έξι προηγούμενες γενιές. Παρόλα αυτά, η κατάρτιση τσιπ, κατά κανόνα, θεωρούνται πολύ χαμηλότερη αγορά τσιπ από το συμπέρασμα. Αυτό οφείλεται στο γεγονός ότι οι απαιτήσεις κατάρτισης αυξάνονται μόνο όπως ανοίγει κάθε νέο γιγαντιαίο ερευνητικό έργο Genai, το οποίο είναι συνήθως μία φορά το χρόνο περίπου.
Αντίθετα, το συμπέρασμα αναμένεται να ικανοποιήσει τις ανάγκες χιλιάδων ή εκατομμυρίων πελατών που θέλουν καθημερινές προβλέψεις από εκπαιδευμένο νευρωνικό δίκτυο. Το συμπέρασμα θεωρείται ευρεία αγορά στον κόσμο των τσιπ.
Νωρίτερα, η Google ισχυρίστηκε ότι η έκτη γενιά TPU Trillium, που εισήχθη πέρυσι, το οποίο, κατά κανόνα, έγινε διαθέσιμος τον Δεκέμβριο, μπορεί να χρησιμεύσει ως εκπαίδευση και το τσιπ εξόδου σε ένα μέρος, υπογραμμίζοντας την ικανότητά της να επιταχύνει την υπηρεσία των προβλέψεων.
Στην πραγματικότητα, κατά τη διάρκεια της δεύτερης έκδοσης της TPU το 2017, η Google μίλησε για τη συνδυασμένη ικανότητα μάθησης και συμπεράσματος.
Πρώτα απ ‘όλα, η τοποθέτηση του Ironwood είναι κυρίως chip -output, είναι μια αναχώρηση.
Επίσης: Η Google αποκαλύπτει νέες βελτιώσεις στο Kubernetes και το GKE για την καινοτομία AI
Αυτή είναι μια μετατόπιση που μπορεί επίσης να σημαίνει μια αλλαγή στην ετοιμότητα της Google να βασίζεται σε Intel, Advanced Micro Devices και NVIDIA ως εργαζόμενο του υπολογιστικού στόλου του AI. Στο παρελθόν, η Google περιέγραψε την TPU ως την απαραίτητη επένδυση για την επίτευξη προηγμένων αποτελεσμάτων της έρευνας, αλλά όχι για εναλλακτική λύση στους προμηθευτές της.
Στον τομέα του Google Cloud Computing, με βάση τις ποσότητες των “αντιγράφων”, οι πελάτες διαχειρίζονται, τα τσιπ Intel, AMD και NVIDIA αποτελούν το συνδυασμένο 99% των επεξεργαστών που χρησιμοποιούνται σε σύγκριση με το ποσοστό της TPU, σύμφωνα με τη μελέτη KeyBanc Capital Markets.
Αυτή η εξάρτηση από τρεις κυρίαρχους προμηθευτές έχει οικονομικές συνέπειες για την Google και άλλους γίγαντες, τη Microsoft και την Amazon.
Οι αναλυτές στο Wall Stegdit, οι οποίοι από καιρό σε καιρό συνθέτουν μέτρα μεμονωμένων γραμμών Google, ελπίζουν την οικονομική αξία της TPU. Για παράδειγμα, τον Ιανουάριο, ο αναλυτής των μετοχών της Gil Luria από την ερευνητική εταιρεία Da Davidson έγραψε ότι “η Google θα φέρει μέχρι και 24 δισεκατομμύρια δολάρια πέρυσι εάν πουλήσει την TPU ως εξοπλισμό για το NVDA [Nvidia] Πελάτες “, δηλαδή σε ανταγωνισμό με την NVIDIA.
Και αντίστροφα, σε μια εποχή που το κόστος του AI πηγαίνει σε έργα για αρκετές εκατοντάδες δισεκατομμύρια δολάρια, όπως η Stargate, οι αναλυτές της Wall Street πιστεύουν ότι η TPU Google μπορεί να προσφέρει στην εταιρεία να εξοικονομήσει χρήματα για το κόστος της υποδομής AI.
Παρόλο που η Google πλήρωσε τον κατασκευαστή της Broadcom Chips για να τον βοηθήσει να εισέλθει σε κάθε νέο TPU στην εμπορική παραγωγή, η Google μπορεί ακόμα να εξοικονομήσει χρήματα χρησιμοποιώντας περισσότερα TPU και όχι την τιμή που πρέπει να πληρώσει για την Intel, την AMD και την NVIDIA για πλάτη σε όλο τον καταναλωτή για την παραγωγή.
Επίσης: Το νέο μοντέλο AI Deepseek με ανοιχτή πηγή μπορεί να ξεπεράσει το O1 για ένα μικρό μέρος του κόστους
Για να δικαιολογήσει το Ironwood, η Google τόνισε τα τεχνικά επιτεύγματα του Ironwood την Τετάρτη σε σύγκριση με το Trillium.
Η Google είπε ότι το Ironwood είναι το μισό Trillium “Watt Productivity”, το οποίο μετράται 29,3 τρισεκατομμύρια μαθηματικές επιχειρήσεις με ένα πλωτό κόμμα ανά δευτερόλεπτο.
Στο μπροστινό μέρος του Ironwood υπάρχουν 192 gigabytes μνήμης DRAM, διπλότυπος HBM ή μνήμη υψηλής προβολής, έξι φορές περισσότερο από το trillium. Το εύρος ζώνης μνήμης μεταφέρεται 4,5 φορές περισσότερο, 7,2 Tela ανά δευτερόλεπτο.
Η Google δήλωσε ότι αυτές οι βελτιώσεις θα πρέπει να υποστηρίξουν μια πολύ μεγαλύτερη κίνηση δεδομένων στο τσιπ και πέρα από αυτήν.
“Το Ironwood έχει σχεδιαστεί για να ελαχιστοποιεί την κίνηση των δεδομένων και την καθυστέρηση στο τσιπ κατά την εκτέλεση τεράστιων χειρισμών τανυστή”, ανέφερε η Google.
Τα επιτεύγματα της μνήμης και της απόδοσης αποτελούν μέρος της προφοράς της Google σχετικά με την “κλιμάκωση” της υποδομής του AI.
Η τιμή κλιμάκωσης είναι να είναι σε θέση να χρησιμοποιήσει πλήρως κάθε τσιπ όταν ομαδοποιεί εκατοντάδες ή χιλιάδες μάρκες για να εργαστεί για το πρόβλημα του παράλληλου. Περισσότερες μάρκες που αφιερώνονται στο ίδιο πρόβλημα θα πρέπει να οδηγήσουν σε ταυτόχρονη επιτάχυνση στην απόδοση.
Και πάλι, η κλιμάκωση έχει ένα οικονομικό στοιχείο. Ομαδοποιώντας αποτελεσματικά τα τσιπ, η TPU μπορεί να επιτύχει περισσότερη “χρήση”, το ποσό αυτού του πόρου που χρησιμοποιείται στην πραγματικότητα ανάλογα με το υπόλοιπο ποσό. Η επιτυχής κλιμάκωση σημαίνει υψηλότερη χρήση των τσιπ, η οποία είναι καλή, επειδή σημαίνει λιγότερο από χάσιμο δαπανηρού πόρου.
Επίσης: 5 λόγοι για τους οποίους το Trillium Google μπορεί να μετατρέψει το AI και το cloud computing – και 2 εμπόδια
Αυτός είναι ο λόγος για τον οποίο στο παρελθόν, η Google υπογράμμισε την ικανότητα του Trillium να “κλιμακωθεί έως και εκατοντάδες χιλιάδες μάρκες” σε μια συλλογή αυτοκινήτων.
Ενώ η Google δεν έδωσε προφανείς λεπτομέρειες σχετικά με την απόδοση της κλιμάκωσης του Ironwood στα καθήκοντα της παραγωγής, την Τετάρτη τόνισε και πάλι την ικανότητα των “εκατοντάδων χιλιάδων τσιπ σιδήρου, οι οποίες θα συνθέσουν μαζί για να προωθήσουν γρήγορα τα σύνορα των υπολογισμών Genai”.
Η ανακοίνωση Google αποτελούσε επίσης μια σημαντική ανακοίνωση του λογισμικού, Pathways on Cloud. Το λογισμικό Pathways είναι ένας κώδικας που διανέμει τμήματα του AI που υπολογίζουν σε διαφορετικούς υπολογιστές. Χρησιμοποιήθηκε στο πλαίσιο της Google και τώρα παρέχεται στο κοινό.