Σύμφωνα με τους ανθρώπους που είναι εξοικειωμένοι με αυτό το ζήτημα, ο Jack Ma-Backed Ant Group Co. Χρησιμοποίησα κινεζικές ημιαγωγές για να αναπτύξω μεθόδους για τη διδασκαλία μοντέλων τεχνητής νοημοσύνης, τα οποία θα μειώσουν το κόστος 20%.
Ο ANT χρησιμοποίησε εγχώρια τσιπ, μεταξύ άλλων από την Alibaba Group Holding Ltd. και Huawei Technologies Co., για να διδάξουν μοντέλα χρησιμοποιώντας τον SO -που ονομάζεται συνδυασμός της προσέγγισης των εμπειρογνωμόνων μηχανικής μάθησης. Σύμφωνα με αυτούς, έλαβε αποτελέσματα παρόμοια με τα αποτελέσματα από τα τσιπ της Nvidia Corp, όπως το H800, ζητούν να μην καλέσουν τις πληροφορίες που δεν είναι δημόσιες.
Ο Ant, με έδρα το Hangzhou, εξακολουθεί να χρησιμοποιεί το Nvidia για να αναπτύξει το AI, αλλά τώρα βασίζεται κυρίως σε εναλλακτικές λύσεις, μεταξύ άλλων από τις Advanced Micro Devices Inc. Και τα κινεζικά τσιπ για τα τελευταία μοντέλα τους, είπε ένας από τους ανθρώπους.
Τα μοντέλα σημειώνουν την είσοδο του Ant στον αγώνα μεταξύ κινεζικών και αμερικανικών εταιρειών, η οποία επιταχύνει, καθώς η Deepseek έχει καταδείξει πώς τα ικανά μοντέλα μπορούν να εκπαιδευτούν πολύ λιγότερο από τα δισεκατομμύρια που επενδύονται στο Google OpenAI και το Alphabet Inc. Αυτό τονίζει τον τρόπο με τον οποίο οι κινεζικές εταιρείες προσπαθούν να χρησιμοποιήσουν τοπικές εναλλακτικές λύσεις στους πιο προηγμένους ημιαγωγούς της Nvidia. Παρά το γεγονός ότι το H800 δεν είναι το πιο προηγμένο, είναι ένας σχετικά ισχυρός επεξεργαστής και απαγορεύεται επί του παρόντος από τις Ηνωμένες Πολιτείες από την Κίνα.
Αυτό το μήνα, η εταιρεία δημοσίευσε ερευνητική εργασία, η οποία μερικές φορές ξεπέρασε τη Meta Platforms Inc. Σε ορισμένες δοκιμές ότι το Bloomberg News δεν έλεγξε μόνοι τους. Αλλά αν εργάζονται σε αυτό που διαφημίζουν, οι αντι -πλατφόρμες μπορούν να σημειώσουν ένα άλλο βήμα προς τα εμπρός για την ανάπτυξη της κινεζικής τεχνητής νοημοσύνης, μειώνοντας το κόστος της παραγωγής ή την υποστήριξη των υπηρεσιών τεχνητής νοημοσύνης.
Δεδομένου ότι οι εταιρείες επενδύουν σημαντικά χρήματα στο AI, τα μοντέλα MOE έχουν γίνει μια δημοφιλής επιλογή, αποκτώντας αναγνώριση για τη χρήση τους από την Google και την Hangzhou Startup Deepseek, μεταξύ άλλων. Αυτή η τεχνική διαιρεί τα καθήκοντα σε μικρότερα σύνολα δεδομένων, είναι πολύ παρόμοια με την παρουσία μιας ομάδας ειδικών, καθένα από τα οποία επικεντρώνεται στο τμήμα εργασίας, γεγονός που καθιστά την διαδικασία πιο αποτελεσματική. Το μυρμήγκι αρνήθηκε να σχολιάσει τη δήλωση του e -mail.
Παρόλα αυτά, η εκπαίδευση των μοντέλων MOE, κατά κανόνα, βασίζεται σε τσιπ υψηλής απόδοσης, όπως γραφικές μονάδες επεξεργασίας, η Nvidia πωλεί. Το κόστος μέχρι σήμερα ήταν υπερβολικό σε πολλές μικρές εταιρείες και περιορίζεται από την ευρύτερη αποδοχή. Ο ANT εργάζεται σε μεθόδους αποτελεσματικότερης κατάρτισης LLMS και εξαλείφει αυτόν τον περιορισμό. Ο τίτλος του χαρτιού διευκρινίζει αυτό, επειδή η εταιρεία θέτει το στόχο της κλίμακας στο μοντέλο “χωρίς επεξεργαστές γραφικών μπόνους”.
Αυτό είναι αντίθετο με το Nvidia. Ο διευθύνων σύμβουλος Jensen Juang ισχυρίστηκε ότι η ζήτηση για υπολογισμούς θα αναπτυχθεί ακόμη και με την εμφάνιση πιο αποτελεσματικών μοντέλων, όπως το Deepseek R1, υποστηρίζοντας ότι οι εταιρείες χρειάζονται τα καλύτερα τσιπ για να αποκτήσουν περισσότερα εισοδήματα και όχι φθηνότερα για να μειώσουν τα έξοδα. Προσκολλάται από τις στρατηγικές για τη δημιουργία μεγάλων γραφικών επεξεργαστών με μεγάλο αριθμό πυρήνων επεξεργασίας, τρανζίστορ και αυξημένη μνήμη.
Ο Ant δήλωσε ότι κοστίζει περίπου 6,35 εκατομμύρια γιουάν (880.000 δολάρια ΗΠΑ) για να εκπαιδεύσει 1 τρισεκατομμύρια μάρκες χρησιμοποιώντας εξοπλισμό υψηλής απόδοσης, αλλά η βελτιστοποιημένη προσέγγισή του θα μειώσει αυτό σε 5,1 εκατομμύρια γιουάν χρησιμοποιώντας εξοπλισμό με χαμηλότερες προδιαγραφές. Οι μάρκες είναι μονάδες πληροφοριών που το μοντέλο δέχεται να μάθει για τον κόσμο και να παρέχει χρήσιμες απαντήσεις στα αιτήματα χρηστών.
Σύμφωνα με τους ανθρώπους, η εταιρεία σχεδιάζει να χρησιμοποιήσει μια πρόσφατη ανακάλυψη σε μεγάλα γλωσσικά μοντέλα που έχει αναπτύξει, Ling-Plus και Ling-Lite για λύσεις για βιομηχανική τεχνητή νοημοσύνη, συμπεριλαμβανομένης της υγειονομικής περίθαλψης και της χρηματοδότησης.
Φέτος, ο Ant αγόρασε μια κινεζική ηλεκτρονική πλατφόρμα Haodf.com για να ενισχύσει τις υπηρεσίες τεχνητής νοημοσύνης στην υγειονομική περίθαλψη. Ο Ant δημιούργησε έναν γιατρό AI για να υποστηρίξει 290.000 γιατρούς HAODF σε καθήκοντα όπως η διαχείριση των ιατρικών καρτών, ανέφερε η ξεχωριστή δήλωση σε ξεχωριστή δήλωση τη Δευτέρα.
Η εταιρεία έχει επίσης το βοηθό βοηθό προσάρτημα, που ονομάζεται Zhixiaobao και η οικονομική συμβουλευτική υπηρεσία της τεχνητής νοημοσύνης Maxiaocai.
Όσο για την κατανόηση της αγγλικής γλώσσας, ο Ant στο άρθρο της δήλωσε ότι το μοντέλο Ling-Lite είναι καλύτερο στο δάπεδο λέξεων-κλειδιών σε σύγκριση με ένα από τα μοντέλα Meta Llama. Τα μοντέλα Ling-Lite και Ling-Plus ξεπέρασαν τα ισοδύναμα του Deepseek στα κριτήρια της κινεζικής γλώσσας.
“Εάν βρείτε ένα σημείο επίθεσης για να νικήσετε τον καλύτερο κύριο Kung-Fu στον κόσμο, μπορείτε ακόμα να πείτε ότι τα έχετε κερδίσει, οπότε είναι σημαντικό για πραγματική χρήση”, δήλωσε ο Robin Yu, διευθυντής των αποφάσεων AI, με έδρα το Shengshang Tech Co.
Ο Ant έκανε ένα μοντέλο Ling Open Source. Το Ling-Lite περιέχει παραμέτρους 16,8 δισεκατομμυρίων, οι οποίες είναι ρυθμιζόμενες ρυθμίσεις που λειτουργούν ως λαβές και καλεί για να κατευθύνουν την απόδοση του μοντέλου. Το Ling-Plus έχει 290 δισεκατομμύρια παραμέτρους, οι οποίες θεωρούνται σχετικά μεγάλες στον τομέα των γλωσσικών μοντέλων. Για σύγκριση, οι εμπειρογνώμονες, σύμφωνα με τις εκτιμήσεις, το GPT-4,5 στο ChatGPT έχει 1,8 τρισεκατομμύρια παραμέτρους, σύμφωνα με την ανασκόπηση της τεχνολογίας MIT. Το Deepseek-R1 έχει 671 δισεκατομμύρια.
Η εταιρεία αντιμετωπίζει προβλήματα σε ορισμένους τομείς κατάρτισης, συμπεριλαμβανομένης της σταθερότητας. Ακόμη και οι μικρές αλλαγές στον εξοπλισμό ή τη δομή του μοντέλου οδήγησαν σε προβλήματα, συμπεριλαμβανομένου του άλματος στη συχνότητα του σφάλματος μοντέλων, λέει το άρθρο.
Τη Δευτέρα, η Anta δήλωσε ότι έχτισε μεγάλες μηχανές μοντελοποίησης επικεντρώθηκε στην υγειονομική περίθαλψη, τα οποία χρησιμοποιήθηκαν από επτά νοσοκομεία και προμηθευτές ιατρικών υπηρεσιών σε πόλεις, όπως το Πεκίνο και η Σαγκάη. Το μεγάλο μοντέλο χρησιμοποιεί το Deepseek R1, το Qwen Alibaba και το δικό του μυρμήγκι και μπορεί να διεξάγει ιατρικές συμβουλές.
Η εταιρεία δήλωσε επίσης ότι χρησιμοποίησε δύο ιατρικούς πράκτορες – ο Angel, ο οποίος υπηρέτησε περισσότερα από 1000 ιατρικά ιδρύματα και η Yibaoer, η οποία υποστηρίζει υπηρεσίες ιατρικής ασφάλισης. Τον περασμένο Σεπτέμβριο, ξεκίνησε την υπηρεσία MAHS Healthcare Manager στο πλαίσιο του Alipay, της αίτησης πληρωμής του.
Αυτή η ιστορία παρουσιάστηκε αρχικά στο Fortune.com