Την τελευταία ημέρα των 12 ημερών Shipmas OpenAi, η εταιρεία εισήγαγε τα τελευταία της μοντέλα, O3 και O3-Mini, τα οποία κατάφεραν να σκεφτούν και να ξεπεράσουν το O1 σε μια σειρά κριτηρίων, συμπεριλαμβανομένων των μαθηματικών και της επιστήμης. Κατά την εκτόξευση, ο γενικός διευθυντής του Openai Sam Altman δήλωσε ότι η O3 έπρεπε να πέσει στα τέλη Ιανουαρίου και σήμερα η εταιρεία εκπλήρωσε την υπόσχεσή της.
O3-Mini
Την Παρασκευή, η Openai κυκλοφόρησε το μοντέλο O3-Mini, το πιο οικονομικό μοντέλο της σειράς OpenAI για το κοινό. Μέχρι τώρα, αυτή η σειρά αποτελείται από O1 και O1-Mini. Όπως και ο προκάτοχός του, το μοντέλο είναι ιδιαίτερα ισχυρό στην επιστήμη, τα μαθηματικά και την κωδικοποίηση, σύμφωνα με την εταιρεία.
Όταν επιλεγεί το O3-Mini, θα χρησιμοποιήσει τις προσπάθειες για τη συλλογιστική, η οποία ισορροπεί την ταχύτητα και την ακρίβεια. Αν και το αρχικό μοντέλο O1 εξακολουθεί να έχει ευρύτερη κοινή γνώση από το O3-Mini, το κύριο πλεονέκτημα του νέου μοντέλου είναι η υψηλότερη ταχύτητα και η υψηλότερη απόδοση του σε σύγκριση με το O1-Mini.
Απόδοση αναφοράς
Συγκρίνοντας την απόδοση του O3-Mini με O1-Mini, οι εμπειρογνώμονες διαπίστωσαν ότι το O3-Mini έδωσε ακριβέστερες, λογικές και σαφέστερες απαντήσεις από το O1-Mini. Σύμφωνα με την έκθεση, προτιμούσαν τις απαντήσεις O3-Mini στο 56% των περιπτώσεων και παρατηρούσαν μείωση των κύριων σφαλμάτων κατά 39%.
Εκτός από την αξιολόγηση των ανθρώπινων προτιμήσεων, σε αρκετούς δείκτες ελέγχου του STEM, συμπεριλαμβανομένων των ανταγωνιστικών μαθηματικών (AIME 2024), των επιστημονικών ζητημάτων σε επίπεδο διδακτορικού επιπέδου (Diamond GPQA) και του κώδικα ανταγωνισμού (CodeForces), O3-Mini με μέση λογική και χρήστες του CATGPT θα ληφθούν από τους χρήστες την προεπιλεγμένη-συγκρότηση O1-Mini.
Είναι επίσης αξιοσημείωτο το γεγονός ότι το O3-Mini, με υψηλές προσπάθειες για συλλογιστική στα κριτήρια, πλησίαζε την απόδοση του O1, μερικές φορές ξεπέρασε το, όπως μπορεί να φανεί από το AIME 2024 υψηλότερο και τους μηχανικούς λογισμικού (επαληθεύτηκαν από το Swench). Το μοντέλο O3-Mini με μέσες προσπάθειες συλλογιστικής αντιστοιχούσε στην απόδοση του O1 στη δοκιμή CodeForces.
Ασφάλεια
Η Openai εκτίμησε την ασφάλεια του O3-Mini μέσω της δημόσιας απελευθέρωσης μέσω του jailbreak και της απαγόρευσης της αξιολόγησης του περιεχομένου. Η εταιρεία διαπίστωσε ότι το μοντέλο είναι σημαντικά ανώτερο από το GPT-4O όσον αφορά τις εκτιμήσεις. Η OpenAI δημοσίευσε τα αποτελέσματα της κατωτέρως αξιολόγησης και ξεκίνησε επίσης την κάρτα συστήματος O3-Mini, το PDF 37 σελίδων, η οποία περιλαμβάνει λεπτομερή αποτελέσματα της αξιολόγησης.
Πώς να έχετε πρόσβαση
Όλοι οι συνδρομητές για τα αμειβόμενα επίπεδα OpenAI, συμπεριλαμβανομένου του Catgpt Plus, Team και Pro, μπορούν να έχουν πρόσβαση στο OpenAi O3-Mini, ξεκινώντας από σήμερα. Το Plus και οι χρήστες της ομάδας έχουν τώρα περιορισμό του ορίου ταχύτητας, μετακινώντας από 50 μηνύματα την ημέρα από O1-Mini σε 150 μηνύματα την ημέρα. Το ChatGPT Enterprise Access θα πραγματοποιηθεί σε μια εβδομάδα.
Επίσης: ένα ισχυρό νέο copilot “Think Deeper” είναι δωρεάν για όλους τους χρήστες – πώς λειτουργεί
Το μοντέλο O3-Mini θα αντικαταστήσει το O1-Mini στον συλλέκτη μοντέλου, καθώς θα είναι χρήσιμο για τα ίδια καθήκοντα, εκτός από την εμπειρία που θα βελτιωθεί τώρα με χαμηλότερη καθυστέρηση και όρια υψηλότερης ταχύτητας. Ως πληρωμένος χρήστης, κατά τη στιγμή της γραφής, δεν είχα ακόμα πρόσβαση στο O3-Mini, και αντ ‘αυτού εξακολουθώ να βλέπω την επιλογή O1-Mini.
Εάν δεν έχετε συνδρομή, μην ανησυχείτε: μπορείτε να δείτε αν το O3-Mini αξίζει τον κόπο από τον δωρεάν λογαριασμό σας. Όλοι οι δωρεάν χρήστες του CHATGPT πρέπει να το κάνουν αυτό – είναι να κάνετε κλικ στον “λόγο” στο κείμενο του μηνύματος ή να επαναφέρετε την απάντηση. Ο Γενικός Διευθυντής του OpenAi Sam Altman επιβεβαίωσε την ελεύθερη πρόσβαση στο Χ. Μέχρι στιγμής, όλα τα μοντέλα συλλογισμού έχουν μείνει πίσω από τον τοίχο πληρωμής. Το OpenAi δεν έδειξε περιορισμούς γύρω από το νέο μοντέλο για δωρεάν χρήστες.