
Πρόσκληση: Δημιουργήστε μια φωτορεαλιστική εικόνα της αγοράς των αγροτών στο Τορόντο το Σάββατο το καλοκαίρι του 2006, αυτή είναι μια υπέροχη μέρα στα τέλη Ιουνίου, οι άνθρωποι κάνουν αγορές και τρώνε σάντουιτς. Στο επίκεντρο θα πρέπει να υπάρχει ένα νεαρό ασιατικό κορίτσι, ένα φθαρμένο τζιν φόρμες και να πας μια φραουλική μπανάνα smoothie – η ανάπαυση μπορεί να είναι θολή. Η φωτογραφία θα πρέπει να σας υπενθυμίσει ότι η ψηφιακή φωτογραφική μηχανή 2006 θα πάρει, με προσωρινό σήμα, παρόμοια τυπωμένη φωτογραφία. Ο λόγος των μερών πρέπει να είναι 3: 2
Ανοικτός
Η OpenAI επέκτεινε συνεχώς τις προτάσεις του στο ChatGPT, προσθέτοντας βοηθό φωνής AI, κατανόηση αρχείων και εικόνων, διευρυμένες ερευνητικές δυνατότητες, πράκτορες AI και πολλά άλλα. Παρ ‘όλα αυτά, υπήρξε μια προφανής παράλειψη – μια πραγματικά ικανή γεννήτρια εικόνων.
Την Τρίτη, η Openai ξεκίνησε 4ο γενιά. Αυτό το μοντέλο εικόνας είναι πολύ καλύτερο, καλό και πιο αργό, περισσότερο από το Dall-e, που προσφέρεται προηγουμένως από το OpenAI. Αντιμετωπίζει πολύ περίπλοκες ενδείξεις, όπως ρεαλιστικές εικόνες και, πιο εντυπωσιακό, ακριβές κείμενο.
Επίσης: Δοκίμασα μια νέα ενημέρωση της λειτουργίας Voice CHATGPT – αυτό έχει αλλάξει
Για παράδειγμα, στο demo, ο γενικός διευθυντής του OpenAi, ο Sam Altman, ο οποίος προσχώρησε οι ερευνητές Gabriel Go και Praofulla Dhary, ώθησαν το 4ο να δημιουργήσει μια φωτογραφία από ένα συγκεκριμένο POV με ένα Flaer, το οποίο περιελάμβανε πολλά κείμενο. Μετά τη φόρτωση για μερικά δευτερόλεπτα, κατάλαβε σωστά την κατεύθυνση του κινηματογράφου και εκτύπωσε με ακρίβεια ολόκληρο το κείμενο.
Μπορεί επίσης να καυχηθεί με πολλά άλλα χαρακτηριστικά που δεν είχαν την προηγούμενη γεννήτρια εικόνων OpenAI, όπως αναφορά στην εικόνα που μπορεί να χρησιμοποιηθεί για να εμφανίσει μια νέα έκδοση της εικόνας (για παράδειγμα, anime έκδοση ή selfie) ή ως έμπνευση για να δημιουργήσει μια εντελώς νέα δουλειά.
Δεδομένου ότι αυτό το εργαλείο προορίζεται για ενσωμάτωση στις διαδικασίες εργασίας των δημιουργικών εργαζομένων, μπορεί να δημιουργήσει εικόνες σε διαφανές υπόβαθρο, να χρησιμοποιεί ορισμένα χρώματα από εξαγωνικούς κώδικες ή να εφαρμόσει τις διευρυμένες συνομιλίες του Chatbot σε γενιές. Για παράδειγμα, όταν προτείνεται να ενεργοποιηθεί το “χιούμορ” στη φωτογραφία κατά τη διάρκεια της επίδειξης, περιελάμβανε το κείμενο που αντιστοιχούσε σε αυτά τα κριτήρια.
Δεδομένου ότι η γεννήτρια εικόνων είναι διαθέσιμη στο CHATGPT, οι χρήστες μπορούν επίσης να βελτιώσουν τις εικόνες ως αποτέλεσμα μιας συνομιλίας με αρκετές στροφές. Αυτό διευκολύνει τη ρύθμιση των εικόνων και επιτρέπει στο μοντέλο να χρησιμοποιεί το πλαίσιο των προηγούμενων γενεών για να δημιουργήσει νέες. Δεδομένου ότι το GPT-4O έχει πρόσβαση στο Διαδίκτυο, αυτό το πλαίσιο προστίθεται επίσης στη δημιουργία εικόνων.
Σύμφωνα με την εταιρεία, η γενιά των εικόνων GPT-4O έχει επίσης μια ισχυρή δέσμευση για οδηγίες. Μπορεί να επεξεργαστεί 10-20 διαφορετικά αντικείμενα, πράγμα που σημαίνει ότι μπορείτε να του ζητήσετε να δημιουργήσει ένα μεγάλο αριθμό αντικειμένων κάθε φορά.
Ευρύτερες εγγυήσεις
Μια άλλη νέα πτυχή της γεννήτριας εικόνων είναι ότι τώρα μπορεί να δημιουργήσει πιο επικίνδυνο περιεχόμενο από το μοντέλο της μάσκας Gorka Elon είναι γνωστό. Κατά τη διάρκεια μιας ζωντανής ροής, ο Altman μοιράστηκε ότι μπορείτε να χρησιμοποιήσετε τη γενιά εικόνων GPT-4O για να δημιουργήσετε ένα επιθετικό περιεχόμενο “εντός”. Στο Post X, μετά από μια άμεση εκπομπή, ο Altman πρόσθεσε:
“Θα θέλαμε να προσπαθήσουμε να διασφαλίσουμε ότι το εργαλείο δεν δημιουργεί προσβλητικά πράγματα αν δεν θέλετε να είναι, στην περίπτωση αυτή, μέσα στο πλαίσιο του νου. Όπως λέμε στο μοντέλο μας, πιστεύουμε ότι αυτή η πνευματική ελευθερία και ο έλεγχος στα χέρια των χρηστών είναι το σωστό, αλλά θα παρατηρήσουμε πώς θα πάει και θα ακούσει την κοινωνία.
Επίσης: Το GROK 3 AI είναι τώρα δωρεάν για όλους τους χρήστες X – έτσι λειτουργεί
Η αναφορά στο blog, η οποία ανέφερε ότι το μοντέλο σημείωσε ότι εμποδίζει τα αιτήματα που παραβιάζουν την πολιτική περιεχομένου, συμπεριλαμβανομένης της σεξουαλικής βίας έναντι των παιδιών και των σεξουαλικών βαθιών θεμάτων. Μια άλλη εγγύηση επί τόπου είναι ο περιορισμός του τι μπορεί να δημιουργηθεί όταν οι πραγματικοί άνθρωποι βρίσκονται στο πλαίσιο, συμπεριλαμβανομένων “ιδιαίτερα αξιόπιστων εγγυήσεων για γυμνό και γραφική βία”.
Οι χρήστες μπορούν να επισκεφθούν μια κάρτα συστήματος για όλες τις πληροφορίες ασφαλείας στο μοντέλο δημιουργίας εικόνων 4O.
Πώς να έχετε πρόσβαση
Οι ενημερωμένες λειτουργίες δημιουργίας εικόνων αναπτύσσονται σήμερα στο ChatGPT και το SORA. Ανεξάρτητα από το αν έχουν υπογραφεί, όλοι οι χρήστες (συμπεριλαμβανομένων των δωρεάν) θα έχουν πρόσβαση στη δημιουργία εικόνων GPT-4O ως προεπιλογή. Εάν οι χρήστες εξακολουθούν να θέλουν να έχουν πρόσβαση στο Dall-E, μπορούν να το κάνουν αυτό μέσω του Dall-E GPT. Οι χρήστες της επιχείρησης και της εκπαίδευσης θα λάβουν σύντομα πρόσβαση σε πρόσβαση σε προγραμματιστές μέσω του API, που έχουν προγραμματιστεί για τις επόμενες εβδομάδες.
Επίσης: Οι καλύτερες γεννήτριες των εικόνων AI: δοκιμασμένες και προβολές
Όταν ο Dall-E ξεκίνησε για πρώτη φορά, έζησε στον αυτόνομο ιστότοπό του. Εκείνη την εποχή φαινόταν το μεγαλύτερο και τελευταίο. Από τότε, έχει μετακινηθεί μόνο στο ChatGpt. Εκεί, το μοντέλο έγινε ανοιχτό σε σύγκριση με πιο προηγμένα μοντέλα δημιουργίας εικόνων από ανταγωνιστές όπως το Midjourney, το Google και το Adobe. Αυτή η ενημέρωση συμβάλλει τώρα στην ευθυγράμμιση του πεδίου παιχνιδιού, το οποίο του επιτρέπει να ανταγωνίζεται καλύτερα με άλλα μοντέλα.
Θέλετε περισσότερες ιστορίες για το AI; Εγγραφείτε για καινοτομίαΗ εβδομαδιαία ψηφοφορία πληροφόρησης.