L’azienda dietro ChatGPT ha lanciato un’altra diavoleria. Il suo nome è Operator ed è praticamente un agente AI. Per spiegarlo in modo semplice, il nuovo servizio di intelligenza artificiale generativa di OpenAI riesce a eseguire operazioni complesse al posto dell’utente su Internet.
Operator può visitare autonomamente una pagina Web e interagire con essa digitando del testo, cliccando sugli elementi in essa presente e scorrendo la pagina senza che l’utente dia alcun input se non quello iniziale che specifica le informazioni di cui ha bisogno. Operator è in grado di gestire operazioni ripetitive sul browser e può perfino compilare moduli, ordinare prodotti e ordinare meme.
Le interfacce e gli elementi sulla pagina utilizzati dall’agente di OpenAI sono gli stessi con cui interagiscono gli esseri umani e l’agente rappresenta una grande opportunità anche per l’ambito business. Il modello AI utilizzato prende il nome di CUA (Computer-Using Agent) e combina le capacità di visione di GPT-4o con il ragionamento avanzato del machine learning. E’ in grado di interagire con interfacce grafiche, pulsanti, menu e campi di testo che le persone vedono sullo schermo.
E’ già in grado di operare perfettamente su servizi come Etsy, Booking, Reuters e Associated Press. Il rilascio per ora è avvenuto solo negli USA per gli abbonati a ChatGPT Pro, ma si estenderà gradualmente al resto del mondo.