OpenAI lancia Operator: l’agente AI che naviga e cerca per l’utente

L’azienda dietro ChatGPT ha lanciato un’altra diavoleria. Il suo nome è Operator ed è praticamente un agente AI. Per spiegarlo in modo semplice, il nuovo servizio di intelligenza artificiale generativa di OpenAI riesce a eseguire operazioni complesse al posto dell’utente su Internet.

Operator può visitare autonomamente una pagina Web e interagire con essa digitando del testo, cliccando sugli elementi in essa presente e scorrendo la pagina senza che l’utente dia alcun input se non quello iniziale che specifica le informazioni di cui ha bisogno. Operator è in grado di gestire operazioni ripetitive sul browser e può perfino compilare moduli, ordinare prodotti e ordinare meme.

Le interfacce e gli elementi sulla pagina utilizzati dall’agente di OpenAI sono gli stessi con cui interagiscono gli esseri umani e l’agente rappresenta una grande opportunità anche per l’ambito business. Il modello AI utilizzato prende il nome di CUA (Computer-Using Agent) e combina le capacità di visione di GPT-4o con il ragionamento avanzato del machine learning. E’ in grado di interagire con interfacce grafiche, pulsanti, menu e campi di testo che le persone vedono sullo schermo.

E’ già in grado di operare perfettamente su servizi come Etsy, Booking, Reuters e Associated Press. Il rilascio per ora è avvenuto solo negli USA per gli abbonati a ChatGPT Pro, ma si estenderà gradualmente al resto del mondo.

Fonte

Michele Ingelido: Blogger che da anni lavora nel settore tecnologico. Da perito tecnico mi definisco non solo un incurabile fanatico della tecnologia, ma anche un profondo estimatore di tutto ciò che intelligentemente crea innovazione, specie se in modo anticonformista… Un po’ come il Rock ‘n Roll!