OpenAI ha presentado su último desarrollo, Operador, una herramienta de inteligencia artificial diseñada para completar tareas de forma autónoma a través de un navegador web. Este agente de IA, actualmente disponible para los usuarios de ChatGPT Pro en los Estados Unidos, marca la entrada de OpenAI en el ámbito de la tecnología de IA autónoma.

El operador opera con una participación mínima de los usuarios, manejando tareas que normalmente requerirían interacción humana. Utiliza un modelo especializado conocido como agente que utiliza computadora (CUA), que incorpora las capacidades de visión y las capacidades de razonamiento avanzado de GPT-4 para realizar tareas de manera eficiente.

Lea también: Meta busca una solución urgente a la confusión del chatbot de IA sobre el nombre del presidente de EE. UU.

¿Cómo trabaja el operador?

El operador puede navegar por sitios web y realizar tareas como realizar reservas, comprar artículos o buscar información, sin mucha supervisión. Utiliza un teclado y un mouse virtuales para interactuar con interfaces gráficas de usuario, como botones y campos de texto. El agente de IA procesa datos de la pantalla, utilizando texto e imágenes para comprender el entorno y tomar decisiones. Esto le permite adaptarse a cambios inesperados y manejar tareas complejas como completar formularios o gestionar compras. Sin embargo, los usuarios pueden intervenir en cualquier momento durante un trabajo para mantener el control.

Lea también: Reino Unido explorará los ecosistemas móviles de Apple y Google: detalles aquí

Ejemplos de operador en acción

OpenAI visualiza a Operador como una solución para tareas repetitivas en línea, ayudando a los usuarios a ahorrar tiempo. En las demostraciones, el agente de IA planificó con éxito un viaje de fin de semana extrayendo información de Reddit, estableciendo presupuestos y teniendo en cuenta preferencias. Cuando Reddit dejó de estar disponible, el operador se trasladó a Bing para continuar trabajando, demostrando su adaptabilidad.

El operador también gestionó una tarea de investigación de criptomonedas, deteniéndose para alertar al usuario cuando se encontraba un CAPTCHA, lo que requería la intervención humana antes de continuar. Esta característica enfatiza la colaboración entre el usuario y la IA, asegurando que las tareas se completen con precisión y al mismo tiempo permitiendo la participación del usuario.

Lea también: Más allá de 50MP y 60MP: el sensor de cámara de fotograma completo de 410MP de Canon está aquí y ofrece 8 veces la resolución de 8K

Plataformas compatibles y casos de uso

El operador es compatible con servicios populares como DoorDash, Instacart, Uber y eBay. Opera de acuerdo con los términos de servicio de estas plataformas, garantizando un uso ético. El agente de IA está diseñado para aplicaciones individuales y comerciales, con el objetivo de simplificar las tareas cotidianas para una amplia gama de usuarios.

Lea también: iOS 18.3 próximamente: pistas de software filtradas sobre el lanzamiento de los modelos iPhone SE 4, iPad 11 y iPhone Air

Precauciones y preocupaciones de seguridad

A medida que el operador maneja tareas más avanzadas, OpenAI ha priorizado la seguridad. El sistema está diseñado para rechazar solicitudes relacionadas con actividades dañinas o contenido ilegal. Además, solicita confirmación al usuario para transacciones que podrían tener consecuencias importantes, como compras o ingreso de datos sensibles. OpenAI también realizó pruebas rigurosas para identificar riesgos potenciales y garantizar que el agente cumpla con las pautas éticas. Revisores humanos y sistemas automatizados monitorean las interacciones para garantizar el cumplimiento de los estándares de seguridad.

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *