En una actualización notable de la aplicación Files by Google, Gemini, el asistente avanzado de inteligencia artificial de Google, ahora tiene la capacidad de reconocer cuando un PDF está abierto en su pantalla, lo que permite a los usuarios consultar directamente el contenido del archivo.

Según The Verge, esta función es parte de una implementación más amplia de funciones contextuales en Gemini diseñadas para mejorar la forma en que los usuarios interactúan con sus archivos digitales.

La funcionalidad ha comenzado a implementarse para los suscriptores de Gemini Advanced, informa The Verge. Cuando los usuarios ven un PDF en la aplicación Files by Google, pueden llamar a Gemini y presionar un nuevo botón llamado “Preguntar sobre este PDF”. Esta opción permite a los usuarios hacer preguntas específicas sobre el contenido del PDF, de forma similar a cómo se interactuaría con una IA conversacional como ChatGPT.

Esta característica mejora enormemente la forma en que los usuarios interactúan con sus archivos. Por ejemplo, podrías abrir un PDF (ya sea un trabajo de investigación, un libro electrónico o un informe) y preguntarle a Gemini: “¿Cuál es el resumen de este documento?”. o “¿Puedes explicar esta sección?” El asistente responde con un resumen o aclaración detallada, como si tuviera un asistente personal para interpretar el expediente por usted.

Google adelantó esta función por primera vez durante su conferencia de desarrolladores de E/S de mayo de 2024 y ahora está disponible para los suscriptores de Gemini Advanced. Aunque actualmente está limitada a este grupo, se espera que la función se expanda a una audiencia más amplia en el futuro.

La función de reconocimiento de PDF es parte de los esfuerzos de Google para hacer que Gemini sea más consciente de los medios. Anteriormente, Gemini permitía a los usuarios hacer preguntas sobre sitios web y vídeos de YouTube. Ahora puede interpretar el contenido que se muestra en la pantalla de un dispositivo, abriendo nuevas posibilidades para los usuarios de dispositivos móviles.

Para aplicaciones o archivos que aún no son compatibles con la función contextual de Gemini, el asistente puede ayudar tomando una captura de pantalla de la pantalla y ofreciéndose a responder preguntas basadas en ella. Por ejemplo, mientras leen un artículo en un navegador web o miran un vídeo de YouTube, los usuarios pueden tocar “Preguntar sobre esta pantalla” para analizar el contenido y responder a Gemini.

Esta característica interactiva posiciona a Gemini como algo más que un simple asistente. se convierte en una herramienta altamente intuitiva para navegar por contenido digital entre dispositivos.

Para acceder a esta nueva función, los usuarios necesitan una suscripción a Gemini Advanced, el servicio premium de asistente de inteligencia artificial de Google. Si bien la función aún se está implementando, marca un avance significativo en la forma en que los asistentes digitales pueden interpretar e interactuar con el contenido, agilizando la recuperación de información y las tareas cotidianas.

La integración de herramientas basadas en inteligencia artificial como estas en aplicaciones ampliamente utilizadas como Google Files refleja la creciente tendencia de que los asistentes digitales se vuelvan esenciales para la productividad y la gestión de contenidos. Ya sea que esté revisando un informe, leyendo un PDF para trabajar o navegando por información compleja, las funciones de Gemini están diseñadas para hacer que el proceso sea más rápido, más eficiente y más interactivo.

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *