Microsoft ha lanzado una nueva característica para su Copilot impulsado por IA en versión preliminar: Copilot Vision. Permite que el compañero de IA procese información visual en páginas web y entable conversaciones sobre el contenido con el usuario.
Actualmente, la función se está implementando solo para un número limitado de suscriptores de Copilot Pro en los Estados Unidos a través de Copilot Labs. Una suscripción a Copilot Pro cuesta $20,00 por mes.
Vision es una de las primeras funciones que debuta en Copilot Labs, el campo de pruebas de Microsoft para proyectos experimentales de IA, junto con Think Deepeer. Microsoft anunció inicialmente Copilot Vision en octubre cuando implementó otras funciones para el compañero de IA, como una interfaz rediseñada, Voice, Copilot Daily y Customized Discover, por nombrar algunas.
La compañía dice que la función inicialmente será compatible sólo con una selección limitada de sitios web, ya que van con cuidado. Tienen planes de ampliar el soporte en función de los comentarios de los usuarios y las tendencias de uso.
Copilot Vision actualmente solo está disponible en el navegador Microsoft Edge, una tendencia que Microsoft tiende a seguir cuando presenta productos que otras compañías necesitan para ponerse al día; Hizo lo mismo cuando se lanzó inicialmente Copilot (cuando se conocía como Bing AI).
Copilot ahora se encuentra en la parte inferior del navegador Edge desde donde puede acceder a Copilot Vision; el icono se parece a una fuente RSS. Cuando está habilitado, procesa información visual en la página, lo que permite a los usuarios discutir el contenido con la IA. Esto aborda el desafío de que los usuarios tengan que explicar lo que están viendo a Copilot, transformando la navegación web de una "experiencia solitaria", según Microsoft.
La privacidad es una consideración clave con Copilot Vision. La función es voluntaria y brinda a los usuarios control sobre su activación. Una vez que habilita Vision, permanece encendido durante toda la sesión de navegación hasta que lo apaga manualmente.
Todos los datos de la conversación, incluido el contexto compartido con Copilot, se eliminan al final de cada sesión. Sin embargo, las respuestas de Copilot se registran para mejorar los sistemas de seguridad. Es importante destacar que Microsoft afirma que Copilot Vision no almacena ni utiliza el contenido del editor para entrenar sus modelos y respeta los controles del sitio web comorobots.txt
.
Esta nueva característica se basa en los esfuerzos continuos de Microsoft para integrar la IA en sus productos y servicios. Si bien un intento anterior, la función "Recuperar", enfrentó problemas de privacidad debido a su funcionalidad de captura de pantalla, Microsoft ha adoptado un enfoque más consciente de la privacidad con Copilot Vision. En lugar de realizar capturas de pantalla, la IA analiza directamente el contenido de la página web, abordando algunas de las críticas anteriores. Además, solo puede ver tu pantalla cuando tú lo desees, a diferencia de Recall.
"Ve la página en la que se encuentra, la lee junto con usted y pueden hablar juntos sobre el problema que enfrentan".—Microsoft
En algunas demostraciones compartidas por el gigante tecnológico, se considera que Copilot Vision ayuda a un usuario a planificar un día de actividades divertidas para que su sobrina u otra persona elija un suéter navideño. Puede ayudarle a encontrar un producto que se ajuste a sus necesidades entre la interminable lista de productos e incluso ayudarle a responder cualquier pregunta al respecto. La experiencia me recuerda a estar en una videollamada con mis amigos mientras me ayudan a elegir algo en lugar de compartir pantalla. Pero Copilot puede analizar todo en un instante. Incluso puede ayudar a simplificar el aprendizaje o los juegos.
La introducción de Copilot Vision refleja la creciente tendencia de incorporar IA en la navegación web, transformando la forma en que los usuarios interactúan con el contenido en línea. La compañía monitoreará los datos de uso y la respuesta del público durante el período de vista previa antes de que la función esté ampliamente disponible.