Cómo acceder al Proyecto Astra de Google (más o menos)

Google presentó el Proyecto Astra el verano pasado justo cuando OpenAI presentó al mundo su GPT-4o con Vision. Sin embargo, si bien el producto OpenAI ya llegó a las masas en diciembre, todo lo que hizo Google fue proporcionar otra demostración de un Proyecto Astra mejorado.

No hace falta decir que fue un acontecimiento decepcionante. Sin embargo, hay un lado positivo. Si bien no hay una hoja de ruta sobre cuándo estará disponible el Proyecto Astra a través de la aplicación Gemini (como es el plan), ya hay una manera de probar el Proyecto Astra ahora mismo a través de Google AI Studio.

Google agregó recientemente una nueva función a Google AI Studio, Stream Realtime, que funciona de manera muy similar al Proyecto Astra y es un buen lugar para tener una idea de las capacidades del Proyecto Astra. Si bien Google AI Studio está destinado a ser un lugar para que los desarrolladores realicen pruebas de API, cualquiera puede usar la interfaz de AI Studio de forma gratuita sin la API.

Con Stream Realtime, puedes compartir tu entorno con Gemini a través de la cámara de tu teléfono/computadora, o la pantalla de tu computadora y chatear sobre lo que estás transmitiendo.

  1. Para utilizar Stream Realtime, es decir, el Proyecto Astra disfrazado, navegue hastaen tu teléfono o computadora.
  2. Inicie sesión en su cuenta de Google.
  3. Vaya a 'Transmitir en tiempo real' desde la opción en el menú de la izquierda.
  1. Una vez que cambies a 'Transmitir en tiempo real', encontrarás algunas opciones a la derecha que puedes personalizar, como 'Formato de salida' y 'Voz'. Actualmente hay 5 voces disponibles: 'Puck', 'Charon', 'Kore', 'Fenrir' y 'Aoede', siendo Puck la predeterminada. No se puede cambiar el modelo desde Gemini 2.0 Flash Experimental.
  1. También puede habilitar ciertas herramientas como 'Ejecución de código', 'Llamada de función', 'Respuesta automática de función' y 'Conexión a tierra'.
  1. Una vez que haya configurado los ajustes, seleccione 'Mostrar Gemini' para compartir la transmisión de su cámara o 'Compartir su pantalla' para compartir la pantalla de su PC con Gemini; La última opción está ausente en el móvil.
  1. En mi PC, decidí compartir mi pantalla con Gemini y, aunque inicialmente hubo cierta fricción (Gemini no respondía), después de una actualización, funcionó perfectamente. Puedes seleccionar una pestaña del navegador, una aplicación o toda tu pantalla con Gemini.
  1. Una vez que tu pantalla esté visible, comienza a chatear con Gemini sobre el contenido de tu pantalla. Para dejar de compartir su pantalla, haga clic en "Dejar de compartir" en la parte inferior.
  1. Para finalizar la sesión por completo, haga clic en el botón 'cámara' en el chat para detener la grabación.
  1. Una vez que finalice la sesión, podrá encontrar las grabaciones de video, grabaciones de voz y transcripciones de las respuestas de Gemini en el chat.

Puedes compartir la transmisión de tu cámara y charlar con Gemini al respecto de la misma manera.

Cosas que debes saber:

  • Gemini hace un gran trabajo identificando elementos en su pantalla y respondiendo cualquier consulta al respecto.
  • Solo puede ver la parte de la aplicación/página web actualmente visible en la pantalla y no puede ver nada más hasta que se desplace y la muestre.
  • No tiene acceso a Internet en Gemini AI Studio y solo puede acceder a la información hasta la fecha límite de entrenamiento, que es agosto de 2024.

Related Posts