¿Qué permite la Aplicación?

Es una herramienta de visión por computadora que corre directamente en tu navegador. No necesitás instalar nada. La idea principal es que usa la cámara web de tu compu o celular para identificar objetos a su alrededor en tiempo real.

Las funciones clave son:

  1. Detección en Vivo: Apenas le das permiso, la app empieza a analizar el video de la cámara. Usando un modelo de inteligencia artificial (TensorFlow.js con COCO-SSD), dibuja cuadritos de colores sobre los objetos que reconoce, indicando qué es (ej: "taza", "celular", "libro") y con qué nivel de seguridad lo detecta.

  2. Análisis Preciso: Como a veces el video en vivo es muy rápido, le agregamos el botón de "Congelar" (❄️). Esto te permite pausar la imagen y analizar con calma todos los objetos detectados en ese cuadro específico.

  3. El Toque Creativo con Gemini: Acá es donde se pone más potente. Una vez que tenés una imagen congelada con objetos, podés usar el "Asistente Gemini":

    • ✨ Describir Escena: Le pedís a la IA que, basándose en la lista de objetos, te escriba una pequeña historia o descripción creativa de lo que podría estar pasando.

    • 💡 Ideas: Le pedís que te tire ideas ingeniosas o útiles que combinen los objetos que ve. Por ejemplo, si ve una "notebook" y una "taza", te puede sugerir desde "armar un espacio de trabajo ideal" hasta "una idea para una foto".

  4. Interfaz de Control: Tenés un panel al costado donde podés ver:

    • Las estadísticas de cuántos objetos de cada tipo hay en pantalla.

    • Un historial de los objetos que fue detectando por primera vez.

    • Un slider para ajustar la confianza mínima. Si lo subís, solo te va a mostrar las detecciones de las que está muy segura, lo que ayuda a limpiar la imagen de posibles errores.