En mi proyecto BuscaBot, uno de los componentes clave es el sistema de reconocimiento facial que estoy desarrollando con InsightFace. Ayer publiqué un video donde muestro, en la práctica, cómo una imagen de un rostro termina convertida en un vector de 512 dimensiones, un proceso que puede sonar complejo, pero que en realidad es la base del funcionamiento moderno de la inteligencia artificial aplicada a visión por computadora.
Cuando capturamos una imagen con una cámara —como la del BuscaBot— el sistema no “ve” la foto como lo hacemos los humanos. Para la IA, cada rostro debe ser representado como una serie de números que describen sus características más importantes: forma del rostro, distancias entre ojos, ángulos, proporciones, texturas, entre muchas otras.
InsightFace toma esa imagen y extrae un conjunto de 512 valores numéricos.
Ese conjunto se conoce como embedding, o “huella matemática” del rostro.
Cada rostro genera un vector diferente, pero rostros de una misma persona generan vectores muy parecidos entre sí. Esta es la razón por la que un robot o un sistema de IA puede “reconocer” sin guardar fotos, solamente números.
En el flujo de reconocimiento facial del BuscaBot:
La cámara captura el rostro.
InsightFace lo procesa y genera un vector de 512 dimensiones.
Ese vector se compara con los vectores almacenados previamente.
Si la distancia entre vectores es pequeña, el sistema determina que se trata de la misma persona.
Esto permite que el robot no solo detecte personas, sino que pueda identificarlas y, en un futuro, realizar acciones específicas en mis proyectos de búsqueda y rescate, interacción educativa o navegación inteligente.
InsightFace utiliza redes neuronales profundas entrenadas con millones de imágenes.
Como resultado, la red aprende a representar cada rostro mediante 512 características altamente discriminativas. Mientras más dimensiones, más detalle puede capturar la IA sin necesidad de almacenar imágenes completas.
Este tipo de representación es:
segura: no guarda fotos, solo vectores.
eficiente: comparar dos vectores es rápido incluso en dispositivos como la Jetson Nano o la Orin Nano.
muy preciso: funciona incluso con cambios de luz, expresión o ángulo.
Este avance será parte fundamental de:
BuscaBot: identificación de personas en entornos complejos.
Sistema Mesa STEAM: reconocimiento para demostraciones educativas.
Publicado por: Leli Liliana Díaz Izquierdo
Ingeniera de Sistemas – Docente e investigadora en Robótica Educativa
Noviembre 2025