Comprenda qué son los metadatos de video, cómo se generan, dónde se utilizan y cómo apoyan a los sistemas inteligentes de video monitoreo.
¡Descúbrelo!
En el contexto del Video Monitoreo, los metadatos son descripciones textuales que detallan el contenido visual de un video.
Los metadatos pueden proporcionar una gran variedad de información útil. Pueden ofrecer una descripción detallada de la situación, identificar objetos importantes visibles y aportar información sobre características específicas asociadas a la escena.
Los metadatos aportan contexto a los eventos, permitiendo que grandes volúmenes de grabaciones se organicen y se acceda a ellas rápidamente en búsquedas. Pueden incluir detalles como colores de autos y ropa, ubicaciones exactas de objetos o la dirección de un movimiento, por ejemplo.
Por eso, entender cómo manipular metadatos se ha vuelto cada vez más importante para garantizar seguridad, protección y eficiencia en las operaciones comerciales.
En este artículo hablaremos de los metadatos en el contexto del monitoreo y la eficiencia operativa, detallando cómo funcionan y cómo se utilizan para incorporar inteligencia a los sistemas de monitoreo.
Veámoslo.
[elementor-template id=”24446″]
¿Qué son los Metadatos de Video?
Los metadatos son conjuntos de información estructurada que describen, localizan o facilitan la recuperación, el uso o la gestión de un recurso de información.
Pueden clasificarse en tres tipos diferentes: administrativos, estructurales y descriptivos:
- Los metadatos administrativos proporcionan información para ayudar a gestionar un recurso, como cuándo y cómo fue creado, el tipo de archivo y quién puede acceder a él;
- Los metadatos estructurales detallan cómo están organizados los componentes de un recurso;
- Los metadatos descriptivos proporcionan información que ayuda en el descubrimiento e identificación de otros datos.
En un Sistema de CCTV, los metadatos proporcionan una descripción textual del contenido del video, identificando objetos de interés o suministrando una descripción detallada de la escena.

¿Cómo se generan los Metadatos de Video?
Los metadatos se generan en tiempo real mediante Analíticos de Video. Los analíticos son algoritmos que pueden ejecutarse directamente en la cámara o en un servidor dedicado.
Hasta hace poco, el análisis de video se realizaba exclusivamente en los servidores, ya que demandaba un nivel de procesamiento que los dispositivos de borde no podían soportar.
Con el aumento de la capacidad de procesamiento de las cámaras en los últimos años, se volvió posible realizar análisis avanzados directamente en el borde.
Las herramientas de análisis en el borde tienen acceso a video sin compresión y una latencia extremadamente baja. Esto permite un uso rápido y en tiempo real, evitando los costos y complejidades adicionales asociados a transferir todo el contenido de video para procesarlo en otras partes del sistema.
Sin embargo, es importante destacar que las cámaras equipadas con suficiente capacidad de procesamiento para realizar análisis en el borde suelen tener un costo más elevado. Esto introduce una consideración importante al diseñar un Sistema de Video Monitoreo.
El proyectista debe considerar invertir en cámaras con mayor capacidad de procesamiento o asignar recursos a un servidor dedicado para procesar los analíticos de video.
Esta decisión debe basarse en un análisis cuidadoso del retorno sobre la inversión, teniendo en cuenta factores como el desempeño deseado del sistema, el presupuesto disponible y las necesidades específicas del proyecto.
La elección ideal puede variar dependiendo de las circunstancias específicas de cada proyecto.
¿Dónde se utilizan los Metadatos?
Los principales “consumidores de metadatos” pueden categorizarse de la siguiente manera:

- Aplicaciones de Borde;
- Aplicaciones de Procesamiento Híbrido;
- Sistemas de Gestión de Video (VMS);
- Dashboards.
Aplicaciones de Borde

Las Aplicaciones de Borde se refieren al uso de herramientas de análisis que se ejecutan directamente en la cámara. Estas herramientas pueden aplicar filtros y reglas lógicas para procesar la información relacionada con los objetos detectados en la escena.
Estas herramientas de análisis en el borde son capaces de activar acciones específicas con base en eventos predefinidos o comportamientos identificados. Por ejemplo, pueden controlar una cámara PTZ (Pan-Tilt-Zoom) para seguir el movimiento de una persona detectada en la escena.
La evolución de la computación en el borde permitió el uso de herramientas avanzadas como Inteligencia Artificial (IA), Machine Learning y Deep Learning dentro de las propias cámaras. Esto representa un hito significativo en la forma en que procesamos e interpretamos datos.
Además, las cámaras equipadas con capacidad de procesamiento en el borde pueden almacenar videos directamente en la cámara a través de una tarjeta SD, aumentando la confiabilidad del sistema y posibilitando aplicaciones de sistemas de alto desempeño en regiones remotas.
Aplicaciones de Procesamiento Híbrido

Las Aplicaciones de Procesamiento Híbrido representan un modelo en el que el procesamiento en el borde (en la cámara) y el procesamiento en el servidor se combinan para realizar análisis más avanzados.
En este modelo, el preprocesamiento generalmente se realiza en la propia cámara. Esto puede incluir tareas como la detección inicial de objetos, la aplicación de filtros y la ejecución de análisis básicos.
El procesamiento adicional se realiza entonces en el servidor. Esto puede involucrar análisis más complejos que requieren más poder de procesamiento o capacidad de almacenamiento de la que una cámara puede proporcionar.
Por ejemplo, esto puede incluir la correlación de datos de varias cámaras, la realización de análisis de largo plazo o la aplicación de algoritmos de aprendizaje automático más avanzados.
Sistemas de Gestión de Video (VMS)

Un Sistema de Gestión de Video (VMS) desempeña un papel fundamental en el contexto del Video Monitoreo Inteligente. Actúa como el centro de control del sistema, permitiendo la recepción, procesamiento y almacenamiento de imágenes y videos provenientes de cámaras IP.
El VMS tiene la capacidad de integrar todos los recursos avanzados en una única plataforma. Esto incluye tecnologías como reconocimiento facial, detección de movimiento y análisis de comportamiento, ampliando las capacidades del sistema de monitoreo.
Uno de los principales recursos del VMS es su capacidad de búsqueda avanzada. Cuenta con filtros de búsqueda que permiten a los operadores localizar rápidamente eventos específicos en grabaciones recurrentes. Los criterios de búsqueda pueden definirse utilizando metadatos como fecha, hora, cámara, tipo de evento, color del objeto y dirección del movimiento, por ejemplo.
Además, el VMS dispone de recursos robustos de gestión de usuarios y permisos. Esto permite que los administradores creen perfiles de usuarios con distintos niveles de acceso y control, garantizando que solo individuos autorizados tengan acceso a las cámaras y grabaciones. Esto refuerza la seguridad y la privacidad del sistema.
Por último, un VMS puede integrarse con otros sistemas de seguridad, como control de acceso y sistemas de alarma. Esto permite una visión unificada de los eventos, mejorando la eficacia y la eficiencia del sistema de seguridad.
Dashboards

Los Dashboards son plataformas de Inteligencia de Negocios (Business Intelligence). Reciben y organizan metadatos para facilitar el análisis de tendencias, tanto históricas como en tiempo real.
Estos dashboards emplean análisis estadísticos basados en datos recopilados, como el flujo de clientes o la experiencia general de los clientes en un establecimiento. Estos análisis proporcionan insights valiosos que pueden orientar la toma de decisiones basada en datos, resultando en operaciones más eficientes y eficaces.
Los metadatos recopilados por los dashboards pueden abarcar una amplia gama de información, desde detalles sobre el comportamiento del cliente hasta métricas de desempeño del sistema. Estos datos se procesan y presentan de manera visualmente intuitiva, permitiendo a los usuarios identificar rápidamente patrones, tendencias y anomalías.
Además, los dashboards pueden personalizarse para atender las necesidades específicas de cada organización. Pueden configurarse para rastrear métricas específicas, proporcionar alertas en tiempo real e incluso integrar datos de múltiples fuentes para una visión más completa.
¿Cómo se transmiten los metadatos?
Los metadatos generados en Sistemas de CCTV pueden entregarse de dos maneras distintas, dependiendo del contexto y de las necesidades del sistema que consumirá esta información:
Transmisión en tiempo real
En este método, se proporciona una descripción completa de la escena, cubriendo todos los cuadros, incluso cuando no hay actividad ni objetos presentes.
Los metadatos se envían continuamente y bajo demanda. Esto es esencial en situaciones que exigen una respuesta inmediata y una conciencia situacional precisa.



Esta figura ilustra el flujo de metadatos, donde cuadros continuos de la cámara proporcionan información en tiempo real sobre la escena. Cada cuadro captura la escena en un momento específico, independientemente de eventos pasados.
En el Cuadro 1, se detectan los objetos A y B, clasificando A como una persona con ropa roja y B como una persona con ropa azul.
En el Cuadro 2, la cámara actualiza la clasificación, determinando que el objeto A en realidad lleva ropa azul y el objeto B lleva ropa amarilla. Aunque los objetos son los mismos del Cuadro 1, sus atributos de color cambian y esto se refleja en los metadatos.
El Cuadro 3 muestra la ausencia del objeto B, con la cámara rastreando solo el objeto A, todavía clasificado como una persona con ropa azul.
Entrega optimizada
En este enfoque, los metadatos relacionados con cada objeto específico de la escena se combinan en una única entidad, un proceso que puede denominarse agregación.
Esto significa que, en lugar de tratar cada instancia de cada objeto como una entidad separada, todas las instancias del mismo objeto se tratan como una única entidad. Esto reduce significativamente la cantidad total de datos que deben almacenarse y procesarse, resultando en un uso más eficiente de los recursos del sistema.
Además, en la entrega optimizada, los metadatos se suministran solo cuando hay objetos presentes en la escena. Esto evita la transmisión de datos innecesarios y garantiza que solo la información más relevante llegue al usuario final.


Esta figura demuestra la entrega optimizada de metadatos, donde la cámara proporciona información en un formato unificado con base en el rastreo detectado de los objetos en la escena. Los cuadros para cada objeto abarcan todos los detalles conocidos a lo largo de la vida útil del rastreo del objeto.
En el primer cuadro, se presentan detalles sobre el objeto B, incluyendo su primera y última detección, el resumen de trayectoria y los atributos detectados durante el rastreo. El objeto B tenía un 50% de probabilidad de llevar ropa amarilla y un 50% de probabilidad de llevar ropa azul.
El segundo cuadro refleja este formato para el objeto A, revelando una probabilidad de 33% de ropa roja y una probabilidad de 67% de ropa azul.
Entender las ventajas y desventajas de cada enfoque es esencial para diseñar la arquitectura del sistema.
Además, los metadatos pueden entregarse a través de varios protocolos de comunicación y formatos de archivo, dependiendo de las necesidades y preferencias específicas del sistema consumidor.
Combinando Metadatos de diferentes fuentes
La integración de metadatos de múltiples fuentes es una estrategia poderosa que maximiza el potencial de los metadatos.
Cuando se aplican a diversas fuentes de datos, visuales, auditivas, de actividades y de procesos, los metadatos pueden proporcionar insights valiosos para la gestión eficaz de cualquier lugar.
Fuentes de datos como rastreo RFID, coordenadas GPS, eventos de alarma, lecturas de medidores como temperatura o niveles químicos, detección de ruido y datos transaccionales de punto de venta son ejemplos de fuentes de metadatos que pueden integrarse. La clave de esta integración es alinear los datos de todas las fuentes de acuerdo con sus registros de fecha y hora.
La combinación de metadatos de diferentes fuentes da como resultado una visión más completa y rica que la que puede obtenerse de cada fuente de forma aislada. Esto permite obtener insights más calificados y una toma de decisiones más eficiente.
Conclusión
En conclusión, vimos que los metadatos desempeñan un papel crucial en la optimización de la Seguridad y de la Gestión Operativa.
Ya sea mediante la entrega en tiempo real para respuestas inmediatas, la entrega optimizada para una visión general, o la combinación de metadatos de varias fuentes para una visión más completa, los metadatos están transformando la manera en que gestionamos e interpretamos la información.
A medida que seguimos explorando e innovando en esta área, podemos esperar ver aún más mejoras en la eficiencia, la eficacia y la capacidad de los Sistemas de Video Monitoreo.