Organizar fotos de cámara trampa: flujo de datos

Esta es la verdad incómoda de la que nadie te avisa cuando compras tu primera docena de cámaras: la parte difícil del fototrampeo no es el trampeo. Es todo lo que ocurre después de que las tarjetas SD llegan a casa. Un solo proyecto acumula sin esfuerzo desde miles de imágenes por tarjeta hasta cientos de miles, incluso millones, de archivos. Y en el momento en que ese montón existe, empieza a correr un reloj, porque un archivo que no puedes consultar, en el que no puedes confiar y que no puedes entregar a nadie más es, a efectos de investigación, apenas un archivo.

Quienes estudian esto para ganarse la vida lo dicen de forma contundente. En toda la literatura, el hallazgo que se repite es que la gestión de los datos, y no su recolección, es el factor limitante para completar los estudios de cámara trampa. Las cámaras se abarataron y se volvieron fiables; el muro del almacenamiento y el etiquetado no se movió. La catalogación va por detrás de la adquisición, y «una gran cantidad de datos permanece sin usar y, en última instancia, se pierde para la ciencia y la gestión de la conservación». Una revisión constató que las comparaciones entre sitios y los metanálisis están casi por completo ausentes de la literatura, no porque los datos no existan, sino porque cada quien los organizó de forma distinta, a su manera privada, y nadie puede combinarlos.

Este artículo trata del paso anterior al análisis: cómo estructurar, nombrar, etiquetar, respaldar y, con el tiempo, compartir un archivo de fotos de cámara trampa de modo que sobreviva al proyecto, sobreviva a la rotación de personal y siga siendo útil para ti y para cualquiera con quien colabores. No trata de dónde colocar las cámaras, ni de convertir marcas de tiempo en curvas de actividad; esos son trabajos aparte. Piensa en lo que sigue como la fontanería. Es poco vistoso, es donde la mayoría de los proyectos pierde valor en silencio, y hacerlo bien depende casi por completo de decisiones que tomas en la primera hora, no en la última.

Por qué este es el cuello de botella, y por qué «ya lo ordeno luego» fracasa

Conviene entender por qué este paso se traga proyectos, porque las razones te dicen de qué defenderte.

La primera razón es el volumen bruto chocando con el trabajo manual. Recuperar, almacenar, organizar y —lo más doloroso— identificar el contenido de cada imagen se sigue haciendo en gran medida a mano, y la clasificación de imágenes se señala de forma sistemática como el mayor reto del fototrampeo. El trabajo es «laborioso, lento, propenso a errores y caro». Cuando el trabajo no puede seguir el ritmo, el atasco crece, y un atasco de imágenes sin catalogar es, en la práctica, un atasco de datos perdidos.

La segunda razón es que la manipulación manual genera errores, y los errores en un archivo son corrosivos de un modo que no lo son en una simple hoja de cálculo. Hay una cifra concreta y elocuente para esto, de un estudio de comportamiento en Namibia que gestionó unas 1,2 millones de fotografías de 26 cámaras a lo largo de tres años: antes de que el equipo automatizara la manipulación de archivos, los errores humanos —carpetas mal etiquetadas, copias enviadas al lugar equivocado— representaban el 15,5 % de sus pérdidas de datos; después de dejar que el software gestionara las descargas, eso bajó al 6,2 %. Las mismas personas, las mismas cámaras. La diferencia fue la estructura.

La tercera razón es la que más le cuesta al campo: la fragmentación. Como la mayoría de los proyectos solo se preocupó de su propia especie objetivo y construyó su propio sistema improvisado, el resultado es lo que un artículo muy citado llama «datos oscuros»: datos no disponibles para otros investigadores ni para el público, encerrados en un formato propio de un programa y guardados en el disco local de alguien. Las cámaras trampa son indiscriminadas; fotografían todo lo que dispara el sensor. Si solo catalogas los cérvidos y descartas el resto, has tirado datos por los que otro equipo —que estudie los zorros, o a las personas, o las interacciones entre ambos— habría dado cualquier cosa. La solución es catalogarlo todo, de forma coherente, a la primera.

Así que «ya lo ordeno luego» fracasa por una razón sencilla: luego es cuando el volumen es mayor, el recuerdo de qué cámara estaba dónde es más débil y el coste de cada error se multiplica en toda la colección. La disciplina hay que anticiparla. La buena noticia es que la versión anticipada no da mucho trabajo: son sobre todo un puñado de convenciones aplicadas desde el primer día. Las cámaras se abarataron y se volvieron fiables; el muro del almacenamiento y el etiquetado no se movió, y la única manera de superarlo es construir los hábitos antes de que exista el montón.

Las cámaras se abarataron y se volvieron fiables; el muro del almacenamiento y el etiquetado no se movió.

Estructura de carpetas: organiza por despliegue, copia de la tarjeta tal cual

Empieza por las carpetas, porque todo lo demás cuelga de ellas.

Hay un acuerdo llamativo en todo el campo sobre el principio básico, aunque las herramientas difieran: organiza el material en un directorio por despliegue —siendo un despliegue una única colocación de una cámara en un punto durante un tramo de tiempo— y no renombres los archivos según salen de la tarjeta. La guía de buenas prácticas de GBIF lo enuncia casi como un mandamiento: «Evita renombrar los nombres de los archivos multimedia. En su lugar, organiza los archivos multimedia en un directorio por cada despliegue».

¿Por qué tanta insistencia en no renombrar? Por cómo funciona en realidad la unicidad de los nombres de archivo. La mayoría de las cámaras nombra los archivos con un contador secuencial corto (`IMG_0001.JPG`, `PICT0001.JPG`), y esos nombres solo están garantizados como únicos dentro de una tarjeta. Vuelca imágenes de tres cámaras en una carpeta y colisionarán de inmediato tres archivos `IMG_0001.JPG`. Mantener cada despliegue en su propio directorio esquiva todo el problema, y significa que puedes copiar el contenido de una tarjeta exactamente tal cual: sin transformación, sin oportunidad de introducir un error. Los autores de Aardwolf construyeron todo su esquema de tres niveles (proyecto → cámara → carpeta de operación de descarga) en torno a esta idea: «esta estructura física también garantiza que la copia de directorios desde una tarjeta de almacenamiento de cámara trampa pueda hacerse tal cual».

El paquete de R camtrapR formaliza una disposición muy relacionada. Para un muestreo con una cámara por estación, obtienes `rawImages/stationA`, `rawImages/stationB`, y así sucesivamente; con más de una cámara por estación, añades un nivel: `rawImages/stationA/camera1`, `rawImages/stationA/camera2`. Y viene con una advertencia que merecería tatuarse en algún sitio visible: «Si tienes más de una cámara por estación pero no separas en esta fase las imágenes de las distintas cámaras, no podrás hacerlo más adelante». Fusiónalas ahora y la procedencia se pierde para siempre. Este es el tema recurrente de todo el asunto: cierta información solo puede conservarse en el momento de la ingesta, nunca reconstruirse.

Dos hábitos más lo redondean. Primero, conserva tus imágenes en bruto como copia de seguridad intacta y trabaja sobre una copia: la función de renombrado de camtrapR copia deliberadamente las imágenes a una nueva ubicación para que los originales nunca corran riesgo. Segundo, no guardes nada más que imágenes dentro de tus directorios de imágenes; los archivos ajenos pueden interferir con las herramientas que escanean esas carpetas.

¿Cuánta profundidad debe tener la jerarquía? Toma la regla práctica del mundo de la gestión de datos de investigación, que lleva pensándolo más tiempo que los fototrampeadores: limita las carpetas a tres o cuatro niveles de profundidad e intenta no tener más de unos diez elementos en cualquier lista, manteniendo los datos y la documentación en ramas separadas. Un proyecto de cámara trampa encaja aquí de forma natural —proyecto, luego sitio o despliegue, luego tarjeta— sin que nadie tenga que forzarlo.

Cierta información solo puede conservarse en el momento de la ingesta, nunca reconstruirse.

Convenciones de nombres: empieza por la fecha, nunca por la especie

Manos enguantadas retirando una tarjeta SD de una cámara de fauna en un árbol hacia una funda de tarjetas etiquetada

Si sí renombras los archivos —y hay razones legítimas para hacerlo, sobre todo para que sean autodescriptivos una vez que salen de la seguridad de su carpeta—, hay una forma correcta y varias equivocadas.

La regla más importante con diferencia es hacer que el orden alfabético coincida con el cronológico. El truco limpio es empezar el nombre por la fecha, `AAAAMMDD`, o la fecha y la hora, `AAAAMMDD_HHMMSS`. La guía de GBIF da los ejemplos resueltos directamente: `20200709_093352.JPG` está bien, porque se ordena correctamente; `09072020_093352.JPG` está mal, porque nombrar con el día primero descoloca el orden cronológico en cuanto tienes más de un mes de datos. Esto no es pedantería: la mitad de las herramientas que usarás asumen que el orden de los archivos refleja el orden temporal, y una cámara que nombra los archivos `1.jpg, 2.jpg … 10.jpg` será leída por tu ordenador como `1, 10, 2 …`, rompiendo esa suposición en silencio.

Las guías genéricas de archivado de datos coinciden y añaden los detalles de higiene: usa fechas en formato ISO `AAAA-MM-DD`, separa los elementos con guiones o guiones bajos, evita espacios y caracteres especiales como `&`, `?` o `!`, mantén los nombres significativos pero breves, reserva la extensión de tres letras para el formato del archivo e incluye un indicador de versión donde importe. El propio esquema de nombres de camtrapR es una instancia concreta de todo esto: renombra a `StationID__Date__Time(X).JPG`, donde el `(X)` desambigua imágenes tomadas en el mismo minuto, y reserva los guiones bajos dobles como delimitadores de campo, de modo que tus identificadores de estación y de cámara no deben contener guiones bajos.

Hay una regla aquí que los fototrampeadores infringen constantemente, y merece su propia línea: no guardes información de clasificación en el nombre del archivo. Es tentador renombrar una foto como `..._Ardea_alba_1_Anas_platyrhynchos_macho_hembra.jpg` para poder encontrarla luego. No lo hagas. La guía de GBIF señala exactamente esto como mala práctica. La razón es que una identificación no es un hecho sobre el archivo; es una interpretación, y las interpretaciones se revisan. Graba «zorro rojo» en mil nombres de archivo y luego descubre que la mitad eran de otra especie, y tendrás mil operaciones de renombrado y un rastro de auditoría roto. Las etiquetas pertenecen a los metadatos, donde pueden corregirse sin tocar la identidad del archivo, que es justo a donde nos dirigimos ahora. (camtrapR puede añadir un nombre de especie a un nombre de archivo como comodidad para hojear, pero ten en cuenta que lee ese identificador de especie de tu estructura de carpetas o de tus etiquetas de metadatos en primer lugar; la identificación vive en otra parte, y el nombre del archivo es solo una copia de ella.)

Cuando de verdad necesites renombrar en bloque, no lo haces a mano. Existen herramientas dedicadas de renombrado por lotes para cada plataforma, y la utilidad de metadatos ExifTool puede renombrar archivos a partir de sus propios metadatos —extrayendo la fecha de captura de cada imagen para construir el nuevo nombre—, además de ediciones de metadatos por lotes, geoetiquetado y corrección de fecha y hora.

Etiquetado y anotación: acuerda el esquema antes de tocar una imagen

Ahora la parte que todos consideran «el trabajo»: revisar las imágenes y registrar qué hay en ellas. Este paso se llama etiquetado —examinar cada imagen y codificar como datos sus atributos de interés— y es donde ocurren los errores más grandes, más caros y más evitables.

La lección más profunda aquí viene de un artículo que destila ocho años de construcción de la herramienta de análisis de imágenes Timelapse, y no es un consejo sobre software. Es sobre una decisión que tomas antes del software: especifica y despliega un esquema de datos común. Antes de que nadie etiquete nada, quien dirige el proyecto debería decidir exactamente qué datos se registrarán de las imágenes, definirlo como un esquema estandarizado y legible por máquina —los campos, sus nombres, sus tipos de dato, sus valores permitidos— y luego hacer que el software lo imponga. La razón es el problema de los múltiples etiquetadores. Un proyecto real tiene varias personas (a menudo incluyendo voluntariado) trabajando cada una en una porción de las imágenes, y «sin coherencia en los datos —si cada analista especificara de forma idiosincrásica qué datos codificar de las imágenes, en qué formato y bajo qué nombre— sería extremadamente difícil dar sentido a los datos entre analistas». Acuerda primero el esquema, o pasarás el resto del proyecto reconciliando diez dialectos del mismo conjunto de datos.

Una plantilla concreta y citable para ese esquema es la disposición de cuatro tablas hacia la que convergen los proyectos organizados, bien recogida en un ejemplo didáctico construido en torno a un conjunto de datos canadiense: una tabla de proyecto (objetivos, diseño, quién está a cargo), una tabla de imagen u observación (especie, recuento, edad/sexo, comportamiento, marca de tiempo, por imagen), una tabla de despliegue (ubicación, inicio y fin, cámara, altura, orientación) y un inventario de cámaras (marca, modelo, número de serie). Cada colocación única de cámara recibe su propio registro de despliegue. Este es el mismo esqueleto que usan los estándares formales —más sobre eso en breve—, y aunque nunca publiques, disponer tus datos así desde el principio significa que guardas las cosas correctas en los lugares correctos.

Más allá del esquema, el artículo de los ocho años de Timelapse es un catálogo de patrones de eficiencia ganados a pulso, y vale la pena conocerlos porque separan un flujo de trabajo que lleva una temporada de otro que lleva un año. El mismo equipo midió mejoras de tiempo de en torno al 200 % frente a analistas que usaban una simple hoja de cálculo. Algunos de los patrones que más importan:

Minimiza la escritura. Escribir es lento y propenso a errores; sustitúyelo por selección siempre que sea posible: menús desplegables para la especie, casillas de verificación para las marcas, autocompletado que ofrece tus entradas previas.
Cuenta haciendo clic y marca lo que has contado. Cuando una imagen contiene una manada, es fácil contar mal: perder el sitio, contar doble, saltarse uno. Dejar que quien etiqueta haga clic en cada animal para incrementar un contador y deposite un marcador visible corrige los tres modos de error a la vez y permite que una segunda persona verifique el recuento después.
Autocompleta cualquier cosa que el ordenador ya sepa. El nombre del archivo, la carpeta y la fecha y hora de captura deberían rellenarse automáticamente, nunca reescribirse. Muchas cámaras también incrustan extras —temperatura ambiente, a veces GPS— que pueden extraerse directamente de los metadatos de la imagen a tus campos de datos.
Agrupa las ráfagas en episodios. Un disparo por movimiento suele producir una ráfaga, y un animal que se demora genera muchos fotogramas casi idénticos. Agrupar en un único «episodio» las imágenes tomadas en un intervalo corto permite a quien etiqueta registrar el suceso una vez en lugar de inflar los recuentos; la herramienta puede marcar el primer fotograma de cada episodio y numerar el resto.
Propaga los valores repetitivos. A lo largo de una serie de imágenes similares, los datos suelen ser idénticos; los controles de copiar hacia delante, rellenar hacia atrás y copiar a todo convierten cien entradas idénticas en una.

Esto no son lujos. Las malas decisiones de herramientas suponen «introducción tediosa de datos… propensa a errores (lo que afecta a la validez de los datos recogidos)… y —a la larga— muy cara en términos de tiempo de analista». De paso, esta es la manera más honesta de pensar en el software en general para esta tarea: el propio repaso del campo a los programas disponibles constató que ninguna herramienta ha surgido como favorita clara, y un informe destacado de buenas prácticas concluyó prácticamente lo mismo: muchos proyectos grandes «han terminado diseñando sus propios sistemas desde cero», y puede que necesites probar varios antes de que uno encaje en tu flujo de trabajo. No hay una respuesta correcta universal; está la disciplina del esquema, y está ajustar la herramienta a cómo trabaja de verdad tu gente.

Acuerda primero el esquema, o pasarás el resto del proyecto reconciliando diez dialectos del mismo conjunto de datos.

Dónde viven las etiquetas: EXIF, IPTC, XMP y archivos adjuntos

Un portátil y un disco externo sobre una mesa de campo mostrando un árbol organizado de carpetas fechadas

Así que has etiquetado una especie en una imagen. ¿Dónde va físicamente esa etiqueta, y seguirá ahí cuando copies la carpeta a la máquina de un colega dentro de un año?

Aquí conviene entender los tres estándares de metadatos que viven dentro (y junto) a un archivo de imagen, porque hacen trabajos distintos:

EXIF es lo que la cámara escribe en el momento de la captura: fecha y hora, más ajustes como velocidad de obturación, exposición, ISO y estado del flash. En general no lo editas; lo lees. El campo de fecha y hora (`DateTimeOriginal`) es la joya de la corona aquí, y volveremos a por qué.
IPTC es para el texto posterior a la captura que añades tú: autor, derechos de autor, pies de foto y, sobre todo, palabras clave. Su pega es que sus campos de texto tienen la longitud limitada.
XMP es la evolución moderna de IPTC. «Elimina las limitaciones de tamaño de texto» y admite varios idiomas, motivo por el cual las herramientas suelen recomendar dar máxima prioridad a XMP para etiquetas y pies de foto.

El punto que hace que los tres importen para un archivo: las palabras clave y las etiquetas pueden escribirse directamente en los propios metadatos de la imagen, mediante los campos IPTC y XMP. Eso significa que una etiqueta de especie —«zorro rojo», o todo un sujeto jerárquico como Mammalia > Carnivora > Vulpes > Vulpes vulpes— puede almacenarse dentro de la foto, de modo que viaja con el archivo. Como lo expresa con claridad la documentación de una herramienta de metadatos: «Almacenar los metadatos directamente en los archivos de imagen permite que esta información se conserve al mover o enviar los archivos de imagen a sistemas distintos». En eso consiste todo el juego. Una etiqueta en una base de datos aparte que se queda atrás en una copia es una etiqueta que has perdido; una etiqueta incrustada en el archivo es una etiqueta que sobrevive al viaje.

Hay una sutileza que conviene conocer, sobre todo si haces algo de RAW o vídeo. No siempre puedes volver a escribir metadatos en el archivo original: los formatos RAW suelen ser de solo lectura, y el etiquetado de vídeo está poco estandarizado. La respuesta es un archivo adjunto (sidecar): un pequeño archivo acompañante (llamado `nombre.ext.xmp`) que guarda los metadatos junto a la imagen, usado por sí solo o además de escribir dentro del archivo. Así que la elección práctica es configurable —escribir las etiquetas en la imagen, en un adjunto o en ambos— y el ajuste correcto depende de tus tipos de archivo.

Un híbrido pragmático y muy usado es almacenar las etiquetas en dos sitios a la vez: incrustadas en la imagen (o su adjunto) para que sean portátiles, y también en una base de datos externa para búsquedas rápidas, tratando la base de datos como una caché y los archivos como «la única fuente de verdad». Así consigues velocidad al consultar y durabilidad al mover.

Bajo casi todo esto se asienta una herramienta pequeña, poco vistosa e indispensable: ExifTool, la utilidad gratuita e independiente de plataforma de Phil Harvey para leer, escribir y editar metadatos en cientos de formatos, incluidos EXIF, IPTC y XMP. Es el motor en el que se apoyan los paquetes de investigación —camtrapR, por ejemplo, depende de él para cada operación de metadatos y no hace gran cosa sin él. Puede que rara vez lo llames directamente, pero casi con seguridad está haciendo el trabajo detrás de lo que sea que uses.

Una nota honesta sobre cómo se ensambla en la práctica el flujo de etiqueta-de-especie-en-metadatos, porque las herramientas reparten el trabajo de una forma que sorprende. Suele ser una aplicación general de gestión de fotos la que escribe la palabra clave de la especie en los metadatos de la imagen en primer lugar (mediante sus campos de palabra clave o sujeto), y el paquete de R luego lee esas etiquetas incrustadas —camtrapR puede extraer un identificador de especie de la etiqueta de metadatos `HierarchicalSubject` que escribió una aplicación de etiquetado— para armar sus tablas de registros. La identificación se origina en la herramienta de etiquetado; el campo de metadatos es cómo se almacena y se transmite.

Una etiqueta en una base de datos que se queda atrás en una copia es una etiqueta que has perdido; una etiqueta incrustada en el archivo es una etiqueta que sobrevive al viaje.

La marca de tiempo merece una paranoia especial

Entre todos los datos que acompañan a una imagen, un campo es singularmente irrecuperable, y vale la pena sacarlo de la discusión de los metadatos para insistir en él por separado.

La guía de GBIF es tajante: la fecha y hora en que se tomó una foto «es el aspecto más importante de sus metadatos… y no puede derivarse después», a diferencia, por ejemplo, de la ubicación de la cámara, que siempre puedes consultar a posteriori. Equivócate con la marca de tiempo y no hay una segunda fuente con la que corregirla. El equipo de Timelapse, tras ocho años viendo cómo esto salía mal, catalogó los cuatro fallos clásicos: una cámara cuyo reloj sencillamente nunca se ajustó bien (todo desfasado una cantidad fija); una cámara que no gestiona el cambio de hora de verano (un bloque de imágenes desfasado una hora); un reloj que se adelanta o atrasa lentamente a lo largo de un despliegue; y una cámara que registra las fechas de forma ambigua, como `02/10/2019`, que podría ser el 2 de octubre o el 10 de febrero según la convención.

Dos hábitos previos previenen la mayoría de esto, y ambos son neutrales respecto a la localización por diseño. Primero, ajusta el reloj de la cámara a la hora universal coordinada (UTC) o a la hora local de invierno, y desactiva el cambio automático a la hora de verano; luego registra por separado la zona horaria del despliegue. La razón por la que esto supera a «ponlo en hora local» es que el cambio a hora de verano es el saboteador silencioso: mete una costura oculta de una hora en la mitad de tus registros, y un reloj fijado en UTC o en hora de invierno sencillamente no tiene ninguna costura en la que tropezar. Segundo, cuando exportes o nombres archivos, escribe las horas en un orden inequívoco —fecha primero, `AAAA-MM-DD` o la marca de tiempo ISO completa— para que nadie aguas abajo tenga que adivinar si `02/10` es el 2 de octubre o el 10 de febrero.

Si descubres a posteriori que el reloj de un despliegue estaba mal por una cantidad conocida, se puede recuperar en bloque: la herramienta puede desplazar las marcas de tiempo de todas las imágenes de una carpeta un desfase fijo, que es la forma correcta de gestionar, por ejemplo, el fallo de firmware que envió un fabricante importante y que descolocó el año en sus cámaras en el paso de 2015 a 2016. Respalda primero las imágenes, luego corrige. El punto de fondo se mantiene: un error de reloj detectado en la ingesta es una molestia de cinco minutos; el mismo error detectado nunca es una ficción permanente en tu conjunto de datos.

Vista por encima del hombro de una persona etiquetando en pantalla una foto de un cérvido de cámara trampa

Despejar las fotos vacías: prefiltrado con IA

Aquí está la parte del flujo de trabajo donde el problema del volumen y las herramientas modernas por fin se encuentran a tu favor.

Las cámaras trampa se disparan por calor y movimiento, lo que significa que se disparan por ramas mecidas por el viento, hierba oscilante, lluvia, sol cambiante y aire cálido con tanta facilidad como por animales. El resultado es que una gran mayoría de los fotogramas de un despliegue típico no contiene ningún animal: son fotos vacías. (Verás citada por el campo una cifra concreta de «70-95 % vacías»; trátala como folclore salvo que tus propios datos digan lo contrario, porque no está anclada a una única fuente sólida. Lo que sí está bien establecido es la realidad cualitativa: las fotos vacías suelen empequeñecer a las útiles, y revisarlas a mano es el gran sumidero de tiempo de toda la empresa.) Vadearlas manualmente es justo el trabajo «aburrido» que se traga las horas de analista.

La herramienta estándar para atravesarlas es un modelo detector —el más destacado, MegaDetector, el modelo de código abierto del laboratorio AI for Good de Microsoft. Hace un solo trabajo y lo hace de forma amplia: «detecta animales, personas y vehículos en imágenes de cámara trampa y filtra las imágenes vacías, reduciendo la revisión manual en grandes conjuntos de datos». Entrenado con varios millones de imágenes de muchos ecosistemas, ha sido adoptado por bastante más de un centenar de organizaciones en todo el mundo, desde agencias nacionales de fauna hasta laboratorios universitarios de varios continentes. Es fundamental que entiendas su alcance: MegaDetector encuentra animales; no los identifica hasta la especie. Es un primer barrido burdo pero implacable —animal / persona / vehículo / nada— que te permite apartar los fotogramas vacíos y dedicar tu atención real a los fotogramas que de verdad contienen algo. Las coordenadas y la confianza del detector fluyen luego a una herramienta de etiquetado, que dibuja un recuadro alrededor de cada detección y te deja aceptarla, rechazarla o asignarle una especie.

Una nota sobre lo que esto te da y lo que no. Un detector despeja las fotos vacías; no hace tu identificación de especie, e incluso emparejado con un clasificador de especies, la precisión de la visión artificial todavía va por detrás de un experto humano, de modo que la recomendación duradera en todo el campo es prefiltrado asistido por IA más verificación humana, no automatización ciega. Usado así, cambia la aritmética de un proyecto: en lugar de que una persona abra cada una de unos cientos de miles de imágenes, abre la fracción que un detector marca como no vacía, y verifica a partir de ahí.

Un detector despeja las fotos vacías; no hace tu identificación de especie: emparéjalo con una persona, no con fe ciega.

Copias de seguridad y almacenamiento: da por hecho que un disco morirá, porque lo hará

Un archivo solo es tan duradero como su peor punto único de fallo, y en el fototrampeo ese punto suele ser un disco duro en un escritorio.

El volumen que hace difícil todo lo demás hace también que la copia de seguridad no sea trivial: «no es trivial almacenar, respaldar y gestionar de forma segura los archivos multimedia» a esta escala. La orientación estándar es usar servicios en la nube o almacenamiento institucional bien gestionado, aceptando que esto tiene un coste real, y —donde puedas— usar un sistema de almacenamiento capaz de servir los archivos a través de direcciones web estables, de modo que un conjunto de datos publicado pueda referenciar las imágenes directamente en lugar de enviar copias de todo. Las guías genéricas de gestión de datos refuerzan la disciplina obvia que los fototrampeadores se saltan a su propio riesgo: copia de seguridad deliberada, no solo «está en mi portátil».

Dos decisiones de diseño de las herramientas vale la pena robar aunque nunca las toques. La primera es el modelo de archivos como fuente de verdad ya mencionado: mantén los datos autoritativos en los archivos de imagen (y sus adjuntos) y trata cualquier base de datos como una caché reconstruible. Si la base de datos se corrompe, la regeneras desde los archivos; nunca pierdes las observaciones reales. La segunda es separar la organización lógica de la ubicación física —permitir que los datos de un proyecto abarquen varios discos o un recurso de red y aun así se presenten como una única jerarquía limpia—, que es precisamente cómo un sistema minimalista escaló a más de un millón de fotos en hardware corriente.

El hilo conductor es dejar de confiar en cualquier dispositivo aislado. Los discos fallan, las tarjetas se corrompen, y el recuento contundente de fallos físicos del estudio de Namibia —daños por lluvia, baterías muertas, fallos de tarjeta, destrucción por fauna— recuerda que el campo es hostil a tus datos mucho antes de que lleguen a un ordenador. La redundancia no es opcional; es el precio de mantener vivo un archivo de varios años.

Dos discos duros externos conectados en un escritorio para copia de seguridad con las luces de estado encendidas

Estándares de datos: hablar un idioma que otros puedan leer

Todo lo anterior hace tu archivo usable para ti. Los estándares son lo que lo hace usable para todos los demás y, cada vez más, para tu propio yo futuro y los modelos de aprendizaje automático que quizá entrenes más adelante.

Dominan dos estándares, y encajan uno dentro de otro con limpieza.

Camtrap DP (el Camera Trap Data Package) es el hecho a medida. Es un formato de intercambio desarrollado por la comunidad, gestionado bajo el organismo de Estándares de Información sobre Biodiversidad (TDWG), que estructura todo un proyecto en tres tablas enlazadas —Despliegues, Multimedia y Observaciones— más un archivo de metadatos que describe el paquete. Se diseñó precisamente porque, aunque procesar los «grandes datos» de cámara trampa se había vuelto abordable, «la armonización y el intercambio de los datos siguen siendo limitados, lo que dificulta aprovechar todo su potencial». Admite toda la variedad de cómo trabaja la gente en realidad —clasificación humana y por IA, basada en imágenes y basada en eventos— y se construye sobre una especificación abierta de empaquetado de datos ya existente, de modo que el software estándar puede validarlo automáticamente. Es, en efecto, el sucesor moderno de un estándar anterior de metadatos de cámara trampa que definió por primera vez la ahora omnipresente jerarquía de cuatro niveles Proyecto → Despliegue → Secuencia de Imágenes → Imagen y la convención de agrupar en una secuencia las imágenes tomadas en un margen de 60 segundos.

Darwin Core es el estándar de biodiversidad más amplio al que los datos de cámara trampa también pueden fluir. Es «un conjunto de términos con una semántica claramente definida que puede ser entendido por personas o interpretado por máquinas», ratificado como estándar en 2009 y usado para compartir cientos de millones de registros de biodiversidad entre cientos de organizaciones y decenas de países. Sus términos se organizan en clases que cubren cosas como evento, ubicación, ocurrencia y taxón; una observación de cámara trampa se asigna a la clase Occurrence. Como es deliberadamente sencillo e independiente de la tecnología, los mismos datos pueden expresarse como CSV, XML, JSON u otras codificaciones.

¿Cómo eliges? La orientación práctica es clara: para los datos de cámara trampa en concreto, se prefiere Camtrap DP porque «está diseñado específicamente para este tipo de datos y puede retener más información que un Darwin Core Archive», mientras que un Darwin Core Archive es la vía cuando quieres encajar en el mundo más amplio de los datos de biodiversidad. Y ambos no son rivales: hay un paquete de R cuyo único trabajo es leer un Camtrap DP y convertirlo a Darwin Core (y a EML), que es justo el puente que usa un repositorio público para ingerir paquetes de cámara trampa. Puedes trabajar en el formato nativo de cámara trampa y aun así publicar en el general.

Un enfoque que toda esta discusión de estándares vuelve neutral respecto a la localización y que conviene interiorizar: almacena el nombre científico, aunque a la gente solo le muestres el común. Los nombres comunes varían entre regiones e idiomas y a veces señalan animales completamente distintos —«elk» significa una especie en Norteamérica y otra distinta en Europa—, mientras que el nombre científico es globalmente coherente e inequívoco. Mantén una única tabla de referencia de las especies que esperas, tomada de una taxonomía autorizada, y almacena el nombre científico como ancla. Es un hábito pequeño que salva a una colaboración internacional de una categoría de confusión que es genuinamente difícil de desenredar a posteriori.

Compartir y archivar: convertir una carpeta privada en un activo público

El último paso —y el que distingue un archivo de investigación de una caja de zapatos personal— es publicar los datos en algún sitio donde otros puedan encontrarlos y reutilizarlos.

El destino, en el mundo de la investigación, suele ser un repositorio público de biodiversidad al que se llega mediante una tubería de publicación estándar; el Sistema Global de Información sobre Biodiversidad (GBIF) es el principal, y publicas en él estandarizando primero tus datos a Camtrap DP o Darwin Core. El objetivo rector tiene un nombre —datos FAIR: localizables, accesibles, interoperables, reutilizables— y la receta es concreta: deposita los datos en un repositorio que les dé un identificador único y estable, adjunta metadatos ricos para que otros puedan juzgar si les encajan, añade una licencia abierta para que tengan permiso de usarlos y estandariza el formato para que de verdad se combine con otros conjuntos de datos. La recomendación firme es publicar un conjunto de datos por proyecto, lo que mantiene el alcance, los métodos y los colaboradores describibles en un único lugar coherente.

Antes de que nada se haga público, importan dos pasos de preparación. Primero, identificadores estables y únicos para tus registros, idealmente los que tu sistema de gestión ya asignó, usados tal cual en lugar de manipulados, ya que añadir trozos a un identificador solo lo vuelve frágil. Segundo, gestiona la información sensible generalizando, no borrando. Los datos de cámara trampa cargan con tres tipos de sensibilidad: las ubicaciones de especies raras o amenazadas (que pueden atraer a cazadores furtivos), las ubicaciones de tus propias cámaras (robo y vandalismo) y los datos personales —los nombres de participantes, y cualquier imagen de personas identificables, que caen bajo normativas de privacidad como el RGPD. El enfoque recomendado es difuminar las coordenadas de una especie sensible en lugar de retener el registro por completo, mantener privadas las imágenes de personas y documentar cualquier generalización que hayas aplicado para que quien use los datos sepa qué está mirando. El mundo de la ciencia ciudadana lleva mucho haciendo versiones de esto: enmascarar la ubicación de especies amenazadas y en peligro para que los puntos de datos públicos resuelvan solo hasta el centro de un proyecto, y ofrecer embargos de datos para que un equipo tenga la primera oportunidad de publicar antes de que los datos se abran.

Vale la pena decir sin rodeos por qué molestarse en compartir, porque es fácil tratar la publicación como una carga burocrática. Toda la razón por la que el problema de los «datos oscuros» importa es que los datos de cámara trampa compartidos en un formato coherente son reutilizables mucho más allá de su propósito original: para modelización de la distribución de especies, para seguimiento de la biodiversidad, incluso como datos de entrenamiento para la próxima generación de modelos de detección. Los datos que recogiste para responder una pregunta pueden, bien archivados y compartidos, ayudar a responder una docena que nunca se te ocurrió plantear. Ese es todo el argumento para hacer cualquier parte de esto con cuidado: un archivo organizado, estandarizado y publicado abiertamente no solo sobrevive a tu proyecto, lo supera.

Los datos que recogiste para responder una pregunta pueden, bien archivados, ayudar a responder una docena que nunca se te ocurrió plantear.

Un flujo de trabajo mínimo, de principio a fin

Un monitor mostrando fotogramas de bosque vacío separados de fotogramas que contienen un zorro y un cérvido

Si quieres todo el asunto como una secuencia, aquí está la columna vertebral que las fuentes describen en conjunto; adapta las herramientas, conserva el orden:

Ingesta por despliegue. Copia cada tarjeta en su propia carpeta por despliegue, sin renombrar; conserva intacta la copia en bruto como copia de seguridad.
Arregla el reloj primero. Verifica las marcas de tiempo; si el reloj de un despliegue estaba desfasado una cantidad conocida, desplázalo en bloque ahora, antes de que nada más lea esas horas.
Decide el esquema. Define tus campos de datos y valores permitidos de antemano y haz que tu software los imponga a cada persona que etiquete.
Prefiltra las fotos vacías. Ejecuta un detector para apartar los fotogramas vacíos, de modo que la atención humana vaya solo a las imágenes con algo dentro.
Etiqueta con eficiencia, hacia los metadatos. Identifica y anota usando selección en lugar de escritura y agrupación por episodios en lugar de fotograma a fotograma, y almacena las etiquetas en el propio EXIF/IPTC/XMP de la imagen (o en un adjunto) para que viajen.
Respalda con redundancia. Almacenamiento en la nube o institucional, más la disciplina de que los archivos —no ninguna base de datos— son la fuente de verdad.
Estandariza y comparte. Exporta a Camtrap DP (o Darwin Core), generaliza cualquier cosa sensible y publica un conjunto de datos por proyecto en un repositorio público.

Ninguno de estos pasos es difícil. Varios son imposibles de hacer después. Esa asimetría es toda la razón para tomarse en serio el paso aburrido: el archivo que puedes entregar a un desconocido dentro de cinco años se construye, o se pierde, en la primera hora después de que las tarjetas llegan a casa.

Preguntas frecuentes

¿Cómo debería organizar las fotos de cámara trampa en carpetas?

Haz una carpeta por despliegue —una única colocación de cámara durante un único tramo de tiempo— y copia dentro el contenido de cada tarjeta de memoria sin renombrar los archivos. Esto evita que los nombres de archivo colisionen entre cámaras, conserva el vínculo entre una foto y su procedencia y te permite copiar las tarjetas exactamente tal cual. Mantén la jerarquía de carpetas en tres o cuatro niveles de profundidad, y nunca fusiones imágenes de dos cámaras de una estación salvo que estés seguro de que nunca las necesitarás separadas.

¿Debería poner el nombre de la especie en el nombre del archivo?

No. Una identificación es una interpretación que puede revisarse, así que pertenece a los metadatos, no al nombre del archivo; la guía de buenas prácticas de GBIF lista explícitamente la especie-en-el-nombre-del-archivo como mala práctica. En su lugar, empieza los nombres de archivo por la fecha (`AAAAMMDD_HHMMSS`) para que se ordenen cronológicamente, y escribe las etiquetas de especie en los campos de palabra clave IPTC/XMP de la imagen, donde pueden corregirse sin renombrar nada.

¿Cuál es el mejor formato o estándar para compartir datos de cámara trampa?

Para los datos de cámara trampa en concreto, Camtrap DP es el estándar de publicación preferido, porque está hecho a medida y retiene más información que la alternativa; Darwin Core es el estándar de biodiversidad más amplio a usar cuando alimentas el ecosistema de datos más grande. Son compatibles: existen herramientas para convertir un paquete Camtrap DP a Darwin Core y publicarlo en un repositorio como GBIF.

¿Las etiquetas de especie se quedan con la imagen si muevo el archivo?

Solo si las incrustas en los propios metadatos de la imagen (o en un archivo adjunto emparejado). Las etiquetas escritas en los campos IPTC o XMP se conservan cuando el archivo se copia o se envía a otro sistema; las etiquetas guardadas solo en una base de datos aparte se quedan atrás cuando mueves la imagen. Una configuración robusta las almacena en ambos sitios: en el archivo para portabilidad, en una base de datos para búsquedas rápidas.

¿Cómo lidio con la enorme cantidad de fotos vacías?

Usa un detector de IA para prefiltrarlas. Un modelo como MegaDetector marca si cada fotograma contiene un animal, una persona o un vehículo y aparta las vacías, de modo que solo revisas imágenes con algo dentro; aunque no identifica la especie, así que emparéjalo con verificación humana en lugar de confiar en él a ciegas. La gran mayoría de los fotogramas de un despliegue típico suelen estar vacíos, motivo por el cual este único paso ahorra la mayor cantidad de tiempo.

¿Qué ajuste de reloj debería usar en mis cámaras?

Ajusta el reloj a la hora universal coordinada (UTC) o a la hora local de invierno, desactiva el cambio automático a la hora de verano y registra por separado la zona horaria del despliegue. La marca de tiempo es el único dato de los metadatos que no puedes reconstruir después, y el cambio a hora de verano mete en silencio un error de una hora en parte de tus datos; un reloj fijado en UTC o en hora de invierno evita esa costura por completo.