trail.cam

Modelos de ocupación para cámaras trampa: cuando una cámara en blanco no significa que el animal se haya ido

Una cámara trampa en un árbol vigilando un claro del bosque vacío entre una suave niebla

Tuviste una cámara en una loma durante tres semanas y nunca fotografiaste un lince. ¿No hay lince, o simplemente lo pasaste por alto?

Esa pregunta lo es todo, y la mayoría de los análisis la resuelven mal al suponer que la respuesta es obvia. No lo es. Un registro de detección en blanco en un sitio ocupado no es un fallo; es el resultado esperado de un hecho simple: tu cámara no capta todo lo que pasa delante, y un animal que recorre un área de campeo mucho mayor que el campo de visión de tu cámara pasará la mayor parte del tiempo en algún lugar donde tu cámara no está mirando. Trata ese blanco como una ausencia real y habrás incrustado un error en todo lo que viene después: tu mapa de distribución, tu modelo de hábitat, tu conclusión de que «la especie ha desaparecido de esta cuenca». El nombre correcto y preciso para este tipo de registro no es «ausencia». Las notas de ocupación de Gary White lo dicen sin rodeos: son datos de presencia/ausencia aparente, y «no detectar una especie no implica ausencia».

El modelado de ocupación es el marco construido para tomarse eso en serio. En lugar de contar animales, plantea una pregunta más respondible —¿está este sitio ocupado o no?— y estima dos cosas a la vez: ψ (psi), la probabilidad de que un sitio esté ocupado, y p, la probabilidad de que detectes la especie en un muestreo dado dado que está ahí. El truco que lo hace funcionar es casi vergonzosamente simple: muestrea cada sitio más de una vez. Si detectas la especie aunque sea una sola vez, sabes que ese sitio estuvo ocupado todo el tiempo, lo que significa que cada muestreo en blanco en ese sitio fue un fallo, no una ausencia; y la tasa de esos fallos es exactamente la información que necesitas para estimar p, y luego corregir ψ en todos los sitios donde no viste nada en absoluto.

Este es un artículo de método para quienes de verdad lo van a aplicar: investigadores, gestores de caza y fauna, y el extremo serio de la ciencia ciudadana. Iremos construyendo por qué la ocupación ingenua está sesgada, cómo funcionan los modelos de una sola temporada y los dinámicos, qué exigen de verdad los supuestos, dónde tropiezan específicamente las cámaras trampa con el modelo, y a qué software recurrir. Es primo cercano de otras dos preguntas —cómo colocar las cámaras en primer lugar y cómo convertir detecciones en densidad de animales—, pero es una pregunta distinta, y así la mantendremos. Si quieres la capa de diseño del arreglo de cámaras, consulta; si quieres una cifra en animales por km², consulta.

Por qué la «ocupación ingenua» es la línea de salida equivocada

Empecemos con la tentación que todos sentimos. Tienes una cuadrícula de sitios con cámaras y un registro para cada uno: ¿apareció la especie objetivo o no? El movimiento obvio es llamar «estimación de ocupación» a la proporción de sitios donde apareció. Eso es la ocupación ingenua (o aparente), y está sesgada a la baja, siempre, por una cantidad que no puedes ver ni acotar sin más información.

Aquí está el mecanismo, todavía sin matemáticas. Supón que una especie ocupa de verdad 60 de tus 100 sitios. En los 60 sitios ocupados, tu cámara la detecta en, digamos, 40 de ellos y la pierde en los otros 20. Tu estimación ingenua es 40/100 = 0,40. La verdad era 0,60. No mediste la ocupación; mediste la ocupación por la detectabilidad, enredadas juntas, y reportaste el producto como si fuera lo que te importaba. Cuanto más baja sea tu probabilidad de detección, peor es la brecha; y las probabilidades de detección son bajas. En una revisión cuantitativa de 537 artículos de ecología, Kellner y Swihart hallaron que, entre los estudios que de hecho la reportaron, el 70 % tenía estimaciones de detección por muestreo por debajo de 0,5. La mayoría de los muestreos, la mayor parte del tiempo, pierden la especie más veces de las que la captan.

Se pone peor en cuanto haces algo interesante con los datos. La demostración clásica es «Absent or undetected?» de Gu y Swihart, que mostró que cuando tu probabilidad de detectar una especie está a su vez correlacionada con una variable de hábitat —y normalmente lo está; a los animales es más fácil fotografiarlos en algunos tipos de cobertura que en otros—, esa correlación se filtra en tus coeficientes de hábitat estimados y los sesga, en cualquiera de las dos direcciones según los signos implicados. En su ejemplo de trampeo de micromamíferos, el error de no detección iba del 0 % al 23 % en siete especies tras cinco días de muestreo. Así que el modelo que te dice «a esta especie le encanta el matorral denso» podría no estarte diciendo más que «a esta especie es más fácil capturarla en matorral denso». Los mismos datos, el significado opuesto.

Una estimación de ocupación ingenua no es ocupación: es ocupación por detectabilidad, reportada como si el segundo número fuera 1.

Esa es la razón para hacer el trabajo extra. Ahora, el trabajo en sí.

El modelo de una sola temporada, construido a partir de un solo sitio

Todo empieza con el modelo estático, de una sola temporada: una instantánea en el tiempo, durante la cual suponemos que el estado de ocupación de un sitio no cambia. Elige tus sitios, muestrea cada uno varias veces dentro de una ventana lo bastante corta como para que nada entre o salga, y anota lo que viste como un historial de detección: una cadena de unos (detectado) y ceros (no detectado), un dígito por muestreo.

El modelo tiene dos partes móviles. Un sitio está ocupado con probabilidad ψ, o no, con probabilidad 1−ψ. Si está ocupado, detectas la especie en cada muestreo con probabilidad p, o la pierdes con probabilidad 1−p. Y —este es el supuesto que carga con todo el peso y al que volveremos— si el sitio está desocupado, no puedes detectar la especie en absoluto. A partir de esas piezas puedes escribir la probabilidad de cualquier historial de detección. La versión resuelta del manual de MARK es la más clara que conozco. Para el historial «01» (fallo en el muestreo uno, detección en el muestreo dos), la probabilidad es:

ψ (1 − p₁) p₂ — el sitio está ocupado, lo perdiste la primera vez, lo captaste la segunda.

El interesante es el historial de todo ceros, «00». No viste nada. ¿Significa eso que el sitio está vacío? El modelo se niega a suponerlo. Su probabilidad es:

ψ (1 − p₁)(1 − p₂) + (1 − ψ).

Léelo en voz alta, porque es toda la filosofía en una sola línea: o bien el sitio estaba ocupado y perdiste la especie en ambos muestreos (el término de la izquierda), o bien el sitio de verdad no estaba ocupado (el término de la derecha). El «+» es un O lógico. Un registro en blanco es compatible con ambas historias, y el modelo mantiene ambas vivas, ponderándolas según con qué frecuencia detectas la especie en los sitios donde la viste. De ahí viene la corrección. Aplica esta verosimilitud a todos tus sitios a la vez y obtienes una ψ que da cuenta de los animales que no fotografiaste.

Compáralo con la forma antigua —regresión logística de presencia sobre hábitat—, que «supone que una especie estaba ausente en los sitios donde no fue detectada, y por tanto se sabe que la inferencia está sesgada cuando la probabilidad de detectar una especie en un sitio es menor que uno». El modelado de ocupación es, en esencia, ese único arreglo aplicado con honestidad.

En R, esta es la función `occu()` del paquete unmarked: construyes un objeto `unmarkedFrameOccu` a partir de tu matriz de detección y lo ajustas con una fórmula doble —una parte para la detección, otra para la ocupación. Volveremos al software. Primero, los datos de los que se alimentan esos modelos, porque para las cámaras trampa ahí es donde se esconden las decisiones de verdad.

Un investigador de campo arrodillado junto a una cámara trampa tomando notas en un cuaderno de campo

Convertir un rollo de cámara en un historial de detección

Un muestreo de aves viene preempaquetado en ocasiones: visitaste el humedal el martes, el jueves y el sábado: tres muestreos. Una cámara trampa no funciona así. Corre de forma continua durante semanas y te entrega un montón de fotos con marca de fecha y hora. Antes de que cualquier modelo de ocupación pueda tocar eso, tienes que trocear el despliegue en ocasiones discretas tú mismo, y cómo lo troceas cambia tu respuesta.

La herramienta que la mayoría usa es `detectionHistory()` de camtrapR, que toma tus registros y una `occasionLength` y produce la matriz de detección/no detección que unmarked o sus primos bayesianos esperan; y, algo importante, te deja arrastrar el esfuerzo activo de la cámara, de modo que una estación que corrió diez días no se trate igual que una que corrió treinta. La decisión de criterio es la longitud de la ocasión, y el manual introductorio de Sollmann expone el compromiso con claridad:

Hay una trampa más sutil, específica de las cámaras, a la que un artículo de 2024 de Goldstein y colegas le pusieron un número: la autocorrelación temporal. Un animal fotografiado hoy en una cámara tiene más probabilidad de ser fotografiado allí mañana: está usando ese lugar. Los modelos de ocupación estándar suponen que tus detecciones repetidas son independientes, y cuando no lo son, el modelo lee las detecciones agrupadas como una tasa de detección más alta de la real, y luego concluye que los sitios sin detecciones probablemente están vacíos, sesgando la ocupación a la baja. Su veredicto es aleccionador: la autocorrelación es «probablemente generalizada en los datos de cámaras trampa, y muchos estudios previos de ocupación basados en datos de cámaras trampa pueden haber subestimado sistemáticamente las probabilidades de ocupación». Sus soluciones son prácticas y vale la pena memorizarlas: comprueba su presencia con una prueba de bondad de ajuste de conteo de uniones (join-count); si está ahí, usa ventanas de detección más grandes para absorber el agrupamiento; y no intentes arreglarlo dejando huecos entre ocasiones: los huecos no eliminan la estructura temporal y solo tiran datos.

Trocea tu despliegue de cámara en ocasiones demasiado finas y el modelo se ahoga en ceros; demasiado gruesas y tiras las detecciones repetidas que lo hacen funcionar.

La probabilidad de detección nunca es constante, así que modélala

Un cérvido tenue medio oculto entre maleza densa, apenas detectable

La imagen ingenua supone una única probabilidad de detección para todo. La realidad, de la misma revisión de 537 artículos, es que cuando los investigadores se molestaron en comprobar si la detección era constante, el 86 % de las veces variaba de forma significativa. El tiempo atmosférico, la estación, la posición de la cámara sobre o fuera de un sendero, el observador, la luna: todo mueve p. La buena noticia es que el marco se construyó para esto: puedes modelar la ocupación ψ como función de covariables del sitio (hábitat, altitud, distancia a una carretera) y la **detección p como función de covariables del sitio y del muestreo** (esfuerzo, temperatura, estación).

Una peculiaridad que conviene interiorizar: como se supone que la ocupación está fija dentro de una temporada, las covariables que pongas sobre ψ deben ser cosas que no cambien dentro de esa temporada —a nivel de sitio, constantes en el tiempo—. La detección p, en cambio, puede aceptar sin problema covariables que varían en el tiempo, porque la mides muestreo a muestreo.

Luego hay un tipo de heterogeneidad de detección que normalmente no puedes ver y no puedes meter en una covariable: la variación impulsada por cuántos animales hay de verdad en un sitio. Un sitio con ocho zorros residentes fotografiará «un zorro» con mucha más facilidad que un sitio con uno de paso. Royle y Nichols convirtieron esa molestia en un modelo. Su idea clave es que la variación en la abundancia induce variación en la probabilidad de detección, a través de una relación limpia: la probabilidad de detectar la especie en un sitio es uno menos la probabilidad de fallar con cada individuo que hay allí:

pᵢ = 1 − (1 − r)^{Nᵢ}, donde r es la probabilidad de detección por individuo y Nᵢ es la abundancia local en el sitio i.

Más animales, mayor detectabilidad a nivel de sitio. Recórrelo en sentido inverso y puedes extraer una estimación rudimentaria de la abundancia a partir de nada más que datos repetidos de detección/no detección, sin marcar jamás un individuo: ese es el modelo de Royle–Nichols. La lección más profunda, en palabras de los propios Royle y Nichols, es que ignorar este tipo de heterogeneidad es «un supuesto de facto de abundancia constante entre sitios», que rara vez es lo que quieres decir. El trabajo posterior de Royle generalizó el punto: cuando la detección varía entre sitios ocupados y la dejas sin modelar, tu estimación de ocupación queda sesgada a la baja. La heterogeneidad de detección no es una nota al pie. Es la segunda mayor forma en que estos modelos salen mal, después de fingir que la detección es perfecta siquiera.

Cuando la ocupación cambia: el modelo dinámico

Un modelo de una sola temporada es una fotografía. A veces necesitas la película: ¿está la especie expandiéndose hacia territorio nuevo, o desapareciendo de lugares donde solía estar? Ese es el modelo dinámico, multitemporada, la extensión de 2003 de MacKenzie y colegas, y una rama de una familia de modelos que desde entonces ha crecido para cubrir estados múltiples, comunidades y falsos positivos. Añade dos parámetros que son todo el sentido de la cosa:

La estructura refleja el diseño robusto de Pollock: tienes periodos primarios (las «temporadas», entre las cuales la ocupación puede cambiar) y, dentro de cada uno, muestreos secundarios (tus visitas repetidas, durante las cuales no puede). Una advertencia sobre la palabra «temporada», porque hace tropezar a la gente: en el modelado de ocupación no significa invierno ni verano. Como afirma sin rodeos un estudio de carnívoros, «en el modelo de ocupación la palabra "temporada" no significa necesariamente estación geográfica… solo significa el periodo en el que se recogieron los datos». Tus temporadas podrían ser tres años consecutivos, o verano-e-invierno repetidos a lo largo de una década. Al modelo le da igual cómo las llames; lo que le importa es que la ocupación esté cerrada dentro de cada una y abierta entre ellas.

Dos estudios con cámaras trampa muestran al modelo ganándose el sustento. En un muestreo de tres años de leopardo del norte de China, gato leopardo y zorro rojo en una reserva natural china, el equipo usó un modelo dinámico para preguntar si la ocupación de cada carnívoro era estable o cambiante, y ató la colonización y la extirpación a la altitud y la perturbación humana, hallando la ocupación bastante estable, con la altitud pesando más que la distancia a pueblos o carreteras. También fueron francos sobre la tensión central: los modelos dinámicos suponen que los sitios están cerrados durante los muestreos, pero «pueden estar "abiertos" entre temporadas», y esa apertura «introduce heterogeneidad, que… causa sesgo en las estimaciones» que las covariables solo pueden absorber en parte.

El ejemplo más instructivo es un conjunto de datos de cámaras trampa de once años y ocho especies del noroeste de Anatolia, Turquía. Lo estructuraron como 11 temporadas de verano y 11 de invierno —22 periodos primarios— y modelaron cómo el uso que cada especie hacía de un sitio cambiaba con la estación, la altitud y la densidad humana, ajustándolo todo en un marco bayesiano con JAGS y comprobando el ajuste con un valor p bayesiano. Su hallazgo fue un argumento limpio a favor de ir a lo dinámico desde el principio: todas las especies mostraron estacionalidad en el uso del hábitat, pero la intensidad de esa estacionalidad difería según la especie, de modo que una única instantánea anual habría promediado hasta borrar el mismísimo patrón que buscaban. Si tus animales se reordenan a lo largo del año —y la mayoría lo hace—, un modelo estático te miente en silencio sobre un blanco en movimiento.

La «temporada» en un modelo de ocupación no es invierno ni verano: es simplemente la ventana en la que decides que la ocupación se queda quieta.

Los supuestos, y lo que te cuestan

Un mapa topográfico sobre una mesa salpicado de una cuadrícula regular de marcadores de estaciones de cámara

Aquí es donde los buenos profesionales se separan de los que aplican rituales sin entenderlos. Los modelos de ocupación descansan sobre una lista corta de supuestos, y la disciplina consiste en saber cuál estás doblando y qué le hace eso a tu respuesta. El capítulo de MARK enumera cinco; el tratamiento en formato libro, si quieres cada matiz y las demostraciones detrás de ellos, es Occupancy Estimation and Modeling de MacKenzie y colegas.

SupuestoQué significaQué sale mal si lo rompes
ClausuraEl estado ocupado/desocupado de un sitio no cambia durante los muestreos de una temporadaLas estimaciones se sesgan al alza; o, si el movimiento es aleatorio, estás estimando uso, no ocupación
Variación de ocupación modeladaLa ocupación es constante entre sitios, o has modelado las diferencias con covariablesLas estimaciones representan un promedio; la precisión queda sobrestimada
Variación de detección modeladaLa detección es constante entre sitios ocupados, o modelada con covariablesLa heterogeneidad no modelada sesga la ocupación a la baja
IndependenciaLos historiales de detección en sitios distintos son independientesOcupación aproximadamente insesgada, pero intervalos de confianza demasiado estrechos
Sin falsos positivosLa especie nunca se registra donde en realidad está ausenteOcupación sesgada al alza; colonización y extinción distorsionadas

Tres de estos merecen una mirada más de cerca para cualquiera que trabaje con cámaras.

La clausura, y la retirada honesta hacia el «uso». Una cámara vigila unos pocos metros cuadrados de sendero; el área de campeo de un lobo son cientos de kilómetros cuadrados. El animal entra y sale constantemente del campo de tu cámara, lo que viola estrictamente la clausura. La respuesta madura y honesta del campo es reinterpretar el parámetro: cuando una especie de amplio desplazamiento está disponible de forma aleatoria como esta, tus estimaciones de ocupación siguen siendo insesgadas, pero ψ debe leerse como la probabilidad de que el sitio sea «usado» por la especie, no estrictamente ocupado. El estudio turco hizo exactamente esto, y lo dijo con claridad: como un sitio con cámara «puede cubrir solo una pequeña porción del área de campeo de un individuo», su análisis «estima la probabilidad de uso de un sitio, más que de ocupación», de modo que escribieron «uso» a lo largo de todo el texto y rebautizaron la extinción local como «abandono». Esto no es una debilidad que ocultar; es la interpretación correcta, y enunciarlo es la marca de alguien que entiende el modelo.

La independencia, y la trampa del arreglo de cámaras. Esta es una que muerde específicamente a la gente de cámaras. Los autores de MARK dan el escenario exacto: «si las cámaras remotas se ubican cerca unas de otras, un solo individuo puede ser detectado en múltiples cámaras (sitios) durante una semana dada (muestreo)». Cuando eso ocurre, tus sitios no son independientes —el mismo animal está generando «detecciones» en varios de ellos—, así que el número de cámaras sobrestima el número de unidades independientes de tu estudio. El daño es tramposo: tu estimación de ocupación a menudo se mantiene más o menos bien, pero tu incertidumbre queda subestimada —intervalos de confianza demasiado estrechos, una falsa sensación de precisión. La solución vive en la etapa de diseño: espacia las cámaras lo suficiente para la independencia. (Que es una pregunta distinta de la de este artículo, y buena:.)

Sin falsos positivos, y por qué la IA sube las apuestas. Todos los modelos anteriores suponen que si registraste la especie, de verdad estaba ahí. Los modelos de ocupación estándar se desviven por los falsos negativos —perder un animal presente—, pero suponen que los falsos positivos nunca ocurren. Sí ocurren. Miller y colegas construyeron el modelo fundacional para manejar ambos tipos de error después de que experimentos controlados mostraran que incluso observadores muy entrenados identifican especies como presentes cuando están ausentes. Su advertencia es afilada: «el sesgo en los estimadores de ocupación, colonización y extinción puede ser severo cuando ocurren falsos positivos», y la identificación errónea no modelada sobrestima la ocupación. Esto importa más ahora que cuando se escribió, porque los clasificadores automáticos de especies cometen exactamente este error: etiquetan con seguridad un coyote como un lobo, un lince rojo como un lince euroasiático. Una detección mal clasificada es un falso positivo en el sentido técnico, y si metes un historial de detección sin verificar, autoetiquetado, directo en un modelo de ocupación, puede que estés modelando los errores del clasificador como expansión de área de distribución. El flujo de trabajo defendible que señala el marco de Miller es conservar un subconjunto de detecciones que estén verificadas —un tipo confirmado por un humano para el que puede asumirse la ausencia de falsos positivos— y dejar que el modelo se apoye en ellas.

Para animales de amplio desplazamiento en cámaras, rara vez estás estimando ocupación estricta: estás estimando uso del sitio, y los artículos honestos lo dicen.

Más de una especie a la vez

Una hilera de cámaras trampa montadas a lo largo de un transecto del bosque

Si tienes una cuadrícula de cámaras, casi nunca tienes una sola especie: tienes una comunidad, la mayoría fotografiada demasiado pocas veces como para modelarla una a una. Los modelos de ocupación multiespecie (de comunidad) juntan información entre especies, de modo que las ricas en datos ayudan a estimar las pobres en datos, sin dejar de corregir cada una por su propia probabilidad de detección. El estudio de Rich y colegas sobre una comunidad de mamíferos del norte de Botsuana es un buen buque insignia: 44 especies a lo largo de 6607 noches-trampa, una probabilidad media de aparición de especie de 0,32, y un mapa de qué hábitats y áreas protegidas albergaban la mayor diversidad; todo ello dando cuenta del hecho de que distintas especies se fotografían a tasas enormemente diferentes.

La advertencia honesta viene de Guillera-Arroita y colegas: los modelos de comunidad pueden estimar la riqueza de especies, incluida una conjetura sobre especies nunca detectadas en absoluto, pero esa conjetura sobre lo no detectado descansa fuertemente en la estructura y los supuestos del modelo, más que en datos que de hecho recogiste; así que interpreta las cifras de riqueza a nivel de comunidad con la debida humildad. El modelo es potente; no es una bola de cristal para especies que tus cámaras nunca vieron.

¿Cuántas visitas antes de que «ausente» signifique algo?

Esta es la pregunta que los gestores hacen de verdad: muestreé y no encontré nada; ¿ahora puedo decir que la especie no está aquí? La respuesta de la ocupación es refrescantemente concreta: nunca puedes decir «ausente» con certeza, pero puedes hacer la probabilidad de haber perdido una especie presente tan pequeña como quieras, apilando oportunidades de detección. Si tu detección por muestreo es p, la probabilidad de que perdieras un sitio ocupado a lo largo de k muestreos independientes es (1−p)^k; una p pequeña solo significa que necesitas más k. La literatura de diseño de muestreos lo trabaja por el lado práctico: decide cuánta confianza necesitas, y luego asigna suficientes visitas y esfuerzo por visita para empujar tu probabilidad de detección acumulada hasta ella. Para cámaras, «más visitas» suele significar «déjala puesta más tiempo», que es la palanca más barata que tienes. Y no siempre necesitas un muestreo hecho a propósito: Wevers y colegas construyeron modelos de distribución para jabalí y corzo en el Jura suizo a partir de «captura incidental» (by-catch) de cámaras trampa —detecciones que se acumularon durante muestreos invernales de fauna dirigidos a otra cosa— modelando primero la detectabilidad y corrigiendo luego por ella. Las detecciones que ya tienes a menudo pueden responder una pregunta de ocupación, siempre que des cuenta de lo imperfectamente que las recogiste.

Y cuando lo que está en juego es alto —una especie amenazada, una decisión sobre hábitat crítico—, la postura conservadora es la que defienden Bennett y colegas: como la detección imperfecta es la norma y carecemos de buenas estimaciones de detectabilidad para la mayoría de las especies prioritarias, «la ausencia en los muestreos debería considerarse solo indicativa», y el hábitat crítico debería gestionarse como ocupado incluso cuando la presencia no está confirmada. Una no detección es evidencia, no prueba, y cuán fuerte es esa evidencia depende por completo de cuánto miraste.

Nunca puedes probar que una especie está ausente: solo hacer las probabilidades de haberla perdido tan pequeñas como estés dispuesto a trabajar.

El software, en breve

Una marta pasando por delante de una cámara trampa, un único evento de detección

No necesitas programar a mano una verosimilitud. El ecosistema es maduro, y qué herramienta elijas depende sobre todo de cuánto quieras programar y de cuán grande o complejo sea tu problema.

HerramientaQué esRecurre a ella cuando…
PRESENCEEl programa autónomo original de ocupación (USGS, con MacKenzie); estima la ocupación de parches y las extensiones dinámica/de falsos positivos. Tiene interfaz de apuntar-y-hacer-clic y un puente en R, RPresencePrefieres no vivir en R, o quieres el programa alrededor del cual se construyeron los artículos de métodos
unmarked (R)El paquete de R gratuito de referencia; ajuste por máxima verosimilitud de modelos de ocupación, Royle–Nichols, de conteo repetido y de distancia a través de una única interfazEstás en R y quieres modelos de una sola especie y dinámicos, rápidos y bien probados
camtrapR (R)No es un ajustador de modelos: el puente. `detectionHistory()` convierte fotos con marca de tiempo en las matrices de detección que necesitan los paquetes de modelos, esfuerzo incluidoTienes registros de cámara en bruto y necesitas una entrada de ocupación limpia
ubms (R)El gemelo bayesiano de unmarked: casi la misma interfaz, pero ajusta en Stan, así que obtienes efectos aleatorios e inferencia posterior completaNecesitas efectos aleatorios o un tratamiento bayesiano pero te gusta la sintaxis de unmarked
spOccupancy (R)Paquete bayesiano moderno para ocupación espacialmente explícita, multiespecie e integrada con datos; escala a decenas de miles de sitios mediante procesos gaussianos de vecino más próximoTu problema es grande, espacial, multiespecie, o fusiona varios conjuntos de datos

Una tubería típica de cámaras trampa va de camtrapR → unmarked (o ubms / spOccupancy), con PRESENCE como alternativa sin código. Si estás aprendiendo el marco desde cero, el paquete `occupancyTuts` de USGS es una rampa de entrada genuinamente buena: 28 tutoriales interactivos que cubren una sola temporada, dinámica, diseño de estudio y los modelos derivados, con vídeos y ejercicios.

Una nota suave sobre el flujo de trabajo, porque es el cuello de botella antes de que corra cualquiera de estos programas: los modelos de ocupación necesitan historiales de detección limpios, y la parte lenta casi siempre es ordenar miles de fotos para encontrar el puñado con tu especie objetivo dentro, y no etiquetarlas mal, lo cual, como vimos, es un falso positivo que el modelo tomará al pie de la letra.

Un investigador ante un portátil revisando una tenue cuadrícula de detecciones de cámaras trampa

La ocupación es una cantidad real: no la conviertas en abundancia a hurtadillas

Una disciplina de cierre, porque es el abuso más común. La ocupación es una cantidad legítima y útil por sí misma —la proporción de sitios usados, cómo cambia con el hábitat, cómo varía entre años. Lo que no es, es un sustituto de la abundancia. Sollmann es explícito: «la ocupación no debe malinterpretarse como un índice de abundancia», porque la relación entre las dos depende del tamaño del área de distribución de una especie y de su comportamiento. Un sitio puede leerse como «ocupado» tanto si lo usa un animal como si lo usan cincuenta. Si la cifra que de verdad necesitas es animales por kilómetro cuadrado, la ocupación es el modelo equivocado y quieres en su lugar la familia de densidad. Usa la ocupación para lo que es brillante —dónde está una especie, y hacia dónde va— y deja que se detenga ahí.

Preguntas frecuentes

¿Qué es un modelo de ocupación en términos sencillos?

Es una forma de estimar la probabilidad de que una especie esté presente en un sitio teniendo en cuenta que no siempre la detectas cuando lo está. Muestreas cada sitio de forma repetida y el modelo separa «dónde está de verdad la especie» (ocupación, ψ) de «cuán probable es que la veas cuando está ahí» (probabilidad de detección, p).

¿Por qué una no detección no es lo mismo que una ausencia?

Porque la detección es imperfecta: tu cámara o tu muestreo pierden animales que están presentes, sobre todo cuando son escasos o recorren un área de campeo grande. Un registro en blanco es compatible tanto con «no está» como con «está pero se perdió», así que tratarlo como una ausencia real subestima de forma sistemática cuán extendida está una especie. A lo largo de cientos de estudios, la mayoría de las probabilidades de detección por muestreo estaban por debajo de 0,5.

¿Cuántas veces necesito muestrear un sitio antes de poder llamarlo vacío?

No hay ningún número que pruebe la ausencia, pero puedes reducir la probabilidad de un falso «ausente» tanto como necesites añadiendo muestreos o esfuerzo: a lo largo de k visitas independientes, la probabilidad de perder un sitio ocupado es (1−p)^k, así que una detección baja solo significa más visitas. Para decisiones de alto riesgo, la postura conservadora es tratar una no detección como solo indicativa.

¿Cuál es la diferencia entre un modelo de ocupación de una sola temporada y uno dinámico?

Un modelo de una sola temporada (estático) supone que la ocupación no cambia durante el periodo de muestreo: una instantánea de dónde está la especie. Un modelo dinámico (multitemporada) deja que la ocupación cambie entre temporadas y estima las tasas de ese cambio: colonización (sitios que pasan a estar ocupados) y extinción local (sitios que pasan a estar desocupados).

¿De verdad funcionan los modelos de ocupación para animales de amplio desplazamiento en cámaras trampa?

Sí, pero con una reinterpretación. Como una cámara cubre solo una porción de un área de campeo grande, el animal entra y sale del campo de visión y se viola la «clausura» estricta; la solución estándar y honesta es leer tu estimación como la probabilidad de que el sitio sea usado por la especie, más que estrictamente ocupado: la estimación sigue siendo válida, cambia la etiqueta.

¿Puede el reconocimiento de especies por IA causar problemas en el análisis de ocupación?

Puede, si no lo verificas. Un clasificador que etiqueta mal una especie como otra crea una detección de falso positivo —una especie «registrada» donde está ausente—, y los falsos positivos no modelados sesgan las estimaciones de ocupación al alza y distorsionan la colonización y la extinción. La solución es verificar las detecciones (o conservar un subconjunto confirmado en el que el modelo pueda confiar) antes de construir los historiales de detección.