Belægningsmodeller for vildtkameraer: en guide

Du har kørt et kamera på en højderyg i tre uger og aldrig fotograferet en ulv. Er der ingen ulv, eller gik du bare glip af den?

Det spørgsmål er hele kernen, og de fleste analyser besvarer det forkert ved at antage, at svaret er indlysende. Det er det ikke. En tom detektionsregistrering på en besat lokalitet er ikke en fejl; det er det forventede udfald af en simpel kendsgerning — dit kamera fanger ikke alt, der går forbi, og et dyr, der strejfer over et leveområde, der er langt større end kameraets synsfelt, vil tilbringe det meste af sin tid et sted, hvor kameraet ikke kigger. Behandl den blanke registrering som et reelt fravær, og du har bagt en fejl ind i alt nedstrøms: dit udbredelseskort, din habitatmodel, din konklusion om, at »arten er forsvundet fra dette vandløbsopland«. Den høflige, præcise betegnelse for denne slags registrering er ikke »fravær«. Gary Whites belægningsnoter siger det ligeud: dette er tilstedeværelses-/tilsyneladende fraværsdata, og »det at man ikke detekterer en art, betyder ikke, at den er fraværende«.

Belægningsmodellering er den ramme, der er bygget til at tage det alvorligt. I stedet for at tælle dyr stiller den et mere besvarligt spørgsmål — er denne lokalitet besat eller ej? — og den estimerer to ting på én gang: ψ (psi), sandsynligheden for, at en lokalitet er besat, og p, sandsynligheden for, at du detekterer arten på en given optælling givet at den er der. Tricket, der får det til at virke, er næsten pinligt enkelt: optæl hver lokalitet mere end én gang. Hvis du detekterer arten bare én gang, ved du, at lokaliteten var besat hele tiden, hvilket betyder, at hver tom optælling på den lokalitet var et fejlskud, ikke et fravær — og hyppigheden af disse fejlskud er præcis den information, du har brug for til at estimere p, og derefter korrigere ψ for alle de lokaliteter, hvor du intet så overhovedet.

Dette er et metodestykke til folk, der rent faktisk skal køre det: forskere, vildt- og naturforvaltere og den seriøse ende af borgervidenskab. Vi bygger op, hvorfor naiv belægning er skæv, hvordan de enkeltsæsons- og dynamiske modeller fungerer, hvad antagelserne reelt kræver af dig, hvor vildtkameraer specifikt får modellen til at snuble, og hvilket software man skal gribe til. Det er en nær slægtning til to andre spørgsmål — hvordan man placerer sine kameraer i første omgang og hvordan man omsætter detektioner til dyretæthed — men det er et særskilt spørgsmål, og det holder vi det til. Vil du have laget om array-design, så se Design af vildtkamera-undersøgelser: afstand, tæthed og varighed; vil du have et tal med dyr-per-km² på, så se Sådan estimerer du vildttæthed fra vildtkameraer uden at mærke dyrene.

Hvorfor »naiv belægning« er den forkerte startlinje

Start med den fristelse, alle mærker. Du har et net af kameralokaliteter og en registrering for hver: dukkede målarten op eller ej? Det oplagte træk er at kalde andelen, hvor den dukkede op, for dit belægningsestimat. Det er naiv belægning — og den er skæv nedad, hver gang, med en størrelse, du ikke kan se og ikke kan afgrænse uden mere information.

Her er mekanismen, helt uden matematik endnu. Antag, at en art reelt besætter 60 af dine 100 lokaliteter. På de 60 besatte lokaliteter detekterer dit kamera den på, lad os sige, 40 af dem og går glip af den på de øvrige 20. Dit naive estimat er 40/100 = 0,40. Sandheden var 0,60. Du målte ikke belægning; du målte belægning gange detekterbarhed, viklet sammen, og rapporterede produktet, som om det var det, du gik op i. Jo lavere din detektionssandsynlighed er, jo værre er kløften — og detektionssandsynligheder er lave. I en kvantitativ gennemgang af 537 økologiartikler fandt Kellner og Swihart, at blandt de studier, der rent faktisk rapporterede det, havde 70 % detektionsestimater per optælling under 0,5. De fleste optællinger, det meste af tiden, går glip af arten oftere, end de fanger den.

Det bliver værre i samme øjeblik, du gør noget interessant med data. Den klassiske demonstration er Gu og Swiharts »Absent or undetected?«, som viste, at når din sandsynlighed for at detektere en art selv er korreleret med en habitatvariabel — og det er den som regel; dyr er lettere at fotografere i nogle dækningstyper end andre — så siver den korrelation ind i dine estimerede habitatkoefficienter og gør dem skæve, i begge retninger afhængigt af de involverede fortegn. I deres illustration med fældefangst af smågnavere løb ikke-detektionsfejlen fra 0 % til 23 % på tværs af syv arter efter fem dages prøvetagning. Så modellen, der fortæller dig, at »denne art elsker tæt krat«, fortæller dig måske ikke andet end, at »denne art er lettere at fange i tæt krat«. Samme data, modsat betydning.

Et naivt belægningsestimat er ikke belægning — det er belægning gange detekterbarhed, rapporteret som om det andet tal var 1.

Det er argumentet for at gøre det ekstra arbejde. Nu selve arbejdet.

Enkeltsæsonmodellen, bygget op fra én lokalitet

Alt starter med den statiske enkeltsæsonmodel: ét øjebliksbillede i tid, hvorunder vi antager, at en lokalitets belægningstilstand ikke ændrer sig. Vælg dine lokaliteter, optæl hver enkelt flere gange inden for et vindue, der er kort nok til, at intet flytter ind eller ud, og skriv ned, hvad du så, som en detektionshistorik — en streng af 1-taller (detekteret) og 0-taller (ikke detekteret), ét ciffer per optælling.

Modellen har to bevægelige dele. En lokalitet er besat med sandsynlighed ψ, eller ikke, med sandsynlighed 1−ψ. Hvis den er besat, detekterer du arten ved hver optælling med sandsynlighed p, eller går glip af den med sandsynlighed 1−p. Og — dette er den bærende antagelse, vi vender tilbage til — hvis lokaliteten er ubesat, kan du slet ikke detektere arten. Ud fra disse brikker kan du nedskrive sandsynligheden for enhver detektionshistorik. MARK-lærebogens gennemarbejdede version er den klareste, jeg kender. For historikken »01« (gik glip af den ved optælling et, detekterede den ved optælling to) er sandsynligheden:

ψ (1 − p₁) p₂ — lokaliteten er besat, du gik glip af den første gang, du fangede den anden.

Den interessante er nul-historikken »00«. Du så intet. Betyder det, at lokaliteten er tom? Modellen nægter at antage det. Dens sandsynlighed er:

ψ (1 − p₁)(1 − p₂) + (1 − ψ).

Læs det højt, for det er hele filosofien i én linje: enten var lokaliteten besat, og du gik glip af arten ved begge optællinger (det venstre led), eller lokaliteten var i sandhed ikke besat (det højre led). »+«-tegnet er et logisk ELLER. En tom registrering er forenelig med begge historier, og modellen holder dem begge i live, vægtet efter, hvor ofte du detekterer arten på de lokaliteter, hvor du faktisk så den. Det er der, korrektionen kommer fra. Kør denne likelihood på tværs af alle dine lokaliteter på én gang, og du får en ψ, der tager højde for de dyr, du ikke fotograferede.

Sammenlign det med den gamle måde — logistisk regression af tilstedeværelse på habitat — som »antager, at en art var fraværende på lokaliteter, hvor den ikke blev detekteret, og derfor er inferensen kendt for at være skæv, når sandsynligheden for at detektere en art på en lokalitet er mindre end én«. Belægningsmodellering er, når det kommer til stykket, netop den ene rettelse anvendt ærligt.

I R er dette `occu()`-funktionen i pakken unmarked: du bygger et `unmarkedFrameOccu`-objekt ud fra din detektionsmatrix og tilpasser det med en dobbelt formel — én del for detektion, én for belægning. Vi vender tilbage til softwaren. Først de data, modellerne æder, for for vildtkameraer er det dér, de virkelige beslutninger gemmer sig.

En feltforsker, der knæler ved et vildtkamera og gør notater i en feltbog

At forvandle en kamerarulle til en detektionshistorik

En fugleoptælling kommer færdigpakket i lejligheder: du besøgte vådområdet tirsdag, torsdag og lørdag — tre optællinger. Et vildtkamera fungerer ikke sådan. Det kører kontinuerligt i ugevis og overrækker dig en bunke tidsstemplede billeder. Før nogen belægningsmodel kan røre det, må du hugge udsætningen op i diskrete lejligheder selv, og hvordan du hugger den op, ændrer dit svar.

Værktøjet, de fleste bruger, er camtrapRs `detectionHistory()`, som tager dine registreringer og en `occasionLength` og frembringer den detektions-/ikke-detektionsmatrix, som unmarked eller dens bayesianske fætre forventer — og, vigtigt, lader dig føre kameraets aktive indsats med, så en station, der kørte ti dage, ikke behandles som en, der kørte tredive. Skønssagen er lejlighedslængden, og Sollmanns introduktion lægger afvejningen rent frem:

For kort (sig, daglige lejligheder), og din matrix fyldes med nuller. En mur af 0-taller driver detektionsestimatet mod nul og kan bryde modellen numerisk.
For lang, og du smider information væk — femten separate fotografier af en ræv på én lokalitet kollapser til et enkelt »1«, og du har kasseret alt det, gentagne besøg skulle fortælle dig om p.
Hold den konstant. Detektionssandsynligheden stiger med lejlighedslængden, så hvis dine lejligheder (eller indsatsen inden for dem) er forskellige, må du lægge lejlighedslængde eller indsats ind som en kovariat på detektionen eller acceptere en skæv p.

Der er en mere subtil kameraspecifik fælde, som en artikel fra 2024 af Goldstein og kolleger satte et tal på: tidslig autokorrelation. Et dyr, der fotograferes ved et kamera i dag, er mere tilbøjeligt til at blive fotograferet dér i morgen — det bruger det sted. Standardbelægningsmodeller antager, at dine gentagne detektioner er uafhængige, og når de ikke er det, læser modellen de klyngede detektioner som en højere detektionsrate, end den reelt er, og konkluderer derefter, at lokaliteter med ingen detektioner sandsynligvis er tomme — hvilket gør belægningen skæv nedad. Deres dom er ædru: autokorrelation er »sandsynligvis udbredt i vildtkameradata, og mange tidligere studier af belægning baseret på vildtkameradata kan systematisk have undervurderet belægningssandsynligheder«. Deres løsninger er praktiske og værd at lære udenad: test for det med en join-count goodness-of-fit-test; hvis det er der, så brug større detektionsvinduer til at opsuge klyngedannelsen; og prøv ikke at rette det ved at lægge mellemrum mellem lejlighederne — mellemrum fjerner ikke den tidslige struktur og smider bare data væk.

Hug din kameraudsætning op i lejligheder for fint, og modellen drukner i nuller; for groft, og du smider de gentagne detektioner væk, der får den til at virke.

Detektionssandsynligheden er aldrig konstant — så modellér den

Et utydeligt hjortedyr halvt skjult i tæt krat, knap nok til at detektere

Det naive billede antager én detektionssandsynlighed for alt. Virkeligheden, fra den samme gennemgang af 537 artikler, er, at når forskere gad teste, om detektionen var konstant, varierede den signifikant 86 % af tiden. Vejret, årstiden, kameraets position på eller uden for en sti, observatøren, månen — alt sammen rykker p rundt. Den gode nyhed er, at rammen blev bygget til dette: du kan modellere belægningen ψ som en funktion af lokalitetskovariater (habitat, højde over havet, afstand til en vej) og **detektionen p som en funktion af lokalitets- og optællingskovariater** (indsats, temperatur, årstid).

Et særtræk værd at internalisere: fordi belægning antages fast inden for en sæson, bør de kovariater, du lægger på ψ, være ting, der ikke ændrer sig inden for den sæson — på lokalitetsniveau, tidskonstante. Detektionen p kan derimod gladeligt tage tidsvarierende kovariater, fordi du måler den optælling for optælling.

Så er der en slags detektionsheterogenitet, du som regel ikke kan se og ikke kan lægge ind i en kovariat: variation drevet af, hvor mange dyr der faktisk er på en lokalitet. En lokalitet med otte fastboende ræve vil fotografere »en ræv« langt lettere end en lokalitet med én, der passerer igennem. Royle og Nichols forvandlede den plage til en model. Deres nøgleindsigt er, at variation i antal fremkalder variation i detektionssandsynlighed, gennem en ren sammenhæng — chancen for at detektere arten på en lokalitet er én minus chancen for at gå glip af hvert eneste individ dér:

pᵢ = 1 − (1 − r)^{Nᵢ}, hvor r er detektionssandsynligheden per individ, og Nᵢ er det lokale antal på lokalitet i.

Flere dyr, højere detekterbarhed på lokalitetsniveau. Kør det den anden vej, og du kan udlede et groft estimat af antal ud fra intet andet end gentagne detektions-/ikke-detektionsdata, uden nogensinde at mærke et individ — det er Royle-Nichols-modellen. Den dybere lære, med Royle og Nichols' egne ord, er, at det at ignorere denne slags heterogenitet er »en de facto-antagelse om konstant antal blandt lokaliteter«, hvilket sjældent er det, man mener. Royles senere arbejde generaliserede pointen: når detektionen varierer blandt besatte lokaliteter, og du lader den være umodelleret, bliver dit belægningsestimat skævt nedad. Detektionsheterogenitet er ikke en fodnote. Det er den næststørste måde, disse modeller går galt på, efter at lade som om detektionen overhovedet er perfekt.

Når belægningen ændrer sig: den dynamiske model

En enkeltsæsonmodel er et fotografi. Nogle gange har du brug for filmen — er arten på vej til at sprede sig ind i nyt land, eller blinke ud af steder, den plejede at være? Det er den dynamiske, flersæsonmodel, MacKenzie og kollegers udvidelse fra 2003 og én gren af en modelfamilie, der siden er vokset til at dække flere tilstande, samfund og falske positiver. Den tilføjer to parametre, der er hele pointen:

Kolonisering (γ, gamma): sandsynligheden for, at en lokalitet, der var ubesat i én sæson, bliver besat i den næste.
Lokal uddøen (ε, epsilon): sandsynligheden for, at en lokalitet, der var besat, bliver ubesat.

Strukturen spejler Pollocks robuste design: du har primærperioder (»sæsonerne«, mellem hvilke belægningen kan ændre sig), og inden for hver, sekundære optællinger (dine gentagne besøg, hvorunder den ikke kan). En advarsel om ordet »sæson«, for det får folk til at snuble: i belægningsmodellering betyder det ikke vinter eller sommer. Som ét rovdyrsstudie konstaterer ligeud, »i belægningsmodellen betyder ordet 'sæson' ikke nødvendigvis geografisk årstid… det betyder bare den periode, hvori data blev indsamlet«. Dine sæsoner kan være tre på hinanden følgende år eller sommer-og-vinter gentaget over et årti. Modellen er ligeglad med, hvad du kalder dem; den går op i, at belægningen er lukket inden for hver og åben mellem dem.

To vildtkamerastudier viser modellen tjene sin løn. I en treårig optælling af nordkinesisk leopard, leopardkat og rødræv i et kinesisk naturreservat brugte holdet en dynamisk model til at spørge, om hvert rovdyrs belægning var stabil eller skiftende, og knyttede kolonisering og udryddelse til højde over havet og menneskelig forstyrrelse — og fandt belægningen rimeligt stabil, med højden som vigtigere end afstand til landsbyer eller veje. De var også åbne om den centrale spænding: dynamiske modeller antager, at lokaliteter er lukkede under optællinger, men »kan være 'åbne' mellem sæsoner«, og den åbenhed »indfører heterogenitet, som… forårsager estimatskævhed«, som kovariater kun delvist kan opsuge.

Det mest instruktive eksempel er et elleve år langt, otte-arts vildtkameradatasæt fra det nordvestlige Anatolien i Tyrkiet. De strukturerede det som 11 sommer- og 11 vintersæsoner — 22 primærperioder — og modellerede, hvordan hver arts brug af en lokalitet skiftede med årstid, højde over havet og menneskelig tæthed, og tilpassede det hele i en bayesiansk ramme med JAGS og tjekkede tilpasningen med en bayesiansk p-værdi. Deres fund var et rent argument for overhovedet at gå dynamisk: hver art viste sæsonvariation i habitatbrug, men styrken af den var forskellig fra art til art, så et enkelt årligt øjebliksbillede ville have gennemsnittet netop det mønster væk, som de var ude efter. Hvis dine dyr rykker rundt i løbet af året — og det gør de fleste — lyver en statisk model stille og roligt for dig om et bevægeligt mål.

»Sæson« i en belægningsmodel er ikke vinter eller sommer — det er bare det vindue, du beslutter, at belægningen holder stille i.

Antagelserne, og hvad de koster dig

Et topografisk kort på et bord prikket med et regelmæssigt net af kamerastationsmarkører

Det er her, gode praktikere skiller sig fra kult-efterlignere. Belægningsmodeller hviler på en kort liste af antagelser, og disciplinen ligger i at vide, hvilken én man bøjer, og hvad det gør ved ens svar. MARK-kapitlet opregner fem; den bogværksbehandling, hvis du vil have hver nuance og beviserne bag dem, er MacKenzie og kollegers Occupancy Estimation and Modeling.

Antagelse	Hvad den betyder	Hvad der går galt, hvis du bryder den
Lukkethed	En lokalitets besat/ubesat-status ændrer sig ikke under en sæsons optællinger	Estimaterne bliver skæve opad; eller, hvis bevægelsen er tilfældig, estimerer du brug, ikke belægning
Modelleret belægningsvariation	Belægningen er konstant på tværs af lokaliteter, eller du har modelleret forskellene med kovariater	Estimaterne repræsenterer et gennemsnit; præcisionen overvurderet
Modelleret detektionsvariation	Detektionen er konstant på tværs af besatte lokaliteter, eller modelleret med kovariater	Umodelleret heterogenitet gør belægningen skæv nedad
Uafhængighed	Detektionshistorikker på forskellige lokaliteter er uafhængige	Belægningen nogenlunde uskæv, men konfidensintervaller for snævre
Ingen falske positiver	Arten registreres aldrig, hvor den i virkeligheden er fraværende	Belægningen skæv opad; kolonisering og uddøen forvrænget

Tre af disse fortjener et nærmere kig for enhver, der arbejder med kameraer.

Lukkethed og det ærlige tilbagetog til »brug«. Et kamera overvåger nogle få kvadratmeter sti; en ulvs leveområde er hundredvis af kvadratkilometer. Dyret bevæger sig konstant ind og ud af kameraets synsfelt, hvilket strengt taget bryder lukketheden. Feltets modne, ærlige svar er at omfortolke parameteren: når en vidtstrejfende art er tilfældigt tilgængelig på denne måde, er dine belægningsestimater stadig uskæve, men ψ bør læses som sandsynligheden for, at lokaliteten »bruges« af arten, ikke at den er strengt besat. Det tyrkiske studie gjorde præcis dette og sagde det rent ud — fordi en kameralokalitet »kun kan dække en lille del af et individs leveområde«, »estimerer deres analyse sandsynligheden for brug af en lokalitet snarere end for belægning«, så de skrev »brug« hele vejen igennem og omdøbte lokal uddøen til »forladelse«. Dette er ikke en svaghed at skjule; det er den korrekte fortolkning, og at angive den er kendemærket på en, der forstår modellen.

Uafhængighed og kamera-array-fælden. Her er en, der bider kamerafolk specifikt. MARK-forfatterne giver det præcise scenarie: »hvis fjernkameraer er placeret tæt på hinanden, kan et enkelt individ blive detekteret ved flere kameraer (lokaliteter) i løbet af en given uge (optælling)«. Når det sker, er dine lokaliteter ikke uafhængige — det samme dyr genererer »detektioner« ved flere af dem — så antallet af kameraer overvurderer antallet af uafhængige enheder i dit studie. Skaden er lumsk: dit belægningsestimat holder sig ofte nogenlunde rigtigt, men din usikkerhed er undervurderet — konfidensintervaller for snævre, en falsk fornemmelse af præcision. Løsningen ligger på designstadiet: spred kameraerne langt nok fra hinanden til uafhængighed. (Hvilket er et andet spørgsmål end denne artikel, og et godt et — Design af vildtkamera-undersøgelser: afstand, tæthed og varighed.)

Ingen falske positiver, og hvorfor AI hæver indsatsen. Hver model ovenfor antager, at hvis du registrerede arten, var den der virkelig. Standardbelægningsmodeller bukker sig bagover for falske negativer — at gå glip af et tilstedeværende dyr — men antager, at falske positiver aldrig sker. Det gør de. Miller og kolleger byggede den grundlæggende model til at håndtere begge fejltyper, efter at kontrollerede forsøg viste, at selv højt trænede observatører fejlidentificerer arter som til stede, når de er fraværende. Deres advarsel er skarp: »skævhed i estimatorer af belægning, kolonisering og uddøen kan være alvorlig, når falske positiver forekommer«, og umodelleret fejlidentifikation overvurderer belægningen. Dette betyder mere nu end, da det blev skrevet, fordi automatiske artsklassifikatorer begår netop denne fejl — og med stor selvsikkerhed sætter en forkert artsetiket på en detektion. En fejlklassificeret detektion er en falsk positiv i teknisk forstand, og hvis du fører en ubekræftet, autoetiketteret detektionshistorik direkte ind i en belægningsmodel, modellerer du måske klassifikatorens fejl som udbredelsesudvidelse. Den forsvarlige arbejdsgang, Millers ramme peger på, er at beholde en delmængde af detektioner, der er bekræftede — en menneskeligt bekræftet type, hvor falske positiver kan antages fraværende — og lade modellen læne sig op ad dem.

For vidtstrejfende dyr på kameraer estimerer du sjældent streng belægning — du estimerer brug af lokaliteten, og de ærlige artikler siger det.

Mere end én art ad gangen

En række vildtkameraer monteret langs et skovtransekt

Har du et kameranet, har du næsten aldrig én art — du har et samfund, de fleste af dem fotograferet for sjældent til at modellere ét ad gangen. Multiartsmodeller (samfundsmodeller) samler information på tværs af arter, så de dataríge hjælper med at estimere de datafattige, mens hver stadig korrigeres for sin egen detektionssandsynlighed. Rich og kollegers studie af et pattedyrsamfund i det nordlige Botswana er et godt flagskib: 44 arter over 6.607 fældenætter, en gennemsnitlig artsforekomstsandsynlighed på 0,32 og et kort over, hvilke habitater og beskyttede områder der rummede mest diversitet — alt sammen mens der tages højde for, at forskellige arter fotograferes ved vildt forskellige rater.

Det ærlige forbehold kommer fra Guillera-Arroita og kolleger: samfundsmodeller kan estimere artsrigdom, inklusive et gæt på arter, der aldrig blev detekteret overhovedet, men det gæt om de udetekterede hviler tungt på modelstruktur og antagelser snarere end på data, du rent faktisk indsamlede — så fortolk artsrigdomstal på samfundsniveau med passende ydmyghed. Modellen er kraftfuld; den er ikke en krystalkugle for arter, dine kameraer aldrig så.

Hvor mange besøg, før »fraværende« betyder noget?

Dette er det spørgsmål, forvaltere faktisk stiller: jeg optalte og fandt intet — nu kan jeg så sige, at arten ikke er her? Belægningssvaret er forfriskende konkret: du kan aldrig sige »fraværende« med sikkerhed, men du kan gøre sandsynligheden for at have overset en tilstedeværende art så lille, du vil, ved at stable detektionschancer op. Hvis din detektion per optælling er p, er sandsynligheden for, at du ville gå glip af en besat lokalitet på tværs af k uafhængige optællinger, (1−p)^k — en lille p betyder bare, at du har brug for mere k. Litteraturen om undersøgelsesdesign arbejder det den praktiske vej rundt: beslut, hvor sikker du har brug for at være, og afsæt så nok besøg og nok indsats per besøg til at skubbe din kumulative detektionssandsynlighed op til det. For kameraer betyder »flere besøg« som regel »lad det stå længere«, hvilket er den billigste knap, du har. Og du har ikke altid brug for en specialbygget undersøgelse: Wevers og kolleger byggede udbredelsesmodeller for vildsvin og rådyr i det schweiziske Jura ud af tilfældig vildtkamera-»bifangst« — detektioner, der hobede sig op under vinterlige vildttællinger rettet mod noget andet — ved først at modellere detekterbarhed og derefter korrigere for den. De detektioner, du allerede har, kan ofte besvare et belægningsspørgsmål, så længe du tager højde for, hvor ufuldkomment du indsamlede dem.

Og når indsatsen er høj — en truet art, en beslutning om kritisk levested — er den konservative holdning den, Bennett og kolleger argumenterer for: fordi ufuldkommen detektion er normen, og vi mangler gode detekterbarhedsestimater for de fleste prioriterede arter, »bør fravær i undersøgelser kun betragtes som vejledende«, og kritisk levested bør forvaltes som besat, selv når tilstedeværelsen ikke er bekræftet. En manglende detektion er bevis, ikke bevisførelse, og hvor stærkt det bevis er, afhænger udelukkende af, hvor hårdt du ledte.

Du kan aldrig bevise, at en art er fraværende — kun gøre oddsene for at have overset den så små, som du er villig til at arbejde for.

Softwaren, kort

En skovmår, der passerer foran et vildtkamera, en enkelt detektionshændelse

Du behøver ikke at håndkode en likelihood. Økosystemet er modent, og hvilket værktøj du vælger, afhænger mest af, hvor meget du vil kode, og hvor stort eller komplekst dit problem er.

Værktøj	Hvad det er	Grib til det, når…
PRESENCE	Det originale frittstående belægningsprogram (USGS, med MacKenzie); estimerer lokalitetsbelægning og de dynamiske/falske-positiv-udvidelser. Har en peg-og-klik-grænseflade og en R-bro, RPresence	Du helst ikke vil bo i R, eller vil have det program, metodeartiklerne blev bygget op omkring
unmarked (R)	Den frie R-arbejdshest; maximum-likelihood-tilpasning af belægning, Royle-Nichols, gentagne-tællings- og afstandsmodeller gennem én grænseflade	Du er i R og vil have hurtige, veltrådte enkeltarts- og dynamiske modeller
camtrapR (R)	Ikke en modeltilpasser — broen. `detectionHistory()` forvandler tidsstemplede billeder til de detektionsmatricer, modelpakkerne har brug for, indsats inkluderet	Du har rå kameraregistreringer og har brug for ren belægningsinput
ubms (R)	unmarkeds bayesianske tvilling — næsten samme grænseflade, men tilpasser i Stan, så du får tilfældige effekter og fuld posterior-inferens	Du har brug for tilfældige effekter eller en bayesiansk behandling, men kan lide unmarkeds syntaks
spOccupancy (R)	Moderne bayesiansk pakke til rumligt eksplicit, multiarts- og dataintegreret belægning; skalerer til titusinder af lokaliteter via nærmeste-nabo-Gauss-processer	Dit problem er stort, rumligt, multiarts eller fusionerer flere datasæt

En typisk vildtkamerapipeline kører camtrapR → unmarked (eller ubms / spOccupancy), med PRESENCE som det kodefri alternativ. Lærer du rammen fra bunden, er USGS' pakke `occupancyTuts` en ægte god indgang: 28 interaktive tutorials, der dækker enkeltsæson, dynamik, undersøgelsesdesign og aflæggermodellerne, med videoer og øvelser.

Én blød bemærkning om arbejdsgang, for det er flaskehalsen, før noget af denne software overhovedet kører: belægningsmodeller har brug for rene detektionshistorikker, og den langsomme del er næsten altid at sortere tusindvis af billeder for at finde de få med din målart i — og ikke fejletikettere dem, hvilket, som vi så, er en falsk positiv, modellen tager for pålydende.

En forsker ved en bærbar computer, der gennemgår et blødt net af vildtkameradetektioner

Belægning er en reel størrelse — lav den ikke stille om til antal

En afsluttende disciplin, for det er det mest almindelige misbrug. Belægning er en legitim, nyttig størrelse i sig selv — andelen af lokaliteter, der bruges, hvordan den skifter med habitat, hvordan den ændrer sig over årene. Hvad den ikke er, er en stedfortræder for antal. Sollmann er eksplicit: »belægning bør ikke fejltolkes som et indeks for antal«, fordi forholdet mellem de to afhænger af en arts områdestørrelse og adfærd. En lokalitet kan læses som »besat«, hvad enten ét dyr eller halvtreds bruger den. Hvis det tal, du faktisk har brug for, er dyr per kvadratkilometer, er belægning den forkerte model, og du vil have tæthedsfamilien i stedet Sådan estimerer du vildttæthed fra vildtkameraer uden at mærke dyrene. Brug belægning til det, den er fremragende til — hvor en art er, og hvor den er på vej hen — og lad den stoppe der.

Ofte stillede spørgsmål

Hvad er en belægningsmodel i jævne ord?

Det er en måde at estimere sandsynligheden for, at en art er til stede på en lokalitet, samtidig med at man tager højde for, at man ikke altid detekterer den, når den er der. Du optæller hver lokalitet gentagne gange, og modellen adskiller »hvor arten faktisk er« (belægning, ψ) fra »hvor sandsynligt det er, at du ser den, når den er der« (detektionssandsynlighed, p).

Hvorfor er en manglende detektion ikke det samme som et fravær?

Fordi detektionen er ufuldkommen — dit kamera eller din optælling går glip af dyr, der er til stede, især når de er sjældne eller strejfer over et stort leveområde. En tom registrering er forenelig med både »ikke der« og »der, men overset«, så at behandle den som et reelt fravær undervurderer systematisk, hvor udbredt en art er. På tværs af hundredvis af studier var de fleste detektionssandsynligheder per optælling under 0,5.

Hvor mange gange skal jeg optælle en lokalitet, før jeg kan kalde den tom?

Der er intet tal, der beviser fravær, men du kan drive chancen for et falsk »fraværende« så lavt, du har brug for, ved at tilføje optællinger eller indsats: på tværs af k uafhængige besøg er sandsynligheden for at gå glip af en besat lokalitet (1−p)^k, så lav detektion betyder bare flere besøg. For beslutninger med høj indsats er den konservative holdning at behandle en manglende detektion som kun vejledende.

Hvad er forskellen på en enkeltsæson- og en dynamisk belægningsmodel?

En enkeltsæsonmodel (statisk) antager, at belægningen ikke ændrer sig i optællingsperioden — et øjebliksbillede af, hvor arten er. En dynamisk (flersæsons) model lader belægningen ændre sig mellem sæsoner og estimerer raterne for den ændring: kolonisering (lokaliteter, der bliver besatte) og lokal uddøen (lokaliteter, der bliver ubesatte).

Virker belægningsmodeller virkelig for vidtstrejfende dyr på vildtkameraer?

Ja, men med en omfortolkning. Fordi et kamera kun dækker en strimmel af et stort leveområde, bevæger dyret sig ind og ud af synsfeltet, og streng »lukkethed« brydes; den standardmæssige, ærlige løsning er at læse dit estimat som sandsynligheden for, at lokaliteten bruges af arten snarere end er strengt besat — estimatet forbliver gyldigt, etiketten ændrer sig.

Kan AI-artsgenkendelse skabe problemer i belægningsanalyse?

Det kan den, hvis du ikke verificerer den. En klassifikator, der fejletiketterer én art som en anden, skaber en falsk-positiv detektion — en art »registreret«, hvor den er fraværende — og umodellerede falske positiver gør belægningsestimater skæve opad og forvrænger kolonisering og uddøen. Løsningen er at verificere detektioner (eller beholde en bekræftet delmængde, modellen kan stole på), før der bygges detektionshistorikker.