Aktivitetsmønstre fra vildtkameraers tidsstempler

Q: Kan jeg stole på et aktivitetsmønster fra kameraer sat på stier?

Med forbehold. Sti-placerede kameraer registrerer sti-*brug*, ikke aktivitet i almindelighed, og kan få en art til at se mere dagaktiv ud, end den er — hovdyr undgår stier om natten for at undslippe rovdyr, så stikameraer undervurderer deres natteaktivitet. Tilfældigt placerede eller off-trail-kameraer giver en mere ærlig kurve; oplys som minimum, at sti-placering skævvrider mod dagtimerne.

Hvert eneste foto, dine kameraer har taget, bærer allerede på det mest værdifulde tal i hele datasættet, og det er ikke arten. Det er tidspunktet på dagen. Et vildtkamera udløses, når et dyr er til stede, så bunken af tidsstempler, du har samlet, er en stikprøve af, hvornår netop det dyr var vågent og i bevægelse — flere udløsninger, når det er aktivt, færre eller ingen, når det hviler. Aflæs nok af de tidspunkter, og du kan rekonstruere formen på en arts døgn: hvornår den rører på sig, hvornår den topper, hvornår den falder til ro. Det er et dyrs aktivitetsmønster, og et vildtkamera er en af de få billige, ikke-invasive måder at få fat i ét på.

Her er hele pipelinen i ét åndedrag, så du ved, hvor det her er på vej hen. Du trækker en ren dato-tid ud af hvert billede (næsten altid fra EXIF-metadataene, nogle gange ved at aflæse det tidsstempel, der er brændt ind i selve fotoet); du afgør, hvilke poster der tæller som uafhængige hændelser; du omregner de urtider til en cirkulær skala og — hvis dit studie spænder over årstider eller ligger langt fra ækvator — til soltid; du tilpasser en cirkulær kernel-density til tidspunkterne for at estimere aktivitetskurven; og hvis du sammenligner to arter, beregner du overlapskoefficienten (Δ) mellem deres kurver. I R bor arbejdet næsten udelukkende i tre pakker — `overlap`, `activity` og `camtrapR` — og det hele hviler på én lidet glamourøs forudsætning: omkring 100 detektioner af arten, før du stoler på kurven.

Ingen af de trin er svære. Flere af dem er lette at få stille og umærkeligt forkerte — et ur, der er drevet af sted, et "uafhængigheds"-filter, der sletter netop den top, du forsøger at måle, en solopgang, der flyttede sig tre timer mellem juni og december, mens din x-akse blev stående. Dette stykke går pipelinen igennem fra ende til anden og markerer — mindst lige så vigtigt — hvor en troværdig aktivitetsanalyse skiller sig fra en værdiløs. Forskellen ligger sjældent i statistikken. Den ligger i datahygiejnen opstrøms for den.

Først: få rene dato-tider ud af hvert foto

Du kan ikke senere rekonstruere, hvornår et dyr blev fotograferet — der findes ingen anden kilde til det, sådan som der er til f.eks. et kameras koordinater. Som GBIF's best practice-vejledning siger det rent ud, er dato og tid "det vigtigste aspekt af dets metadata... og kan ikke udledes senere". Så dette trin fortjener mere omhu, end det som regel får.

Den rene vej er de indlejrede metadata. Når et kamera skriver en JPEG, stempler det optagetidspunktet ind i EXIF-blokken, i feltet `DateTimeOriginal`. Værktøjer læser det felt direkte: `camtrapR`'s funktion `recordTable()` læner sig op ad ExifTool for at trække `DateTimeOriginal` ud af hvert billede og samle en ryddelig posttabel med station, art og tid. Hvis dine billeder bærer god EXIF, er det her et løst problem — peg funktionen mod dine mapper, og du har maskinlæsbare dato-tider ned til sekundet.

To opstrøms-vaner gør det hele mere sikkert, og begge handler om kameraet, ikke softwaren. For det første: sæt uret til UTC eller lokal vintertid, og deaktivér det automatiske skift til sommertid. Sommertid er en tavs sabotør af aktivitetsdata: indstiller du et kameras ur om sommeren, og det ikke kender til sommertid, lander hvert vinterfoto en time skævt i forhold til den sande urtid, og omvendt — en systematisk én-times-fejl smurt ud over halvdelen af dine poster. `camtrapR`'s råd er den pragmatiske udgave af samme regel: bruger dit studieområde sommertid, men dine kameraer ikke registrerer det, så lad analysens tidszone stå på UTC, fordi UTC ikke har noget sommertids-spring at snuble over. For det andet: navngiver eller organiserer du selv filerne, så start filnavnene med datoen — `YYYYMMDD_HHMMSS` — så en alfabetisk sortering også sorterer dem kronologisk, og skriv tider i ISO 8601 (`YYYY-MM-DDTHH:MM:SS`), når du eksporterer.

Opdager du efterfølgende, at et kameras ur var sat forkert — en hel udsætning forskudt med et kendt beløb — kan det reddes. `camtrapR` indeholder `timeShiftImages()` til at batch-korrigere tidsstemplerne i billedernes metadata, og en dedikeret `fixDateTimeOriginal()` til en bestemt fejltype: visse Reconyx HyperFire-kameraer, der ikke gemmer dato og tid i standard-tagget. Tag backup af billederne først. Pointen er, at urfejl fanget tidligt er en irritation; urfejl, der aldrig fanges, bliver til et fiktivt aktivitetsmønster.

Definér dine kategorier — men vid, at de er en grov første sortering

Før al kurvetilpasning hjælper det at have det ordforråd, feltet har brugt fra begyndelsen. I det øjeblik forskerne indså, at kameratidsstempler kunne beskrive aktivitet, var det første, de gjorde, at sortere arter i fire spande:

Dagaktiv (diurnal) — aktiv mest i dagslys.
Natteaktiv (nokturn) — aktiv mest om natten.
Skumringsaktiv (crepuskulær) — aktiv mest i tusmørket, omkring daggry og skumring.
Døgnaktiv (kathemeral) — aktiv på tværs af både dag og nat, uden stærk præference.

Det er ikke bare fornemmelser; de kan defineres operationelt. I et toårigt studie af otte pattedyr i det nordlige Japan inddelte Ikeda og kolleger hvert foto i dag, nat eller tusmørke, sammenlignede fotografisk hyppighed på tværs af de tre perioder med en envejs-ANOVA og tildelte hver art en kategori: dagaktiv, hvis fotos klumpede sig i dagtimerne, natteaktiv hvis om natten, skumringsaktiv hvis i tusmørket, og døgnaktiv, når der "ingen forskel" var mellem de tre perioder. Det gav rene afgørelser — almindeligt egern dagaktivt, mårhunde og vaskebjørne natteaktive, sikahjorte og sneharer skumringsaktive, japanske mårer og brune bjørne døgnaktive.

To forbehold følger med spandene. Det første er, at de er reelt grove, og de mest interessante fund bor i sprækkerne mellem dem. De samme sikahjorte "skiftede toppe fra tusmørke om foråret-efteråret til dagtimerne om vinteren, muligvis på grund af termiske begrænsninger", og mårerne var døgnaktive det meste af året, men natteaktive om efteråret. Et enkelt kategorimærkat ville have udvisket begge dele. Det andet forbehold er skala. Globalt er firedelingen skæv: i et datasæt med tusindvis af pattedyrarter fandt Bennie og kolleger, at "størstedelen af pattedyrarterne er natteaktive (69 %...; 20 % dagaktive, 8,5 % døgnaktive og 2,5 % skumringsaktive)", og at strategien er dybt konserveret på tværs af pattedyrenes stamtræ (Pagels λ = 0,947). Så din standardantagelse om et uudforsket pattedyr bør være "sandsynligvis natteaktivt", og en sikker dagaktiv-klassifikation fortjener et nyt blik — især i lyset af de placeringsfælder, vi kommer til senere. Kategorier er en nyttig overskrift. Aktivitetskurven er historien.

Kategorier er en nyttig overskrift. Aktivitetskurven er historien.

Temporal uafhængighed: det mest konsekvensfyldte — og mest omstridte — valg, du træffer

Et lille, natteaktivt pattedyr fouragerer ved foden af et træ om natten i køligt, næsten monokromt lys

Her er der, hvor gode hensigter ødelægger aktivitetsanalyser. Kameraer tager ikke ét foto pr. besøg. Et enkelt dyr, der dvæler foran linsen, eller et kamera indstillet til at affyre serier på tre eller ti billeder pr. udløsning, kan producere snesevis af tidsstempler fra ét eneste øjeblik af aktivitet. Får de lov at blive, hober de tidsstempler, der ligner hinanden til forveksling, sig op og forvrider kurven mod "de tidspunkter, arten tilfældigvis optrådte foran dine kameraer", som `camtrapR` mindeværdigt formulerer det om en argusfasan, der elskede rampelyset.

Standardløsningen er et tid-til-uafhængigheds-filter (i `camtrapR` argumentet `minDeltaTime`): læg enhver post af samme art ved samme station, der falder inden for et vist vindue — 30 minutter og 60 minutter er de almindelige valg — sammen til en enkelt hændelse. Det er let at anvende. `camtrapR`'s `recordTable()` har som standard `minDeltaTime = 0` (behold alt) og lader dig sætte f.eks. 60 for at udtynde data; i pakkens eksempelkørsel bliver 68 billeder til 56 poster efter fjernelse af dublet-tider og dernæst til 40, når et én-times-filter anvendes. Afgørende er, at `minDeltaTime` "påvirker alle aktivitetsplot-resultater, da det bestemmer temporal uafhængighed mellem poster" — ændr vinduet, og du ændrer kurven.

Og det er præcis problemet, for konventionen er omstridt helt ned til roden. Peral og kolleger gennemgik 134 frit tilgængelige vildtkamera-aktivitetsstudier og fandt, at "næsten 70 % (90 af 134...) anvender et tid-til-uafhængigheds-filter", typisk 30 minutter, nogle gange 60 eller endda 24 timer. Deres argument imod det er begrebsligt: disse filtre blev lånt fra tæthedsestimering, hvor flere fotos af ét individ blæser optællinger op, men aktivitet er ikke en række diskrete hændelser — det er en kontinuerlig tilstand. Som de formulerer det, får filteret observatøren til "i realiteten at beslutte, at dyret er inaktivt i denne periode, og kassere meningsfuld information om dyrets aktivitet". Værre endnu er skaden ujævn. Med et Serengeti-datasæt på 164.509 billeder viste de, at talrige, sociale planteædere "mistede 74-93 % af aktivitetsdataene, da tid-til-uafhængighed steg fra 1 til 60 minutter", mens sjældne rovdyr kun mistede 21-23 %. Filtreringen krympede ikke bare stikprøverne; den deformerede kurverne — gazellens middagstop faldt med op til 44 % — og fordi den ramte planteædere og rovdyr asymmetrisk, forvred den selve de rovdyr-byttedyr-overlapssammenligninger, folk laver. Deres konklusion er utvetydig: brugen af tid-til-uafhængigheds-filtre i aktivitetsestimering "er ikke gyldig og bør ikke anvendes".

Så hvad skal du så egentlig gøre? Læs ikke Peral som "behold hvert billede råt". Læs det præcist. Serieoptagelser — de ti billeder, et kamera affyrer på en enkelt udløsning — er slet ikke en stikprøve af adfærd; de er en brugerdefineret indstilling, og Peral siger eksplicit, at de bør udelukkes fra aktivitetsanalyser. Uenigheden er smallere, end den først ser ud: næsten alle er enige om, at man skal fjerne den kunstige ophobning fra serier og fra et enkelt dyr, der dvæler. Den levende uenighed er, hvorvidt man derefter skal pålægge et fast urvindue (30 eller 60 minutter) oven på det. Den nyere, forsvarlige holdning er at fjerne kun den oplagte ikke-uafhængighed og ellers beholde posterne, eller — hvis du filtrerer — at rapportere, hvad filtreringen gør ved dine estimater, frem for at vælge 30 minutter, fordi alle andre gjorde det. Uanset hvad du vælger, så oplys det. Et aktivitetsresultat er ufortolkeligt uden sin uafhængighedsregel, og det faktum, at publicerede studier brugte "variable og vilkårlige" vinduer, betyder, at deres kurver ofte ikke meningsfuldt kan sammenlignes med hinanden. Vær det studie, der er eksplicit.

Et aktivitetsresultat er ufortolkeligt uden sin uafhængighedsregel. Vær det studie, der er eksplicit.

Tilpas kurven: cirkulær kernel-density og von Mises-kernen

En flok hjortedyr græsser på åben græsslette i blødt morgenlys

Nu statistikken, som er den lette del. Tidspunktet på dagen er cirkulært — 23:59 ligger op ad 00:00, ikke elleve timer fra det — så du kan ikke tilpasse en almindelig densitetskurve til det. Du tilpasser en cirkulær. Standardtilgangen, introduceret for kameradata af Ridout og Linkie og nu feltets standard, tilpasser en kernel-density til de observerede tidspunkter ved hjælp af en von Mises-kerne (den cirkulære pendant til den gaussiske) frem for den sædvanlige retlinede kerne. Resultatet er en glat sandsynlighedstæthed over døgnets 24-timers cyklus: høj, hvor dyret er aktivt, lav, hvor det ikke er.

Et par mekanikker betyder noget. Alle disse værktøjer arbejder i radianer, ikke timer eller brøkdele af et døgn, så den første linje i næsten ethvert script omregner: `timeRad <- time 2 pi`. Udjævningen styres af en båndbredde, eksponeret i `overlap`-pakken som argumentet `adjust` — hæv den over standarden på 1 for en fladere kurve, sænk den for en mere takket — og valget påvirker de efterfølgende overlapsestimater, så det er ikke rent kosmetisk. I `activity`-pakken klares samme opgave af `fitact()`, som tilpasser den cirkulære kerne og — fordi flere poster ophobes, når dyret er mere aktivt — udleder et samlet aktivitetsniveau (den andel af døgnet, populationen bruger aktivt) fra arealet under fordelingen.

To R-pakker dominerer, og de er komplementære. Brug `overlap` (funktionerne `densityPlot()`, `overlapPlot()`, `overlapEst()`), når dit spørgsmål handler om at sammenligne to arters kurver. Brug `activity` (`fitact()`, `solartime()`, `compareCkern()`), når du vil have et kvantificeret aktivitets-niveau-estimat med bootstrappede konfidensintervaller, eller rigere værktøjer til at sammenligne fordelinger statistisk. Og `camtrapR` binder dem til dine billeder: dens `activityDensity()` kalder `overlap::densityPlot()`, `activityOverlap()` kalder `overlap::overlapPlot()` og `overlapEst()`, og `activityRadial()` og `activityHistogram()` giver dig urskive- og time-søjle-visningerne, alt aflæst direkte fra posttabellen. Til visualisering af resultater er det radiale plot og den overlejrede densitetskurve de to arbejdsheste; densitetsplottet er det, man bør publicere, fordi det viser den faktiske estimerede form frem for at samle i hele timer.

Tidspunktet på dagen er cirkulært — 23:59 ligger op ad 00:00, ikke elleve timer fra det — så du kan ikke tilpasse en almindelig densitetskurve til det.

Sammenligning af arter: overlapskoefficienten (Δ)

Den enkeltvis hyppigste grund til at lave denne analyse er at spørge, om to arter deler døgnet — rovdyr og bytte, eller to konkurrenter. Standardsammenfatningen er overlapskoefficienten, Δ, arealet, der ligger under begge densitetskurver: den løber fra 0 (intet overlap overhovedet) til 1 (identiske aktivitetsmønstre). Tænk på den som den brøkdel af aktiviteten, de to arter har til fælles.

Hvilken estimator du bruger, afhænger af din mindste stikprøvestørrelse, og det er her, folk falder i. `overlap`-pakken tilbyder tre — Dhat1, Dhat4 og Dhat5 — og vejledningen er konkret: brug Dhat1 til små stikprøver og Dhat4 til større. Præcis hvor tærsklen falder, angives en smule forskelligt forskellige steder af de samme forfattere, hvilket er værd at vide: pakkens dokumentation siger, at "Dhat4 er bedst, når den mindste stikprøve har mindst 50 observationer", mens pakkens vignette lægger overgangen højere og anbefaler Dhat1, når den mindste stikprøve er under 50, og Dhat4, når den er "større end 75", med en gråzone imellem. Den praktiske læsning: komfortabelt over ~75 i din mindste stikprøve, Dhat4; klart lille, Dhat1; ind imellem, foretræk Dhat1 og overfortolk ikke. Én regel er fast i hver kilde — brug ikke Dhat5, fordi "selv små ændringer i data kan resultere i store, diskontinuerte ændringer i Dhat5, og den kan antage værdier > 1". (Et hint til `camtrapR`-brugere: `activityOverlap()` returnerer som standard Dhat1, så hvis dine stikprøver er store, så angiv `overlapEstimator = "Dhat4"` frem for at acceptere standarden.)

Konfidensintervaller kommer fra en bootstrap, og en udjævnet foretrækkes — tilpas en density, og træk så simulerede observationer fra den — fordi almindelig resampling aldrig kan producere et tidspunkt uden for dit observerede interval, hvilket er forkert for et kontinuerligt aktivitetsmønster. Brug nok genudtræk: eksempler viser ofte 1.000, men vignetten er eksplicit om, at "til en rigtig analyse ville 10.000 bootstrap-stikprøver være bedre", og pakken advarer om, at "for stabile estimater har du brug for mindst 999 bootstrap-estimater, helst 10.000".

Konkrete tal gør det håndgribeligt. I det kanoniske Kerinci-eksempel gav tigre og makakker i én zone — begge med mere end 75 observationer — et Dhat4-overlap på 0,42, et moderat, delvist overlap. I et nordirsk rovdyr-byttedyr-studie overlappede ræve og harer 73 % (CI 68-77 %) på årsbasis, ræve og kaniner 80 %, ræve og halsbåndmus 81 % — rovdyrets døgn fulgte byttets — mens skovmårer og dagaktive egern viste det modsatte, en asynkroni i tråd med temporal undgåelse. Blandt sympatriske store rovdyr på Qinghai-Tibet-plateauet overlappede sneleoparder og los Δ = 0,88 (CI 0,80-0,95), sneleoparder og ulve 0,86, ulve og los 0,83 — alle høje, alle overvejende natteaktive, med overlap, der faldt mod moderat i den varme årstid. En udbredt konvention for at tale om disse tal: under 0,5 er lavt overlap, 0,5-0,8 moderat, over 0,8 højt. Det er en nyttig tommelfingerregel, ikke en lov.

Et rovdyr går langs en skovsti i skumringen, set på respektfuld afstand

Hvor mange data er nok? Cirka 100 detektioner

Du kan køre hver eneste funktion ovenfor på et dusin fotos. Det bør du ikke. Spørgsmålet om stikprøvestørrelse har et rent empirisk svar fra Lashley og kolleger, som sammenlignede kamera-afledte aktivitetskurver med radiotelemetrisk "sandhed" og udtog delstikprøver af dataene for at iagttage nøjagtigheden forringes. Deres fund: "det gennemsnitlige overlap steg, og overlapsfejlen faldt hurtigt, efterhånden som stikprøvestørrelserne voksede, indtil en asymptote nær 100 detektioner", hvorefter flere data købte lidt forbedring. Deres anbefaling er tallet, man skal huske — indsaml mindst 100 detektioner af en målart, før du estimerer dens aktivitetskurve.

To ærlige forbehold omkring de 100. For det første kan indsatsen for at få 100 detektioner "variere bredt afhængigt af artens økologi, mobilitet og opdagelighed" — trivielt for et almindeligt hjortedyr, en sæsons arbejde for en sjælden kat. Foderpladser kan hjælpe: i det studie trak kameraer med foder ("aktive") en 700 gange højere detektionsrate for hjortedyr end de passive, der var sat ud langs stier, hvilket betyder noget, når du kapløber mod en stikprøve inden for et biologisk meningsfuldt vindue. For det andet matchede kamerakurver radiotelemetrien godt i form, selv ved gode stikprøvestørrelser, men adskilte sig i størrelsen af toppene — overlap med radiotelemetrisk sandhed lå på Δ = 0,74-0,84, med statistisk signifikante forskelle koncentreret omkring de travleste ædetidspunkter. Kameraer er fremragende til hvornår en art er aktiv; vær mere forsigtig med at aflæse den nøjagtige højde af en top.

Til selve bootstrappen er gulvet lavere, men stadig reelt: `overlap`-pakken bemærker, at 40 bootstrap-estimater er det absolutte minimum for et 95 %-konfidensinterval, 200 for 99 % — men, igen, du vil have hundreder-til-tusinder for stabilitet, ikke minimummet.

Urtid kontra soltid: den korrektion, de fleste tilfældige analyser springer over

Det her er trinnet, der skiller en omhyggelig aktivitetsanalyse fra en sjusket, og det er usynligt, hvis du ikke ved, at du skal kigge efter det. Solopgang og solnedgang flytter sig gennem året, og de flytter sig mere, jo længere du er fra ækvator. Samler du fotos på tværs af årstider på en fast urtidsakse, bliver et skumringsdyrs to toppe — som faktisk følger daggry og skumring — smurt ud i brede, fladtrykte pukler, fordi "daggry" var kl. 05:00 i juni og 07:30 i december. Saml på tværs af et tilstrækkeligt bredt spænd, og du kan endda fabrikere et overlap, der ikke er virkeligt: vignettens eksempel med en flagermus, der flyver ud ved solnedgang, og en høg, der søger til ro ved solnedgang, viser nul overlap i nogen enkelt måned, men de samlede data viser tilsyneladende overlap, udelukkende fordi solnedgangen flyttede sig.

Løsningen er at udtrykke hvert fotos tidspunkt i forhold til solen frem for uret. Begge hovedpakker gør det. I `overlap` "omdanner `sunTime()` en vektor af urtider til 'soltider' ved at afbilde solopgang på π/2 og solnedgang på 3π/2", givet hver posts dato og placering. I `activity` forankrer `solartime()` urtider til gennemsnitlig solopgang og solnedgang for studiets koordinater og returnerer både en urtids- og en soltidsversion, så du kan sammenligne dem. Tommelfingerreglen, der falder ud af dette: jo længere du er fra ækvator, og jo mere af året dit studie spænder over, jo mere betyder korrektionen — den underliggende aktivitetsniveau-metodes antagelser er eksplicit "mindre sandsynligt opfyldt hos store rovdyr eller i vintre på høje breddegrader". Nær ækvator, eller for et studie afgrænset til et enkelt kort vindue, er urtid som regel fint.

I praksis gør de omhyggelige studier det bare. Et studie af 61 arter på tværs af kinesiske bjergskove "omregnede urtid for hver detektion til en relativ soltid for at eliminere effekterne af variation i daglængde", før kurver blev tilpasset. Plateau-rovdyrstudiet standardiserede alle optagetider til soltid med `overlap::sunTime()`, eksplicit fordi solopgang lå mellem 5:30 og 8:30 hen over året. Det nordirske studie forskød hver detektion i forhold til den nærmeste solhændelse — morgenposter relativt til solopgang, aftenposter relativt til solnedgang — så en detektion kl. 22:10 med solnedgang kl. 20:00 blev til "−2 t 10 min", et rent mål for, hvor dybt ind i natten dyret var aktivt. Sad dine kameraer ét sted i én sommermåned nær troperne, kan du springe dette over. Ellers: omregn — og bemærk, at `camtrapR`'s aktivitetsfunktioner bruger urtid, ikke soltid, så hvis du har brug for korrektionen, skal du selv anvende den, før du plotter.

Det her er trinnet, der skiller en omhyggelig aktivitetsanalyse fra en sjusket, og det er usynligt, hvis du ikke ved, at du skal kigge efter det.

Faldgruberne, der stille ødelægger et aktivitetsmønster

Et bjerglandskab ved solopgang med solen lavt over en bjergryg, der kaster langt lys

De fleste værdiløse aktivitetsanalyser væltes ikke af statistikken. De væltes opstrøms. De tilbagevendende fejltyper, groft sorteret efter hvor ofte de bider:

Urdrift og sommertid. Dækket ovenfor, men det er den fejl nummer ét, der sker i tavshed: et kameraur indstillet under sommertid, eller en udsætning, hvis ur simpelthen var forkert, rækker dig en systematisk forskudt kurve uden varsel. Verificér ure ved udsætning; sæt dem til UTC eller vintertid; deaktivér skift til sommertid.
Et uafhængighedsfilter, der æder toppen. Et 30- eller 60-minutters filter kan fjerne 74-93 % af en social planteæders poster og flade dens travleste timer ud, mens det knap rører et sjældent rovdyr — og forvrider både kurverne og enhver sammenligning mellem arter. Fjern serier og oplagt dvælen; tænk dig grundigt om, før du pålægger et fast urvindue, og rapportér dets effekt, hvis du gør.
Sammenlægning på tværs af soltid uden at korrigere. Smører toppe ud og kan fabrikere overlap. Omregn til soltid for data over flere årstider eller på høje breddegrader.
For få detektioner. Under ~100 falder nøjagtighed og præcision hurtigt af, og en selvsikkert udseende kurve fra 18 fotos er mest støj.
Placeringsbias — den lumske. Den fortjener sit eget afsnit.

Placeringsfælden er værd at dvæle ved, fordi den narrer omhyggelige folk. Kameraer sat på stier og veje — netop der, hvor man placerer dem for at fange rovdyr eller maksimere detektioner — registrerer dyr, der bruger stier, hvilket ikke er det samme som dyr, der er aktive. Tanwar og kolleger gennemførte det rene eksperiment i et indisk tigerreservat ved at udsætte stikameraer og tilfældigt placerede kameraer side om side. Stikameraerne viste hovdyr — aksishjort, nilgauantilope, vildsvin, gazelle — med "overvejende dagaktivitet og meget få optagelser om natten". De tilfældigt placerede kameraer, der samplede landskabet frem for stierne, afslørede betydelig natteaktivitet hos de samme arter; nilgauantilopen vendte endda om til en natteaktiv top, med overlappet mellem sti- og tilfældige estimater nede på Δ = 0,41. Årsagen er adfærdsmæssig: "stier bruges i udstrakt grad af rovdyr om natten", så hovdyrene undgår dem efter mørkets frembrud — et anti-rovdyr-træk, der får dem til at se dagaktive ud for et stikamera. Forfatternes advarsel er en, ethvert aktivitetsstudie bør tage til sig: publicerede aktivitetsmønstre udledt af rovdyr-fokuserede sti-undersøgelser "er sandsynligvis biaseret mod dagaktivitet". `overlap`-vignetten gør samme pointe fra den anden side — et kamera på en sti måler "gang på stier", så to arters overlap er overlappet i deres sti-gang, og "en græssende planteæder og det rovdyr, der lister sig ind på den, er sandsynligvis begge 'inaktive' efter den definition". Løsningen er design: tilfældigt placerede eller off-trail-kameraer giver et mere ærligt aktivitetsbillede, og som minimum bør du oplyse, at sti-placering skævvrider mod dagtimerne.

Et sidste, finere forbehold: vær forsigtig med at sammenlægge heterogene data af enhver art, ikke kun på tværs af årstider. Kombinerer man lokaliteter eller perioder med reelt forskellig aktivitet, blæser det overlapsestimaterne op, "og dette tilsyneladende overlap er en artefakt af sammenlægningen". Og husk, at det, du faktisk måler, er detektioner på kameraer, som fortolker "aktiv" som "bevæger sig forbi en sensor" — et virkeligt, men ufuldstændigt vindue til adfærd. Fortolk arts-interaktioner med omhu; vignettens advarende fortælling er et studie, hvor en asiatisk vildhund (dhole) og vildsvin lod til at dele døgnet, hvilket antydede, at dholen åd vildsvin, indtil ekskrementanalyse viste, at dholen for det meste åd hjortedyr i stedet.

De fleste værdiløse aktivitetsanalyser væltes ikke af statistikken. De væltes opstrøms.

Hvor det her er på vej hen: hierarkiske modeller

Et lille, diskret vildtkamera spændt fast til et træ vendt mod en åben lysning i skoven væk fra enhver sti

Kernel-density-estimering er feltets standard, og til de fleste spørgsmål er det det rette værktøj. Men det er værd at kende dens loft, for metodelitteraturen er aktivt på vej forbi den. Iannarilli og kolleger fremlægger KDE's begrænsninger rent ud: den sammenlægger data på tværs af lokaliteter og ignorerer dermed variabiliteten fra lokalitet til lokalitet, hvilket giver overdrevent selvsikker usikkerhed; den er følsom over for båndbreddevalget i små stikprøver; den kan ikke inddrage kovariater eller formelt teste hypoteser; og den "betragter kun poster, hvor et dyr blev detekteret, og kasserer information om, hvornår der blev samplet, men arten ikke blev registreret". Det sidste er subtilt, men reelt — en KDE smider hver kameratime ud, hvor intet skete, selvom de nuller bærer information om, hvornår arten ikke var aktiv.

Det foreslåede alternativ er hierarkiske modeller — trigonometriske generaliserede lineære blandede modeller (sinus- og cosinusled med tilfældige lokalitetseffekter, via `glmmTMB` eller `lme4`) eller cykliske kubiske-spline-GAM'er (via `mgcv`) — som inddeler data i tidsintervaller, bruger ikke-detektionerne, tager højde for variabiliteten fra lokalitet til lokalitet og lader dig teste, hvordan årstid eller en konkurrents tilstedeværelse forskyder kurven. I et studie på 100 lokaliteter i Minnesota kvantificerede denne tilgang sortbjørnes og prærieulves aktivitet, samtidig med at den blottede "betydelig heterogenitet fra lokalitet til lokalitet, et aspekt der i vid udstrækning er blevet ignoreret" af sammenlagt KDE. Disse modeller er mere krævende — en udbredt tommelfingerregel er 10 eller flere lokaliteter, før man tilpasser tilfældige effekter — og overkill til en enkelt-art-, enkelt-lokalitet-beskrivelse. For de fleste læsere er KDE plus en klart angivet uafhængighedsregel og en soltidskorrektion det rette valg i dag. Men hvis dit spørgsmål involverer kovariater, flere lokaliteter eller formelle hypotesetest, er det her, du skal kigge videre.

Ofte stillede spørgsmål

Hvad er det mindste antal detektioner, der skal til for at estimere et aktivitetsmønster fra vildtkameraer?

Cirka 100. Nøjagtighed og præcision forbedres skarpt, efterhånden som stikprøven vokser, og rammer så en asymptote nær 100 detektioner, hvilket er det anbefalede minimum, før man estimerer en aktivitetskurve. Du kan tilpasse en kurve på færre, men den bliver støjende og bør ikke bære megen fortolkningsmæssig vægt.

Bør jeg anvende et 30-minutters eller 60-minutters uafhængighedsfilter på mine fotos?

Det er reelt omdiskuteret. Filteret er konventionelt og fjerner ophobningen fra serier og dvælende dyr, men en stor analyse argumenterer for, at faste tid-til-uafhængigheds-filtre er uhensigtsmæssige for aktivitetsdata — de kan kassere hovedparten af nogle arters poster og forvride de resulterende kurver og overlap. Den forsvarlige mellemvej: udeluk altid serieoptagelser, fjern oplagt ikke-uafhængighed, tænk dig om to gange før du pålægger et fast urvindue, og hvis du filtrerer, så rapportér dets effekt på dine estimater.

Hvad måler overlapskoefficienten (Δ) egentlig?

Det er arealet, der deles under to arters aktivitets-densitetskurver, fra 0 (ingen fælles aktivitet) til 1 (identiske mønstre) — den brøkdel af døgnet, to arter er aktive på samme tid. En udbredt tommelfingerregel læser under 0,5 som lavt overlap, 0,5-0,8 som moderat og over 0,8 som højt.

Skal jeg omregne til "soltid", og hvordan?

Ja, hvis dit studie spænder over årstider eller ligger et godt stykke fra ækvator — jo længere fra ækvator og jo længere studiet varer, jo mere betyder det. Sammenlægning på tværs af skiftende solopgang/solnedgang på en urtidsakse flader toppe ud og kan fabrikere overlap. Brug `overlap::sunTime()` eller `activity::solartime()`, som forankrer hver post til solopgang og solnedgang efter dato og placering.

Hvilken R-pakke skal jeg bruge — `overlap`, `activity` eller `camtrapR`?

Alle tre, til forskellige opgaver. `camtrapR` trækker tidsstemplerne ud af dine billeder og producerer posttabellen og hurtige aktivitetsplot; `overlap` er værktøjet til at sammenligne to arter via Δ-koefficienten; `activity` er bedst til at estimere et samlet aktivitets-niveau med konfidensintervaller. Bemærk, at `camtrapR`'s aktivitetsfunktioner bruger urtid, så anvend selv enhver soltidskorrektion først.

Kan jeg stole på et aktivitetsmønster fra kameraer sat på stier?

Med forbehold. Sti-placerede kameraer registrerer sti-brug, ikke aktivitet i almindelighed, og kan få en art til at se mere dagaktiv ud, end den er — hovdyr undgår stier om natten for at undslippe rovdyr, så stikameraer undervurderer deres natteaktivitet. Tilfældigt placerede eller off-trail-kameraer giver en mere ærlig kurve; oplys som minimum, at sti-placering skævvrider mod dagtimerne.