Åldersbedömning
Magnetkameraundersökning av tillväxtzonen i lårbenets nedre del (knät)
En systematisk översikt
1. Inledning
1.1 Uppdrag och Syfte
SBU fick förfrågan från Utredningen om medicinsk åldersbedömning (Ju 2020:14) att granska det aktuella vetenskapliga underlaget för den metod för medicinsk åldersbedömning i asylprocessen som tillämpas av Rättsmedicinalverket (RMV) i Sverige. RMV:s metod för medicinsk åldersbedömning bygger på två undersökningar: magnetkameraundersökning (MR) av tillväxtzonen i lårbenets nedre del (knät) och röntgenundersökning av visdomständer i underkäken [1] [2]. I denna rapport ingår det att belysa det vetenskapliga underlaget för MR-undersökningen av knät. I ett parallellt SBU-projekt belyses det vetenskapliga underlaget för röntgenundersökning av visdomständer i underkäken. Det ingick inte i vårt uppdrag att belysa etiska eller hälsoekonomiska aspekter.
1.2 Målgrupper
Huvudmålgruppen för denna rapport är Utredningen om medicinsk åldersbedömning.
2. Bakgrund
2.1 Metoden för åldersbedömning vid asylärenden i Sverige
Rättsmedicinalverkets metod för åldersbedömning i asylärenden bygger på två metoder; undersökning av visdomständer med röntgen och magnetkameraundersökning (MR) av tillväxtzonen i lårbenets nedre del (distala femur, i denna rapport kommer vi fortsättningsvis använda begreppet knä). Bilderna bedöms alltid av två personer, oberoende av varandra det vill säga två tandläkare respektive två radiologer. Med “moget” knä menas i korthet att förbeningsprocessen av tillväxtzonen är avslutad (sluten med eller utan en kvarstående slutningslinje, här i rapporten benämnt som ”ärr"). Om en kroppsdel (knä eller visdomstand) hos män uppnått mognad talar detta för att personen är vuxen det vill säga 18 år eller äldre enligt RMV [1]. Då tillväxtzonen i knät mognar tidigare hos kvinnor blir RMV:s bedömning i de fall då knät har varit mogen (sluten tillväxtzon) men visdomstanden omogen istället:"Resultatet tillåter ingen bedömning avseende den undersöktas ålder relativt 18-årsgränsen” [1]. I de fall där både knäled och visdomstand bedöms som omogna är RMV:s bedömning att undersökningarna ”talar möjligen för att den undersökta är under 18 år” [1].
När det gäller MR av knä så använder RMV det femgradiga klassificeringssystemet Schmeling och Kellinghaus, där stadie 4 och 5 bedöms som moget knä. Ett moget knä innebär att tillväxtzonen är helt förbenad - med eller utan synligt ”ärr”. För att tillväxtzonen ska bedömas som sluten (moget) måste båda radiologerna angett detta, om de är oeniga så blir slutbedömningen omoget knä.
Bedömare av knäundersökningen ska vara specialistläkare i radiologi med tillräcklig kompetens för att utifrån MR-bild avgöra om tillväxtzonen i lårbenets nedre del har uppnått slutstadium eller inte. För RMV:s krav på tekniska specifikationer avseende MR se Faktaruta 2.1
2.2 Faktorer som påverkar radiologisk åldersbedömning
Svårigheten med radiologisk åldersbedömning beror framförallt på den stora biologiska variationen i skelettmognad mellan individer i femton-till tjugoårsåldern. Andra faktorer som kan påverka är MR-metod och bedömarnas rutin. Dessa faktorer illustreras i Figur 2.1 och beskrivs mer ingående i nedanstående avsnitt.
2.2.1 Skelettmognad
Skelettmognad är en successiv process som pågår under hela barndomen. Man har länge studerat tillväxtzonerna i handen respektive knät med slätröntgen med hjälp av särskilda manualer framtagna från europeiska barn [3] och validerade för svenska förhållanden [4]. Dessa anses föga representativa för andra befolkningsgrupper/populationer och även sekulära trender över tid kan påverka tillförlitligheten [5], men data talar för att denna risk är störst hos flickor i tonåren [6]. De sekulära trenderna innebär successiv och relativ systematisk förändring över decennier eller sekler i populationer avseende mönster i längdtillväxt-, viktförändringar- och pubertetsförlopp. Trenderna uppstår när en majoritet av populationen får en bättre eller sämre socioekonomisk situation med bättre eller sämre nutrition. Bedömning av skelettålder/-mognad görs inom sjukvården exempelvis hos barn och ungdomar med avvikelser gällande tillväxt eller pubertet. Eftersom röntgen med denna frågeställning kräver god vana vid bedömning, har flera större center i Sverige ombesörjt att det är några få vana röntgenkunniga läkare/sköterskor som granskar röntgenbilderna. Försök har gjorts att med artificiell intelligens ta fram digitala beslutsprogram [7] [8]. Idag finns andra tekniker såsom datortomografi och MR, men fortfarande är ett problem representativiteten, förutom behovet av systematisering i undersökningsprocedur och analysrutin.
I kliniken har skelettålder följts regelbundet vid vissa kroniska tillstånd såsom kongenital binjurehyperplasi (medfödd förstoring av binjurebarken) eller organtransplanterade respektive vid olika hormonbehandlingar [9] [10]. Kunskap från detta visar på en stor spridning i skelettmognad bland barn med samma kronologiska ålder. Skelettåldern påverkas mer av det biologiska mognadstempot än den kronologiska åldern. I början av livet kan biologisk och kronologisk ålder skilja sig åt, exempelvis på grund av för tidig födsel eller tillväxthämning hos det ofödda barnet. När barnet sen närmar sig pubertetsfasen blir det ånyo mer påtagligt att biologisk mognad/ålder och kronologisk ålder kan variera kraftigt mellan individer. Här kan även stor spridning i psykologisk mognad förekomma, men framförallt märks stor skillnad gällande pubertetsspurt (dvs. den snabba längdtillväxt som ses hos både flickor och pojkar under puberteten), kroppssammansättning och skelettålder.
De faktorer som påverkar skelettålder är en kombination av genetik och nutrition, men påverkan från olika typer av hormoner är påtaglig. Som ett exempel leder tillväxthormonbrist till 3 till 4 års försenad skelettålder men allteftersom tillväxten normaliseras på insatt hormonbehandling minskar det man uppfattat som en försenad skelettålder [11]. Andra hormon som påverkar är nivåer av sköldkörtelhormon, insulin och framförallt könshormonet östrogen [12]. Barn med hypothyreos (otillräckliga nivåer av sköldkörtelhormon) har en försenad skelettmognad, medan barn med höga insulinnivåer eller höga östrogennivåer har en accelererad skelettmognad [12]. Cytokiner som stimulerar inflammation respektive stresshormonet kortisol hämmar tillväxtzonen i alla åldrar [13].
Under normala förhållanden startar puberteten hos pojkar, med stor spridning, alltifrån tio-till elvaårsåldern upp till femtonårsåldern. För flickor startar motsvarande process drygt något år tidigare med stor spridning upp till fjortonårsåldern. Mekanismen bakom pubertet är komplicerad. Normal sköldkörtelfunktion krävs för funktion av tillväxtzonen under pubertet, och utan hormonet uteblir pubertetsspurten. Frisättning av insulin och tillväxtfaktorer ökar under puberteten, vilket stimulerar tillväxt och benmognad. Själva puberteten pågår under en period av 3 till 4 år och innebär en successiv ökning av könshormonfrisättning med motsvarande förändringar i kroppssammansättning. Pojkar får successivt ökande nivåer av testosteron och flickor ökande nivåer av östrogen. Samtidigt bildas även östrogen hos pojkar men i lägre nivåer [14] och på samma sätt testosteron i lägre nivåer hos flickor. Det är östrogenet hos båda könen som påverkar tillväxtzonernas celler via östrogenreceptorer till skelettmognad [15]. Slutresultatet är helt slutna tillväxtzoner i de långa rörbenen. Flickor uppnår oftare slutlängd tidigare än pojkar och blir i genomsnitt 12 till 13 centimeter kortare. Enstaka pojkar kan växa upp till drygt tjugoårsåldern, mycket beroende på ärftlighet.
En längre period av undernäring efterföljt av en period av relativt kaloriöverskott kan leda till snabb pubertetsutveckling med en snabbare slutning av tillväxtzonerna. Som ett exempel på snabb pubertetsutveckling kan nämnas adopterade barn, som kan vara undernärda i födelselandet och efter flytt till förbättrade närings- och socioekonomiska omständigheter får en återhämtnings- eller så kallad catch-up tillväxt, där förloppet med snabb viktökning kan riskera att sluta tillväxtzonerna för snabbt [16] [17].
Vad gäller socioekonomi, är publicerad litteratur heterogen. En tidig studie från Danmark visade att det fanns inga samband mellan socioekonomi och skelettmognad [18]. I andra länder med större klasskillnader har man funnit korrelation mellan försenad skelettålder och låg socioekonomi [19] [20]. Orsaken är huvudsakligen undernutrition och leder även till bestående kortvuxenhet [21] [22]. Avseende etnicitet är data inte konklusiv. Socioekonomisk status verkar vara en starkare faktor än etnicitet i att förklara skelettålder [23] [24].
Av ovan förstår man att framtagande av referenser för skelettåldrar är avhängigt av vilken befolkningsgrupp/population man studerar och det har stor betydelse för hur det vetenskapliga underlaget bör tolkas inom detta område.
2.2.2 Magnetkameraundersökning (MR)
2.2.2.1 Klassificeringssystem
Klassificeringen av skelettmognad i knät baseras på utseendet på tillväxtzonen, det vill säga den gränslinje mellan brosk och ben som är platsen för tillväxt i ett långt rörben. Det är en tunn struktur, bestående av celler i olika mognadsstadier. Under hela mognadsprocessen ändrar tillväxtzonen utseende. Den blir tunnare och tunnare innan den så småningom försvinner och bentillväxten upphör. I ett moget knä kan den kvarvarande, slutna tillväxtzonen hos vissa individer uppträda som en tvärgående linje (ett ”ärr”). Det innebär att för flera av de klassificeringssystem som nämns nedan så uppnår vissa vuxna individer aldrig slutstadiet.
I alla klassificeringssystem för skelettmognad av knät (lårbenets nedre del) som beskrivs i de inkluderade artiklarna, är mognadsprocessen uppdelad i olika exklusiva stadier (3 till 5 stadier, i vissa fall upp till 11 inklusive understadier). Alla system innebär både avgränsning och karakterisering av den tunna tillväxtzonen för att skilja de olika stadierna åt, till exempel bestämning av ”fokal dimmighet”, laminärt utseende, ljus, kontinuitet och även mätningar med en cut-off på 1,5 millimeter. Vid framtagning av klassificeringssystemen för skelettmognad har olika viktning av MR-sekvensen använts (T1 tse, PD och T2 fetthämmande). Viktningen avgör signalintensiteten och därmed visualisering och karakterisering av olika vävnader. Detta påverkar i sin tur bedömningen av skelettmognad [25]. Definitionen av stadierna som ses i skelettmognad och till och med vad som utgör ett ”moget knä” varierar mellan klassificeringssystemen.
2.2.2.2 MR-parametrar
Undersökning av små och detaljerade strukturer, såsom tillväxtzonen, kräver högupplösta MR-bilder. Jämförelse av klassificeringssystem för mognad kräver standardisering vad gäller viktning, signal-to-noise-ratio (SNR), upplösning och skanningsplan (sagittalt eller koronalt). Detta avgörs delvis av parametrarna som används för att producera en MR-bild. MR- parametrarna varierar avsevärt mellan forskningsstudier och beskrivs ofta otillräckligt i publicerade artiklar [26]. Dessutom kan samma MR-parametrar som tillämpas på olika maskiner ge olika resultat eftersom ett flertal andra faktorer kan påverka de resulterande MR-bilderna. Både programvara och hårdvara (typ av maskin, fältstyrka och typ av spole) påverkar särskilt SNR, men också viktning och fettsupprimering. Även hur spolen appliceras på den undersökta individen påverkar SNR, till exempel. om en spole lindas löst runt en kroppsdel ökar bruset jämfört med en tätt lindad spole.
Som redan nämnts så kommer olika typer av viktning att visa anatomiska strukturer på olika sätt. T2-viktning ger exempelvis en tydligare visualisering av vatten medan PD-viktning ger förbättrad visualisering av brosk. Detta kan potentiellt påverka bedömningen av tillväxtzonens mognad, även när samma klassificeringssystem används [27].
Anatomiska strukturer kan se olika ut beroende på vilket plan som avbildas. Tillväxtzonen är relativt horisontell, dock något böjd vilket betyder att planet varierar även inom en och samma undersökning i förhållande till tillväxtzonen. Detta kommer i vissa snitt orsaka en partiell volymseffekt vilket också kan påverka noggrannheten i mätningen.
För detaljerade klassificeringssystem där stadieindelningen baseras på liten skillnad mellan strukturerna som definierar stadierna, är standardisering av MR-bilderna avgörande.
2.2.2.3 Variabilitet mellan granskare
Skillnader mellan olika granskares bedömning påverkas av många olika faktorer. En helt objektiv bedömning av MR-signal är svår eftersom olika granskare tenderar att uppleva samma bilds intensitet på olika sätt, beroende på omgivande bakgrundsintensitet [28] [29 [30] [31]. Window leveling (fönster/nivåinställningar) påverkar signalens intensitet i bilden och är svår att standardisera [32]. Granskarens erfarenhet inom området samt kalibrering av bedömningen och tolkningen av bilderna påverkar givetvis också [27].
2.2.2.4 Sammanfattning
MR är förmodligen den metod inom radiologin som är svårast att standardisera, både när det gäller hur man producerar sina bilder och hur de bedöms. Detta kan avsevärt påverka resultaten i MR-studier som avser att utforska samma strukturer, särskilt om dessa strukturer är små och detaljerade. Undersökning av ’inter- and intra observer variability’ (variabilitet i granskning inom och mellan individuella granskare) utförs ofta som ett första steg i en studie. Det är dock ovanligt att reproducerbarheten av ett mått undersöks, nämligen hur en viss struktur hos samma individ (t.ex. tillväxtzonen) skulle se ut och bedömas om individen skannades i olika maskiner och/eller med olika parametrar. Citat från Krämer och medarbetare [25]: ”No tissue-specific normative values exist and details of the composition of tissues of the maturing epiphyseal plate which provide the contrast are not known with any degree of certainty, the findings of different studies achieved using different MRI weightings cannot be compared without problems.” Dessutom kan MR-bilder variera avsevärt även vid undersökningar där samma viktning använts på grund av alla ovan nämnda faktorer. Således är resultat från studier utförda på olika institutioner, med olika typer av MR- apparater, med olika skanningsparametrar, med olika granskare och/eller med användande av olika klassificeringssystem inte direkt jämförbara.
3. Metod
Detta avsnitt beskriver frågor, urvalskriterier och metodik för den systematiska översikten. Centralt för en systematisk översikt är att proceduren ska genomföras så att resultatet blir så objektivt som möjligt och att tillvägagångssättet beskrivs på ett transparent sätt. SBU följer de internationella riktlinjerna för att genomföra en systematisk översikt, PRISMA Statement (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) [33]. För mera utförlig information om metodiken hänvisar vi till SBU:s metodbok [34].
3.1 Frågor
Vilket vetenskapligt stöd finns för bedömning av huruvida en person av manligt respektive kvinnligt kön är över eller under 18 år genom magnetkameraundersökning av tillväxtzonen i knät?
3.2 Urvalskriterier
3.2.1 PIROs - magnetkameraundersökning av tillväxtzonen i knät
Population
Barn, ungdomar och unga vuxna i ålder 8 till 30, som är friska i leder och skelett.
Exkluderar studier på avlidna, samt studier där populationen har någon kronisk sjukdom eller fått hormonbehandling som påverkar skelettet.
Indextest
Magnetkameraundersökning (MR) av tillväxtzonen i knät (nedre delen av lårbenet). MR undersökningen måste vara specificerad i vilken viktning och plan som använts. Studien måste tydligt beskriva hur och när mätningarna utfördes.
Referenstest
Bekräftad kronologisk ålder.
Utfallsmått
Samband mellan stadium och ålder, på individ- eller aggregerad nivå.
Studiedesign
Tvärsnittsstudier och longitudinella studier.
3.3 Process för urval av studier
3.3.1 Litteratursökning
En informationsspecialist utformade och genomförde litteratursökningar i samråd med projektets sakkunniga och projektledare. De sakkunniga bidrog med lämpliga söktermer och beslutade om sökstrategin. Som utgångspunkt för litteratursökningen användes en systematisk översikt från Folkhelseinstituttet i Norge (Ding, 2018, litteratursökningen 2017) [35]. Eftersom sökningen i nämnda rapport bedömdes vara systematiskt genomförd avgränsades projektets sökning från år 2017 och framåt. Litteratursökningarna gjordes i mars 2021 i följande internationella databaser: Cochrane Library (Wiley), Embase (Elsevier), Medline (OvidSP), Epistemonikos, KSR Evidence och International HTA Database. Sökningen kompletterades med artiklar som identifierats via referens- och citeringssökning av inkluderade studier i databasen Scopus. Sökstrategierna redovisas i Bilaga 1.
3.3.2 Bedömning av relevans
Två personer oberoende av varandra gallrade bort irrelevanta referenser (artikelsammanfattningar) med stöd av programmet Rayyan [36]. Inkluderade referenser beställdes i fulltext. Studierna i fulltext bedömdes av två personer, först oberoende av varandra, och därefter gemensamt (konsensus). Fanns det en osäkerhet om en studie var relevant eller ej diskuterades den i hela projektgruppen. De studier som uppfyllde urvalskriterierna bedömdes vara relevanta. De studier som inte uppfyllde urvalskriterierna exkluderades från översikten och finns redovisade i Bilaga 2.
3.3.3 Bedömning av risk för bias
Risken för bias bedömdes av två personer, oberoende av varandra innan en konsensusbedömning gjordes. För bedömning användes mallen QUADAS 2 [37] (Bilaga 3). Mallen har justerats för att anpassas till projektets frågeställning (Bilaga 3). Risken för bias klassificerades som låg, måttlig eller hög. De studier där MR-protokollet inte var tillräckligt välbeskrivet det vill säga viktig information saknades bedömdes ha hög risk för bias och inga fler frågor i mallen behövdes besvaras. I de studier där MR-protokollet var suboptimalt beskriven kunde som bäst få måttlig risk för bias. Studier där endast en minoritet av MR-bilderna (<25 %) hade dubbelgranskats av två oberoende personer kunde som bäst få måttlig risk för bias.
Studier med hög risk för bias ingår inte i analysen utan redovisas i Bilaga 2. Karakteristika för studier med låg eller måttlig risk för bias finns sammanställda i Bilaga 4.
3.3.4 Syntes
Vi bedömde att det inte var lämpligt att sammanväga studierna då det var stora olikheter både rörande population, MR-metod och klassificeringssystemen (se resultatkapitlet samt Bilaga 5 för mer information). Resultat från studierna redovisas könsuppdelat då det föreligger skillnad i mognad mellan könen. För de studier som använt metoden som tillämpas av RMV idag så har vi räknat ut risken för felaktig klassificering för åldrarna 15 till 21 år för stadium 4, det vill säga det RMV definierar som moget knä (sluten tillväxtzon med ”ärr”). I RMV:s definition av moget knä ingår också stadium 5, skalans slutstadium, (sluten tillväxtzon utan ”ärr”). Vi har även beräknat PPV, NPV sensitivitet och specificitet (Faktaruta 3.1) för att åskådliggöra att dessa mått är beroende av vilken population som testas. Vi presenterar även data för det stadiet för respektive klassificeringssystem där gränsdragning kring om individen är över eller under 18 år kan tänkas bli störst. Detta motsvarar sista eller näst sista stadiet i dessa skalor. Notera att detta inte är direkt översättningsbart med stadium 4 i den skala som RMV använder.
I majoriteten av studier har resultaten inte presenterats på ett optimalt sätt för att belysa den relevanta frågeställningen. Vi har därför utvecklat en specifik metod för att analysera data. Metoden bygger på en ansats som använts i Mostad & Tamsen (2019) [38], dock något justerad. I Bilaga 5 redovisas metodbeskrivningen i mer detalj. Metoden ger en skattning av andelen med moget knä (sluten tillväxtzon) som en funktion av ålder.
3.3.5 Bedömning av de sammanvägda resultatens tillförlitlighet
Vi planerade att bedöma tillförlitligheten till det samlade vetenskapliga underlaget. Vid en sådan bedömning använder SBU ett system som baseras på det internationellt utarbetade systemet GRADE (The Grading of Recommendations Assessment, Development and Evaluation) [39]. En utförligare beskrivning finns i SBU:s metodbok [34]. Då studierna inte gick att sammanväga, varken narrativt, i en metaanalys eller bivariat analys så utgick den formella evidensbedömningen (bedömning av tillförlitligheten).
4. Resultat – Magnetkameraundersökning av tillväxtzonen i knät
4.1 Sammanfattning av resultaten
Det går inte att bedöma sensitiviteten, specificiteten, NPV eller PPV för MR-undersökning av tillväxtzonen i knät för att avgöra om en person av manligt respektive kvinnligt kön är över eller under 18 år. Därmed kan inte risken för att en person med okänd ålder klassificeras fel bedömas (barn klassificeras som vuxen eller vuxen klassificeras som barn).
4.2 Urval av studier
Den frågeställning som skall belysas är hur väl en indelning i olika mognadsstadier kan användas för att bedöma ifall en person är under eller över 18 år. Notera åter att i denna rapport kommer genomgående termerna män respektive kvinnor att användas för att beskriva personer av manligt respektive kvinnligt kön, oavsett om det är personer över eller under 18 år som åsyftas.
Litteratursökningen genomfördes i april 2021 och citeringssökningen i maj 2021. Sökstrategierna redovisas i Bilaga 1. Litteratur- och citeringssökningen genererade totalt 2 529 artikelsammanfattningar (Figur 4.1) som var publicerade från år 2017 och framåt. Av dessa lästes 35 i fulltext. Dessutom inkluderas de fyra studier som ingick i systematiska översikten av Ding och medarbetare som vi utgick från [35] (totalt 39 artiklar som lästes i fulltext). Totalt 16 artiklar uppfyllde våra urvalskriterier. Tretton studier bedömdes ha låg eller måttlig risk för bias och ingår i rapporten. Studier med hög risk för bias finns redovisade i Bilaga 2. En studie bedömdes ha hög risk för bias då MR-metoden inte var tillräckligt välbeskriven [40], en studie hade inte fullständiga uppgifter rörande kronologisk ålder (endast födelseår) [41] och en studie hade flera brister i både urval av deltagarna och indextestet [42]. Studiernas risk för biasbedömning finns redovisade i Bilaga 6. Det fanns ytterligare en svensk studie men den har delvis överlappande deltagare som Kvist (2020) [43].
Karakteristika för de 13 studierna beskrivs i Bilaga 4.
Studierna hade använt sex olika klassificeringssystem för åldersbedömning av tillväxtzonen i knät:
- Schmeling och Kellinghaus [25, 44, 45] (klassificeringssystemet som används av RMV)
- Vieth [46-48]
- Dedouit [49-52]
- Dedouit, Kellinghaus och Schmeling, modifierad version [27]
- Jopp [53]
- Schmeling [54]
Huvudfokus är på de studier som använt samma klassificeringssystem som idag används vid asylärenden i Sverige. Vi kommer även presentera resultat från övriga klassificeringssystem för det stadie för respektive klassificeringssystem där gränsdragning kring om individen är över eller under 18 år kan tänkas bli störst, för män respektive kvinnor. Detta för att ge en övergripande bild. Dessutom kommer vi belysa problematiken med att beräkna sensitivitet, specificitet, PPV och NPV för metoden.
4.3 Klassificeringssystem Schmeling och Kellinghaus (RMV:s metod)
4.3.1 Beskrivning av ingående studier
Totalt identifierades fyra studier [25] [41] [44] [45] som uppfyllde urvalskriterierna men endast tre bedömdes ha måttlig risk för bias och ingår i analysen [25] [44] [45]. Den fjärde studien hade endast födelseår på deltagarna vilket medför hög risk för bias [41]. I Bilaga 6 redovisas biasbedömning av studierna.
Av de tre studierna var en prospektiv studie på friska volontärer [44] och de andra två retrospektiva studier där deltagarna inkommit till sjukhus på grund av trauma eller knäsmärta [25] [45]. Åldern varierande mellan 10 till 30 år och det totala antalet deltagare var 1 597. Alla tre studier redovisade resultat uppdelat på kön. Studierna var från Tyskland [25] [44] och Turkiet [45], det vill säga begränsat geografiskt urval. (Tabell 4.1). Den använda skalan innefattar stadie 1 till 5 men alla stadier fanns inte representerade i de tre studiepopulationerna. Exempelvis fanns inte stadie 5, slutstadium, representerat i någon av de tre studierna. För ytterligare detaljer, se Bilaga 4.
Det fanns skillnader i MR-metoden som använts, dock hade alla tre studierna T1-viktning. Två av studierna hade använt sagittaltplan (vilket är vad RMV använder) [25] [45] medan den tredje studerat koronalplanet [44]. Det fanns även skillnader i till exempel magnetstyrka och upplösning (Tabell 4.1).
Det var endast i en studie som alla MR-bilderna bedömdes av två oberoende bedömare. Dock var det oklart om deltagarnas ålder var dolt för bedömarna och den ena granskaren var inte radiolog, dock erfaren granskare [45]. I denna studie granskade även båda granskarna om alla bilder igen (649 deltagare). I de två andra studierna var det endast 10 procent [25] respektive 17 procent [44] av MR-bilderna som bedömdes av två bedömare och det var dessa bilder som också granskades om. Alla tre studierna rapporterade kappavärden som anses innebära hög tillförlitlighet (reliabilitet), både mellan och inom bedömare, se Bilaga 4.
Studie | Ekizoglu [45] | Krämer [25] | Ottow [44] |
Land | Turkiet | Tyskland | Tyskland |
Klassificeringssystem Stadier |
Schmeling, Kellinghaus I-V |
Schmeling, Kellinghaus I-V |
Schmeling, Kellinghaus I-V |
Studiedesign | Retrospektiv | Retrospektiv | Prospektiv |
Antal deltagare | 649 | 290 | 658 |
% bedömt av 2 personer | 100 % | 10 % | 17 % |
MR-metod | 1,5 T | 3 T | 3 T |
Plan | Sagittalt | Sagittalt | Koronalt |
Viktningteknik | T1 tse | T1 tse | T1 tse |
Vi kommer nedan redovisa data från distala femur (lårbenets nedre del, i vår rapport benämnt som knä). Data i dessa studier har inte presenterats på ett optimalt sätt för att belysa den relevanta frågeställningen och vi har därför utvecklat en metod för att analysera data (se metodavsnitt 3.3.3 samt Bilaga 5). I Bilaga 4 redovisas den deskriptiva statistiken över åldersfördelningen inom respektive stadie.
4.3.2 Resultat för män
Vi redovisar resultatet för åldersspannet 15 till 21 år. I Figur 4.2 redovisas andelen män med moget knä med synligt ”ärr” (stadie 4) per ålder (15–21 år) beräknat från de tre studierna. Studierna visar på en heterogenitet i resultatet, där studien av Krämer och medarbetare skiljer sig mest från de andra två studierna det vill säga indikerar en senare mognad av knät. Om man även lägger in konfidensintervallen visar det tydligt hur stor osäkerheten är (se Bilaga 5). I Figur 4.3 och Tabell 4. 2 redovisas risken för att felaktigt klassificeras; antingen att barn klassificeras som vuxna (≥18 år) eller att vuxna klassificeras som barn (åldersintervallet 15–21 år). Resultatet redovisas per studie och visar på en variation mellan studierna (Figur 4.3 och Tabell 4.2). Antalet deltagare per ålder (åldersspannet 15–21 år) är litet, varierar mellan 45 och 68 deltagare i de tre studierna (Figur 4.2).
Studie | 15 år | 16 år | 17 år | 18 år | 19 år | 20 år | 21 år | Totalt |
Krämer | 9 | 8 | 7 | 7 | 7 | 9 | 13 | 60 |
Ottow | 23 | 23 | 26 | 26 | 25 | 25 | 28 | 176 |
Ekizoglu | 36 | 24 | 21 | 12 | 17 | 19 | 11 | 140 |
Totalt | 68 | 55 | 54 | 45 | 49 | 53 | 52 | 376 |
Det går inte med MR-undersökning av tillväxtzonen i knät att bedöma hur stor risken är för att en man med okänd ålder felaktigt klassificeras; antingen att barn klassificeras som vuxna eller vuxna som barn. I de tre studierna är dock risken för felklassificering högst för sjutton- och artonåringar (Tabell 4.2 och Figur 4.3). I de tre studierna är risken för att sjuttonåringar felaktigt klassificeras som vuxna 6 procent [25], 19 procent [45] och 27 procent [44] och risken för artonåringar att felaktigt klassificeras som barn 32 procent [44], 38 procent [45] och 62 procent [25].
* Bilaga 5 för beräkning | |||
Per åldersgrupp | Antal deltagare (Antal studier, studiedesign) |
Risk för felklassificering*, % (referens) |
|
Risken att barn felaktigt klassificeras som vuxna | |||
15-åring | 68 (2 retrospektiva 1 prospektiv) |
0 % [25] 1 % [45] 1 % [44] |
|
16-åring | 55 (2 retrospektiva 1 prospektiv) |
1 % [25] 3 % [45] 6 % [44] |
|
17-åring | 54 (2 retrospektiva 1 prospektiv) |
6 % [25] 19 % [45] 27 % [44] |
|
Risken att vuxna felaktigt klassificeras som barn | |||
18-åring | 45 (2 retrospektiva 1 prospektiv) |
62 % [25] 38 % [45] 32 % [44] |
|
19-åring | 49 (2 retrospektiva 1 prospektiv) |
14 % [25] 8 % [45] 8 % [44] |
|
20-åring | 53 (2 retrospektiva 1 prospektiv) |
2 % [25] 1 % [45] 2 % [44] |
|
21-åring | 52 (2 retrospektiva 1 prospektiv) |
0 % [25] 0 % [45] 0 % [44] |
4.3.3 Resultat för kvinnor
Vi redovisar resultat för åldersspannet 15 till 21 år. I Figur 4.4 redovisas andelen kvinnor med moget knä (sluten tillväxtzon med synligt ”ärr”, stadie 4) per ålder (15–21 år) från respektive studie. Det framgår tydligt att kvinnorna uppnår stadium 4 tidigare än männen (Figur 4.2 och Figur 4.4). Om man lägger in konfidensintervallen visar det tydligt hur stor osäkerheten är (Bilaga 5). I Figur 4.5 och Tabell 4.3 redovisas risken för att kvinnor felaktigt klassificeras; antingen att barn klassificeras som vuxna (≥18 år) eller att vuxna klassificeras som barn (data från åldersintervall 15–21 år). Resultatet redovisas per studie och visar på en variation mellan studierna. Skulle man använda stadium 4 som kriterium för kvinnor skulle väldigt många kvinnor under 18 år klassificeras som vuxna. Däremot skulle få kvinnor över 18 år klassificeras fel som barn. Antalet deltagare per ålder (för åldersspannet 15–21 år) är litet, mellan 42 och 57 deltagare (Figur 4.4).
Studie | 15 år | 16 år | 17 år | 18 år | 19 år | 20 år | 21 år | Totalt |
Krämer | 2 | 9 | 6 | 5 | 6 | 4 | 9 | 41 |
Ekizoglu | 14 | 10 | 22 | 15 | 15 | 23 | 9 | 108 |
Ottow | 26 | 28 | 29 | 28 | 31 | 27 | 29 | 198 |
Totalt | 42 | 47 | 57 | 48 | 52 | 54 | 47 | 347 |
Det går inte med MR-undersökningen av tillväxtzonen i knät att bedöma hur stor risken är för att en kvinna med okänd ålder felaktigt klassificeras: barn klassificeras som vuxna eller vuxna som barn (Tabell 4.3 och Figur 4.5).
* Bilaga 5 för beräkning | ||
Åldersgrupp | Antal deltagare (Antal studier, studiedesign) |
Risk för felklassificering*, % (referens) |
Risken för att barn klassificeras som vuxna | ||
15-åring | 42 (2 retrospektiva 1 prospektiv) |
8 % [25] 12 % [45] 12 % [44] |
16-åring | 47 (2 retrospektiva 1 prospektiv) |
21 % [25] 34 % [45] 42 % [44] |
17-åring | 57 (2 retrospektiva 1 prospektiv) |
47 % [25] 67 % [45] 80 % [44] |
Risken att vuxna klassificeras som barn | ||
18-åring | 48 (2 retrospektiva 1 prospektiv) |
26 % [25] 11 % [45] 5 % [44] |
19-åring | 52 (2 retrospektiva 1 prospektiv) |
10 % [25] 3 % [45] 1 % [44] |
20-åring | 54 (2 retrospektiva 1 prospektiv) |
3 % [25] 1 % [45] 0 % [44] |
21-åring | 47 (2 retrospektiva 1 prospektiv) |
1 % [25] 0 % [45] 0 % [44] |
4.4 Övriga klassificeringssystem
4.4.1 Beskrivning av ingående studier
Fem andra klassificeringssystem för benmognad som utvärderades i totalt tio studier: Vieth [46] [47] [48], Dedouit [49] [50] [51] [52], Dedouit, Kellinghaus och Schmeling, modifierad version [27] , Schmeling [54] samt Jopp [53].
Av dessa 10 studier var 7 retrospektiva [47] [48] [49] [50] [51] [52] [54] och tre prospektiva studier [27] [46] [53] (varav en longitudinell studie [53]). I sex av de sju retrospektiva studierna kom materialet från personer som inkommit till sjukhus på grund av knäskada och eller smärta [47] [48] [49] [51] [52] medan en var utförd på grund av legala orsaker [54]. I de prospektiva studierna hade man rekryterat friska personer (volontärer), oklart dock hur rekryteringen genomfördes. Studierna var från Frankrike [49], Iran [54], Sverige [27], Turkiet [47] [48] [50] [51], Tyskland [46] [53] och USA [52].
I sju av studierna bedömdes alla bilderna av minst två bedömare [27] [45] [49] [50] [52] [53] [54], medan dubbelgranskningen varierade mellan 14 till 21 procent i övriga studier [46] [47] [48] [51]. I alla studier har delar [46] [48] [50] [51] eller hela materialet [27] [49] [52] [54] omgranskats. I samtliga fall var deltagarnas ålder dold för bedömarna. Kappavärden är ett sätt att mäta hur god tillförlitligheten (reliabiliteten) i granskningen är, både för samma granskare vid olika tillfällen (intra-observer reliabilitet) och mellan olika granskare (inter-observer reliabilitet). Generellt, med undantag för en studie [27], redovisade de allra flesta en mycket god tillförlitlighet enligt båda dessa parametrar. För detaljer, se Bilaga 4.
Det fanns skillnader i vilken MR-metod som använts och i fyra av studierna fanns det brister i själva beskrivningen av densamma [49] [51] [52] [54]. Alla 10 studierna hade använt koronaltplan, medan 3 studier även använt sagittaltplan [49] [52] ]54]. I merparten av studierna användes PD-viktning/teknik [47] [48] [49] [50] [51] [54] eller en slags PD-viktning (cartilage) [27], medan i två T1 sense [27] [53], i en T2-viktning [46] och i en studie intermediär viktning [52].
Fyra av klassificeringssystemen har liksom det klassificeringssystem som använts av RMV fem olika stadieindelningar. Trots att de har lika många stadieindelningar så går det inte att säga att de motsvarar varandra det vill säga likställa de olika stadierna mellan klassificeringssystemen. Det femte klassificeringssystemet, Jopp, har endast tre stadier. En sammanfattande tabell över samtliga klassificeringssystem redovisas nedan (Tabell 4.4).
* Klassificeringssystemet som idag används i Sverige vid asylärenden. | |||||||
Studie | Land | Klassificeringssystem (antal stadieindelningar) | Studiedesign (Antal deltagare) | % bedömt av 2 personer | MR-metod Plan |
Viktning teknik | Upplösning (resolution) |
Alatas [48] | Turkiet | Vieth (2–6) |
Retrospektiv (709) |
21 % | 1,5T Koronala |
PD, T1 tse | 2 × 4 × 3,5 mm |
Altinsoy [50] | Turkiet | Dedouit (1–5) |
Retrospektiv (472) |
100 % | 1,5 T Koronala |
PD | 0,9 × 1,6 × 4,5 mm |
Auf der Mauer [53] | Tyskland | Jopp (1–3) |
Prospektiv longitudinell (40) |
100 % | 3T Koronala |
T1 sense | 0,1875 × 0,1875 mm × 2 |
Daghighi [54] | Iran | Schmeling (1–5) |
Retrospektiv (193) |
100 % | 1,5T Sagittala och Koronala |
PD fs, T2 tse | Oklart |
Dedouit [49] | Frankrike | Dedouit (1–5) |
Retrospektiv (290) |
100 % | 1,5 T Sagittala och koronala |
PD | Oklart |
Ekizoglu* [45] | Turkiet | Schmeling, Kellinghaus (1–5) |
Retrospektiv (649) |
100 % | 1,5 T Sagittala |
T1 tse | 0,35 × 0,35 × 1,5 mm |
Gurses [47] | Turkiet | Vieth (2–6) |
Retrospektiv (598) |
100 % | 1,5T Koronala |
PD, T1 tse | 0,78 × 1,56 × 3,5 mm |
Krämer* [25] | Tyskland | Schmeling, Kellinghaus (1–5) |
Retrospektiv (290) |
10 % | 3 T Sagittala |
T1 tse | 0,4 × 0,4 × 3,0 mm |
Kvist [27] | Sverige | Dedouit, Kellinghaus Schmeling (1–5) |
Prospektiv (395) |
100 % | 1,5T Sagittala och Koronala |
T1 tse och cartilage |
0,62 × 0,62 × 3 mm |
Margalit [52] | USA | Dedouit (1–5) |
Retrospektiv (165) |
100 % | 1,5 och 3T | Fse | Oklart |
Ottow* [44] | Tyskland | Schmeling, Kellinghaus (1–5) |
Prospektiv (658) |
17 % | 3T Koronala |
T1 tse | 0,6 × 0,77 × 3 mm |
Uygun [51] | Turkiet | Dedouit (1–5) |
Retrospektiv (489) |
Oklart | 1,5T Koronala |
PD | Oklart |
Vieth [46] | Tyskland | Vieth (2–6) |
Prospektiv | 14 % | 3T Koronala |
T1 och T2 spir | 0,6 × 0,76 × 3 mm |
4.4.2 Resultat för alla 13 studier
I Figur 4.6 redovisas andelen med sista och eller näst sista stadiet (”moget knä”) för män respektive kvinnor för 10 av de 13 studierna. Det stadie/stadier som presenteras i figuren för respektive klassificeringssystem redovisas i Tabell 4.5. Det är vid dessa stadier som gränsdragning kring om en individ är över eller under 18 år är som störst, det vill säga individer både under och över 18 år finns representerade inom detta/dessa stadier. Två studier ingick inte då de inte redovisade minimum och maximumålder [52] [54], i den tredje studien fanns det relevant information endast för sex personer [53]. Fyra av studierna hade redovisat stadie per ålder så här krävdes inga omräkningar [27] [49] [50] [51]. Figuren visar tydligt på den stora osäkerheten som finns för att kunna bedöma om en person är över eller under 18 år, oberoende av vilket klassificeringssystem som använts. Observera att det inte går att säga att stadierna motsvarar varandra det vill säga likställa de olika stadierna mellan klassificeringssystemen.
Klassificeringssystem | Stadie | Studier |
Schmeling och Kellinghaus |
Stadie 4 Nästa sista stadiet |
Krämer [25] Ekizoglu [45] Ottow [44] |
Vieth | Stadie 5 och 6 Näst sista och sista stadiet |
Vieth [46] Gurses [47] Alatas [48] |
Dedouit | Stadie 4 och 5 Näst sista och sista stadiet |
Dedouit [49] Altinsoy [50] Uygun [51] |
Dedouit, Kellinghaus och Schmeling, modifierad version |
Stadie 5 Sista stadiet |
Kvist [27] |
I Bilaga 5 redovisar vi risken för att felklassificeras, antingen att barn klassificeras som vuxna eller vuxna klassificeras som barn, för de sju studierna [27] [46] [47] [48] [49] [50] [51].
4.5 PPV, NPV, Sensitivitet och Specificitet
Det mått man skulle vilja veta är sannolikheten att en person med mogen kroppsdel är över 18 år (PPV) samt sannolikheten att en person med omogen kroppsdel är under 18 år (NPV) (se Faktaruta 3.1). Problemet är att det som regel saknas den information som behövs för att kunna beräkna dessa. Det krävs att följande två saker är kända:
- Hur stor andel som har mogen respektive omogen kroppsdel i respektive ålder.
- Hur åldersfördelningen ser ut bland de vi testar.
Vad gäller den första punkten så är frågan hur säkert man kunnat skatta kurvan som beskriver sambandet mellan ålder och andelen med mogen kroppsdel. Om den påverkas av genetiska faktorer, nationalitet, bedömare, val av undersökningsmetod med mera så går det inte att fastslå hur kurvan ser ut.
Vad gäller den andra punkten så är det väl känt att andelen korrekta och inkorrekta beslut som kommer att fattas beror på den faktiska åldersfördelningen på de vi testar. Testas till exempel många i åldersspannet 17 till 18 år så blir det många fel. Breddas intervallet så blir andelen fel färre. Men det grundläggande problemet är att vi inte vet åldern på de vi testar, det är ju därför som de testas. Även om man skulle veta åldern på de som testats historiskt så kommer åldern för de som testas nästa gång/år vara okänt. Därför bör man inte lägga så stor vikt vid statistik som bygger på antagande om åldersfördelningen på de som testas.
För att illustrera hur testet skulle kunna fungera i praktiken har vi gjort ett antal beräkningar. I Tabell 4.6 illustreras fem hypotetiska populationer. I varje population har vi olika åldersfördelningar.
Population | 15 år | 16 år | 17 år | 18 år | 19 år | 20 år |
17–18 | 0 | 0 | 100 | 100 | 0 | 0 |
16–19 | 0 | 100 | 100 | 100 | 100 | 0 |
15–20 | 100 | 100 | 100 | 100 | 100 | 100 |
15–18 | 100 | 100 | 100 | 100 | 0 | 0 |
17–20 | 0 | 0 | 100 | 100 | 100 | 100 |
Vi illustrerar med data från Ottow (män) [44], hur PPV och NPV beror av vilken population som testas (Figur 4.7). I Bilaga 5 redovisas mer i detalj PPV, NPV, sensitivitet och specificitet för de olika åldersintervallen per studie, för män respektive kvinnor.
Testar vi en relativt äldre population (17–20 år) så blir PPV relativt högt eftersom de flesta är över 18 år. Testar vi däremot en yngre population (15–18 år) så blir PPV mycket lägre eftersom de flesta som testas är under 18 år. Så det prediktiva värdet av testet är beroende av vilka som testas. Andelen med moget knä per ålder är däremot en statistik som inte är beroende av vilka som testas.
Det går därför inte att bedöma sensitiviteten, specificiteten, NPV eller PPV för MR- undersökning av tillväxtzonen i knät för att avgöra om en person av manligt respektive kvinnligt kön är över eller under 18 år i åldersintervallet 15 till 20 år. Detta beror på att sensitiviteten, specificiteten, NPV och PPV är helt beroende på åldersfördelningen i population som testas.
5. Diskussion
Trots att flera nya studier har tillkommit sedan år 2017, så är det vetenskapliga underlaget fortfarande otillräckligt. Detta beror bland annat på att studierna har använt olika klassificeringssystem (6), olika MR-metoder, begränsat geografiskt urval samt heterogenitet i populationerna mellan studierna. De inkluderade studierna visar också på tydlig biologisk variation i materialet det vill säga det finns ett relativt brett spann av olika åldrar för ett stadie samt att stadiet ”moget knä” finns representerat både hos barn och vuxna. Det är därför inte möjligt att fastställa hur stor risken är för att en person med okänd ålder felaktigt klassificeras; barn som vuxna, eller vuxna som barn. Det är inte heller möjligt att bedöma sensitivitet, specificitet, NPV eller PPV. Detta då dessa parametrar helt beror på den sanna åldersfördelningen i populationen som testas.
Till skillnad från PPV och NPV, så beror statistik avseende andelen med mogen kroppsdel per ålder inte på vilka som testas. Denna typ av statistik fokuserar också på risken per ålder vilket möjliggör att bedöma vilken risk enskilda personer som testas har att klassificeras korrekt eller fel.
5.1 Resultatdiskussion
I majoriteten av studierna är beskrivningen av populationen bristfällig. Detta försvårar jämförelsen mellan studier och överförbarheten till andra populationer. Har de till exempel drabbats av undernäring under barndomen? Har de haft perioder av snabb återhämtningstillväxt med svängningar i BMI? Kan det i de undersökta populationerna finnas individer med särskild predisposition för tidig eller sen pubertet, beroende på etnicitet, socioekonomi samt ovanstående faktorer? De olika faktorernas påverkan på skelettmognad belyser hur svårt det är att översätta biologisk ålder till kronologisk ålder. Just senare delen av tonåren är den tidsperiod då slutfasen av knämognaden ofta sker vilket leder till ett inneboende problem, nämligen att osäkerheten är som störst där den behöver vara som minst för att metoden ska kunna räknas som tillförlitlig. Till detta tillkommer MR-metod, klassificeringssystem och bedömarnas erfarenhet.
Vi identifierade tre studier som använde det klassificeringssystem samt viktning (T1) som tillämpas vid åldersbedömning i asylärenden i Sverige [25] [44] [45]. Det fanns dock en heterogenitet vilket gjorde att de inte kunde sammanvägas. De hade använt olika maskiner (3T [25] [44] och 1,5T [45]), rapporterade olika upplösningar; hög dock ej samma [25] [45] och en mellanliggande till låg [44]. Den senare kan orsaka betydande felaktigheter vid utvärdering av små och detaljerade strukturer. Det var även skillnader i tjockleken på snitten: 1,5 millimeter [45] och 3 millimeter [25] [44]. Detta innebär att undersökning av knän av samma storlek ger dubbelt så många bilder i studien med 1,5 millimeter jämfört med de med 3 millimeter snitt, vilket i sin tur också kan påverka bildbedömningen. Den mest uppenbara skillnaden var dock skanningsplanet. Bedömning i koronalplanet [44] är inte nödvändigtvis direkt jämförbar med bedömning av samma anatomiska struktur i sagittalplanet [25] [45]. För de 2 studierna som utfördes med en 3T-maskin [25] [44] skiljde sig skanningsplanet åt och för de 2 studierna med sagittalplan [25] [45] [21] användes en 1,5T och en 3T.
Olika typer av MR-spolar användes också. Ekizoglu och medarbetare [45] rapporterade endast att de använt en ”knäspole” medan Krämer och medarbetare [25] gav mer detaljerade specifikationer om sin knäspole. Ottow och medarbetare [44] rapporterade användningen av en så kallad flex coil. Sammantaget skiljer sig de tre studierna åt på ett flertal punkter, där de mest uppenbara är skanningsplanet och upplösningen, men också fältstyrka och typ av spole. Alla dessa faktorer kan påverka den resulterande MR-bilden som i sin tur kan påverka bedömningen av skelettmognad.
Flera olika klassificeringssystem har använts i de andra artiklarna som har inkluderats i rapporten. Alla baserades på antingen T2fs eller PDfs-bilder och de använde delvis olika skanningsplan och skalorna innefattar olika antal stadier. Vad som definierar ett moget knä är baserat på tillväxtzonens utseende på MR, som med tanke på mångfalden av MR-protokoll inte är direkt jämförbar mellan olika studier och klassificeringssystem. Skanningsparametrarna varierade också avsevärt, även mellan studier som använt samma viktning. De rapporterades delvis otillräckligt, exempelvis gavs i fem av studierna inga detaljer angående upplösning. Svårigheterna med att jämföra studier med olika klassificeringssystem, viktning och eller skanningsparametrar framhävdes också i diskussionsdelen i många av de inkluderade artiklarna.
I studien av Kvist och medarbetare [27] jämfördes resultat från samma klassificeringssystem som tillämpades på bilder erhållna med två olika MR-sekvenser och i två olika plan. De jämförde också resultat mellan granskare med olika erfarenhet av att tolka MR-bilder av barn/ungdomar. Studien visade att bilder av samma person som erhållits med två olika protokoll delvis ledde till olika klassificering av tillväxtzonens då samma klassificeringssystem användes. Noterbart var också att granskarens erfarenhet av metoden påverkade resultaten påtagligt.
Effekten av alla ovannämnda faktorer för bedömningens reproducerbarhet av knät återstår att fastställa. Det verkar inte finnas något allmänt accepterat klassificeringssystem för bedömning av tillväxtzonen i knät med MR. Dessutom finns det en påfallande brist på standardisering av de MR-metoder som används för detta ändamål, även mellan studierna som använder samma klassificeringssystem. Detta i sig gör det svårt att bestämma precisionen för MR för klassificering av mognad och ytterligare korrelationen mellan kronologisk ålder och fysikalisk mognad enligt MR.
5.2 Jämfört med andra översikter
Våra resultat är i samklang med andra översikter [35] [55]. Ding och medarbetare (2018), identifierade fyra relevanta studier rörande MR-undersökning av knät [35]. Deras bedömning var att det fanns för få studier och att dessa hade brister, varför ingen sammanvägning gjordes, och att fler studier behövs för att bedöma metodens tillförlitlighet. Av dessa fyra studier ingår tre i vår analys då den fjärde bedömdes ha hög risk för bias (oklar beskrivning av MR-protokollet) [41]). I en nyare systematisk översikt från 2020 [55] bedömer de också att trots att fler studier har tillkommit så är heterogenitet stor och att det därför inte går att bedöma metodens tillförlitlighet.
I RMV:s vetenskapliga sammanställning (2021) ingår fem studier: Ottow (2017) [44], Krämer (2014) [25], Ekizoglu (2021) [45], Saint-Martin (2015) [57], samt en studie som gjordes på uppdrag till Socialstyrelsen [58]. Studien av Saint-Martin (2015) [57] ingår inte här då det är en kommentar och inte en fullständig originalartikel. Dessutom är MR-metoden inte tillräckligt välbeskriven. Socialstyrelsens bryggningsstudie är delvis med då delar av materialet ingår i den svenska studien av Kvist och medarbetare [27] men den har använt en något modifierad klassificeringssystem.
6. Medverkande
6.1 Projektgrupp
6.1.1 Sakkunniga
- Johan Bring, PhD, statistiker, Statisticon AB, Stockholm, Sverige
- Jovanna Dahlgren, professor pediatrisk endokrinologi, Drottning Silvias Barn & Ungdomssjukhus, Centrum för pediatrisk tillväxtforskning Göteborgs Universitet, Sverige
- Lil-Sofie Ording Müller, MD, PhD, pediatrisk radiologi, Oslo University Hospital, Norge
6.1.2 SBU
- Jenny Odeberg, projektledare
- Lisa Forsberg, biträdande projektledare
- Jan Adolfsson, biträdande projektledare
- Carl Gornitzki, informationsspecialist
- Emma Wernersson, projektadministratör
- Jessica Dagerhamn, projektdeltagare
- Jenny Odeberg, projektansvarig chef
6.1.3 Externa granskare
SBU anlitar externa granskare av sina rapporter. De har kommit med värdefulla kommentarer som förbättrat rapporten. SBU har dock inte alltid möjlighet att tillgodose alla ändringsförslag och de externa granskarna står därför inte med nödvändighet bakom samtliga resultat och texter i rapporten.
- Sten Antilla, PhD, analytiker, Formas, Stockholm
- Lars Hagenäs överläkare, specialist i barn- och ungdomsmedicin, Astrid Lindgrens Barnsjukhus; docent i pediatrisk endokrinologi, Institutet för Kvinnor och barns hälsa, Karolinska Institutet
- Øystein Olsen, docent, pediatrisk radiologi, Great Ormond Street Hospital, London. European Editor for Pediatric Radiology, Springer
6.1.4 Bindningar och jäv
Sakkunniga och externa granskare har i enlighet med SBU:s krav lämnat deklarationer om bindningar och jäv. SBU har bedömt att de förhållanden som redovisats där är förenliga med myndighetens krav på saklighet och opartiskhet.
6.1.5 SBU:s vetenskapliga råd
I detta projekt var det tyvärr inte möjligt på grund av den korta tiden att ta in synpunkter från hela vetenskapliga rådet. Istället har fyra medlemmar specialgranskat manus
- Ata Ghaderi, Uppsala, Karolinska institutet (psykologi)
- Ulrik Kihlbom, Uppsala universitet (etik)
- Christina Nehlin-Gordh, Uppsala universitet (socialt arbete)
- Sverker Svensjö, Falun och Uppsala universitet (medicin)
7. Ordförklaringar och förkortningar
- Window leveling (fönster/nivåinställningar)
- Justering av gråskalan i en radiologisk bild efter att bilden tagits.
- Bias
- Systematiskt fel. Ett resultatfel i forskningsprocessen som uppstått i en studies upplägg, genomförande, effektbedömning, publikation eller annan hantering av resultaten, och som inte beror på slumpen.
- Biologisk ålder
- Ett begrepp som används för att beskriva hur olika kroppsliga processer som vanligtvis är kopplade till kronologisk ålder (se nedan) kan variera. Begreppet biologisk mognad kan också användas då det rör sig om biologisk ålder hos unga individer.
- BMI
- BMI är en förkortning av Body Mass Index och används för att beskriva förhållandet mellan en persons vikt och längd.
- Cytokiner
- En grupp proteiner och peptider vars funktion är att bära kemiska signaler.
- Femur
- Lårben.
- Fettsuppression
- Tekniker för att ta bort signal från fettvävnad i en MR-bild.
- Fältstyrka
- Styrkan hos magnetfältet i en MR-maskin. Anges i Tesla (T).
- Kappavärden
- Kappavärden är ett sätt att mäta hur god tillförlitligheten (reliabiliteten) i granskningen är, både för samma granskare vid olika tillfällen (intra-observer reliabilitet) och mellan olika granskare (inter-observer reliabilitet).
- Koronalplan
- Kallas även frontalplanet, är vertikalt och löper sida till sida. En anatomisk term för ett plan (ett snitt) som delar kroppen i en främre och en bakre del.
- Kronologisk ålder
- Hur många år en person levt det vill säga ålder i tid.
- Kvinnor
- I denna rapport används termen ”kvinna/kvinnor” om personer av kvinnligt kön oavsett ålder.
- Longitudinell studie
- En studie som bygger på att variabler gällande en individ eller en grupp individer registreras över en längre tidsperiod.
- Metaanalys
- Statistisk analysmetod för att väga samman resultat från primärstudier av samma diagnosmetod, behandling eller intervention.
- MR
- Magnetresonanstomografi eller magnetkameraundersökning. Radiologisk undersökningsmetod som med hjälp av magnetfält avbildar olika anatomiska strukturer.
- Män
- I denna rapport används termen ”man/män” om personer av manligt kön oavsett ålder.
- NPV
- (Negativt prediktivt värde) Hur stor andel av de med omoget knä är under 18 år.
- PPV
- (Positivt prediktivt värde) Hur stor andel av de med moget knä är över 18 år?
- Prospektiv studie
- Studie som går framåt i tiden, det vill säga att data om varje deltagare börjar samlas in vid den tidpunkt när denna deltagare tas in i studien.
- Radiologi
- Radiologi är ett medicinskt område som använder avbildning av anatomiska och fysiologiska strukturer för att upptäcka och behandla olika sjukdomar eller processer i kroppen. I radiologi används liknande metoder.
- Reliabilitet
- Hur tillförlitlig eller precis en granskares bedömning är. Kan exempelvis beskrivas med kappa-värden som kan ange inter-observer reliabilitet (tillförlitlighet mellan olika bedömare) eller intra-observer validitet (hur stabil en och samma granskares bedömning är över tid).
- Retrospektiv studie
- Undersökning som är ”tillbakablickande”, det vill säga utnyttjar data som är anskaffade, respektive händelser som inträffat, innan undersökningen startades.
- Sagitalplan
- En anatomisk term för ett plan (ett snitt) som passerar framifrån till bak och delar kroppen i en höger- och en vänsterdel.
- Sekulära trender
- Successiv och relativt systematisk förändring över decennier i en stor population avseende mönster i längdtillväxt-, viktförändringar- och pubertetsförlopp.
- Sensitivitet
- Sannolikheten att ett diagnostiskt test eller en bedömningsmetod ska ge positivt svar (det vill säga signalera förekomst) hos personer som faktiskt har sjukdomen eller tillståndet. I denna rapport: Hur stor andel av de som är över 18 år har moget knä?
- Skanningsplan
- Det anatomiska planet där den anatomiska strukturen avbildas i.
- SNR
- Signal to noise ratio.
- Specificitet
- Sannolikheten att ett diagnostiskt test eller en bedömningsmetod ska ge negativa svar (det vill säga signalera avsaknad) hos personer som faktiskt saknar sjukdomen eller tillståndet. I denna rapport: Hur stor andel av de som är under 18 år har omoget knä?
- Spole
- På engelska ’coil’. Den del av magnetkameran som fästs på kroppsdelen som ska undersökas.
- Tillväxtzon
- Gränslinje mellan brosk och ben som är platsen för tillväxt i ett långt rörben. Tillväxtzonen är en linje som ligger mellan epifysen och metafysen och kallas ibland även fys.
- Tvärsnittsstudie
- Studie av ett antal personer som utförs vid ett enda tillfälle.
- Upplösning
- Anger detaljrepresentationen i en bild. Upplösningarna i en MR-bild ges i voxelstorlek och bestäms av storleken på området som undersöks, matrisstorleken och snittjockleken.
- Viktning
- Parametrar som avgör vilken signal du får från de olika anatomiska strukturerna i en bildinspelning och som i sin tur bestämmer gråtonerna i en färdig MR-bild.
8. Referenser
- Rättsmedicinalverket. Metodbeskrivning för Rättsmedicinalverkets medicinska åldersbedömningar avseende 18-årsgränsen. 2021; Dnr N21-90088.
- Rättsmedicinalverket. Sammanställning av kunskapsläget om medicinskåldersbedömning av personer med manligt kön baserad på magnetkameraundersökning av knäled. 2019.
- Tanner JM. Assessment of skeletal maturity and prediction of adult height (TW3 method). I: Cameron N, Goldstein H, Healy MJR, editors. 3rd ed. uppl. London ;: W.B. Saunders; 2001.
- Taranger J, Karlberg J, Bruning B, Engström I. Standard deviation score charts of skeletal maturity and its velocity in Swedish children assessed by the Tanner-Whitehouse method (TW2-20). Ann Hum Biol. 1987;14(4):357-65. Available from: https://doi.org/10.1080/03014468700009141.
- Satoh M. Bone age: assessment methods and clinical applications. Clin Pediatr Endocrinol. 2015;24(4):143-52. Available from: https://doi.org/10.1297/cpe.24.143.
- Alshamrani K, Offiah AC. Applicability of two commonly used bone age assessment methods to twenty-first century UK children. Eur Radiol. 2020;30(1):504-13. Available from: https://doi.org/10.1007/s00330-019-06300-x.
- Thodberg HH. An Automated Method for Determination of Bone Age. The Journal of Clinical Endocrinology & Metabolism. 2009;94(7):2239-44. Available from: https://doi.org/10.1210/jc.2008-2474.
- Fischer B, Welter P, Günther RW, Deserno TM. Web-based bone age assessment by content-based image retrieval for case-based reasoning. International Journal of Computer Assisted Radiology and Surgery. 2012;7(3):389-99. Available from: https://doi.org/10.1007/s11548-011-0627-8.
- Fink B, Schneider T, Wilcke C, von Lilien T, Rüther W. [The epiphyseal plate in hemodialysis, peritoneal dialysis and following kidney transplantation]. Z Orthop Ihre Grenzgeb. 1996;134(4):317-23. Available from: https://doi.org/10.1055/s-2008-1039768.
- Drube J, Wan M, Bonthuis M, Wühl E, Bacchetta J, Santos F, et al. Clinical practice recommendations for growth hormone treatment in children with chronic kidney disease. Nat Rev Nephrol. 2019;15(9):577-89. Available from: https://doi.org/10.1038/s41581-019-0161-4.
- Ranke MB, Lindberg A, Mullis PE, Geffner ME, Tanaka T, Cutfield WS, et al. Towards Optimal Treatment with Growth Hormone in Short Children and Adolescents: Evidence and Theses. Hormone Research in Paediatrics. 2013;79(2):51-67. Available from: https://doi.org/10.1159/000347121.
- Nilsson A, Ohlsson C, Isaksson OG, Lindahl A, Isgaard J. Hormonal regulation of longitudinal bone growth. Eur J Clin Nutr. 1994;48 Suppl 1:S150-8; discussion S8-60. Available from: https://doi.org/10.1007/bf02558817.
- Mårtensson K, Chrysis D, Sävendahl L. Interleukin-1beta and TNF-alpha act in synergy to inhibit longitudinal growth in fetal rat metatarsal bones. J Bone Miner Res. 2004;19(11):1805-12. Available from: https://doi.org/10.1359/jbmr.040805.
- Ankarberg-Lindgren C, Norjavaara E. Twenty-four hours secretion pattern of serum estradiol in healthy prepubertal and pubertal boys as determined by a validated ultra-sensitive extraction RIA. BMC Endocr Disord. 2008;8:10. Available from: https://doi.org/10.1186/1472-6823-8-10.
- Albin AK, Norjavaara E. Pubertal Growth and Serum Testosterone and Estradiol Levels in Boys. Hormone Research in Paediatrics. 2013;80(2):100-10. Available from: https://doi.org/10.1159/000353761.
- Proos LA, Lönnerholm T, Jonsson B, Tuvemo T. Can the TW3 bone age determination method provide additional criteria for growth hormone treatment in adopted girls with early puberty? A comparison of the Tanner-Whitehouse 3 method with the Greulich-Pyle and the Tanner-Whitehouse 2 methods. Horm Res Paediatr. 2010;73(1):35-40. Available from: https://doi.org/10.1159/000271914.
- Teilmann G, Petersen JH, Gormsen M, Damgaard K, Skakkebæk NE, Jensen TK. Early Puberty in Internationally Adopted Girls: Hormonal and Clinical Markers of Puberty in 276 Girls Examined Biannually over Two Years. Hormone Research in Paediatrics. 2009;72(4):236-46. Available from: https://doi.org/10.1159/000236085.
- Wenzel A, Melsen B. Skeletal maturity in 6-16-year-old Danish children assessed by the Tanner-Whitehouse-2 method. Ann Hum Biol. 1982;9(3):277-81. Available from: https://doi.org/10.1080/03014468200005761.
- Linhares ED, Round JM, Jones DA. Growth, bone maturation, and biochemical changes in Brazilian children from two different socioeconomic groups. Am J Clin Nutr. 1986;44(4):552-8. Available from: https://doi.org/10.1093/ajcn/44.4.552.
- Cole TJ, Cole AJ. Bone age, social deprivation, and single parent families. Arch Dis Child. 1992;67(10):1281-5. Available from: https://doi.org/10.1136/adc.67.10.1281.
- Fleshman K. Bone age determination in a paediatric population as an indicator of nutritional status. Trop Doct. 2000;30(1):16-8. Available from: https://doi.org/10.1177/004947550003000109.
- Elamin F, Abdelazeem N, Elamin A, Saif D, Liversidge HM. Skeletal maturity of the hand in an East African group from Sudan. Am J Phys Anthropol. 2017;163(4):816-23. Available from: https://doi.org/10.1002/ajpa.23247.
- Schmeling A, Reisinger W, Loreck D, Vendura K, Markus W, Geserick G. Effects of ethnicity on skeletal maturation: consequences for forensic age estimations. Int J Legal Med. 2000;113(5):253-8. Available from: https://doi.org/10.1007/s004149900102.
- Meijerman L, Maat GJ, Schulz R, Schmeling A. Variables affecting the probability of complete fusion of the medial clavicular epiphysis. Int J Legal Med. 2007;121(6):463-8. Available from: https://doi.org/10.1007/s00414-007-0189-z.
- Krämer JA, Schmidt S, Jürgens KU, Lentschig M, Schmeling A, Vieth V. Forensic age estimation in living individuals using 3.0 T MRI of the distal femur. Int J Legal Med. 2014;128(3):509-14. Available from: https://doi.org/10.1007/s00414-014-0967-3.
- Zadig P, von Brandis E, Lein RK, Rosendahl K, Avenarius D, Ording Müller L-S. Whole-body magnetic resonance imaging in children – how and why? A systematic review. Pediatric Radiology. 2021;51(1):14-24. Available from: https://doi.org/10.1007/s00247-020-04735-9.
- Kvist OF, Dallora AL, Nilsson O, Anderberg P, Berglund JS, Flodmark CE, et al. Comparison of reliability of magnetic resonance imaging using cartilage and T1-weighted sequences in the assessment of the closure of the growth plates at the knee. Acta radiologica open. 2020;9(9):2058460120962732.
- Heinemann EG. Simultaneous brightness induction as a function of inducing and test-field luminances. J Exp Psychol. 1955;50(2):89-96. Available from: https://doi.org/10.1037/h0040919.
- Leibowitz H, Mote FA, Thurlow WR. Simultaneous contrast as a function of separation between test and inducing fields. J Exp Psychol. 1953;46(6):453-6. Available from: https://doi.org/10.1037/h0062595.
- Diamond AL. Foveal simultaneous brightness contrast as a function of inducing-and test-field luminances. J Exp Psychol. 1953;45(5):304-14. Available from: https://doi.org/10.1037/h0060230.
- Sinha P, Crucilla S, Gandhi T, Rose D, Singh A, Ganesh S, et al. Mechanisms underlying simultaneous brightness contrast: Early and innate. Vision Res. 2020;173:41-9. Available from: https://doi.org/10.1016/j.visres.2020.04.012.
- Nyúl LG, Udupa JK. On standardizing the MR image intensity scale. Magn Reson Med. 1999;42(6):1072-81. Available from: https://doi.org/10.1002/(sici)1522-2594(199912)42:6<1072::aid-mrm11>3.0.co;2-m.
- Moher D, Liberati A, Tetzlaff J, Altman DG. Preferred reporting items for systematic reviews and meta-analyses: the PRISMA statement. Ann Intern Med. 2009;151(4):264-9, w64. Available from: https://doi.org/10.7326/0003-4819-151-4-200908180-00135.
- SBU. Utvärdering av metoder i hälso- och sjukvården och insatser i socialtjänsten: en metodbok. . Stockholm: Statens beredning för medicinsk och social utvärdering (SBU). [accessed May 20 2021]. Available from: https://www.sbu.se/metodbok.
- Ding KY, Dahlberg PS, Rolseth V, Mosdøl A, Straumann GH, Bleka Ø, et al. Development stages of the knee and ankle by computed tomography and magnetic resonance imaging for estimation of chronological age: a systematic review. 2018:60.
- QCRI R. https://rayyan.qcri.org. [
- Whiting PF, Rutjes AWS, Westwood ME, Mallett S, Deeks JJ, Reitsma JB, et al. QUADAS-2: A Revised Tool for the Quality Assessment of Diagnostic Accuracy Studies. Annals of Internal Medicine. 2011;155(8):529-36. Available from: https://doi.org/10.7326/0003-4819-155-8-201110180-00009.
- Mostad P, Tamsen F. Error rates for unvalidated medical age assessment procedures. Int J Legal Med. 2019;133(2):613-23. Available from: https://doi.org/10.1007/s00414-018-1916-3.
- Guyatt G, Oxman A, Vist G, Kunz R, Falck-Ytter Y, Alonso-Coello P, et al. GRADE: an emerging consensus on rating quality of evidence and strength of recommendations. BMJ. 2008;336(7650):924.
- El-Din EAA, Mostafa HES, Tantawy EF, El-Shafei DA. Magnetic resonance imaging of the proximal tibial epiphysis: could it be helpful in forensic age estimation? Forensic science, medicine, and pathology. 2019;15(3):352-61.
- Ekizoglu O, Hocaoglu E, Inci E, Can IO, Aksoy S, Kazimoglu C. Forensic age estimation via 3-T magnetic resonance imaging of ossification of the proximal tibial and distal femoral epiphyses: Use of a T2-weighted fast spin-echo technique. Forensic Sci Int. 2016;260:102.e1-.e7. Available from: https://doi.org/10.1016/j.forsciint.2015.12.006.
- Herrmann J, Saring D, Auf der Mauer M, Groth M, Jopp-van Well E. Forensic age assessment of the knee: proposal of a new classification system using two-dimensional ultrasound volumes and comparison to MRI. European radiology. 2020.
- Kvist O, Luiza Dallora A, Nilsson O, Anderberg P, Sanmartin Berglund J, Flodmark CE, et al. A cross-sectional magnetic resonance imaging study of factors influencing growth plate closure in adolescents and young adults. Acta paediatrica (Oslo, Norway : 1992). 2021;110(4):1249-56.
- Ottow C, Schulz R, Pfeiffer H, Heindel W, Schmeling A, Vieth V. Forensic age estimation by magnetic resonance imaging of the knee: the definite relevance in bony fusion of the distal femoral- and the proximal tibial epiphyses using closest-to-bone T1 TSE sequence. European radiology. 2017;27(12):5041-8.
- Ekizoglu O, Er A, Bozdag M, Basa CD, Kacmaz IE, Moghaddam N, et al. Forensic age estimation via magnetic resonance imaging of knee in the Turkish population: use of T1-TSE sequence. International journal of legal medicine. 2021;135(2):631-7.
- Vieth V, Schulz R, Heindel W, Pfeiffer H, Buerke B, Schmeling A, et al. Forensic age assessment by 3.0T MRI of the knee: proposal of a new MRI classification of ossification stages. European radiology. 2018;28(8):3255-62.
- Gurses MS, Altinsoy HB. Evaluation of distal femoral epiphysis and proximal tibial epiphysis ossification using the Vieth method in living individuals: applicability in the estimation of forensic age. Australian Journal of Forensic Sciences. 2020.
- Alatas O, Altınsoy HB, Gurses MS, Balci A. Evaluation of knee ossification on 1.5 T magnetic resonance images using the method of Vieth et al.: A retrospective magnetic resonance imaging study. Rechtsmedizin. 2021;31(1):50-8.
- Dedouit F, Auriol J, Rousseau H, Rouge D, Crubezy E, Telmon N. Age assessment by magnetic resonance imaging of the knee: a preliminary study. Forensic Sci Int. 2012;217(1-3):232.e1-7. Available from: https://doi.org/https://dx.doi.org/10.1016/j.forsciint.2011.11.013.
- Altinsoy HB, Alatas O, Gurses MS, Turkmen Inanir N. Forensic age estimation in living individuals by 1.5T magnetic resonance imaging of the knee: a retrospective MRI study. Australian Journal of Forensic Sciences. 2020;52(4):439-53.
- Uygun B, Kaya K, Kose S, Ekizoglu O, Hilal A. Applicability of Magnetic Resonance Imaging of the Knee in Forensic Age Estimation. The American journal of forensic medicine and pathology. 2020.
- Margalit A, Cottrill E, Nhan D, Yu L, Tang X, Fritz J, et al. The Spatial Order of Physeal Maturation in the Normal Human Knee Using Magnetic Resonance Imaging. Journal of pediatric orthopedics. 2019;39(4):e318-e22.
- Auf der Mauer M, Saring D, Stanczus B, Herrmann J, Groth M, Jopp-van Well E. A 2-year follow-up MRI study for the evaluation of an age estimation method based on knee bone development. International journal of legal medicine. 2019;133(1):205-15.
- Daghighi MH, Pourisa M, Javanpour-Heravi H, Ghojazadeh M, Mirza-Aghazadeh-Attari M, Daghighi S, et al. Application of knee MRI in forensic age estimation: A retrospective cohort. Radiography (London, England : 1995). 2021;27(1):108-14.
- De Tobel J, Ottow C, Widek T, Klasinc I, Mörnstad H, Thevissen PW, et al. Dental and Skeletal Imaging in Forensic Age Estimation: Disparities in Current Approaches and the Continuing Search for Optimization. Semin Musculoskelet Radiol. 2020;24(5):510-22. Available from: https://doi.org/10.1055/s-0040-1701495.
- Fan F, Zhang K, Peng Z, Cui JH, Hu N, Deng ZH. Forensic age estimation of living persons from the knee: Comparison of MRI with radiographs. Forensic Sci Int. 2016;268:145-50. Available from: https://doi.org/10.1016/j.forsciint.2016.10.002.
- Saint-Martin P, Rérolle C, Pucheux J, Dedouit F, Telmon N. Contribution of distal femur MRI to the determination of the 18-year limit in forensic age estimation. Int J Legal Med. 2015;129(3):619-20. Available from: https://doi.org/10.1007/s00414-014-1020-2.
- Socialstyrelsen. Om magnetkamera vid bedömning av ålder. En studie av validiteten i radiologisk undersökning 2018.
9. Bilagor
- Bilaga 1 Sökdokumentation
- Bilaga 2 Exkluderade studier och studier med hög risk för bias
- Bilaga 3 Granskningsmall för risk för bias: QUADAS 2
- Bilaga 4 Tabellverk över inkluderade studier
- Bilaga 5 Metod för beräkningar och extra material till resultatkapitlet
- Bilaga 6 Sammanställning av risk för biasbedömning av inkluderade studier