Denna publikation publicerades för mer än 5 år sedan. Kunskapen kan ha förändrats genom att ny forskning tillkommit och att den visar på andra resultat. Det är dock mindre troligt att resultat med starkt vetenskapligt stöd förändras, även om nya studier tillkommer.

Vetenskap & Praxis

Hur visa att ny behandling åtminstone inte är sämre?

Att en ny behandling har visats vara minst lika bra som en befintlig metod är en viktig slutsats för vården. Vilka bevis krävs egentligen för så kallad non-inferiority?

Vården ställs ständigt inför olika behandlingsalternativ. Innan man ändrar en dokumenterat effektiv behandlingsstrategi, är det viktigt att det finns belägg för att den nya strategin är minst lika bra som den befintliga. Studier som påstås visa att en ny behandling är lika bra som eller bättre än en etablerad måste dock läggas upp och tolkas med försiktighet. 

Ett exempel: Blåskatarr hos kvinnor brukar behandlas med antibiotika, till exempel mecillinam. Omfattande användning av antibiotika kan ju bidra till resistenta bakterier, som kan orsaka svårbehandlade infektioner. Därför är det intressant att vissa smärtlindrande och inflammationshämmande läkemedel, som ibuprofen, kanske kan påskynda läkningen utan att orsaka resistens.

Likvärdig räcker

Vilka belägg ska vi kräva i valet mellan mecillinam och ibuprofen? Vi behöver inte ställa kravet att ibuprofen ska ge bättre symtomlindring, utan skulle nöja oss om effekten var likvärdig. Men att fastställa detta är ett statistiskt problem, och missförstånd är vanligt.

Figur 1 visar resultat från två tänkta studier, A och B. A visar att andelen symtomfria kvinnor blev 14 procent fler med ibuprofen än med mecillinam, efter fyra dagar. Skillnaden mellan läkemedlen i studie A är statistiskt säkerställd eftersom konfidensintervallet (vågrät linje) inte täcker mittlinjen (som anger 0 skillnad). Visar studie B att behandlingarna är likvärdiga? Nej, men detta är en vanlig feltolkning. Punktskattningen för B (svart fyrkant i mitten) anger visserligen ”ingen skillnad”. Trots detta kan den sanna skillnaden ändå vara betydande, eftersom konfidensintervallet på 95 procent innebär att den faktiska  skillnaden med 95 procents sannolikhet finns någonstans mellan minus 15 till plus 15 procent.

Gräns för relevans

För att kunna påstå att två behandlingar är likvärdiga måste vi bestämma oss för en minsta meningsfull skillnad, en klinisk relevansgräns. Skillnader som är ännu mindre anser vi sakna klinisk betydelse. Att fastställa lämpliga gränser är svårt. I exemplet blåskatarr saknar det nog betydelse att ibuprofen ger en enda procent färre symtomfria personer än mecillinam, men hur är det med en skillnad på 5 procent, 10 procent eller 20 procent? Givetvis spelar det stor roll vilken typ av tillstånd som behandlingen avser. En liten skillnad mellan två behandlingsmetoder kan vara oväsentlig när det handlar om förkylningssymtom men väsentlig om det gäller överlevnad vid hjärtinfarkt.

Patientens värdering

Ytterligare en aspekt som måste beaktas är patientens egen värdering av effekten. En patient i livets slutskede kan ha en annan uppfattning än en patient där sannolikheten för ett långt återstående liv är stor.

I figur 2 har vi satt den kliniska relevansgränsen till 10 procent. Resultat från studie B och studie C har samma punktskattning, men konfidensintervallet i C är snävare och innebär att behandlingarna är likvärdiga. I studie B är likvärdigheten inte statistiskt säkerställd eftersom konfidensintervallet överlappar gränserna.

Men att testa likvärdighet på det här sättet, i så kallade ekvivalensstudier, kan medföra praktiska problem. Om relevansgränserna sätts alltför snävt, kommer det att krävas fler försöksdeltagare än vad som är praktiskt möjligt att ta med. Det finns emellertid en lösning, som gör det möjligt att använda snäva gränser utan att det krävs orimligt många deltagare.

I stället för att fråga om behandlingarna är likvärdiga, nöjer vi oss med frågan ”Är ibuprofen minst lika bra som mecillinam, det vill säga åtminstone inte sämre?” (figur 3). På engelska kallas sådana undersökningar för non-inferiority-studier. Då behövs det ingen relevansgräns på höger sida i figuren – det viktiga är ju bara att ibuprofen i varje fall inte är sämre än mecillinam.

Men denna typ upplägg är bara aktuellt om den befintliga behandlingen är betydligt bättre än placebo eller ingen behandling – och så är inte alltid fallet.

Utan behandling

Anta att en tredjedel av alla kvinnor med blåskatarr faktiskt blir symtomfria efter ett fåtal dagar, utan någon behandling alls, och att mecillinam bara leder till att ytterligare några procent av kvinnorna blir symtomfria. Skulle vi då sätta en relevansgräns på 10 procent så skulle vi alltså acceptera att ibuprofen faktiskt kan vara sämre än ingen behandling alls. Relevansgränsen är med andra ord för generöst tilltagen.

Om en befintlig behandling i stället är betydligt bättre än placebo, och man vill jämföra med ett nytt alternativ som kanske är billigare eller som har en bättre biverkningsprofil, är det viktigt att relevansgränsen inte är för snäv. Sätts gränsen för snävt, finns det risk att man dömer ut den nya behandlingen som kliniskt sämre, trots att skillnaden i effekt mellan metoderna egentligen är försumbar och trots att fördelarna med den nya metoden överväger.

Blir vanligare

Non-inferiority-studier lanserades under 1990-talet, och kommer antagligen att bli mycket vanligare. Ett skäl är att det är oetiskt att ge en kontrollgrupp placebo när det finns bevisat verksamma behandlingar att jämföra med.

När ”inte sämre”-studier utformas och tolkas måste man alltså veta hur verksamt jämförelsealternativet är i sig, och noggrant analysera var den kliniska relevansgränsen har satts. Resultaten står och faller med att relevansgränserna har fastställts på ett omdömesgillt och välgrundat sätt.

Sten Anttila, 
projektledare SBU, fil dr
anttila@sbu.se

Ragnar Levi
medicinsk informationschef, SBU

Ulf Eriksson
samordnare evidensbaserad vård, familjeläkare
Landstinget Blekinge