Validatieprotocol: Klinische Meerwaarde-studie
Versie 1.0.0 -- mei 2026
1. Doel
Vaststellen of het gebruik van Remedice leidt tot het identificeren van additionele klinisch relevante aandachtspunten in vergelijking met een handmatige medicatiebeoordeling zonder software-ondersteuning. Deze studie ondersteunt de benefit-risk analyse in de klinische evaluatie.
2. Type studie
Vergelijkende klinische meerwaarde-studie (paired before-after design). Eeen beoordelaar beoordeelt dezelfde patienten eerst handmatig, daarna met Remedice. Het verschil in gevonden klinisch relevante signalen is de primaire uitkomstmaat.
Dit is een beschrijvende studie, geen hypothesetoetsende trial. Het doel is het kwantificeren van de meerwaarde, niet het statistisch bewijzen van superioriteit.
3. Relatie tot overige validatiestudies
Deze studie hergebruikt patienten uit de STOPP-NL V2 validatie (n=60). Een subset van 30 patienten wordt geselecteerd voor de vergelijkende studie. De volgorde van uitvoering is:
- Eerst: handmatige beoordeling (Fase A van deze studie)
- Daarna: STOPP-NL gold standard beoordeling (protocol_stopp.md)
- Daarna: beoordeling met Remedice (Fase B van deze studie)
De handmatige beoordeling in Fase A is een vrije beoordeling (zoals in de dagelijkse praktijk). De STOPP gold standard beoordeling is een systematische checklist. Door Fase A eerst uit te voeren, is de apotheker niet "besmet" door de STOPP-checklist of de software-output.
4. Populatie
4.1 Selectie
30 patienten, willekeurig geselecteerd uit de 60 patienten van de STOPP-NL V2 validatie.
4.2 Inclusiecriteria
Identiek aan de STOPP-validatie:
- Patienten >= 65 jaar
-
= 5 chronische geneesmiddelen (polyfarmacie)
- Beschikbaar geanonimiseerd medicatieprofiel met contra-indicaties en (indien beschikbaar) labwaarden
5. Methode
Fase A - Handmatige beoordeling (zonder software)
De apotheker ontvangt per patient een uitgeprint of digitaal medicatieprofiel (medicatielijst, contra-indicaties, allergieen, labwaarden) zonder Remedice-output.
Per patient noteert de apotheker alle medicatie-gerelateerde aandachtspunten die hij/zij identificeert. Dit is een vrije beoordeling - geen checklist, geen voorgedefinieerde categorieen. Dit simuleert de dagelijkse praktijk van een medicatiebeoordeling.
Registratie per aandachtspunt:
- Omschrijving van het aandachtspunt
- Betrokken geneesmiddel(en)
- Type: interactierisico / bijwerkingrisico / duplicaat / dosering / contra-indicatie / overig
- Voorgestelde actie (indien van toepassing)
Tijdregistratie: de apotheker noteert de bestede tijd per patient.
Fase B - Beoordeling met Remedice
De apotheker bekijkt dezelfde 30 patienten nu in Remedice. Alle 6 analyse-modules zijn zichtbaar:
- STOPP-NL V2
- ACB-score
- Dubbelmedicatie
- Standaardvragen
- Bijwerkingen-heatmap
- Maagbescherming
Per signaal dat Remedice toont, noteert de apotheker:
| Veld | Waarde |
|---|---|
| Signaal | Omschrijving van het Remedice-signaal |
| Analyse-module | Welke module genereerde het signaal |
| Reeds gevonden in Fase A? | Ja / Nee |
| Klinisch relevant? | Ja / Nee / Onduidelijk |
| Toelichting | Waarom wel/niet relevant (korte notitie) |
Tijdregistratie: de apotheker noteert de bestede tijd per patient (beoordeling van Remedice-output, niet de invoertijd).
6. Uitkomstmaten
6.1 Primaire uitkomstmaat
Aantal additionele klinisch relevante signalen per patient - signalen die Remedice identificeerde en die de apotheker in Fase A niet had gevonden, en die door de apotheker als klinisch relevant worden beoordeeld.
6.2 Secundaire uitkomstmaten
| Uitkomst | Definitie |
|---|---|
| Additionele signalen per module | Verdeling van additionele signalen over de 6 analyse-modules |
| Relevantiepercentage | Percentage van alle Remedice-signalen dat als klinisch relevant wordt beoordeeld |
| Handmatig-unieke signalen | Aandachtspunten die de apotheker in Fase A vond maar die Remedice niet signaleerde (geeft inzicht in beperkingen van de software) |
| Tijdvergelijking | Mediane beoordelingstijd per patient: handmatig vs. met software |
| Meest bijdragende module | Welke analyse-module levert de meeste additionele klinisch relevante signalen |
7. Steekproefonderbouwing
7.1 Omvang
n = 30 patienten (subset van de STOPP-validatie populatie).
7.2 Onderbouwing
Dit is een beschrijvende studie, geen hypothesetoetsende trial. Formele powerberekening (gericht op het verwerpen van een nulhypothese) is niet van toepassing. In plaats daarvan wordt de steekproef onderbouwd op basis van precisie rond beschrijvende schattingen.
7.3 Precisieanalyse
Verwachte aantallen (literatuur en eigen schattingen):
| Parameter | Schatting | Bron |
|---|---|---|
| Handmatige aandachtspunten per patient | 2-4 | Klinische ervaring; vergelijkbaar met Huiskes et al. (2017) |
| Remedice-signalen per patient | 4-8 | Verwacht op basis van 6 analyse-modules bij polyfarmacie |
| Additionele signalen per patient | 1-3 | Schatting: 30-50% van Remedice-signalen is additioneel |
Bij 30 patienten: - Verwacht totaal handmatige aandachtspunten: 60-120 - Verwacht totaal Remedice-signalen: 120-240 - Verwacht totaal additionele signalen: 30-90
Precisie rond de primaire uitkomstmaat (gemiddeld aantal additionele signalen per patient):
Bij een verwacht gemiddelde van 2.0 additionele signalen per patient en een geschatte standaarddeviatie van 1.5:
- 95% BI voor het gemiddelde = gemiddelde +/- t(29, 0.025) * SD / sqrt(n) = 2.0 +/- 2.045 * 1.5 / sqrt(30) = 2.0 +/- 0.56
- 95% BI: [1.44, 2.56]
- Halve BI-breedte: 0.56 signalen per patient
Dit betekent dat het gemiddeld aantal additionele signalen met een precisie van circa 0.6 signalen per patient kan worden geschat. Dit is voldoende om te onderscheiden of de software "geen" (0), "weinig" (1), of "substantieel" (>= 2) additionele signalen per patient oplevert.
Precisie rond het relevantiepercentage:
Bij een verwacht relevantiepercentage van 70% en ~180 Remedice-signalen totaal:
- Clopper-Pearson 95% BI bij 126/180 (70%): [62.8%, 76.6%]
- Halve BI-breedte: 6.9%
7.4 Pragmatische overwegingen
- Haalbaarheid: De apotheker moet elke patient tweemaal beoordelen (Fase A + Fase B). Met een geschatte doorlooptijd van 15-20 minuten per patient per fase is 30 patienten haalbaar binnen 2 werkdagen.
- Hergebruik: Door patienten te hergebruiken uit de STOPP-validatie (V2) is er geen aanvullende dataverzameling nodig.
- Informatiewaarde: 30 patienten leveren ~120-240 signalen op, voldoende om de verdeling over de 6 analyse-modules beschrijvend te analyseren. Per module zijn er gemiddeld ~20-40 signalen, genoeg voor een kwalitatieve beoordeling van de bijdrage per module.
7.5 Beperkingen van het design en mitigatie
- Confirmation bias (primair risico): Dezelfde apotheker beoordeelt handmatig en met software. In Fase B weet de apotheker dat het doel is om additionele signalen te identificeren, wat kan leiden tot een neiging om Remedice-signalen als relevant te beoordelen. Mitigatie (versterkt in versie 1.1):
- (1) De apotheker beoordeelt in Fase B alle Remedice-signalen op klinische relevantie, niet alleen additionele signalen. Dit normaliseert de beoordelingstaak en vermindert de focus op "extra vinden".
- (2) Een tweede apotheker (Apotheker B uit de STOPP-validatie) beoordeelt geblindeerd alle additionele signalen (niet enkel een subset van 10) op klinische relevantie, zonder te weten dat deze signalen additioneel zijn ten opzichte van Fase A. De primaire uitkomstmaat (additionele klinisch relevante signalen) wordt gerapporteerd op basis van de beoordeling van Apotheker B; de beoordeling van Apotheker A geldt als secundair.
- (3) Inter-rater agreement op signaalrelevantie tussen A en B wordt gerapporteerd (Cohen's kappa). Bij kappa < 0.60 wordt een derde apotheker ingeschakeld voor consensusbeoordeling.
- Volgorde-effect: De handmatige beoordeling is altijd eerst. De apotheker kan in Fase B alerter zijn door de ervaring in Fase A. Dit is inherent aan het paired design en wordt als acceptabel beschouwd; het alternatief (randomiseren van de volgorde) introduceert een groter probleem (software-output beinvloedt de handmatige beoordeling).
- 1 primaire beoordelaar: Inter-beoordelaar variatie kan niet volledig worden gemeten. De geblindeerde subset-check door Apotheker B biedt een beperkte controle. Uitbreiding met meerdere beoordelaars volgt in post-market surveillance.
8. Analyse
De analyse is beschrijvend (geen p-waarden of hypothesetoetsen):
- Mediaan en spreiding (IQR) van het aantal additionele signalen per patient
- Frequentietabel van additionele signalen per analyse-module
- Percentage klinisch relevante signalen van het totaal
- Mediaan beoordelingstijd handmatig vs. met software
- Kwalitatieve samenvatting van de meest voorkomende typen additionele signalen
- Kwalitatieve samenvatting van signalen die de software miste (handmatig-uniek)
9. Rapportage
Het resultatenrapport bevat:
- Beschrijving van de 30 patienten (leeftijd, aantal medicijnen)
- Resultaten per uitkomstmaat (tabellen en beschrijvende statistieken)
- Top-5 meest voorkomende additionele signalen (geanonimiseerde voorbeelden)
- Analyse van handmatig-unieke signalen (beperkingen van de software)
- Conclusie over de klinische meerwaarde
- Aanbevelingen voor verbetering van de software
10. Ethische overwegingen
- Alle patientdata is geanonimiseerd
- Geen directe patientinteractie
- Retrospectieve data uit bestaande AIS-exports
- De studie heeft geen invloed op de daadwerkelijke zorgverlening aan patienten