Validatieprotocol: Klinische Meerwaarde-studie

Versie 1.0.0 -- mei 2026

1. Doel

Vaststellen of het gebruik van Remedice leidt tot het identificeren van additionele klinisch relevante aandachtspunten in vergelijking met een handmatige medicatiebeoordeling zonder software-ondersteuning. Deze studie ondersteunt de benefit-risk analyse in de klinische evaluatie.

2. Type studie

Vergelijkende klinische meerwaarde-studie (paired before-after design). Eeen beoordelaar beoordeelt dezelfde patiënten eerst handmatig, daarna met Remedice. Het verschil in gevonden klinisch relevante signalen is de primaire uitkomstmaat.

Dit is een beschrijvende studie, geen hypothesetoetsende trial. Het doel is het kwantificeren van de meerwaarde, niet het statistisch bewijzen van superioriteit.

3. Relatie tot overige validatiestudies

Deze studie hergebruikt patiënten uit de STOPP-NL V2 validatie (n=60). Een subset van 30 patiënten wordt geselecteerd voor de vergelijkende studie. De volgorde van uitvoering is:

Eerst: handmatige beoordeling (Fase A van deze studie)
Daarna: STOPP-NL gold standard beoordeling (protocol_stopp.md)
Daarna: beoordeling met Remedice (Fase B van deze studie)

De handmatige beoordeling in Fase A is een vrije beoordeling (zoals in de dagelijkse praktijk). De STOPP gold standard beoordeling is een systematische checklist. Door Fase A eerst uit te voeren, is de apotheker niet "besmet" door de STOPP-checklist of de software-output.

4. Populatie

4.1 Selectie

30 patiënten, willekeurig geselecteerd uit de 60 patiënten van de STOPP-NL V2 validatie.

4.2 Inclusiecriteria

Identiek aan de STOPP-validatie:

patiënten >= 65 jaar
= 5 chronische geneesmiddelen (polyfarmacie)
Beschikbaar geanonimiseerd medicatieprofiel met contra-indicaties en (indien beschikbaar) labwaarden

5. Methode

Fase A - Handmatige beoordeling (zonder software)

De apotheker ontvangt per patient een uitgeprint of digitaal medicatieprofiel (medicatielijst, contra-indicaties, allergieen, labwaarden) zonder Remedice-output.

Per patient noteert de apotheker alle medicatie-gerelateerde aandachtspunten die hij/zij identificeert. Dit is een vrije beoordeling - geen checklist, geen voorgedefinieerde categorieen. Dit simuleert de dagelijkse praktijk van een medicatiebeoordeling.

Registratie per aandachtspunt:

Omschrijving van het aandachtspunt
Betrokken geneesmiddel(en)
Type: interactierisico / bijwerkingrisico / duplicaat / dosering / contra-indicatie / overig
Voorgestelde actie (indien van toepassing)

Tijdregistratie: de apotheker noteert de bestede tijd per patient.

Fase B - Beoordeling met Remedice

De apotheker bekijkt dezelfde 30 patiënten nu in Remedice. Alle 6 analyse-modules zijn zichtbaar:

STOPP-NL V2
ACB-score
Dubbelmedicatie
Clinical Rules
Bijwerkingen-heatmap
Maagbescherming

Per signaal dat Remedice toont, noteert de apotheker:

Veld	Waarde
Signaal	Omschrijving van het Remedice-signaal
Analyse-module	Welke module genereerde het signaal
Reeds gevonden in Fase A?	Ja / Nee
Klinisch relevant?	Ja / Nee / Onduidelijk
Toelichting	Waarom wel/niet relevant (korte notitie)

Tijdregistratie: de apotheker noteert de bestede tijd per patient (beoordeling van Remedice-output, niet de invoertijd).

6. Uitkomstmaten

6.1 Primaire uitkomstmaat

Aantal additionele klinisch relevante signalen per patient - signalen die Remedice identificeerde en die de apotheker in Fase A niet had gevonden, en die door de apotheker als klinisch relevant worden beoordeeld.

6.2 Secundaire uitkomstmaten

Uitkomst	Definitie
Additionele signalen per module	Verdeling van additionele signalen over de 6 analyse-modules
Relevantiepercentage	Percentage van alle Remedice-signalen dat als klinisch relevant wordt beoordeeld
Handmatig-unieke signalen	Aandachtspunten die de apotheker in Fase A vond maar die Remedice niet signaleerde (geeft inzicht in beperkingen van de software)
Tijdvergelijking	Mediane beoordelingstijd per patient: handmatig vs. met software
Meest bijdragende module	Welke analyse-module levert de meeste additionele klinisch relevante signalen

7. Steekproefonderbouwing

7.1 Omvang

n = 30 patiënten (subset van de STOPP-validatie populatie).

7.2 Onderbouwing

Dit is een beschrijvende studie, geen hypothesetoetsende trial. Formele powerberekening (gericht op het verwerpen van een nulhypothese) is niet van toepassing. In plaats daarvan wordt de steekproef onderbouwd op basis van precisie rond beschrijvende schattingen.

7.3 Precisieanalyse

Verwachte aantallen (literatuur en eigen schattingen):

Parameter	Schatting	Bron
Handmatige aandachtspunten per patient	2-4	Klinische ervaring; vergelijkbaar met Huiskes et al. (2017)
Remedice-signalen per patient	4-8	Verwacht op basis van 6 analyse-modules bij polyfarmacie
Additionele signalen per patient	1-3	Schatting: 30-50% van Remedice-signalen is additioneel

Bij 30 patiënten: - Verwacht totaal handmatige aandachtspunten: 60-120 - Verwacht totaal Remedice-signalen: 120-240 - Verwacht totaal additionele signalen: 30-90

Precisie rond de primaire uitkomstmaat (gemiddeld aantal additionele signalen per patient):

Bij een verwacht gemiddelde van 2.0 additionele signalen per patient en een geschatte standaarddeviatie van 1.5:

95% BI voor het gemiddelde = gemiddelde +/- t(29, 0.025) * SD / sqrt(n) = 2.0 +/- 2.045 * 1.5 / sqrt(30) = 2.0 +/- 0.56
95% BI: [1.44, 2.56]
Halve BI-breedte: 0.56 signalen per patient

Dit betekent dat het gemiddeld aantal additionele signalen met een precisie van circa 0.6 signalen per patient kan worden geschat. Dit is voldoende om te onderscheiden of de software "geen" (0), "weinig" (1), of "substantieel" (>= 2) additionele signalen per patient oplevert.

Precisie rond het relevantiepercentage:

Bij een verwacht relevantiepercentage van 70% en ~180 Remedice-signalen totaal:

Clopper-Pearson 95% BI bij 126/180 (70%): [62.8%, 76.6%]
Halve BI-breedte: 6.9%

7.4 Pragmatische overwegingen

Haalbaarheid: De apotheker moet elke patient tweemaal beoordelen (Fase A + Fase B). Met een geschatte doorlooptijd van 15-20 minuten per patient per fase is 30 patiënten haalbaar binnen 2 werkdagen.
Hergebruik: Door patiënten te hergebruiken uit de STOPP-validatie (V2) is er geen aanvullende dataverzameling nodig.
Informatiewaarde: 30 patiënten leveren ~120-240 signalen op, voldoende om de verdeling over de 6 analyse-modules beschrijvend te analyseren. Per module zijn er gemiddeld ~20-40 signalen, genoeg voor een kwalitatieve beoordeling van de bijdrage per module.

7.5 Beperkingen van het design en mitigatie

Confirmation bias (primair risico): Dezelfde apotheker beoordeelt handmatig en met software. In Fase B weet de apotheker dat het doel is om additionele signalen te identificeren, wat kan leiden tot een neiging om Remedice-signalen als relevant te beoordelen. Mitigatie (versterkt in versie 1.1):
- (1) De apotheker beoordeelt in Fase B alle Remedice-signalen op klinische relevantie, niet alleen additionele signalen. Dit normaliseert de beoordelingstaak en vermindert de focus op "extra vinden".
- (2) Een tweede apotheker (Apotheker B uit de STOPP-validatie) beoordeelt geblindeerd alle additionele signalen (niet enkel een subset van 10) op klinische relevantie, zonder te weten dat deze signalen additioneel zijn ten opzichte van Fase A. De primaire uitkomstmaat (additionele klinisch relevante signalen) wordt gerapporteerd op basis van de beoordeling van Apotheker B; de beoordeling van Apotheker A geldt als secundair.
- (3) Inter-rater agreement op signaalrelevantie tussen A en B wordt gerapporteerd (Cohen's kappa). Bij kappa < 0.60 wordt een derde apotheker ingeschakeld voor consensusbeoordeling.
Volgorde-effect: De handmatige beoordeling is altijd eerst. De apotheker kan in Fase B alerter zijn door de ervaring in Fase A. Dit is inherent aan het paired design en wordt als acceptabel beschouwd; het alternatief (randomiseren van de volgorde) introduceert een groter probleem (software-output beinvloedt de handmatige beoordeling).
1 primaire beoordelaar: Inter-beoordelaar variatie kan niet volledig worden gemeten. De geblindeerde subset-check door Apotheker B biedt een beperkte controle. Uitbreiding met meerdere beoordelaars volgt in post-market surveillance.

8. Analyse

De analyse is beschrijvend (geen p-waarden of hypothesetoetsen):

Mediaan en spreiding (IQR) van het aantal additionele signalen per patient
Frequentietabel van additionele signalen per analyse-module
Percentage klinisch relevante signalen van het totaal
Mediaan beoordelingstijd handmatig vs. met software
Kwalitatieve samenvatting van de meest voorkomende typen additionele signalen
Kwalitatieve samenvatting van signalen die de software miste (handmatig-uniek)

9. Rapportage

Het resultatenrapport bevat:

Beschrijving van de 30 patiënten (leeftijd, aantal medicijnen)
Resultaten per uitkomstmaat (tabellen en beschrijvende statistieken)
Top-5 meest voorkomende additionele signalen (geanonimiseerde voorbeelden)
Analyse van handmatig-unieke signalen (beperkingen van de software)
Conclusie over de klinische meerwaarde
Aanbevelingen voor verbetering van de software

10. Ethische overwegingen

Alle patientdata is geanonimiseerd
Geen directe patientinteractie
Retrospectieve data uit bestaande AIS-exports
De studie heeft geen invloed op de daadwerkelijke zorgverlening aan patiënten