Dataskydd

Dataskydd och avidentifiering i CareifAI Summarizer

På CareifAI är integritet och dataskydd en grundförutsättning. Vårt verktyg Summarizer är byggt för att bearbeta journaltext och andra kliniska dokument utan att kompromissa med skyddet av personuppgifter. Nedan förklarar vi hur vi tekniskt säkerställer anonymisering och reducerar risken för återidentifiering (avanonymisering).

1. Flerlagerskydd – före, under och efter analys

Vårt dataskydd bygger på tre nivåer av säkerhet:

A. Förbehandling med anonymiseringsskript

Innan texten ens når språkmodellen, passerar den ett skript som identifierar och neutraliserar direkta personuppgifter som:
- Namn (för- och efternamn)
- Personnummer och födelsedatum

- Telefonnummer och e-postadresser

- Adresser och postnummer

- Interna ID och referensnummer

Detta görs med en kombination av reguljära uttryck, ordbanker och kontextuella regler. Resultatet är en text där explicita identifierare är borttagna eller ersatta med generiska markörer (t.ex. “[NAMN]”, “[PERSONNUMMER]”).

B. Kontextuell identifiering av språklig identifierbarhet

När texten bearbetas av språkmodellen sker ytterligare skydd genom att modellen aktivt tränats och instruerats att:

- Undvika återanvändning av potentiellt unika uttryck eller kombinationer (t.ex. ”Hen bor i ett rött hus i Gällivare och spelar trombon i stadens orkester”)

- Undvika att skapa sammanfattningar där ovanliga eller indirekta attribut kombineras till något som skulle kunna återidentifiera individen

Detta sker genom att modellen kontinuerligt värderar informationsdensitet och unicitetsrisk i det den genererar. Om en formulering innehåller ovanliga detaljer utan kliniskt värde, ersätts eller generaliseras informationen.

C. Output-filter och eftergranskning

Efter att en sammanfattning skapats genomförs en sista kontroll, där modellen instrueras att identifiera kvarvarande personlig eller känslig information och rensa denna. Resultatet är en text som behåller sitt kliniska innehåll men inte går att koppla till en enskild individ.

2. Ingen långvarig lagring

Summarizer i testversionen lagrar inte någon text permanent. All data bearbetas i minnet och raderas automatiskt efter varje session.
Det innebär:

- Ingen kopia sparas på server

- Ingen sammanfattning går att återskapa i efterhand

- All lokal data lagras i användarens webbläsare (local storage), om inte annat avtalats

3. Krypterad överföring och plattformsoberoende säkerhet

All kommunikation sker via HTTPS med modern TLS-kryptering. Verktyget kan användas via dator, surfplatta eller mobil så länge anslutningen är säker och enheten är skyddad.

4. Användarens ansvar

Användaren ansvarar för:

- Att ha lagligt och organisatoriskt godkännande att använda data i verktyget

- Att följa lokala riktlinjer, GDPR och sekretesslagstiftning

- Att skydda data före uppladdning (t.ex. lösenordsskydd, säker uppkoppling)

- Att rensa bort irrelevanta dokument eller känsliga bilagor innan användning

5. Begränsningar och ansvarsfördelning

Trots våra flerlagersskydd och automatiserade anonymiseringsrutiner finns det alltid en teoretisk risk att enstaka personuppgifter kan slinka igenom, särskilt i ovanliga eller komplexa textfall.

CareifAI kan inte garantera att all personlig information alltid rensas bort till 100 %, särskilt i texter som avviker från vanliga mönster. Summarizer ska därför inte användas som ett sätt att anonymisera data för offentlig publicering eller för datadelning utanför organisationens egna godkända system.

Det är alltid användaren som bär det slutgiltiga ansvaret för att de data som används i Summarizer hanteras i enlighet med gällande dataskyddslagstiftning och organisationens interna riktlinjer.