HB Deid - Automatisk avidentifiering av text

Den här versionen av HB Deid är tränad på icke-känsliga annoterade tidningstexter (Webbnyheter 2012), snabbannoterad genom bootstrapping med en modell tränad på Stockholm EPR PHI Corpus. Den kan användas för att identifiera och byta ut personnamn, platser, telefonnummer, åldrar, personnummer och telefonnummer.

Inga av texterna som matas in av användaren sparas.

  • Ersättare : Annat ord som val för innebär att texten pseudonymiseras
  • Viktad : Ökande vikt ger högre täckning, men också sämre precision
  • + Regler : Ja innebär att regler används för att identifiera bland annat telefonnummer och personnummer