Epost automatisk inn i arkivet, med støtte for nasjonale identifikatorer

Petter Reinholdtsen pere at hungry.com
Tue Jan 21 21:11:28 CET 2020


De siste månedene har det vært en enorm forbedring av Nikita, og den
støtter nå de fleste datastrukturene beskrevet i API-spesifikasjonen.  I
dag kom det endelig på plass støtte for nasjonale identifikatorer
knyttet til 'mappe' og 'registrering', hvilket åpner veien for
interessante søk, for eksempel på matrikkelnummer og geografisk
posisjon.

Jeg benyttet sjansen og la inn enkel støtte for nasjonale
identifikatorer i programmet jeg har skrevet for å arkivere epost via
API-et, slik at den nå ser etter noe som ligner fødselsnummer og
organisasjonsnummer i epostinnholdet, kontrollerer sjekksummene i begge
numrene, og hvis sjekksummene stemmer, antar det er ment å være slike
numre og kobler dem som nasjonale identifikatorer til den arkiverte
eposten (knyttet til 'registrering')

Konkret, så betyr at det hvis epostteksten inneholder forholdsvis
vilkårlige nummer ala 02101539531, 030136 49048, 971 524 545 og
986105174, der sjekksummene stemmer, så blir numrene strukturert i
arkivet som nasjonale identifikatorer.  Fødselsnumrene ble generert av
<URL: http://www.fnrinfo.no/verktoy/finnlovlige_tilfeldig.aspx > og
organisasjonsnumrene ble hentet ut fra proff.no.

Foreløbig ser den kun på teksten i eposten, men jeg tenker den må
utvides til å også se i binære vedlegg, f.eks. i teksten i en PDF eller
OCR-uthentet innhold for bilder.

Jeg har nå et opplegg som kan ta all epost sendt til en bestemt
epostadresse og stapper inn i arkivet, knyttet til samme mappe som
tidligere epost i eventuell eposttråd.

-- 
Vennlig hilsen
Petter Reinholdtsen


More information about the nikita-noark mailing list