Vs: Validering av filformater

Thomas Sødring tsodring at oslomet.no
Thu Dec 15 09:40:28 CET 2022


Hei,

Denne kom i innboksen min i går kveld fra Pål Mjørlund ved Innlandet fylkesarkiv og er et tematikk som jeg synes er interessant og relevant her på listen. Jeg har litt dårlig tid med sensur akkurat nå, men tenkte å svare her og la andre kommentere dersom de ønsker det.

-- start --
Mange har nå gått over til fullelektronisk arkivering av dokumenter. I en del tilfeller gjelder dette også avtaler som har blitt sendt til digital signering. Jeg oppfatter at de fleste kommunene benytter den nasjonale fellesløsningen til dette, og at det dermed er postens signeringsportal som blir brukt for selve signeringsprosessen. Jeg antar at du har kjennskap til løsningene og teknologien, men dokumentasjon på løsningen finnes her: https://signering-docs.readthedocs.io/en/latest/index.html . Dette betyr at det allerede finnes en del dokumenter i sak/arkivløsningene som inneholder en digital signatur (basert på PAdES og XAdES).

Jeg har gjort noen kontroller i forhold til dokumenter som har blitt arkivert med avansert digital signatur, og oppdager at disse dokumentene heller ikke validerer som godkjent arkivformat. Dette har vært kjent hos Arkivverket og det ble på et møte sagt at dersom det kun er signaturen som avviker fra PDF/A-2, så godkjennes signerte PDF-dokumenter. Dette er imidlertid ikke helt enkelt. Dokumentene som jeg finner i sak/arkivløsningen fremstår dessverre ikke som PDF/A i det hele tatt, men som PDF 1.7 (pronom: fmt/276). Dette gjelder også dokumenter som var konvertert til PDF/A før de ble sendt til signering. Jeg har ikke funnet noen egen pronom-kode som viser at dette dokumentet inneholder en digital signatur, selv om det sannsynligvis burde være mulig å identifisere signaturen inne i dokumentet.

Bekymringen min er derfor i forhold til videre håndtering av disse dokumentene. Den digitale signaturen kan kun bekreftes så lenge filen er uendret. Dersom vi produserer PDF/A av et signert dokument vil det ikke være mulig å validere signeringen lenger. Denne utfordringen kan komme i forbindelse med produksjon av arkivuttrekk, men også i konverteringsprosesser som skjer i et arkivdepot for å vedlikeholde arkivdata.

Jeg har egentlig to hovedspørsmål:

Spørsmål 1:
I Noark-løsninger kan det være flere måter å håndtere digitale signaturer. I de uttrekkene vi har mottatt, har jeg så langt ikke sett at metadatafeltet elektroniskSignatur har blitt benyttet (M507, M508, M622 og M623). I mitt hode kunne en slik kontroll være automatisert i en løsning som benytter signeringsportalen. Jeg har imidlertid ikke fått signaler om at noen løsninger støtter en slik kontroll.
Flere opererer med flere varianter (eller bruker betegnelsen «versjoner») av dokumentet – slik at løsningen kan lagre både en arkivvariant og en signert variant. Det er imidlertid ikke praktisert å ta med flere av disse variantene i uttrekk. Vi ser at behovet for flere varianter er økende, ved at du gjerne skal ha en offentlig variant (i forhold til meroffentlighet og/eller publisering på postjournal hvor vi nå får krav om PDF/UA). Vil bruk av metadatafeltene elektroniskSignatur i Noark kunne erstatte bevaringen av en uendret versjon av det signerte dokumentet og hvilken løsning vil gi best integritet over tid?

Spørsmål 2:
Vi ønsker at en dokumentanalyse basert på PRONOM skal være grunnlaget for å gjennomføre en dokumentkonvertering. Vi oppfatter at filnavn og mime-type er mer utbredt grunnlagsdata i dag. Dersom signerte dokumenter hadde hatt egne PRONOM-koder ville det vært betydelig enklere å bevare originalversjonen av et signert dokument. Har du noen formening om hvor enkelt det er å få definert de signerte PDF-dokumentene inn som egne innføringer i PRONOM-registeret, og vil det egentlig være nødvendig?



--  slutt --
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://lists.nuug.no/pipermail/nikita-noark/attachments/20221215/aa90a987/attachment.htm>


More information about the nikita-noark mailing list