Validering av filformater

Petter Reinholdtsen pere at hungry.com
Tue Jan 3 12:46:04 CET 2023


[Thomas Sødring]
> Jeg har egentlig to hovedspørsmål:
>
> Spørsmål 1:
> I Noark-løsninger kan det være flere måter å håndtere digitale
> signaturer. I de uttrekkene vi har mottatt, har jeg så langt ikke sett
> at metadatafeltet elektroniskSignatur har blitt benyttet (M507, M508,
> M622 og M623). I mitt hode kunne en slik kontroll være automatisert i
> en løsning som benytter signeringsportalen. Jeg har imidlertid ikke
> fått signaler om at noen løsninger støtter en slik kontroll.

> Flere opererer med flere varianter (eller bruker betegnelsen
> «versjoner») av dokumentet – slik at løsningen kan lagre både en
> arkivvariant og en signert variant. Det er imidlertid ikke praktisert
> å ta med flere av disse variantene i uttrekk. Vi ser at behovet for
> flere varianter er økende, ved at du gjerne skal ha en offentlig
> variant (i forhold til meroffentlighet og/eller publisering på
> postjournal hvor vi nå får krav om PDF/UA). Vil bruk av
> metadatafeltene elektroniskSignatur i Noark kunne erstatte bevaringen
> av en uendret versjon av det signerte dokumentet og hvilken løsning
> vil gi best integritet over tid?

Jeg er litt usikker på detaljene, men slik jeg husker
elektroniskSignatur er den ikke egnet til å ta vare på kryptografiske
signaturer, men har kun tilpasset å notere at en signatur har vært
observert.

Da jeg tittet på dette sist, slo det meg at en mer egnet metode er å
lagre kryptografiske signaturer som en separat fil via
variant-mekanismen, der en kan ha en spesiell filtype som er en variant
av et signert dokument, eventuelt en variant med frakoblet signatur
(dvs. separat fil som ikke inneholder originalfilen).  Noark
5-strukturen og spesifikasjon tillater så vidt jeg vet slike varianter,
men ingen har brukt denne muligheten så vidt jeg vet.  En kan gjøre
tilsvarende med tiltrodd tidsstempling, både av originalil og
signaturfiler, for å teknisk øke notariteten på både originalfil og
signaturer.  En kan til og med kjede slike tidsstempelfiler og dermed
unngå at notariteten knekker når en tidsstemplingstjenestes private
nøkkel kommer på avveie.

En tilnærming med "frakoblede" signatur- og tiltrodd tidsstemplingsfiler
krever at en tar vare på disse variantene sammen med originalfil eller
formatendret fil.  Formatendring vil delvis ødelegge notaritetskjeden,
så det er en fordel å ta vare på både original og arkivformat, jamfør
<URL: https://github.com/arkivverket/noark5-standard/issues/98 >.

> Spørsmål 2:
> Vi ønsker at en dokumentanalyse basert på PRONOM skal være grunnlaget
> for å gjennomføre en dokumentkonvertering. Vi oppfatter at filnavn og
> mime-type er mer utbredt grunnlagsdata i dag. Dersom signerte
> dokumenter hadde hatt egne PRONOM-koder ville det vært betydelig
> enklere å bevare originalversjonen av et signert dokument. Har du noen
> formening om hvor enkelt det er å få definert de signerte
> PDF-dokumentene inn som egne innføringer i PRONOM-registeret, og vil
> det egentlig være nødvendig?

Jeg fikk registrert SOSI-formatet i PRONOM i 2019, og det var en ganske
smertefri prosess som tok ca. 7 måneder fra første forespørsel til jeg
fikk beskjed at den var med.  En liten utfordring kan være å finne ut
hvordan identifisere filinnhold og se at det er aktuelt format.  For
SISO gikk det greit.  Vet ikke hvor enkelt det er å kjenne igjen
spesielle PDF-varianter.  Vet du?

-- 
Vennlig hilsen
Petter Reinholdtsen


More information about the nikita-noark mailing list