Ide for automatisk registrering av metadata basert på filinnhold

Petter Reinholdtsen pere at hungry.com
Tue Oct 30 08:52:46 CET 2018


API-strukturen i tjenestegrensesnittet legger opp til en arbeidsflyt som
er litt bakvent i forhold til hvordan jeg kunne tenke meg å samle
arkivmateriale.  For å kunne laste opp en fil i arkivet, så må det først
opprettes eller spores opp egnet sak/mappe, så journalpost/registrering,
deretter dokumentbeskrivelse og til slutt dokumentobjekt, før filen kan
lastes opp.  Mange av feltene som skal fylles ut i de ulike dataklassene
kan hentes fra fila som lastes opp, f.eks. forfatter og tittel fra
PDF-er, bildetype fra bilder, etc. etc.  Men tjenestegrensesnittet kan
ikke bidra med ferdigutfylte verdier for disse før fila er lastet opp,
og det blir opp til API-klienter å gjøre dette selv, hver på sin måte.

En annen måte, som fortsatt bruker samme API som i dag, men på en litt
annen måte, er å opprette f.eks. sekvensen
saksmappe->journalpost->dokumentbeskrivelse->dokumentobjekt med noen
felter satt til en verdi som betyr at API-kjernen skal fylle ut disse
verdiene basert på opplastet fil.  En slik verdi kan f.eks. være
'<autodetect>', men hva som helst som ikke forekommer i ekte metadata
kan brukes.  Når en så laster opp selve filen, så kan kjernen spole seg
bakover i hierarkiet og legge inn aktuelle verdier i felter med denne
markøren, og API-klienten kan så be brukeren om å se over og eventuelt
justere på verdiene som ble satt automatisk.

En utfordring vil være filer som inneholder mange andre filer, der
opplastingen bør føre til at det opprettes flere
dokumentbeskrivelse/dokumentobjekt, ett sett per fil.  Det gjelder
f.eks. hvis det lastes opp en epost med vedlegg, en zip-fil eller en
tarball.  Klienten må da kunne hente ut den nye listen med
dokumentbeskrivelser koblet til journalpost/registrering.  Eller bør det
legges inn som ekstra dokumentobjekt i samme dokumentbeskrivelse?

Hva tror dere andre om en slik tilnærming?

Alt dette kan naturligvis også gjøres på klientsiden før det sendes til
API-et, men da vil autodeteksjon måtte implementers i hver enkelt
klient.

-- 
Vennlig hilsen
Petter Reinholdtsen


More information about the nikita-noark mailing list