Ide for automatisk registrering av metadata basert på filinnhold
Petter Reinholdtsen
pere at hungry.com
Tue Oct 30 08:52:46 CET 2018
API-strukturen i tjenestegrensesnittet legger opp til en arbeidsflyt som
er litt bakvent i forhold til hvordan jeg kunne tenke meg å samle
arkivmateriale. For å kunne laste opp en fil i arkivet, så må det først
opprettes eller spores opp egnet sak/mappe, så journalpost/registrering,
deretter dokumentbeskrivelse og til slutt dokumentobjekt, før filen kan
lastes opp. Mange av feltene som skal fylles ut i de ulike dataklassene
kan hentes fra fila som lastes opp, f.eks. forfatter og tittel fra
PDF-er, bildetype fra bilder, etc. etc. Men tjenestegrensesnittet kan
ikke bidra med ferdigutfylte verdier for disse før fila er lastet opp,
og det blir opp til API-klienter å gjøre dette selv, hver på sin måte.
En annen måte, som fortsatt bruker samme API som i dag, men på en litt
annen måte, er å opprette f.eks. sekvensen
saksmappe->journalpost->dokumentbeskrivelse->dokumentobjekt med noen
felter satt til en verdi som betyr at API-kjernen skal fylle ut disse
verdiene basert på opplastet fil. En slik verdi kan f.eks. være
'<autodetect>', men hva som helst som ikke forekommer i ekte metadata
kan brukes. Når en så laster opp selve filen, så kan kjernen spole seg
bakover i hierarkiet og legge inn aktuelle verdier i felter med denne
markøren, og API-klienten kan så be brukeren om å se over og eventuelt
justere på verdiene som ble satt automatisk.
En utfordring vil være filer som inneholder mange andre filer, der
opplastingen bør føre til at det opprettes flere
dokumentbeskrivelse/dokumentobjekt, ett sett per fil. Det gjelder
f.eks. hvis det lastes opp en epost med vedlegg, en zip-fil eller en
tarball. Klienten må da kunne hente ut den nye listen med
dokumentbeskrivelser koblet til journalpost/registrering. Eller bør det
legges inn som ekstra dokumentobjekt i samme dokumentbeskrivelse?
Hva tror dere andre om en slik tilnærming?
Alt dette kan naturligvis også gjøres på klientsiden før det sendes til
API-et, men da vil autodeteksjon måtte implementers i hver enkelt
klient.
--
Vennlig hilsen
Petter Reinholdtsen
More information about the nikita-noark
mailing list