On Tue, Jan 03, 2023 at 03:24:51PM +0100, Petter Reinholdtsen wrote:
Jeg har blitt kontaktet av Jari fra tidligere Holder de ord, som nå jobber i VG, med spørsmål om vi i NUUG er interessert i å dele klager på manglende offentlig innsyns som vi har i Mimes brønn-databasen. Tanken er å forsøke å trene ChatGPT med disse tekstene for å lære ChatGPT å hjelpe journalister å skrive innsynsklager.
Jeg synes dette høres ut som et godt formål.
Har tatt en titt i databasen, og det ser ut til å være 1313 slike tekster i databasen. De kan hentes ut som bruker innsyn med følgende kommando:
psql -h localhost -U foi alaveteli_production -c "copy (select body from outgoing_messages where message_type = 'followup' and what_doing ='internal_review') to stdout csv"
Brevene er så vidt jeg forstår allerede sendt til det offentlige og tilgjengelig hvis en spør om innsyn der. Har kun skummet igjennom tekstene. Tekstene inneholder så vidt jeg kan se navn på innsender i de fleste tilfeller, ellers generiske klagetekster. Regner ikke med at de inneholder andre personopplysninger.
Jeg har sett gjennom noe nær 50% (tror jeg) av output fra den kommandoen med list slaphand-øvelse i less, og jeg tror ikke vi kommer i noe påtakelig risiko for å lekke noe sensitivt om vi lar dem bruke tekstene på denne måten.
Så dette har min støtte, om det betyr noe.
- Peter