Jeg tok nylig mot til meg og gikk på oppdatering av korrigering av definisjonene for bokmål og nynorsk som brukes av ulike docbook-verktøy. Det er flere år siden de ble oppdatert sist, og de har noen plagsomme feil. Bakgrunnen er at jeg bruker docbook når jeg typesetter bøker, og vil slippe å måtte overstyre feil i definisjonene hver gang.
Jeg har gått gjennom både nb.xml og nn.xml i <URL: https://github.com/petterreinholdtsen/xslt10-stylesheets/blob/updated-nb-nn/... >, og sørget for at de har samme innhold og rekkefølge på verdiene som en.xml, for å enklere kunne oppdage hva som manglet. Jeg tok ikke med normalize.sort.input, da jeg ikke aner hva det gjør og den ikke var med i de opprinnelige filene.
Jeg har lagt inn verdier som mangler, fjernet duplikater og utdatete oppføringer, samt fikset en god del feil. Før jeg sender dem inn til utviklerne hadde det vært fint med korrekturlesing. Spesielt de delene merket lang="nb" i nn.xml trenger innspill fra noen med mer nynorskpeiling enn meg.
Send gjerne endringsforslag og feilrapprter via github eller send meg en epost med informasjon om feil du finner og korreksjoner som bør inn. Tenker jeg sender inn i slutten av uka.
Kan hende eg tar feil sidan eg ikkje kjenner oppbygginga og bruken av filene, men fann etter ei rask gjennomlesing dette i fila nn.xml:
<gentext key="pubdate" text="Utgivelsesdato"/> "Utgjevingsdato"?
Ser det er fleire oppføringar som er merkte med «lang="nb"». Skal desse omsetjast og språkmerket fjernast? Eksempel:<gentext key="video-unsupported" text="Din nettleser støtter ikke video-taggen" lang="nb"/> Sidan det står lang="nb" er dette kanskje ok? Viss ikkje, kanskje "Nettlesaren din har ikkje støtte for video-taggen"
<dingbat key="bullet" text="•"/> Ut frå «Språklege retningslinjer» bruker vi tankestrek på norsk, men dette er kanskje brukt i ein annan samanheng?
Ser vekenamna, både i full lengde og avkorta, er på bokmål.
Eg hjelper gjerne til når eg har tid, men er ikkje sikker på om hjelpa mi er til noko nytte her sidan eg ikkje kjenner systemet xml-filene blir brukte i.
Helsing Kolbjørn
Den 22.09.2020 13:11, skreiv Petter Reinholdtsen:
Jeg tok nylig mot til meg og gikk på oppdatering av korrigering av definisjonene for bokmål og nynorsk som brukes av ulike docbook-verktøy. Det er flere år siden de ble oppdatert sist, og de har noen plagsomme feil. Bakgrunnen er at jeg bruker docbook når jeg typesetter bøker, og vil slippe å måtte overstyre feil i definisjonene hver gang.
Jeg har gått gjennom både nb.xml og nn.xml i <URL: https://github.com/petterreinholdtsen/xslt10-stylesheets/blob/updated-nb-nn/... >, og sørget for at de har samme innhold og rekkefølge på verdiene som en.xml, for å enklere kunne oppdage hva som manglet. Jeg tok ikke med normalize.sort.input, da jeg ikke aner hva det gjør og den ikke var med i de opprinnelige filene.
Jeg har lagt inn verdier som mangler, fjernet duplikater og utdatete oppføringer, samt fikset en god del feil. Før jeg sender dem inn til utviklerne hadde det vært fint med korrekturlesing. Spesielt de delene merket lang="nb" i nn.xml trenger innspill fra noen med mer nynorskpeiling enn meg.
Send gjerne endringsforslag og feilrapprter via github eller send meg en epost med informasjon om feil du finner og korreksjoner som bør inn. Tenker jeg sender inn i slutten av uka.
Kolbjørn Stuestøl skreiv 22.09.2020 21:53:
Eg hjelper gjerne til når eg har tid, men er ikkje sikker på om hjelpa mi er til noko nytte her sidan eg ikkje kjenner systemet xml-filene blir brukte i.
Eg kjenner (iallfall litt) til DocBook, og kan ta ein kikk, men det får eg nok ikkje gjort før til helga.
[Kolbjørn Stuestøl]
Kan hende eg tar feil sidan eg ikkje kjenner oppbygginga og bruken av filene, men fann etter ei rask gjennomlesing dette i fila nn.xml:
<gentext key="pubdate" text="Utgivelsesdato"/> "Utgjevingsdato"?
Takk. Lagt inn.
Ser det er fleire oppføringar som er merkte med «lang="nb"». Skal desse omsetjast og språkmerket fjernast?
Ja. La inn lang="nb" for å markere de jeg kopiert fra bokmål.
Eksempel:<gentext key="video-unsupported" text="Din nettleser støtter ikke video-taggen" lang="nb"/> Sidan det står lang="nb" er dette kanskje ok? Viss ikkje, kanskje "Nettlesaren din har ikkje støtte for video-taggen
Lagt inn.
<dingbat key="bullet" text="•"/> Ut frå «Språklege retningslinjer» bruker vi tankestrek på norsk, men dette er kanskje brukt i ein annan samanheng?
Usikker selv, så jeg beholdt den slik den var fra før. Jeg ser følgende varianter er i bruk for andre språk:
<dingbat key="bullet" text="·"/> <dingbat key="bullet" text="—"/> <dingbat key="bullet" text="•"/> <dingbat key="bullet" text="●"/> <dingbat key="bullet" text="ߦ"/> <dingbat key="bullet" text="•"/> <dingbat key="bullet" text="•"/>
ߦ er <URL: https://www.codetable.net/decimal/2022 >, mens • og • er <URL: https://www.codetable.net/decimal/8226 >, hvis jeg forstår entitetverdiene korrekt.
Ser vekenamna, både i full lengde og avkorta, er på bokmål.
Ah, godt poeng. Markerer som nb.
Eg hjelper gjerne til når eg har tid, men er ikkje sikker på om hjelpa mi er til noko nytte her sidan eg ikkje kjenner systemet xml-filene blir brukte i.
Jeg tror det er enklere enn du tror, og din hjelp vil være veldig velkommen. Det er i grove trekk å sjekke og korrigere ca. 200 strenger.
Det ser altså ut til at eg kan korrigere det eg finn av feil/manglande omsetjingar og sende til deg eller til lista her. Bør vel også kunne omsetje dei som er merkte med nb og sløyfe språktaggen?
<dingbat key="bullet" text="•"/>: Eg reknar med at Karl Ove Hufthammer kan meir om dette.
Er for tida opptatt med andre prosjekt enn omsetjingar, men det kjem nokre innspel når eg finn ledige stunder.
Kolbjørn
Den 22.09.2020 22:52, skreiv Petter Reinholdtsen:
[Kolbjørn Stuestøl]
Kan hende eg tar feil sidan eg ikkje kjenner oppbygginga og bruken av filene, men fann etter ei rask gjennomlesing dette i fila nn.xml:
<gentext key="pubdate" text="Utgivelsesdato"/> "Utgjevingsdato"?
Takk. Lagt inn.
Ser det er fleire oppføringar som er merkte med «lang="nb"». Skal desse omsetjast og språkmerket fjernast?
Ja. La inn lang="nb" for å markere de jeg kopiert fra bokmål.
Eksempel:<gentext key="video-unsupported" text="Din nettleser støtter ikke video-taggen" lang="nb"/> Sidan det står lang="nb" er dette kanskje ok? Viss ikkje, kanskje "Nettlesaren din har ikkje støtte for video-taggen
Lagt inn.
<dingbat key="bullet" text="•"/> Ut frå «Språklege retningslinjer» bruker vi tankestrek på norsk, men dette er kanskje brukt i ein annan samanheng?
Usikker selv, så jeg beholdt den slik den var fra før. Jeg ser følgende varianter er i bruk for andre språk:
<dingbat key="bullet" text="·"/> <dingbat key="bullet" text="—"/> <dingbat key="bullet" text="•"/> <dingbat key="bullet" text="●"/> <dingbat key="bullet" text="ߦ"/> <dingbat key="bullet" text="•"/> <dingbat key="bullet" text="•"/>
ߦ er <URL: https://www.codetable.net/decimal/2022 >, mens • og • er <URL: https://www.codetable.net/decimal/8226 >, hvis jeg forstår entitetverdiene korrekt.
Ser vekenamna, både i full lengde og avkorta, er på bokmål.
Ah, godt poeng. Markerer som nb.
Eg hjelper gjerne til når eg har tid, men er ikkje sikker på om hjelpa mi er til noko nytte her sidan eg ikkje kjenner systemet xml-filene blir brukte i.
Jeg tror det er enklere enn du tror, og din hjelp vil være veldig velkommen. Det er i grove trekk å sjekke og korrigere ca. 200 strenger.
[Karl Ove Hufthammer]
Eg kjenner (iallfall litt) til DocBook, og kan ta ein kikk, men det får eg nok ikkje gjort før til helga.
Ok, da utsetter jeg innsending til mandag, så får du en sjanse til å ta en titt. :)
[Kolbjørn Stuestøl]
Det ser altså ut til at eg kan korrigere det eg finn av feil/manglande omsetjingar og sende til deg eller til lista her. Bør vel også kunne omsetje dei som er merkte med nb og sløyfe språktaggen?
Ja, det bør gjøres.
I tillegg bør en se på å samkjøre de to språkene, da de nok bør bruke de samme konseptene på samme sted. For eksempel byttet jeg 'Del' med 'Seksjon' for nynorsk som på bokmål, da engelsk 'Part' også var oversatt til 'Del', og de bør ha to ulike navn.
<dingbat key="bullet" text="•"/>: Eg reknar med at Karl Ove Hufthammer kan meir om dette.
OK.
Petter Reinholdtsen skreiv 22.09.2020 13:11:
Jeg har lagt inn verdier som mangler, fjernet duplikater og utdatete oppføringer, samt fikset en god del feil. Før jeg sender dem inn til utviklerne hadde det vært fint med korrekturlesing. Spesielt de delene merket lang="nb" i nn.xml trenger innspill fra noen med mer nynorskpeiling enn meg.
Eg har no gjort ei korrekturlesing, men eg ser no eg gjorde det på feil grein (eg brukte «master»). Så eg må gjera det på nytt. Men eg ser det er fleire endringar frå master til «updated-nb-nn» som ser ut til å gå i feil retning, dvs. frå rett til feil. Så eg spør derfor først på denne lista:
Oppføringar som:
<gentext key="Chapter" text="Kapittel"/> <gentext key="chapter" text="Kapittel"/>
I «master» var variant to «kapittel», altså med liten forbokstav, som eg meiner er rett. Det er det me brukar på norsk; me skriv for eksempel «sjå kapittel 5», ikkje «sjå Kapittel 5» (i motsetnad til på engelsk, der dei brukar stor forbokstav i «Chapter», «Table» osv.). Nokon grunn til at dette er endra?
Eg ser eg har rundt 100 endringar i diff-fila, og eg har endra der eg var sikker, men her nokre ting eg meiner me bør diskutera på lista først:
<gentext key="Bibliography" text="Bibliografi"/> <gentext key="bibliography" text="bibliografi"/>
Det er vanleg å kalla overskrifta her «Litteratur» på norsk. Er det OK? (Ein annan variant er «Kjelder». Eg minnest me har diskutert noko liknande på lista her før?)
<gentext key="Pgs" text="Sider"/> <gentext key="pgs" text="sider"/>
I kva samanheng brukar er dette brukt? Merk at me alltid brukar eintalsformer i referansar på norsk, eks. «sjå side 4–13», «sjå tabell 3.15–3.17», «sjå figur 10 og 11», i motsetnad til på engelsk, der ein skriv «pages» («pp.»), «Tables» og «Figures» når ein referer til meir enn éi side eller éin tabell/figur.
Det er generelt eit problem at det er vanskeleg å forstå i kva samanheng dei ulike tekstane i XML-fila vert brukt. For eksempel, korleis vert <template name="sect2">%n. %t</template> brukt? Finst det eit eksempeldokument som illustrerer korleis *alt* vert sjåande ut til slutt? Eg meiner me helst bør ta ein veldig grundig gjennomgang, for å sikra at alt vert rett.
Men viss eg forstår <template name="sect2">%n. %t</template> rett, er det at ei nivå 2-overskrift vert formatert slik:
3.1. Innføring
Der mellomromet etter punktumet skal vera eit hardt mellomrom. Stemmer det? (I så fall er det feil; me brukar ikkje punktum etter overskriftsnummer på norsk.)
Om desse:
<gentext key="nav-prev-sibling" text="Raskt bakover"/> <gentext key="nav-next-sibling" text="Raskt framover"/>
Dei var rare. Kva er meint her?
Når det gjeld spørsmål om «section», er det vel snakk om inndelingar markerte med ei overskrift. Det kallar me vanlegvis «avsnitt» på norsk. Det er sjølvsagt i teorien tvetydig (eit avsnitt er jo òg ein «paragraph»), men i praksis er det ikkje noko problem, for eksempel i referansar som «sjå avsnitt 3.5 på side 87».
Når det gjeld <dingbat key="bullet" text="•"/>, så er det rett som Kolbjørn seier, at me brukar (kort) tankestrek på norsk, altså «–». Det er uproblematisk å skriva han direkte i teksten; ein treng ikkje bruka teiknreferansar som – eller –. (Forresten, som eit apropos, ein av kjepphestane mine er at dette heiter *teiknreferansar*; det er *ikkje* entitetsreferansar. For eksempel «"» ein entitetsreferanse, til entiteten med namn «quot», som har verdien «"», mens " òg refererer til same teikn «"», men er ikkje ein entitetsreferanse.)
[Karl Ove Hufthammer]
I «master» var variant to «kapittel», altså med liten forbokstav, som eg meiner er rett. Det er det me brukar på norsk; me skriv for eksempel «sjå kapittel 5», ikkje «sjå Kapittel 5» (i motsetnad til på engelsk, der dei brukar stor forbokstav i «Chapter», «Table» osv.). Nokon grunn til at dette er endra?
Ja. Ideen om at key='Chapter' og key='chapter' er to ulike bruk av kapittel har vist seg å være feil. Det er derimot samme streng brukt av ulike stilark (som PDF- og HTML-stilark), og duplisert fordi en ikke har klart å spore opp alle brukerne å få dem til å standardisere på nøkkelverdi.
Jeg trodde som deg en stund, men praktisk bruk har vist at det ikke var tilfelle.
Eg ser eg har rundt 100 endringar i diff-fila, og eg har endra der eg var sikker, men her nokre ting eg meiner me bør diskutera på lista først:
<gentext key="Bibliography" text="Bibliografi"/> <gentext key="bibliography" text="bibliografi"/>
Det er vanleg å kalla overskrifta her «Litteratur» på norsk. Er det OK?
OK for meg. :)
(Ein annan variant er «Kjelder». Eg minnest me har diskutert noko liknande på lista her før?)
<gentext key="Pgs" text="Sider"/> <gentext key="pgs" text="sider"/>
I kva samanheng brukar er dette brukt? Merk at me alltid brukar eintalsformer i referansar på norsk, eks. «sjå side 4–13», «sjå tabell 3.15–3.17», «sjå figur 10 og 11», i motsetnad til på engelsk, der ein skriv «pages» («pp.»), «Tables» og «Figures» når ein referer til meir enn éi side eller éin tabell/figur.
Så vidt jeg kan se brukes malnavn olink.page.citation og page.citation til slikt som du snakker om. Har ikke sett hvor Pgs og pgs brukes.
Det er generelt eit problem at det er vanskeleg å forstå i kva samanheng dei ulike tekstane i XML-fila vert brukt. For eksempel, korleis vert <template name="sect2">%n. %t</template> brukt? Finst det eit eksempeldokument som illustrerer korleis *alt* vert sjåande ut til slutt? Eg meiner me helst bør ta ein veldig grundig gjennomgang, for å sikra at alt vert rett.
Jeg er ikke kjent med noe slikt eksempeldokument. Jeg har typesatt flere bøker med docbook som jeg lager PDF, HTML og ePub av, og der sett hvordan endel av verdiene blir brukt. Andre verdier har jeg basert meg på ren oversetting av de engelske verdiene.
<URL: https://gitlab.com/petterreinholdtsen/mekanikerord > er et jeg kun har gjort mindre endringer i standardoppsettet.
Kanskje noen kan bidra med et testdokument som kan brukes?
Men viss eg forstår <template name="sect2">%n. %t</template> rett, er det at ei nivå 2-overskrift vert formatert slik:
3.1. Innføring
Der mellomromet etter punktumet skal vera eit hardt mellomrom. Stemmer det? (I så fall er det feil; me brukar ikkje punktum etter overskriftsnummer på norsk.)
Det ser slik jeg forstår det, ja.
Om desse:
<gentext key="nav-prev-sibling" text="Raskt bakover"/> <gentext key="nav-next-sibling" text="Raskt framover"/>
Dei var rare. Kva er meint her?
Jeg tolker dem som navigasjonsknapper i en HTML-utgave av docbook som jeg selv ikke har sett.
Når det gjeld spørsmål om «section», er det vel snakk om inndelingar markerte med ei overskrift. Det kallar me vanlegvis «avsnitt» på norsk. Det er sjølvsagt i teorien tvetydig (eit avsnitt er jo òg ein «paragraph»), men i praksis er det ikkje noko problem, for eksempel i referansar som «sjå avsnitt 3.5 på side 87».
I mitt vokabular er avsnitt det som ligger mellom doble linjeskift, ekstra mye luft mellom tekstblokkene eller med innrykk, mens jeg kanskje nok brukt 'se overskrift 3.5 på side 87'
Når det gjeld <dingbat key="bullet" text="•"/>, så er det rett som Kolbjørn seier, at me brukar (kort) tankestrek på norsk, altså «–». Det er uproblematisk å skriva han direkte i teksten; ein treng ikkje bruka teiknreferansar som – eller –.
Høres bra ut.
Petter Reinholdtsen skreiv 27.09.2020 13:19:
[Karl Ove Hufthammer]
I «master» var variant to «kapittel», altså med liten forbokstav, som eg meiner er rett. Det er det me brukar på norsk; me skriv for eksempel «sjå kapittel 5», ikkje «sjå Kapittel 5» (i motsetnad til på engelsk, der dei brukar stor forbokstav i «Chapter», «Table» osv.). Nokon grunn til at dette er endra?
Ja. Ideen om at key='Chapter' og key='chapter' er to ulike bruk av kapittel har vist seg å være feil. Det er derimot samme streng brukt av ulike stilark (som PDF- og HTML-stilark), og duplisert fordi en ikke har klart å spore opp alle brukerne å få dem til å standardisere på nøkkelverdi.
Jeg trodde som deg en stund, men praktisk bruk har vist at det ikke var tilfelle.
Hm. Når eg ser (litt) nærare, ser det ut til at «gentext key»-oppføringane (òg?) vert brukte av «template»-oppføringane i *same* dokument. Eksempel:
<context name="xref-number"> […] <template name="chapter"><Chapter/> %n</template>
Det tolkar eg som at ein kryssreferanse til eit kapittel skal formaterast som
[«Chapter»-nøkklen][hardt mellomrom][kapittelnummer]
for eksempel
Kapittel 7
Og det vert vel feil på norsk (om kryssreferansane har eit prefiks, slik at det vert «Sjå Kapittel 7» eller «Sjå òg Kapittel 7»)? Det talar for å definera variantar med små bokstavar og bruka desse i malane på botnen av fila. Men eg veit ikkje om dette stemmer.
Eg ser eg har rundt 100 endringar i diff-fila, og eg har endra der eg var sikker, men her nokre ting eg meiner me bør diskutera på lista først:
<gentext key="Bibliography" text="Bibliografi"/> <gentext key="bibliography" text="bibliografi"/>
Det er vanleg å kalla overskrifta her «Litteratur» på norsk. Er det OK?
OK for meg. :)
Greitt. Då har eg endra til det (og mykje anna) i https://github.com/petterreinholdtsen/xslt10-stylesheets/pull/1.
Er fleire andre endringar der som òg bør gjerast for bokmål, men me kan eventuelt diskutera dei først.
Det er generelt eit problem at det er vanskeleg å forstå i kva samanheng dei ulike tekstane i XML-fila vert brukt. For eksempel, korleis vert <template name="sect2">%n. %t</template> brukt? Finst det eit eksempeldokument som illustrerer korleis *alt* vert sjåande ut til slutt? Eg meiner me helst bør ta ein veldig grundig gjennomgang, for å sikra at alt vert rett.
Jeg er ikke kjent med noe slikt eksempeldokument. Jeg har typesatt flere bøker med docbook som jeg lager PDF, HTML og ePub av, og der sett hvordan endel av verdiene blir brukt. Andre verdier har jeg basert meg på ren oversetting av de engelske verdiene.
<URL: https://gitlab.com/petterreinholdtsen/mekanikerord > er et jeg kun har gjort mindre endringer i standardoppsettet.
Eg tok ein kikk, men det var ei litt uvanleg bok (ordliste), utan typisk bokstruktur, så det var ikkje så mange element å kjenna att.
Men viss eg forstår <template name="sect2">%n. %t</template> rett, er det at ei nivå 2-overskrift vert formatert slik:
3.1. Innføring
Der mellomromet etter punktumet skal vera eit hardt mellomrom. Stemmer det? (I så fall er det feil; me brukar ikkje punktum etter overskriftsnummer på norsk.)
Det ser slik jeg forstår det, ja.
OK. Då fjerna eg punktumet i «nn.xml». Og der overskriftene var slik «Kapittel 1. Ei løve i gatene», endra eg det til å bruka kolon, «Kapittel 1: Ei løve i gatene».
Om desse:
<gentext key="nav-prev-sibling" text="Raskt bakover"/> <gentext key="nav-next-sibling" text="Raskt framover"/>
Dei var rare. Kva er meint her?
Jeg tolker dem som navigasjonsknapper i en HTML-utgave av docbook som jeg selv ikke har sett.
Då tippar eg det er snakk om navigering til neste element på same nivå. For eksempel, viss du er i avsnitt 2.3, som har underavsnitt 2.3.1 og 2.3.2, etterfølgt av 2.4, så vil «nav-next» gå til 2.3.1, mens «nav-next-sibling» vil hoppa heilt til 2.4. Prøver meg derfor med omsettinga «Neste på same nivå».
Når det gjeld spørsmål om «section», er det vel snakk om inndelingar markerte med ei overskrift. Det kallar me vanlegvis «avsnitt» på norsk. Det er sjølvsagt i teorien tvetydig (eit avsnitt er jo òg ein «paragraph»), men i praksis er det ikkje noko problem, for eksempel i referansar som «sjå avsnitt 3.5 på side 87».
I mitt vokabular er avsnitt det som ligger mellom doble linjeskift, ekstra mye luft mellom tekstblokkene eller med innrykk, mens jeg kanskje nok brukt 'se overskrift 3.5 på side 87'
Ja, eit avsnitt er det du seier, men det er *også* ein bolk tekst identifisert med ei overskrift. Og det er avsnitt som *vert* brukt om dette på norsk. (For litt upåliteleg, «se avsnitt» og «i avsnitt» gjev eit par millionar treff på bokmål (sikkert eit stort overestimat), mens «se overskrift» gjev eit par tusen treff, der iallfall dei første ser ut til å vera eksempel på at viser til den faktiske overskrifta, ikkje avsnittet den representerer.)
Som sagt ligg endringsforslaga mine som https://github.com/petterreinholdtsen/xslt10-stylesheets/pull/1, men her er nokre oppføringar som eg stussa på:
<gentext key="Copyright" text=""/> <gentext key="copyright" text=""/>
Nokon grunn til at desse er tomme på norsk, men ikkje på engelsk? Viss ein har ei opphavsrettside (er det det den er brukt for), ser det vel pussig ut med ei tom overskrift (i staden for overskrifta «Opphavsrett», for eksempel)?
<gentext key="Poetry" text="Poesi"/> <gentext key="poetry" text="Poesi"/>
Denne var pussig. Kva har han i DocBook å gjera? (Avhengig av korleis han vert brukt, kan kanskje «Dikt» fungera?)
<gentext key="Published" text="Utgjeven"/> <gentext key="published" text="Utgjeven"/>
Dette spørsmålet gjeld berre nynorsk. Det er litt vanskeleg med samsvarsbøying her. Ei bok er «utgjeven», men eit verk er «utgjeve». Ein seier òg at «det» er «utgjeve». Så kva er mest naturleg? Kva pleier det stå i nynorske bøker – «utgjeven» eller «utgjeve»? Eks. «Utgjeve(n) på eige forlag», «Utgjeve(n) i 1997».
<gentext key="setindex" text="Serieregister"/> <gentext key="SetIndex" text="Serieregister"/>
«Set» var omsett til «Sett», men i denne samanhengen er det snakk om det me kallar «serie» på norsk, eks. fleire bøker i ein bokserie. Men kva skal «Set Index» vera. Me brukar generelt «register» om «index», men her synest eg eigentleg «serieoversikt» passar like bra.
<gentext key="lastlistcomma" text=""/>
Berre ein kommentar om denne. Eg fjerna kommaet som stod her frå før. På norsk er for eksempel flagget «raudt, kvitt og blått», ikkje «raudt, kvitt, og blått». Bør fjerna kommaet på bokmål òg.
<gentext key="graphicdesigner" text="Grafisk utformar"/>
Dette er jo rett, men i kva samanheng vert teksten brukt? På ei kolofonside står det vel helst «Grafisk utforming: Namn/firma», ikkje «Grafisk utformar: Namn/firma». Så viss det er ein slik samanheng, bør det endrast til «Grafisk utforming».
<template name="alt.person.two.sep"> – </template><!-- separator between two authors - replacement of " and " (if lang="en") --> <template name="alt.person.last.sep"> – </template> <!-- separator between last two authors - replacement of ", and " (if lang="en") --> <template name="alt.person.more.sep"> – </template> <!-- separator between not last two authors - replacement of ", " (if lang="en") -->
Desse forstod eg ikkje heilt. Korfor ikkje berre bruka « og » (på både norsk og engelsk)?
[Karl Ove Hufthammer]
Hm. Når eg ser (litt) nærare, ser det ut til at «gentext key»-oppføringane (òg?) vert brukte av «template»-oppføringane i *same* dokument. Eksempel:
<context name="xref-number"> […] <template name="chapter"><Chapter/> %n</template>
Det tolkar eg som at ein kryssreferanse til eit kapittel skal formaterast som
[«Chapter»-nøkklen][hardt mellomrom][kapittelnummer]
for eksempel
Kapittel 7
Og det vert vel feil på norsk (om kryssreferansane har eit prefiks, slik at det vert «Sjå Kapittel 7» eller «Sjå òg Kapittel 7»)? Det talar for å definera variantar med små bokstavar og bruka desse i malane på botnen av fila. Men eg veit ikkje om dette stemmer.
Slett ingen urimelig tolking, det er jeg enig i. Men erfaringen min er at ulike brukere av disse verdiene slett ikke alle bruker malene som det virker de er tenkt brukt. Dermed er min konklusjon av 'Key' og 'key' er to navn til verdi, ikke to nøkler som skal ha henholdvis stor og liten forbokstav.
Det ser forresten ut som du har fjernet en rekke harde mellomrom, for exempel i '<template name="appendix"><Appendix/> %n: %t</template>'. Hvorfor det?
Greitt. Då har eg endra til det (og mykje anna) i https://github.com/petterreinholdtsen/xslt10-stylesheets/pull/1.
Er fleire andre endringar der som òg bør gjerast for bokmål, men me kan eventuelt diskutera dei først.
Tusen takk. Jeg tok den inn, så gjøres videre endringer derfra. Kommer uansett til å slå sammen alle endringer og sende inn en samle-commit når jeg er klar.
Eg tok ein kikk, men det var ei litt uvanleg bok (ordliste), utan typisk bokstruktur, så det var ikkje så mange element å kjenna att.
Ja, men det tror jeg er den eneste boken der jeg brukt 'standard'-stilen til dblatex. Du kan jo også ta en titt på <URL: https://github.com/petterreinholdtsen/free-culture-lessig >, men der er det mye spesialbehandling for å jobbe meg rundt svakheter i Docbook-prosessorene fra den tiden.
OK. Då fjerna eg punktumet i «nn.xml». Og der overskriftene var slik «Kapittel 1. Ei løve i gatene», endra eg det til å bruka kolon, «Kapittel 1: Ei løve i gatene».
Lurt. Men her byttet du ut hard mellomrom mellom : og E med mykt, hvilket er det motsatte av engelsk. Hvorfor det?
Ja, eit avsnitt er det du seier, men det er *også* ein bolk tekst identifisert med ei overskrift. Og det er avsnitt som *vert* brukt om dette på norsk. (For litt upåliteleg, «se avsnitt» og «i avsnitt» gjev eit par millionar treff på bokmål (sikkert eit stort overestimat), mens «se overskrift» gjev eit par tusen treff, der iallfall dei første ser ut til å vera eksempel på at viser til den faktiske overskrifta, ikkje avsnittet den representerer.)
Godt mulig du har rett, det viktigste for meg er at part og section har ulike navn. :)
Som sagt ligg endringsforslaga mine som https://github.com/petterreinholdtsen/xslt10-stylesheets/pull/1, men her er nokre oppføringar som eg stussa på:
<gentext key="Copyright" text=""/> <gentext key="copyright" text=""/>
Nokon grunn til at desse er tomme på norsk, men ikkje på engelsk? Viss ein har ei opphavsrettside (er det det den er brukt for), ser det vel pussig ut med ei tom overskrift (i staden for overskrifta «Opphavsrett», for eksempel)?
Jeg oppdaget at norske bøker ikke har med det ordet på kolofonsidene sine. Der det på engelsk står:
Copyright © Forfatter
står det i norske bøker
© Forfatter
Den effekten får vi altså ved å sette Copyright og copyright til tom streng.
<gentext key="Poetry" text="Poesi"/> <gentext key="poetry" text="Poesi"/>
Denne var pussig. Kva har han i DocBook å gjera? (Avhengig av korleis han vert brukt, kan kanskje «Dikt» fungera?)
Ingen aning hvor den blir brukt. Antar det er noe Docbook 5-greier jeg ikke har vært borte i.
<gentext key="Published" text="Utgjeven"/> <gentext key="published" text="Utgjeven"/>
Dette spørsmålet gjeld berre nynorsk. Det er litt vanskeleg med samsvarsbøying her. Ei bok er «utgjeven», men eit verk er «utgjeve». Ein seier òg at «det» er «utgjeve». Så kva er mest naturleg? Kva pleier det stå i nynorske bøker – «utgjeven» eller «utgjeve»? Eks. «Utgjeve(n) på eige forlag», «Utgjeve(n) i 1997».
Finner 'Published' kun brukt i XSL-reglene for 'slides' og 'epub', mens jeg ikke finner noen bruk av 'published'. Hjelper det?
<gentext key="setindex" text="Serieregister"/> <gentext key="SetIndex" text="Serieregister"/>
«Set» var omsett til «Sett», men i denne samanhengen er det snakk om det me kallar «serie» på norsk, eks. fleire bøker i ein bokserie. Men kva skal «Set Index» vera. Me brukar generelt «register» om «index», men her synest eg eigentleg «serieoversikt» passar like bra.
Godt poeng, enig.
<gentext key="lastlistcomma" text=""/>
Berre ein kommentar om denne. Eg fjerna kommaet som stod her frå før. På norsk er for eksempel flagget «raudt, kvitt og blått», ikkje «raudt, kvitt, og blått». Bør fjerna kommaet på bokmål òg.
Jepp.
<gentext key="graphicdesigner" text="Grafisk utformar"/>
Dette er jo rett, men i kva samanheng vert teksten brukt? På ei kolofonside står det vel helst «Grafisk utforming: Namn/firma», ikkje «Grafisk utformar: Namn/firma». Så viss det er ein slik samanheng, bør det endrast til «Grafisk utforming».
Vet ikke, men eneste relevante jeg finner er i website/schema/dtd/website.dtd.
<template name="alt.person.two.sep"> – </template><!-- separator between two authors - replacement of " and " (if lang="en") --> <template name="alt.person.last.sep"> – </template> <!-- separator between last two authors - replacement of ", and " (if lang="en") --> <template name="alt.person.more.sep"> – </template> <!-- separator between not last two authors - replacement of ", " (if lang="en") -->
Desse forstod eg ikkje heilt. Korfor ikkje berre bruka « og » (på både norsk og engelsk)?
Jeg tror " and ", ", and " og ", " er de operative bitene her, dvs. innholdet mellom ", ikke "-tegnene. Dvs. relatert til lastlistcomma. Men – er så vidt jeg forstår EN DASH, URL:https://www.fileformat.info/info/unicode/char/2013/index.htm, og jeg forstår ikke hvorfor den er brukt der.
Finner verdiene kun brukt i xsl/html/biblio-iso690.xsl og xsl/fo/biblio-iso690.xsl sin iso690.author.list, uten at jeg ble så mye klokere av det jeg fant der.
Må innrømme at når jeg ikke har forstått verdiene, så har jeg beholdt dem som på engelsk. :)
Jeg laget forresten en par demofiler som kan brukes til å teste hvordan docbook bygger bøker og serier, tilgjengelig fra <URL: https://gitlab.com/petterreinholdtsen/docbook-example >.
Den bygger med PDF-er med dblatex og xsltproc/fop, epub med dbtoepub og html med xmlto. Samtlige arver språkvalg fra de filene jeg håper å korrigere for bokmål og nynorsk.
[Petter Reinholdtsen]
Jeg laget forresten en par demofiler som kan brukes til å teste hvordan docbook bygger bøker og serier, tilgjengelig fra <URL: https://gitlab.com/petterreinholdtsen/docbook-example >.
Og for de som vil se hvordan utgangspunktet er før oppsettet for nb og nn blir korrigert, så har jeg laget en gren nb-nn-output tilgjengelig fra <URL: https://gitlab.com/petterreinholdtsen/docbook-example/-/tree/nb-nn-output >.
Det viser kanskje hvorfor jeg gikk igang med å fikse malene.
Da er forslaget til endring for bokmål og nynorsk sendt inn til utviklerne, <URL: https://github.com/docbook/xslt10-stylesheets/pull/211 >.
Så får vi se hvor lang tid det tar før noen rekker se på om den kan tas inn der. :)