Fra bog til skærm
Ordbog over det danske Sprog er i sin trykte form et pladskrævende (1,5 hyldemeter) og alene pga. oplysningernes mængde og karakter ikke ganske lettilgængeligt værk. Til gengæld er ODS helt uomgængelig for den der er interesseret i det danske sprog i den periode ordbogen dækker.
Det er derfor oplagt at værket findes i en lettilgængelig form på nettet. Netordbogen fylder ikke noget og er lige til at slå op i for alle der interesserer sig for det danske sprog. Det Danske Sprog- og Litteraturselskab (DSL) har digitaliseret værket, og det har ligget på nettet som en del af ordnet.dk siden november 2005.
Digitalisering
Den praktiske opgave med at digitalisere ODS er sket i samarbejde med Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften, en afdeling ved universitetet i Trier. Denne afdeling stod også for digitaliseringen af Grimms ordbog, idet den store tyske nationalordbog blev tastet ind i Nanjing i Kina af firmaet TQY Doublekey.
Efter et besøg på universitetet i Trier besluttede ordnet.dk's redaktion at digitaliseringen af ODS skulle virkeliggøres efter de samme overordnede principper der havde været gældende for digitaliseringen af Grimms ordbog. Ideen om at skanne ODS ind blev hurtigt forkastet fordi de mange diakritiske tegn, symboler, forskellige skriftsnit i værket – antikva, kursiv, fed skrift, spatieret skrift osv. – ville føre til så mange fejl at det ville blive nødvendigt med en resursekrævende korrekturlæsning af hele den skannede ordbog. Svenska Akademiens Ordboks erfaringer med skanning af et lignende værk fristede ikke til en gentagelse.
Forløbet
Digitaliseringen forløb på følgende måde:1. fase:
De 28 ODS-bind blev sendt til Kina først på sommeren 2004. Det kinesiske firma indtastede to uafhængige versioner vha. et almindeligt tekstbehandlingsprogram (Word). Dette arbejde blev afsluttet i foråret 2005 og tog altså under et år.
2. fase:
Tekstbehandingsfilerne blev sendt til Trier, hvor Kompetenzzentrum lavede en sammenkøring og tilretning af de to versioner. De tekstlinjer der indeholdt tvivlstilfælde, blev isoleret og sendt til kontrol hos DSL, der rettede dem manuelt. Resultatet fra Trier er en digital kopi af papirmanuskriptet. I tekstfilerne er alle papirudgavens typografiske kendetegn blevet bevaret med opmærkninger i teksten.
3. fase:
De typografiske filer konverteres til et strukturopmærket xml-format hvor de forskellige betydningselementer i en ordbogsartikel er genkendt. Dette arbejde er påbegyndt, men endnu langtfra afsluttet. En første version med det digitale forlæg konverteret til en simpel html-version har ligget tilgængelig på nettet siden november 2005. Den nuværende version indeholder en indholdsmæssig genkendelse af de vigtigste elementer i hver enkelt ordbogsartikel (opslagsord, ordklasse, betydninger, citater). Versionen omfatter desuden indhold fra Supplementet til ODS, men ikke alt indhold. De fleste nye artikler fra ODS-Supplementet er med, hvorimod tilføjelser og ændringer til eksisterende artikler mangler at blive tilføjet. Det vil ske gradvis. Slå op i ODS.
