Du er her: Forside / KorpusDK / Hjælp til søgning / Faldgruber

Faldgruber

Handlinger tilknyttet webside
Hvorfor er der fejl i teksterne?
Faldgruber ved søgning i korpus: Hvad finder man i et korpus, og hvorfor er der fejl i teksterne?

Hvorfor søge i KorpusDK?

Man søger i et korpus for at få at vide hvordan sproget bruges i praksis. Et korpus kan ikke bruges som en retskrivningsordbog til at fortælle hvad der er rigtigt og forkert. Søgeresultatet er ikke bearbejdet af redaktører på samme måde som artiklerne i en ordbog. Tværtimod gengives teksterne helt uredigeret sådan som forfatterne skrev dem.

KorpusDK adskiller sig på to vigtige punkter fra de mange sider på internettet som man får frem ved søgning med en søgemaskine:

  • Teksterne er udvalgt og sammensat så de viser et bredt udsnit af teksttyper
  • Opmærkningen af teksterne og en avanceret søgefunktion sikrer at man kan udføre præcise sproglige undersøgelser i korpusmaterialet

Korrekthed

Der er ikke nogen garanti for at sproget i et søgeresultat følger Retskrivningsordbogens anvisninger. KorpusDK indeholder autentiske eksempler på dansk sprogbrug. Derfor vil nogle tekster indeholde sprog der afviger fra den norm som fastsættes af Dansk Sprognævn, måske fordi en enkelt sprogbruger har fået galt fat i et udtryk eller simpelt hen har tastet forkert. For det meste vil antallet af de "korrekte" eksempler dog langt overstige de "fejlagtige".

I nogle tilfælde optræder der også uautoriserede former i bøjningsoversigten. Det skyldes at de mest udbredte former er blevet registreret ved opmærkningen, og derfor optræder de også i søgeresultatet – eller kan vælges fra listen over bøjningsformer under Udvidet søgning.

Endelig kan der være fejl i opmærkningen. Mængden af tekster i KorpusDK er så stor at det ikke er muligt at opmærke teksterne manuelt. Derfor gøres det automatisk, og med de metoder og værktøjer vi kender i dag, må man acceptere at opmærkningen bliver lidt mindre end perfekt. Hvis man kommer ud for et lidt underligt resultat, kan det altså skyldes en fejl i den automatiske opmærkning.

Sprogfolk har ofte stor gavn af de eksempler som afviger fra den normale sprogbrug. Det kan være en tilfældig fejl, men det kan også være et tegn på at sprogbrugen er under forandring.

Konkordans: tabt bag_vogn (Faldgruber)
 tabt bag af en vogn eller tabt bag en vogn? (vis i fuld størrelse)

I eksemplet til højre kan man fx se at det faste udtryk tabt bag af en vogn har fået hård konkurrence af varianten tabt bag en vogn.

Det er et spørgsmål om temperament om man vil kalde den slags variation for "fejl" eller for en ny og opfindsom brug af et eksisterende udtryk. I praksis er det op til leksikografernes skøn at afgøre hvornår en bestemt sprogbrug er tilstrækkelig udbredt og etableret til at det er rimeligt at beskrive den i en ordbog.

Hurtigt i gang

Der er 3 søgemuligheder på KorpusDK:

Teksteksempler

Hvilke fugle skydes med kanoner?

Naboord

Hvilke ord optræder hyppigt sammen med "bevægelse"?

Faste udtryk

Find de faste udtryk som "hus" optræder i