Du er her: Forside / KorpusDK / Hjælp til søgning / Hjælp: Naboord

Søgning efter naboord

Handlinger tilknyttet webside
Vejledning i at søge efter naboord
Naboord er ord som statistisk optræder med større hyppighed i teksterne end hvis ordene var tilfældigt fordelt. Derfor er de egnede til at finde eksempler på typisk sprogbrug.

Hvad er naboord?

Naboord: hus (Naboord)
Typiske naboord for hus (vis i fuld størrelse)

Ved naboord forstås ord som typisk optræder sammen med et søgeord. Fagligt kaldes de også for kollokationer. Når to ord siges at være naboord, betyder det at der er større sandsynlighed for at netop de to ord optræder sammen, end at ordene optræder sammen med andre ord. Ordet stråtækte optræder fx næsten udelukkende sammen med ordet hus – det er overrepræsenteret, og derfor er stråtækt et signifikant naboord til hus. Dette er  også et ord der optræder sammen med hus, men det er i sig selv et meget mere udbredt ord end stråtækt. I modsætning til stråtækt optræder dette også sammen med en masse andre ord. Derfor er dette ikke noget signifikant naboord til hus.

Naboord kan give et fingerpeg om et søgeords betydning. Af statistikken kan man hurtigt se at en bevægelse enten kan være konkret (glidende, roterende, langsom) eller betegne en organisation (nyreligiøs, folkelig, demokratisk).

De kan også fortælle om ordenes konstruktionsmuligheder. Hedder det typisk finde, møde, ramme eller træffe en beslutning? Og udøver, øver eller begår man vold?

Naboord kan bruges til at komme på sporet af faste udtryk eller undersøge variationen i et udtryk: anden etnisk baggrund, på den lange bane eller trådløst netværk.

Man kan få vist forekomsterne af et typisk ordpar i KorpusDK ved at klikke på et af naboordene i statistikken. Så udføres en søgning efter teksteksempler på naboordet sammen med søgeordet.

Indstilling af søgeordet

Søgeordet kan indstilles på to måde: Med hensyn til ordklasse og med hensyn til bøjningsformer. Vælger man at søge efter alle bøjningsformer, skal man indtaste grundformen af ordet, hvorefter den statistiske beregning foretages på grundlag af alle ordets bøjningsformer. Hvis man kommer til at indtaste en bøjet form af ordet og vælger alle bøjningsformer, udføres den statistiske beregning alene på den indtastede form.

Findes der flere ord med samme grundform, kan man med fordel begrænse den statistiske beregning til det ene af ordene ved at vælge en bestemt ordklasse, fx have, vb. 

Korpusser

Kun de to korpusser, Korpus 90 og Korpus 2000, er tilgængelige i Naboordssøgning – det er ikke muligt at beregne naboord for KorpusDK-korpusset.

Korpus 90 er valgt som standard fordi Korpus 2000 rummer en overvægt af avistekster i forhold til andre teksttyper, og Korpus 90 derfor bør give et mere dækkende indtryk af sproget.

Den statistiske beregning

Man kan statistisk beregne naboord ved hjælp af forskellige metoder. I KorpusDK er der som grundindstilling valgt metoden Mutual Information. I boksen Statistiske Funktioner på søgeresultatsiden er der mulighed for at ændre beregningsmetoden til en anden metode. Læs mere om statistiske funktioner

For begge metoder gælder det at beregningen sker på de ord der i en sætning står 1 til 2 pladser til højre og venstre for søgeordet. Ord der står længere væk fra søgeordet, indgår ikke i beregningen.

Visning af resultatet

Søgeresultatet vises som en liste over de ord der typisk optræder sammen med søgeordet. Ordene er opført i rækkefølge efter faldende score, med det mest signifikante ord øverst. Som grundindstilling er valgt en samlet liste over naboord. Under søgefeltet er der dog mulighed for at gruppere resultatet sådan at resultatet opgøres efter ordklasse.

Hurtigt i gang

Der er 3 søgemuligheder på KorpusDK:

Teksteksempler

Hvilke fugle skydes med kanoner?

Naboord

Hvilke ord optræder hyppigt sammen med "bevægelse"?

Faste udtryk

Find de faste udtryk som "hus" optræder i