Spørgsmål og svar
- 1 Generelt
- 1.1 Hvad er et korpus?
- 1.2 Hvilke tekster indeholder KorpusDK?
- 1.3 Hvor meget vises der af teksterne i KorpusDK?
- 1.4 Kan man bruge KorpusDK som retskrivningsordbog?
- 1.5 Kan man finde alle danske ord i KorpusDK?
- 1.6 Kan man se hvad ordene betyder?
- 1.7 Er der eksempler på talesprog i KorpusDK?
- 2 Teksteksempler
- 2.1 Hvad er teksteksempler?
- 2.2 Hvorfor giver min søgning intet resultat?
- 2.3 Hvorfor kan man ikke se flere linjer ad gangen på skærmen?
- 2.4 Hvorfor tager min søgning så lang tid?
- 2.5 Hvorfor får jeg et andet resultat når jeg søger med "alle bøjningsformer" slået til end når jeg har valgt alle bøjningsformer manuelt?
- 2.6 Hvorfor søge med søgeattributter?
- 2.7 Hvordan får jeg vist opmærkningen i mit søgeresultat?
- 2.8 Hvordan reduceres en konkordans?
- 3 Naboord
- 4 Faste udtryk
Generelt
Hvad er et korpus?
Et korpus er en stor samling autentiske tekstuddrag der alle har et bestemt format og er forsynet med bestemte oplysninger – det kan fx være at der til alle ord er oplysning om deres respektive ordklasser, og at det er angivet hvornår og af hvem teksten er skrevet. Tekstuddragene er oftest udvalgt efter bestemte kriterier, fx at korpusset skal repræsentere en bestemt periode, teksttype eller lignende. Korpusser som Korpus 2000 og Korpus 90 består fx af tekster fra bestemte tidsrum, hhv. 1998-2002 og 1988-1992.
Hvilke tekster indeholder KorpusDK?
KorpusDK består af to delkorpusser, Korpus 2000 og Korpus 90, og indeholder et bredt udvalg af tekster, både private tekster (dagbogsoptegnelser, private breve, lejlighedssange osv.) og offentlige tekster (bøger, noveller, avisartikler, ugebladsartikler osv.). Se hvem der har leveret tekster til Korpus 2000 og til Korpus 90.
Hvor meget vises der af teksterne i KorpusDK?
Når man søger i KorpusDK, kan man kun se uddrag af de tekster som korpusset består af. Det vil altså ikke være muligt at læse hele den tekst som søgeordet indgår i. I et korpus er det nemlig ikke teksterne i deres helhed der er interessante, men de sproglige konstruktioner i de enkelte sætninger. KorpusDK viser derfor kun så stort et tekstudsnit som er tilladt inden for reglerne om ophavsret.
Kan man bruge KorpusDK som retskrivningsordbog?
KorpusDK indeholder autentiske eksempler på dansk sprogbrug. Det betyder at der ikke er nogen garanti for at det anvendte sprog følger anvisningerne i fx Retskrivningsordbogen. Der vil både forekomme stavefejl og sproglige afvigelser i forhold til den sprogbrug der er normeret af Dansk Sprognævn.
Kan man finde alle danske ord i KorpusDK?
Nej. Selvom KorpusDK indeholder ca. 56 millioner ord, vil der med sikkerhed være en del ord som man leder forgæves efter. Hvilke ord der forekommer, afhænger helt af de tekster som er repræsenteret i korpusset.
Kan man se hvad ordene betyder?
Der er ikke nogen angivelse af ordenes betydning i korpusset, så hvis betydningen ikke fremgår af sammenhængen, kan man slå op i fx Ordbog over det danske Sprog hvis man vil have en præcis definition af ordet. I løbet af 2008 vil der også blive mulighed for at slå op i Den Danske Ordbog her på hjemmesiden.
Er der eksempler på talesprog i KorpusDK?
Teksterne i KorpusDK er baseret på skriftsprog. Direkte gengivet talesprog findes ikke i korpusset, og man kan derfor ikke gennem søgninger finde forskelle mellem konstruktioner i talesprog og skriftsprog. Heller ikke interviews fra blade, aviser osv. kan siges at gengive decideret talesprog da fx øhh, stammen og halvfuldendte sætninger ofte fjernes når interviewet skrives ned.
Teksteksempler
Hvad er teksteksempler?
Teksteksempler er små tekstuddrag der indeholder det eller de ord man har valgt at søge på. Eksemplerne præsenteres i linjer der viser søgeordet i en konkret sammenhæng hvor det er blevet brugt. Linjerne kan sorteres på forskellig måde, fx efter de ord der står til venstre eller til højre. Læs mere om teksteksempler
Hvorfor giver min søgning intet resultat?
Der kan være flere grunde til at en tilsyneladende tilforladelig søgning ikke giver noget resultat eller måske et uventet resultat. Ofte kan den automatiske og ikke fejlfri opmærkning være en del af årsagen. Indtaster man fx ordet nærmest i søgeboksen og søger med Alle bøjningsformer slået til, får man kun 3 teksteksempler. Det skyldes fejl i opmærkningen. Hvis man i stedet indtaster nærmest.* og vælger Kun indtastede former, vises 5000 forekomster. Ved at trykke på + og slå attributterne "lemma" og "pos" til kan man så få opklaret at nærmest er opfattet som en bøjningsform af nær.
Hvorfor kan man ikke se flere linjer ad gangen på skærmen?
I visningen af teksteksempler vises kun sider med højst 50 linjer ad gangen. Man kan se andre sider ved at klikke på næste side eller forrige side eller på sidetallene i midten.
Hvorfor tager min søgning så lang tid?
Der kan være flere grunde til at det varer længe før en søgning giver et resultat:
- Serveren kan være overbelastet: Hvis mange brugere samtidig foretager en søgning, kan der opstå kødannelse og flaskehalse på vores server
- Du har søgt på et meget normalt ord, som optræder mange gange i korpus. Især hvis:
- Du har valgt at sortere konkordansen efter højre og venstre kontekst (spalte)
- Du har valgt at søge på slutningen af et ord, enten ved at vælge Slutningen af ordet fra dropdownboksen på siden for standardsøgning, eller ved at angive et regulært udtryk i en søgning, fx .*agtig (dvs. "alle ord der ender på agtig")
Hvorfor får jeg et andet resultat når jeg søger med "alle bøjningsformer" slået til end når jeg har valgt alle bøjningsformer manuelt?
Når man vælger Alle bøjningsformer, søges der i de automatisk opmærkede former for søgeordet, eller lemmaet som det også kaldes (lemma: søgeord i grundform med alle tilhørende bøjningsformer).
Når man slår alle bøjningsformer til under Vælg bøjningsformer, søges der efter nøjagtig de strenge som fremgår af oversigten.
Fordelen ved at vælge Alle bøjningsformer er at søgningen går hurtigere. Ulempen er at der kan være fejl i den automatiske opmærkning. Søgeresultatet er derfor ikke helt så pålideligt.
Fordelen ved at vælge fra menuen under Vælg bøjningsformer er at man ved præcis hvad der søges efter. Ulempen kan være at søgningen tager længere tid fordi den skal udtrykkes som en kompliceret søgning: "Søg efter form A eller form B eller form C ..."
Hvorfor søge med søgeattributter?
Søgeattributter er de oplysninger som hvert enkelt ord i KorpusDK er blevet forsynet med som led i den automatiske opmærkning. De gør det muligt at søge helt præcis efter bestemte oplysninger. Læs mere om søgeattributter.
Hvordan får jeg vist opmærkningen i mit søgeresultat?
Når du står på søgeresultatet for en søgning efter teksteksempler, skal du klikke på det lille +-tegn til venstre i indstillingspanelet. Derved udvider indstillingspanelet sig med en ekstra linje. Her kan du reducere konkordansen og ændre antallet af ord der vises ved siden af søgeordet, men det er også her du kan vælge at få vist de forskellige attributter indgår i opmærkningen af ord i korpus. Hvis du fx vil se ordklasseopmærkningen, skal du slå attributten pos til og trykke på knappen Skift indstilling. Se liste over søgeattributter.
Hvordan reduceres en konkordans?
Et søgeresultat kan maksimalt indeholde 5000 forekomster. Hvis der er flere forekomster, reduceres konkordansen automatisk til 5000. Det er ikke blot de første 5000 forekomster der vises, men reduktionen sker ved at der hentes stikvise eksempler jævnt fordelt over hele korpus. På den måde giver resultatet et retvisende billede af sprogbrugen. Der er dog ikke tale om randomisering i statistisk forstand, men reduktionen foretages sådan at det er de samme 5000 forekomster der vises når man gentager søgningen.
Naboord
Hvad er naboord?
Naboord er ord der typisk optræder sammen og ofte udgør faste forbindelser som fx lide afsavn, anlægge et skøn, et bragende bifald, den daglige dosis. Læs mere om naboord
Faste udtryk
Hvad er faste udtryk?
Faste udtryk er forbindelser af to eller flere ord der ikke er kombineret tilfældigt og frit med hinanden, men netop afspejler den typiske måde at udtrykke sig på. Det kan fx være billedlige udtryk som tage tyren ved hornene eller ordsprog som mange bække små gør en stor å. De faste udtryk i KorpusDK stammer fra Den Danske Ordbog. Læs mere om faste udtryk
Hvorfor finder jeg ikke teksteksempler på et bestemt fast udtryk?
At der ikke findes teksteksempler til et fast udtryk, kan skyldes at søgeudtrykket er "for præcist" og dermed ikke finder de forventelige variationer af det faste udtryk, fx variation i bøjning og tid.
- Prøv at redigere søgeudtrykket (knappen Redigér på resultatsiden for teksteksempelsøgning), og fjern eventuelle 'småord' (fx præpositioner og pronomener).
