Lemma (lingvistika)

V lingvistice lemma (též lema, mn. č. lemmata) označuje:

  • základní podobu (alolex) lexému (tedy slova nebo fráze), která se uvádí jako reprezentativní ve slovnících (slovníkový tvar), nebo
  • souhrn všech tvarů určité lexikální jednotky (lexému) reprezentovaný jejím základním (heslovým) tvarem (lemmatem v předchozím významu)

V textové analýze se každý konkrétní tvar daného lemmatu označuje jako typ, každá konkrétní realizace slova se nazývá token.

Odlišuje se od kořene slova, ten je nejmenší významovou jednotkou slova; odlišuje se i od tokenu a od stematizace, kdy se hledá kmen slova.

Nástroj (např. počítačový program), který určitému tvaru slova přiřadí jeho lemma, se nazývá lemmatizátor.

Příklady a využití

Např. ve větě "Netrpěliví zákazníci stáli v obchodě i před obchodem, ovšem před obchodem jich čekalo jen několik." se k lemmatu obchod vyskytují tři tokeny dvou typů (obchodě, obchodem).

Poměrem typů a tokenů lze přibližně odhadnout jazykovou bohatost textu (která je ovšem ovlivněna také délkou a specifikací textu).[1]

Ve funkčním generativním popisu (FGP) se rozlišuje morfologické (syntaktické) m-lema od tektogramatického (sémantického) t-lematu.

V češtině se jako slovníkový tvar zpravidla používá:

V jiných jazycích může být konvence pro výběr lemmatu odlišná. V latině se za verbální lemma považuje první osoba singuláru přítomného času, případně třetí osoba u neosobních sloves jako kupř. ningit (sněží).

Odkazy

Reference

  1. ČERMÁK, František. Lexikon a sémantika. Praha: NLN, 2010. S. 232–233. 

Externí odkazy

Pahýl
Pahýl
Tento článek je příliš stručný nebo postrádá důležité informace.
Pomozte Wikipedii tím, že jej vhodně rozšíříte. Nevkládejte však bez oprávnění cizí texty.
Autoritní data Editovat na Wikidatech