sobota, 3 stycznia 2009

Ile słów jest w języku?

Fragment listu i odpowiedzi (http://poradnia.pwn.pl/lista.php?id=7634) Witam serdecznie! Piszę do Państwa, ponieważ mam pytanie: ile słów liczy język polski na chwilę obecną (chodzi mi oczywiście o przybliżoną liczbę)? Pytam, ponieważ dostałam taką pracę domową z angielskiego. Nauczyciel chce udowodnić wyższość języka angielskiego nad polskim i prosi o takie dane w konkretnych liczbach. Twierdzi, że język angielski liczy 2 mln słów. (…) Piszę do Państwa, ponieważ wiem, że jesteście Państwo niejako autorytetem w tej kwestii. Pozdrawiam, (…) Nie da się policzyć zbioru słów żadnego języka naturalnego, gdyż słownictwo to zbiór otwarty. (…) można się o tym przekonać, zaglądając np. do Cambridge Encyclopedia of Linguistics Davida Crystala. Można oczywiście policzyć słowa w słownikach, ale należy pamiętać, że różnice będą świadczyć przede wszystkim o poziomie leksykografii w danym kraju i o przyjętych konwencjach hasłowania, a dopiero wtórnie o bogactwie słownictwa. Niejeden autor próbował już dowodzić wyższości jakiegoś języka nad innymi, czasem było to pozwiązane ze swoistym poczuciem patriotyzmu. Tymczasem prawie każdy język jest na swój sposób doskonały, gdyż zaspokaja potrzeby posługującej się nim społeczności. O wyższości angielszczyzny nad polszczyzną można by mówić ewentualnie w tym sensie, że więcej nasz język zapożycza z angielskiego niż na odwrót. Ale ten fakt wynika raczej z globalnej roli języka angielskiego jako narzędzia komunikacji oraz z przewagi cywilizacyjnej USA (i niektórych innych krajów angielskojęzycznych) nad Polską niż z jakiejś tajemniczej wyższości systemu językowego angielszcyzny (np. jego gramatyki) nad systemem polszczyzny. Warto na koniec zapytać, co rozumiemy przez słowa. Liczba związków chemicznych podobno przekracza milion, ale czy ich nazwy są słowami języka polskiego (albo jakiegokolwiek innego języka naturalnego)? Albo czy są słowami związki frazeologiczne? Można szacować, że liczba współcześnie używanych słów polskich (z pominięciem frazeologizmów oraz terminów znanych wyłącznie specjalistom) jest rzędu setek tysięcy, ale po uwzględnieniu frazeologii liczba ta osiąga rząd milionów. To, co widzimy w słownikach frazeologicznych, to tylko wierzchołek góry lodowej. — Mirosław Bańko, PWN Bardzo interesująca wypowiedź. Według Teorii Słowa zbiór słów jest zbiorem otwartym, ale zbieżnym. Struktura rozkładu słów w słowniku wskazuje, że liczba słów zarówno z małą jak i dużą liczbą liter je tworzących jest mniej prawdopodobna niż np. liczba słów z liczbą liter 9 – i maleje do 0, przy liczbie liter dążących do 30. W rzeczywistości rozkład prawdopodobieństwa występowania słów o określonej długości w słowniku może mieć przebieg pokazany na rysunku poniżej – odpowiadający powierzchni rzeczywistej (krzywa pomiędzy krzywą słownika idealnego (zawierającego wszystkie możliwe kombinacje słów) – reprezentowaną przez krzywą ciała czarnego i słownika uproszczonego (uproszczonego minimalna liczba słów potrzebną do komunikacji) – reprezentowaną przez krzywą ciała szarego. Sytuację języka rzeczywistego przedstawia również rysunek, porównujący promieniowanie ciała doskonale czarnego ciała mniej doskonałego – np. kwarcu:
Prześlij komentarz