niedziela, 22 marca 2009

Wykaz miast w Polsce

... ma również rozkład z maksimum dla n=6 (7) W wykazie na stronie http://pl.wikipedia.org/wiki/Miasta_w_Polsce, znajduje się (tylko!) 1101 miejscowości ... lub - na podstawie słownika na stronie http://popgniezno.jogger.pl/2008/07/17/spis-polskich-miast/, maksimum dla n=7:

środa, 18 marca 2009

Wywiad z Barackiem Obamą

Poddałem analizie zbiór słów zawartych w wywiadzie z Barackiem Obamą, przeprowadzonym 1 listopada 2007, opublikowanym na łamach The New York Times (http://www.nytimes.com/2007/11/01/us/politics/02obama-transcript.html) Wywiad - 1 335 słów bez powtórzeń (cały wywiad zawiera 7 082 słowa). Wykres rozkładu: Wykres rozkładów cząstkowych zbiorów słów, narastający co 100 słów: Wniosek: Każdy rozkład cząstkowy zbioru słów, narastający co 100 słów, zachowuje podobne cechy do rozkładu wszystkich słów bez powtórzeń zawartych w wywiadzie.

Stary Testament - analiza

Poddałem analizie wyrazy zaczynające się na literę a dla zbioru słów Starego Testamentu. Stary Testament - 44 126 słów (bez powtórzeń). Wykres rozkładu: Stary Testament, słowa zaczynające się na literę a - 843 słowa. Wykres rozkładu: Wykres rozkładów cząstkowych, słów zaczynających się na literę a, narastający co 50 słów: Wnioski: 1. Rozkład zbioru słów zaczynających się na literę a ma podobne cechy jak rozkład wszystkich słów bez powtórzeń Starego Testamentu. 2. Każdy rozkład cząstkowy (cząstkowy - narastający co 50 słów) zbioru słów zaczynających się na literę a, zachowuje podone cechy do rozkładu wszystkich słów zaczynających się na a.

Słownik 230 - analiza

Poddałem analizie wyrazy zaczynające się na literę "a" dla zbioru słów słownika zawierającego 230 tys. wyrazów Słownik - 230 450 słów. Wykres rozkładu: Zbiór wyrazów słownika, zaczynających się na literę a - 6 756 słów. Wykres rozkładu: Wykres rozkładów cząstkowych, słów zaczynających się na literę a, narastający co 500 słów: Wnioski: 1. Rozkład zbioru słów zaczynających się na literę a ma podobne cechy jak rozkład wszystkich słów zbioru Słownika 230. 2. Każdy rozkład cząstkowy (cząstkowy - narastający co 500 słów) zbioru słów zaczynających się na literę a, zachowuje podobne cechy do rozkładu wszystkich słów zaczynających się na literę a.

Nazwiska polskie - analiza

Poddałem analizie wyrazy zaczynające się na literę "a" dla zbioru słów "Nazwiska polskie". "Nazwiska polskie" - 418 770 słów. Wykres rozkładu: "Nazwiska polskie" zaczynające się na literę a - 6 780 słów. Wykres rozkładu: Wykres rozkładów cząstkowych, słów zaczynających się na literę a, narastający co 500 słów: Wnioski: 1. Rozkład zbioru słów zaczynających się na literę a ma podobne cechy jak rozkład wszystkich słów zbioru "Nazwiska polskie". 2. Każdy rozkład cząstkowy (cząstkowy - narastający co 500 słów) zbioru słów zaczynających się na literę a, zachowuje podobne cechy do rozkładu wszystkich słów zaczynających się na literę a.

Rozkłady według alfabetu

Słownik zawierający 230 tys. wyrazów. Rozkład zbioru słów Słownika zaczynających się od kolejnych liter alfabetu. Każdy rozkład wykreślony został innym kolorem. (Najwyższy rozkład jest dla słów zaczynających się na literę "p"). Wniosek: Wszystkie rozkłady słów według alfabetu są podobne i mają maksimum dla słów o długości od 8 do 11. Rozkład całego słownika przedstawiony poniżej, ma maksimum dla n=9. Stary Testament, 44 126 słów bez powtórzeń. Rozkład zbioru słów Starego Testamentu zaczynających się od kolejnych liter alfabetu. Każdy rozkład wykreślony został innym kolorem. Wniosek: Wszystkie rozkłady słów według alfabetu są podobne i mają maksimum dla słów o długości od 6 do 9. Rozkład całego słownika Starego Testamentu (słowa bez powtórzeń) przedstawiony poniżej, ma maksimum dla n=8.

piątek, 13 marca 2009

Liczebniki

Poddałem badaniu zbiór liczebników od 1 do 65 tys. zapisanych w języku polskim. Rozkład z powtórzeniami - czyli wszystkie słowa w zbiorze: Rozkład bez powtórzeń - czyli każde słowo tylko raz:

wtorek, 10 marca 2009

Myślenie multiplikatywne

Przez całe zycie, piszemy swoją książkę. Kisążkę, która jest historią, zapisem naszego życia. Przechowujemy ją w naszym umyśle, naszych wspomnieniach. Otwieramy - za każdym gdy myslimy w teraźniejszości. Tu i teraz. I wciąż wydaje nam się, że do tej książki możemy swobodnie dodawać kolejne słowa albo je usuwać, odejmować, zapominać... Ale słowa, które wchodzą do naszej książki, wchodzą w koniunkcję z każdym innym słowem książki. Tworzą z innymi słowami iloczyn a nie sumę. Nie są tylko kolejnym dodanym, niezależnym słowem. Stają się zależne od pozostałych słów w książce. Bo oddziaływanie słów w umyśle ma charakter multiplikatywny. Każde słowo powiązane jest z każdym innym – iloczynem. Wszystkie słowa są w ten sposób zależne od siebie. Brak jakiegokolwiek słowa – zmienia książkę, w większym lub mniejszym stopniu. Zmienia jej treść. Zmienia nasze poglądy, wyobrażenia. Zmienia nas. Taki jest nasz umysł. Jest iloczynem powiązań komórek – a nie tylko ich sumą. Brak jakiejś cżęści mózgu zmienia go – więc zmienia nas. ... Jest jeszcze dużo pytań, bez odpowiedzi. Są podpowiedzi intuicji, poszukiwania kolejnych słów i powiązań między nimi ... ... Czy iloczyn słów wzajemnie zależnych można rozbić poprzez ich dzielenie? (Bo dzielenie jest działaniem odwrotnym do mnożenia). W jaki sposób dodawanie kolejnych słów do książki przekształca się w ich mnożenie? Czy myślenie multiplikatywne może kreować obrazy (w mózgu)? ... Werner Heisenberg nie zobaczył zasady nieoznaczoności, która mówi, że w mechanice kwantowej nie można z dowolną dokładnością wyznaczyć jednocześnie położenia i pędu cząstki. Heisenberg zasadę tą „pomyślał”, bo przecież cząstek tak małych jak elektrony czy protony, nie mógł zobaczyć. Zsada nieoznaczoności ma związek z falowo-korpuskularną naturą światła. Ale narzędziem, które ją odkryło, była myśl. I to nie jedna – ale połączona z setkami, tysiącami innych myśli – wynikających z doświadczenia, wiedzy, poglądów ... To myślenie multiplikatywne składające się z iloczynu wszytskich słów (myślanych) w umyśle Haisenberga – dało mu „podpowiedź” o istnieniu zasady. To oddziaływanie tak dużej ilości myśli na materię przyniosło w efekcie wniosek o nieoznaczoności. To nie był efekt światła. Chyba że, światła myśli ... Kondensat Bosego-Einsteina - tak może wyglądać paczka falowa myślenia multiplikatywnego (na podstawie http://pl.wikipedia.org/wiki/Zasada_nieoznaczono%C5%9Bci).

niedziela, 8 marca 2009

Grawitacyjna Teoria Słowa

Co to jest samogłoska? Samogłoska to odpowiednik „czystego” dźwięku, np. struny. Każdy dźwięk jest złożeniem drgań harmonicznych sinusoidalnych. Teoretycznie sinusoida o określonym okresie i amplitudzie reprezentuje jeden dźwięk. W rzeczywistości każdy dźwięk jest złożeniem kilku-, kilkunastu drgań harmonicznych, których nałożenie daje chrakterystyczną barwę – np. dźwięk c ma inna barwę dla fortepianu, gitary czy trąbki. Jak wydobyć dźwięk-samogłoskę z instrumentu? Musimy uderzyć w strunę gitary, zadąć w ustnik trąbki, nacisnąć klawisz fortepianu itp. Działanie związane z wydobywaniem samogłoski, polega na wzbudzaniu elementów instrumentu do drgania. W przypadku naszej mowy czynimy to za pomocą strumienia powietrza i różnego układu strun głosowych, języka, podniebienia, ust. Sposobem na uzyskanie dźwieku samogłoski jest użycie spółgłosek: „bo”, „po”, „ka”, „ze” – połączenia tego typu są układem, w którym spółgłoska pobudza do drgań narządy naszej mowy by wydobyć samogłoskę. Zresztą spółgłoska jest też niczym innym jak złożeniem różnych podstawowych drgań harmonicznych – czyli samogłosek. Jak zbudowane jest każde słowo? Z samogłosek i spółgłosek. W każdym słowie występuje przynajmniej jedna samogłoska – jeden „czysty” dźwięk harmoniczny pobudzany spółgłoską (dźwięczną, bezdźwięczną i niemą – gdy mówimy tylko: aaaaaaaaaaaa ...). Jeżeli w słowie występują dwie samogłoski to mówimy że słowo ma dwa „czyste” dźwięki, tak jak ma to miejsce dla dwóch dźwięków muzycznych w odległości sekundy, tercji, kwarty, kwinty, seksty, septymy, oktawy itd. Współbrzmienia dwudźwięków (odpowiadające definicji interwału) są traktowane jako akordy niepełne. Jeżeli słowo zawiera trzy różne samogłoski, to mówimy, że ma trzy „czyste” dźwięki drgające, tak jak ma to miejsce gdy uzyskujemy akord – czyli współbrzmienie co najmniej trzech dźwięków o różnej wysokości i nazwie (definicja według Wikipedii: http://pl.wikipedia.org/wiki/Akord). Jeżeli niektóre samogłoski w słowie z trzema samogłoskami, powtarzają się – to mamy do czynienia z akordem niepełnym. Rozkład słów n-literowych ma ekstrema dla n od 4 do 9, gdzie n jest długością słowa (liczbą liter w słowie). W 80% przypadków ekstremum występuje dla długości n=7. Hipoteza: Każde słowo 7-literowe ma przynajmniej 2 samogłoski. Slowa 7-literowe mają układ akordu niepełnego lub pełnego. Język nasz wywodzi się ze świata dźwięków. Od pojedyńczych połączeń typu „bo”, „ka”, „ri”, „wu”, po rozbudowane formy „akordowe” jak w słowach „gwiazda”, „marzenie”, „kolorowy”. Rozkład słów n-literowych przyjmuje wartość maksymalną (największa liczba wyrazów) dla słów o długości 7, ponieważ w słowach o tej długości występują minimum dwie, a najczęściej trzy samogłoski – tworząće akord pełny lub niepełny. W miarę wzrastania długości słowa spółgłoski w nich występujace ulegają „powielaniu” – a więc np. dwa razy występuje „a”, trzy razy „u”, dwa razy „i” itp. – są więc to słowa zbudowane z kilku akordów (współbrzmień). Najistotniejsze znaczenie mają akordy podstawowe, składajace się ze współbrzmień trzech dźwięków: takie jak A-dur, C-dur, Es-mol w muzyce. Z układów trójsamogłoskowych (trójdźwiekowych)zbudowana jest wiekszość słów 7-literowych (również 6-, 8-, 9-literowych). Dla tej długości słów, rozkład słów uzyskuje wartość maksymalną. A teraz cofnijmy sie o parę stuleci... Johannes Kepler formułuje prawa ruchu planet. Przy okazji odkrywa związek pomiędzy ruchem planet a muzyką. Pięknie opisuje to Jarosław Włodarczyk w artykule „Czy Wszechświat śpiewa?” (http://www.wiw.pl/astronomia/eseje/historia/spiew/c2.asp): „Niezwykła czy nie, keplerowska harmonia planet stwarza rzadką okazję wykładu mechaniki nieba za pomocą fortepianu. Pierwsze prawo ruchów planet mówi o kształcie orbit - są one elipsami. Prawo drugie uściśla sposób poruszania się po elipsach: czynią to tak, że promień wodzący planetę po elipsie (początek promienia znajduje się w ognisku elipsy, zajmowanym przez Słońce) w równych odstępach czasu zakreśla równe pola. Dlatego kiedy planeta biegnie po części elipsy leżącej bliżej Słońca (okolice peryhelim), porusza się szybciej, gdyż promień wodzący jest krótszy i musi przebyć większą drogę w tym samym czasie, co promień dłuższy - w części elipsy najbardziej od Słońca oddalonej (okolice aphelium). Niezbyt jasne? Od czego fortepian. Oto klawiatura. Po lewej stronie mamy dźwięki (częstości) najniższe, czyli ruch wolny. Po stronie prawej znajdują się dźwięki (częstości) wysokie, oddające ruch szybki. Słońce, względem którego mierzymy prędkości planet, trzeba umieścić po prawej stronie fortepianu. Prędkość orbitalna najbliższej Słońcu planety, Merkurego, zmienia się od dźwięku e5 do c4: grając e5 Merkury znajduje się najbliżej Słońca i biegnie najszybciej, kolejne uderzenia w klawisze coraz niższych dźwięków oddalają go od Słońca i spowalniają ruch po orbicie aż do cis. Podobnie można odtworzyć zmiany orbitalnych prędkości pozostałych planet. Im większy jest przy tym zakres dźwięków obejmowanych przez planetę, tym bardziej spłaszczona okazuje się elipsa jej orbity. Bezkonkurencyjny pod tym względem pozostaje Merkury, którego orbita rozciąga się na dziewięć białych i jeden czarny klawisz; potem Mars - cztery białe i jeden czarny; Jowisz - trzy białe i czarny; Saturn - dwa białe i czarny; wreszcie Ziemia - jeden biały klawisz i jeden czarny. Elipsa Wenus jest tak podobna do okręgu, że różnica wysokości dźwięków pozostaje w obszarze tego samego klawisza. Trzecie prawo ruchu planet nie mieści się już tak łatwo w czarno-białym schemacie. Ale co nieco fortepianowa klawiatura jest w stanie podpowiedzieć. Kiedy próbujemy odegrać połowę orbitalnego ruchu planety - przebiegając po klawiszach od najwyższego dźwięku w peryhelim do najniższego w aphelium - musimy wziąć pod uwagę właśnie trzecie prawo Keplera. Znosi ono wszelką dowolność w tempie gry, określając ściśle czas przypadający na ruch planety w zależności od jej odległości od Słońca (czyli wysokości dźwięku). W ten sposób Merkury mknie wokół Słońca w wesołym i szybkim tempie allegro. Ziemia i Wenus biegną żywo w tempie vivace. Mars kroczy w andante. Dla majestatycznego Jowisza natura zarezerwowała tempo maestoso, a dla bardzo już powolnego Saturna - adagio molto. W wersji astronomicznej zależność jest dokładnie określona: czas potrzebny planecie na przebycie pełnego okrążenia rośnie proporcjonalnie do odległości planety od Słońca, podniesionej do potęgi 3/2. Klawisze fortepianu, chociaż dość dokładnie wyznaczają granice planetarnych orbit, nie potrafią, niestety, oddać w pełni keplerowskiej muzyki planet, która jest przecież muzyką ciągłą. Od tej niedoskonałości instrumentów tradycyjnych wolna jest muzyka elektroniczna. Wykorzystali to dwaj amerykańscy uczeni z Uniwersytetu Yale, John Rodgers i Willie Ruff, produkując płytę długogrającą z muzyką planet według Keplera. Rodgers i Ruff uwzględnili także planety odkryte później: Urana, Neptuna i Plutona. Ponieważ jednak nawet po przeskalowaniu częstości tych planet nie mieszczą się w zakresie możliwości percepcji ludzkiego słuchu, profesorowie R2 utworzyli z nich sekcję rytmiczną. Poprzestańmy na tym ogólniku, bo skoro Urana, Neptuna i Plutona nie widać gołym okiem, nie powinno nas dziwić, że i gołe ucho nie uchwyci ich melodii.” Ruch planet doskonale opisują prawa Newtona z podstawowym Prawem Powszechnego Ciążenia (wraz z późniejszymi poprawkami relatywistycznymi Einsteina). Z grawitacji wyłania się muzyka. Z muzyki słowa n-literowe. Słowa n-literowe są obrazem (odwzorowaniem) słów myślanych (myśli). Stąd już tylko krok do połączenia grawitacji, muzyki oraz słów myślanych – w jedną teorię: Grawitacyjną Teorię Słowa.

Normalny i logonormalny

Jeżeli w wybranym zbiorze słów istnieje ścisły związek pomiędzy słowami tego zbioru (np. zbiór słów bez powtórzeń dowolnego dzieła literackiego: Biblii, prozy, poezji) to rozkład punktowy słów n-literowych leży na krzywej rozkładu logarytmiczno-normalnego (logonormalnego). Relacja pomiędzy słowami zbioru ma charakter multiplikatywny, tzn. zmiana lub usunięcie dowolnego elementu zbioru wpływa na obraz wszystkich pozostałych elementów, a więc na obraz całego zbioru (dzieła, utworu). Jeżeli w wybranym zbiorze słów nie ma ścisłego związku pomiędzy słowami tego zbioru (np. zbiór słów dowolnego słownika) to rozkład punktowy słów n-literowych leży na krzywej rozkładu normalnego. Relacja pomiędzy słowami zbioru ma wtedy charakter addytywny tzn. usunięcie jednego z elementów zbioru nie wpływa na pozostałe elementy, a tylko na ich liczbę.

Wszystkie nasze zdania powszednie ...

Długo zastanawiałem się jaka funkcja może opisywać rozkład słów n-literowych otrzymywany za pomocą programu TextStats. Rozkład słów n-literowych jest dyskretny – bo każdej długości słowa odpowiada jedna liczba powtórzeń w danym zbiorze. Ten zbiór może być słownikiem np. składającym się ze 119 tys. słów lub 230 tys. słów, lub – w przypadku zbioru nazwisk polskich – prawie 420 tys. słów. Ten zbiór może być również dowolnym tekstem np. literackim takim jak: Biblia, Pan Tadeusz - Adama Mickiewicza, Lord Jim - Józefa Conrada-Korzeniowskiego, czy Romeo i Julia – Wiliama Szekspira. Za każdym razem badając teksty programem TextStats (program opracowany przez Jacka Pazerę (www.pazera-software.pl), otrzymujemy dyskretny wykres z ekstremum dla określonej długości słowa. Najczęściej te ekstremum (maksimum) występuje dla słów 7-literowych, ale w niektórych zbiorach (tekstach) również dla słów 4, 5, 6, 8, 9-literowych. Ciekawiło mnie jaka funkcja najlepiej opisuje przebieg tego rozkładu punktowego, przebiegającego od minimum dla słów 1-literowych, poprzez maksimum dla np. 7-literowych, by znowu opaść do minimum dla słów 15, 17, 20-literowych. Przy czym widać, że przebieg ten nie jest całkowicie symetryczny. Narastanie do maksimum jest bardziej strome (szybsze) niż opadanie z maksimum do minimum, które jest znacznie łagodniejsze (wolniejsze). Najpierw, zasugerowany fizycznym wszechzwiązkiem rzeczy, przypisałem tej funkcji rozkład Plancka, zakładając, że proces powstawania słów w umyśle jest „klasycznym” procesem kwantowym promieniowania ciała doskonale czarnego (przy temperaturze ciała człowieka). Uzyskiwałem całkiem zgodne przebiegi. Jeden z moich rozmówców – pan Paweł Kijko zasugerował, że może to być rozkład normalny – czyli symetryczny. Również przykładając ten rozkład do układu punktów otrzymywałem dosyć dobrą zgodność. Wciąż jednak, frapowała mnie niewielka niesymetryczność rozkładu punktów, szczególnie dla tak dużego zbioru jakim jest 418 tys. nazwisk polskich. I wtedy natrafiłem w internecie na stronę poświęconą rozkładowi logonormalnemu (Dr Piotr Stępień, http://www.skutecznyprojekt.pl/artykul.php?AID=14). Niesymetryczny, lekko pochylony w lewo przebieg rozkładu doskonale pasował do rozkładów punktowych słów. Na stronie tej znalazłem taki opis: „(...) W niektórych zjawiskach obserwuje się wyraźną asymetrię rozkładu prawdopodobieństwa, co często wynika z multiplikatywnej kumulacji wpływów losowych. Przykładem takiej kumulacji jest zmienna losowa X spełniająca trzy warunki. 1. X jest iloczynem (lub ilorazem) składowych zmiennych losowych xi: X=x1*x2*x3*...*x4 2. Brak dominujących zmiennych składowych (zakłóceń) xi, 3. Liczba k zmiennych składowych xi dąży do nieskończoności. Zmienna losowa, spełniająca wymienione warunki, podlega prawom rozkładu lognormalnego. Łatwo zauważyć, że logarytmując wartości zmiennej losowej X otrzymamy: lnX=ln(x1*x2*x3*...*xk)=lnx1+lnx2+lnx3+...+lnxk (3) (...) Stosowanie rozkładu log-normalnego wymaga, żeby wszystkie zmienne xk były większe od zera. Dla naszych rozważań ważne jest to, że zmienna losowa X jest również nieujemna. Przykładami zmiennych losowych o multiplikatywnej kumulacji zakłóceń są: dochody ludzi, rozmiar ziaren żwiru, itp. (...) (...) Porównując oba mechanizmy kumulacji zakłóceń (normalny i logonormalny - przyp.), można wykazać, że dla opisu mechanizmu kumulacji czynników losowych wpływających na czas t realizacji zadań, poprawniejszy jest model multiplikatywny. Istnieją co najmniej dwa uzasadnienia takiego wniosku. I. Większości czynników determinujących czas realizacji nie można skompensować innymi. Wystarczy, że jeden z czynników będzie niekorzystny i całe zadanie wydłuży się bardzo znacznie, lub nawet nigdy nie zostanie zrealizowane. Istotny jest iloczyn czynników, a nie ich suma! II. Czas t realizacji zadania musi być liczbą nieujemną - ten formalny warunek spełniają zmienne losowe o rozkładzie log-normalnym, zaś zmienne losowe o rozkładzie normalnym dopuszczają wartości ujemne...” I w tym momencie nastąpił przebłysk ... To przecież oczywiste, że każdy utwór literacki, każda wypowiedź człowieka, każda jego myśl nie jest sumą słów lecz ich iloczynem. Bo tylko ptrzy określonym połączeniu, zaistnieniu, wszystkich słów jednocześnie, w określonej kolejności (koniunkcji), otrzymujemy taki a nie inny sens dzieła, wypowiedzi, myśli. Wystarczy zmienić jedno słowo, zastąpić je innym, by sens wypowiedzi uległ znaczącej zmianie. Dobrym przykładem jest tu recepta według której kucharz przygotowuje danie (podpowiedź kuzyna Bronka). Wystarczy niewielka zmiana jednego składnika by uzyskać całkowicie inny efekt smakowy. Czasami uzycie jednago składnika w nadmiarze całkowicie „niszczy” danie. Tak więc np. Stary Testament jest zbiorem prawie 530 tys. słów z powtórzeniami, zbudowanymi na słowniku zawierającym 44 tys. słów (bez powtórzeń). Ale określony „smak” tego dzieła wynika z jedynego w swoim rodzaju ciągu połączeń, właśnie tych 44 tys. słów. Ten układ słów, ich koniunkcja, powodują, że Stary Testament stał się „ulubionym daniem” setek milionów wyznawców na całym świecie. (Przepraszam, za te kulinarne porównania wszystkich wierzących). Tak więc myślenie polega na jednoczesnym zaistnieniu określonego ciągu słów. Myślenie nie jest więc zwykłą sumą (następstwem) kolejnych słów. Myślenie jest ich koniunkcją. Jeśli tak, to można przyjąć, że w mózgu naszym zapisane są nie tylko wszytskie pojedyncze słowa - nabywane w procesie uczenia lub istniejące w mózgu od zawsze. W naszym mózgu zapisane są wszytskie istniejace połączenia tych słów. Całe zdania. Wszystkie zdania. Bo zdania są strukturami słów istniejacych w określonym ciągu – multiplikatywnie! Brak, lub zmiana jednego słowa zmienia lub niszczy czasami całkowicie sens zdania. I znowu należy zadać pytanie: czy zdania te nabywane są w procesie uczenia czy istnieja w naszym umyśle (mózgu) od zawsze?. Jeśli istnieją od zawsze, to znaczy, że w każdym mózgu istnieje cała wiedza o istniejącym świecie, odkrywana stopniowo poprzez kolejene procesy czytania, słuchania, poznawania. Znaczyłoby to, że każdy z nas wie o otaczającycm świecie wszystko, tylko potrzebny jest proces aktywujacy tę wiedzę do świadomości ... * * * W poprzednich poszukiwaniach zdefiniowałem materię, jako zbiór wszystkich słów istniejących jednocześnie. Multiplikacyjny charakter procesu myślowego i powstawania zdań, wskazuje, że materię można zdefiniować jako zbiór wszytskich zdań istniejacych jednocześnie. My nie myślimy słowami – nasz umysł myśli zdaniami.

piątek, 6 marca 2009

Prawdopodobieństwo dominanty

Kopiowanie excela do bloga wykonałem zamieniając tabelkę na bitmapę programem FuturixImager 5.9.3 (http://fximage.com/)

Poszukiwanie funkcji rozkładu

Jaki rozkład ciągły najbardziej przybliża rozkład punktowy słów n-literowych? Na poniższym wykresie zaznaczono różne przebiegi dla funkcji typu "rozkład Plancka" (kolory czerwony, zielony, żółty, jasno niebieski) oraz przebieg dla "rozkład normalny" (kolor różowy). Rozkład punktowy oznaczony jest kolorem granatowym. Badanie - dla słownika "Nazwiska polskie" - zawierajacego 418 tys. słów, przeprowadziłem programem Graph 4.3 (www.padowan.dk) natomiast rozkład punktowy uzyskałem programem TextStats Jacka Pazery (www.pazera-software.pl/products/textstats/). Dla Starego Testamentu (rokład punktowy zaznaczony koloroem granatowym)przeprowadziłem próbę z rozkładem normalnym (kolor różowy).

czwartek, 5 marca 2009

Księga Mormona

Księga zawiera 282 671 słów z powtórzeniami i 10 375 słów Słownika (bez powtórzeń), który stanowi niecałe 4% wszystkich słów użytych w Księdze. Wykres słów z powtórzeniami. Dominanta dla n=3. Wykres słów bez powtórzeń. Dominanta dla n=6. Źródło: http://scriptures.lds.org/

Literatura piękna

Poniżej zamieszczam wykresy zbiorcze, utworów literackich, wykonane programem TextStats, Jacka Pazery (http://www.pazera-software.pl/products/textstats/). Na wykresie zbiorczym umieszczono wykresy: wszystkich słów utworu z powtórzeniami (kolor NIEBIESKI) oraz wszystkich słów utworu bez powtórzeń (kolor ZIELONY) stanowiących tzw. SŁOWNIK UTWORU. 1. Byron Robinson, "The Abdominal and Pelvic Brain" 138 704 słów z powtórzeniami; 11 686 słów bez powtórzeń Źródło: http://meridianinstitute.com/eamt/files/robinson/Rob1cont.htm 2. William Shakespeare, "Romeo and Juliet" 26 488 słów z powtórzeniami; 3 541 słów bez powtórzeń Źródło: http://shakespeare.mit.edu/ 3. William Szekspir, "Romeo i Julia" (wersja polska). 21 593 słów z powtórzeniami; 6 818 słów bez powtórzeń. Źródło: http://shakespeare.mit.edu/ 4. Arystoteles, "Politics". 18 460 słów z powtórzeniami; 2 410 słów bez powtórzeń. Źródło: http://classics.mit.edu/Aristotle/politics.mb.txt 5. Edgar Allan Poe, "Philosophy of Furniture" 2 447 słów z powtórzeniami; 935 słów bez powtórzeń. Źródło: http://www.readbookonline.net/readOnLine/518/ 6. Adam Mickiewicz, "Pan Tadeusz". 67 742 słów z powtórzeniami; 18 651 słów bez powtórzeń. Źródło: http://www.antoranz.net/BIBLIOTEKA/PT051225/1PANTAD.HTM 7. Adam Mickiewicz, "Pan Tadeusz", wersja angielska. 93 932 słów z powtórzeniami; 10 582 słów bez powtórzeń. Źródło: http://www.antoranz.net/BIBLIOTEKA/PT051225/1PANTAD.HTM 8. Joseph Conrad, "Lord Jim", wersja angielska. 131 641 słów z powtórzeniami; 10 455 słów bez powtórzeń. Źródło: http://www.online-literature.com/conrad/lord_jim/ 9. Nowy Testament, Ewangielia św. Mateusza, wersja niemiecka. 31 437 słów z powtórzeniami; 3 444 słowa bez powtórzeń. Źródło: http://online.recoveryversion.org/Outlines.asp?bookid=40&image2.x=18&image2.y=6 10. Nowy Testament, Ewangielia św. Mateusza, wersja włoska. 25 887 słów z powtórzeniami; 3 351 słowa bez powtórzeń. Źródło: http://online.recoveryversion.org/Outlines.asp?bookid=40&image2.x=18&image2.y=6 11. Nazwiska polskie. Słownik zawiera 418 770 słów (nazwisk)!. Jest to wykres SŁOWNIKA - bez powtórzeń. Żródło: http://www.futrega.org/etc/nazwiska.html 12. Słownik języka polskiego, wersja 119 565 wyrazów. Żródło: TextStats, example 1 otrzymany od Jacka Pazery (http://www.pazera-software.pl/products/textstats/). 13. Słownik języka polskiego, wersja 230 450 wyrazów. Żródło: TextStats, example 1 otrzymany od Jacka Pazery (http://www.pazera-software.pl/products/textstats/). WNIOSKI: 1. Wykresy zbiorcze - liczby słów n-literowych z powtórzeniami i liczby słów n-literowych bez powtórzeń są podobne. (n przyjmuje wartości od 1 do 24 (lub maksymalnej liczby liter w danym alfabecie). 2. Wykresy są podobne niezależanie od rodzaju dzieła literackiego, autora, czasu w którym powstawało, oraz języka w którym było napisane. (Nie mogę zbadać wszystkich innych języków ze wzgledu na potrzebę zastosowania różnych znaków ASCII). 3. Dominanta - czyli maksymalna liczba słów n-literowych - dla wykresów z powtórzeniami, występuje dla małych n = 2 lub 3 lub 4 lub 5. 4. Dominanta - czyli maksymalna liczba słów n-literowych - dla wykresów bez powtórzeń, występuje dla n = 5 lub 6 lub 7, przy czym dla n=7 dominanta występuje w 7 utworach na 10 badanych. Dominanta dla n=7 występuje również dla największego badanego dotychczas słownika "Nazwisk polskich" (418 tys. wyrazów). Dla słowników Jacka Pazery (http://www.pazera-software.pl/products/textstats/), dominanta występuje dla n=9. Słownik z powtórzeniami to słownik w którym występują te same słowa (lub te same odmiany słów).

Nowy Testament

Analiza Nowego Testamentu, dostępnego on-line: http://www.biblia.pl/PS/Biblia.htm, za pomocą programu TextStats, pana Jacka Pazyry (http://www.pazera-software.pl/products/textstats/). Poniżej zamieszczam wykres: Kolor niebieski - statystyka z powtórzeniami wszystkich słów występujących w Nowym Testamencie - 141 138 słów. Kolor zielony - statystyka bez powtórzeń wszystkich słów występujących w Nowym Testamencie. Wnioski: W Nowym Testamecie jest ponad 141 tys. słów z powtórzeniami, oraz 723 tys. liter (z powtórzeniami). Dominantą są słowa 3-literowe występujace 19,4 tys. razy. Drugą dominantą (subdominantą) słowa 5-literowe: 19,2 tys. razy. Tonika - słowa 1-literowe: 14 tys. razy. W Nowym Testamencie jest 18 tys. słów, bez powtórzeń - stanowiących tym samym Słownik Nowego Testamentu. Dominantą są słowa 7-literowe: 2906 oraz słowa 8-literowe: 2810 razy. Słownik Nowego Testamentu zawiera 12% wszystkich słów występujących w Nowym Testamencie. Oznacza to, że 88% słów jest kombinacją - powtórzeniem lub odmianą - słów Słownika. W Nowym Testamencie jest 723 tys. liter. Wnioski: Wykres wskazuje na wyraźną dominację samogłosek - w kolejności: i, e, a, o, y, u.