Statystyki użycia liter w języku rosyjskim. Rosyjski alfabet. częstotliwość liter w języku rosyjskim (według Nkryi). częstotliwość alfabetu rosyjskiego - jak często dana litera pojawia się w tablicy losowego tekstu rosyjskiego. Charakterystyka częstotliwościowa wiadomości tekstowych

W tym artykule rozpoczniemy dyskusję na niezwykle interesujący temat - wykorzystanie statystyki do analizy informacji tekstowych. Należy pamiętać, że wykorzystanie statystyk do analizy tekstu jest zadaniem tradycyjnym.

Najpierw przedstawimy kilka ciekawostek dotyczących częstotliwości występowania liter i ich kombinacji w różnych językach (więcej szczegółów znajdziesz w książce). W kolejnych artykułach pokażemy, jak zastosować bardziej złożone metody analizy i reprezentacji graficznej.

Charakterystyka częstotliwościowa wiadomości tekstowych

Tak więc tekst składa się ze słów, słów z liter. Liczba różnych liter w każdym języku jest ograniczona i można je po prostu wymienić. Ważnymi cechami tekstu są powtórzenia liter, par liter (digramów) i ogólnie M-OK ( M-gram), zgodność liter ze sobą, naprzemienność samogłosek i spółgłosek i niektóre inne. Godne uwagi jest to, że te cechy są dość stabilne. Pytanie „dlaczego” zostawiamy za kulisami.

Korzystanie z systemu STATYSTYKA Wzorce te można sprawdzić na przykład w tekstach internetowych.

Chodzi o to, aby policzyć liczbę wystąpień każdego z nich n m możliwy M-gram w wystarczająco długich tekstach jawnych T=t 1 t 2 … t l, składający się z liter alfabetu ( za 1 , za 2 , ..., za n). Jednocześnie po kolei M-gramy tekstu:

t 1 t 2 ... t m , t 2 t 3 ... t m+1 , ..., t i-m+1 t l-m+2 ... t l.

Jeśli – liczba wystąpień M-gramy a i1 i i2 ...jestem w tekście T, A L– całkowita liczba zliczonych M-gram, to doświadczenie pokazuje, że dla wystarczająco dużych L częstotliwości

dla tego M-gramy niewiele się od siebie różnią.

Z tego powodu częstotliwość względną (1) uważa się za przybliżenie prawdopodobieństwa P (a i1 i i2 ...jestem) pojawienie się tego M-gramy w losowo wybranym miejscu tekstu (takie podejście przyjmuje się przy statystycznym wyznaczaniu prawdopodobieństwa).

Poniżej znajdują się tabele częstotliwości liter (w procentach) dla wielu języków europejskich. Dane zaczerpnięte z książki.

Litera alfabetu Francuski Niemiecki język angielski hiszpański język włoski
A 7.68 5.52 7.96 12.90 11.12
B 0.80 1.56 1.60 1.03 1.07
C 3.32 2.94 2.84 4.42 4.11
D 3.60 4.91 4.01 4.67 3.54
mi 17.76 19.18 12.86 14.15 11.63
F 1.06 1.96 2.62 0.70 1.15
G 1.10 3.60 1.99 1.00 1.73
H 0.64 5.02 5.39 0.91 0.83
I 7.23 8.21 7.77 7.01 12.04
J 0.19 0.16 0.16 0.24 -
K - 1.33 0.41 - -
L 5.89 3.48 3.51 5.52 5.95
M 2.72 1.69 2.43 2.55 2.65
N 7.61 10.20 7.51 6.20 7.68
O 5.34 2.14 6.62 8.84 8.92
P 3.24 0.54 1.81 3.26 2.66
Q 1.34 0.01 0.17 1.55 0.48
R 6.81 7.01 6.83 6.95 6.56
S 8.23 7.07 6.62 7.64 4.81
T 7.30 5.86 9.72 4.36 7.07
U 6.05 4.22 2.48 4.00 3.09
V 1.27 0.84 1.15 0.67 1.67
W - 1.38 1.80 - -
X 0.54 - 0.17 0.07 -
Y 0.21 - 1.52 1.05 -
Z 0.07 1.17 0.05 0.31 1.24

Pewną różnicę w wartościach częstotliwości w tabelach podanych w różnych źródłach tłumaczy się tym, że częstotliwości w istotny sposób zależą nie tylko od długości tekstu, ale także od jego charakteru. Na przykład w tekstach technicznych rzadka litera F może stać się dość powszechne ze względu na częste używanie takich słów, jak funkcja, różnica, dyfuzja, współczynnik itp.

Jeszcze większe odchylenia od normy w częstotliwości użycia poszczególnych liter obserwuje się w niektórych dziełach sztuki, zwłaszcza w poezji. Dlatego też, aby wiarygodnie określić średnią częstotliwość występowania liter, pożądane jest posiadanie zestawu różnych tekstów zapożyczonych z różnych źródeł. Z reguły jednak takie odchylenia są nieznaczne i w pierwszym przybliżeniu można je pominąć.

Wizualną reprezentację częstości liter przedstawia diagram występowania. Zatem dla języka angielskiego, zgodnie z tabelą, taki schemat pokazano na ryc. 1. Do jego zbudowania wykorzystaliśmy system STATYSTYKA.

W przypadku języka rosyjskiego częstotliwości (w kolejności malejącej) znaków alfabetu, w którym są one identyfikowane mi C Siema, B Z Kommiersant, a między wyrazami znajduje się również znak spacji (-), podano w poniższej tabeli (patrz).

-
0.175
O
0.090
JEJ
0.072
A
0.062
I
0.062
T
0.053
N
0.053
Z
0.045
R
0.040
W
0.038
L
0.035
DO
0.028
M
0.026
D
0.025
P
0.023
U
0.021
I
0.018
Y
0.016
Z
0.016
b, b
0.014
B
0.014
G
0.013
H
0.012
Y
0.010
X
0.009
I
0.007
JA
0.006
Cii
0.006
C
0.004
SCH
0.003
mi
0.003
F
0.002

Na podstawie tabeli otrzymujemy następujący wykres częstotliwości (rys. 2).

Istnieje mnemoniczna zasada zapamiętywania dziesięciu najczęstszych liter alfabetu rosyjskiego. Z tych liter składa się śmieszne słowo HAY. Możesz także zaproponować podobny sposób zapamiętywania popularnych liter w języku angielskim, na przykład używając słowa TETRIS-HONDA (patrz tabela).

Charakterystyka częstotliwościowa bigramów, trygramów i czterogramów znaczących tekstów jest również stabilna.

Przedstawiamy tabele częstotliwości bigramów dla języka rosyjskiego i angielskiego (tabele zapożyczone z książki). Dla wygody podzielono je na cztery części według następującego schematu:

Część 1 Część 2
Część 3 Część 4

Część 1

A B W G D mi I Z I Y DO L M N O P
A 2 12 35 8 14 7 6 15 7 7 19 27 19 45 5 11
B 5 9 1 6 6 2 21
W 35 1 5 3 3 32 2 17 7 10 3 9 58 6
G 7 3 3 5 1 5 1 50
D 25 3 1 1 29 1 1 13 1 5 1 13 22 3
mi 2 9 18 11 27 7 5 10 6 15 13 35 24 63 7 16
I 5 1 6 12 5 6
Z 35 1 7 1 5 3 4 2 1 2 9 9 1
I 4 6 22 5 10 21 2 23 19 11 19 21 20 32 8 13
Y 1 1 4 1 3 1 2 4 5 1 2 7 9 7
DO 24 1 4 1 4 1 1 26 1 4 1 2 66 2
L 25 1 1 1 1 33 2 1 36 1 2 1 8 30 2
M 18 2 4 1 1 21 1 2 23 3 1 3 7 19 5
N 54 1 2 3 3 34 58 3 1 24 67 2
O 1 28 84 32 47 15 7 18 12 29 19 41 38 30 9 18
P 7 15 4 9 1 46

Część 2

R Z T U F X C H Cii SCH Y B mi JA I
A 26 31 27 3 1 10 6 7 10 1 2 6 9
B 8 1 6 1 11 2
W 6 19 6 7 1 1 2 4 1 18 1 2 3
G 7 2
D 6 8 1 10 1 1 1 5 1 1
mi 39 37 33 3 1 8 3 7 3 3 1 1 2
I 1
Z 3 1 2 4 4
I 11 29 29 3 1 17 3 11 1 1 1 3 17
Y 3 10 2 1 3 2
DO 10 3 7 10 1
L 3 1 6 4 1 3 20 4 9
M 2 5 3 9 1 2 5 1 1 3
N 1 9 9 7 1 5 2 36 3 5
O 43 50 39 3 2 5 2 12 4 3 2 3 2
P 41 1 6 2 2

Część 3

A B W G D mi I Z I Y DO L M N O P
R 55 1 4 4 3 37 3 1 24 3 1 3 7 56 2
Z 8 1 7 1 2 25 6 40 13 3 9 27 11
T 35 1 27 1 3 31 1 28 5 1 1 11 56 4
U 1 4 4 4 11 2 6 3 2 8 5 5 5 1 5
F 2 2 2 1
X 4 1 4 1 3 1 2 3 4 3 3 4 18 5
C 3 7 10 2 1
H 12 23 13 2 6
Cii 5 11 14 1 2 2 2
SCH 3 8 6 1
Y 1 9 1 3 12 2 4 7 3 6 6 3 2 10
B 2 4 1 1 2 2 2 6 3 13 2 4
mi 1 1
JA 2 1 2 1 3 1 1 1 1 1 3
I 1 3 9 1 3 3 1 5 3 2 3 3 4 6 3 6

Część 4

R Z T U F X C H Cii SCH Y B mi JA I
R 1 5 9 16 1 1 1 2 8 3 5
Z 4 11 82 6 1 1 2 2 1 8 17
T 26 18 2 10 1 11 21 4
U 7 14 7 1 8 3 2 9 1
F 1 1
X 3 4 2 2 1 1
C 1 1
H 7 1 1 1
Cii 1 1
SCH 1
Y 3 9 4 1 16 1 2
B 1 11 3 1 4 1 3 1
mi 1 9
JA 1 1 7 1 1 4
I 3 6 10 2 1 4 1 1 1 1 1

Ładne stoły k-gram można łatwo uzyskać korzystając z tekstów wersji elektronicznych wielu książek znajdujących się na płytach CD.

Aby uzyskać dokładniejsze informacje na temat tekstów jawnych, można tworzyć i analizować tabele k-gram w k>2, ale dla celów edukacyjnych wystarczy ograniczyć się do bigramów. Nierówność k-gram (a nawet słowa) jest ściśle związany z charakterystyczną cechą tekstu otwartego - obecnością w nim dużej liczby powtórzeń poszczególnych fragmentów tekstu: rdzeni, końcówek, przyrostków, słów i fraz. Tak więc w języku rosyjskim takie znane fragmenty są najczęstszymi bigramami i trygramami:

ST, ALE, EN, TO, NA, OV, NI, RA, VO, KO
STO, ENO, LISTOPAD, TOV, OVO, OVA

Przydatna jest informacja o zgodności liter, czyli o preferowanych połączeniach liter ze sobą, którą można łatwo uzyskać z tablic częstości występowania bigramów.

Odnosi się to do tabeli, w której najbardziej preferowani „sąsiedzi” znajdują się po lewej i prawej stronie każdej litery (w kolejności malejącej częstotliwości odpowiednich bigramów). Tabele takie zazwyczaj wskazują także proporcję samogłosek i spółgłosek (w procentach) poprzedzających (lub następujących po) daną literę.

Połączenie rosyjskich liter:

G Z Lewy Po prawej G Z
3 97 l, d, k, t, v, r, n A l, n, s, t, r, v, k, m 12 88
80 20 ja, e, y, ja, a, o B o, s, e, a, r, y 81 19
68 32 ja, t, a, e, ja, o W o, a, i, s, s, n, l, r 60 40
78 22 r, y, a, ja, e, o G o, a, p, l, i, v 69 31
72 28 r, ja, y, a, ja, e, o D e, a, i, o, n, y, p, v 68 32
19 81 m, ja, l, d, t, r, n mi n, t, r, s, l, v, m, i 12 88
83 17 r, e, ja, a, y, o I e, ja, d, a, n 71 29
89 11 o, e, a i Z a, n, c, o, m, d 51 49
27 73 r, t, m, i, o, l, n I s, n, c, i, e, m, k, h 25 75
55 45 b, v, e, o, a, i, s DO o, a, i, p, y, t, l, e 73 27
77 23 g, v, s, i, e, o, a L i, e, o, a, b, ja, yu, y 75 25
80 20 ja, s, a, ja, e, o M i, e, o, y, a, n, p, s 73 27
55 45 d, b, n, o N o, a, i, e, s, n, y 80 20
11 89 r, p, k, v, t, n O c, s, t, r, i, d, n, m 15 85
65 35 w, z, y, a, i, e, o P o, p, e, a, y, ja, l 68 32
55 45 i, k, t, a, p, o, e R a, e, o, i, y, ja, s, n 80 20
69 31 s, t, v, a, e, i, o Z t, k, o, i, e, b, s, n 32 68
57 43 h, y, ja, a, e, o, s T o, a, e, i, b, v, r, s 63 37
15 85 p, t, k, d, n, m, r U t, p, s, d, n, y, w 16 84
70 30 n, a, e, o i F oraz e, o, a, e, o, a 81 19
90 10 y, e, o, a, s i X o, ja, s, n, v, p, r 43 57
69 31 e, yu, n, a i C ja, e, a, s 93 7
82 18 e, a, y, ja, o H e, ja, t, n 66 34
67 33 b, y, s, e, o, a, i, v Cii e, ja, n, a, o, l 68 32
84 16 e, b, a, ja, y SCH e, ja, a 97 3
0 100 m, r, t, s, b, c, n Y l, x, e, m, i, v, s, n 56 44
0 100 n, s, t, l B n, k, v, p, s, e, o i 24 76
14 86 s, s, m, l, d, t, r, n mi n, t, r, s, k 0 100
58 42 b, o, a, ja, l, y JA d, t, sch, c, n, p 11 89
43 57 o, n, r, l, a, i, s I c, s, t, p, d, k, m, l 16 84

Analizując zgodność liter ze sobą, należy mieć na uwadze zależność wyglądu liter w tekście jawnym od znacznej liczby liter poprzedzających. Aby przeanalizować te wzorce, stosuje się koncepcję prawdopodobieństwa warunkowego.

Obserwacje tekstów jawnych pokazują, że dla prawdopodobieństw warunkowych obowiązują następujące nierówności: p(a i1)≠p(a i1 /a i2), p(a i1 /a i2)≠p(a i1 /a i2 a i3),....

Problem zależności liter alfabetu w tekście jawnym od liter poprzednich był systematycznie badany przez słynnego rosyjskiego matematyka A. A. Markowa (1856 – 1922). Udowodnił, że wystąpień liter w tekście jawnym nie można uważać za niezależne od siebie. W związku z tym A. A. Markov zauważył inny stabilny wzór tekstów otwartych związany z naprzemiennością samogłosek i spółgłosek. Obliczył częstotliwość występowania bigramów samogłoskowo-samogłoskowych ( G, G), samogłoska spółgłoska ( G, Z), spółgłoska-samogłoska ( Z, G), spółgłoska-spółgłoska ( Z, Z) w tekście rosyjskim o długości 10 5 znaków. Wyniki obliczeń przedstawiono w poniższej tabeli:

G Z Całkowity
G 6588 38310 44898
Z 38296 16806 55102

Z tej tabeli widać, że język rosyjski charakteryzuje się naprzemiennością samogłosek i spółgłosek, a częstotliwości względne mogą służyć jako przybliżenie odpowiednich prawdopodobieństw warunkowych i bezwarunkowych:

P(G/Z)≈0.663, P(Z/G)≈0.872,
P(G)≈0.432, P(Z)≈0.568.

Za A. A. Markowem zależność występowania liter w tekście, w ślad za kilkoma wcześniejszymi, badano metodami teorii informacji K. Shannona. Faktycznie wykazały one w szczególności, że taka zależność jest zauważalna do głębokości około 30 znaków, po czym jest praktycznie nieobecna.

Proporcje samogłosek w tekście literackim:

Powyższe wzorce dotyczą zwykłych „czytelnych” tekstów jawnych używanych w komunikacji międzyludzkiej. Jak zauważono wcześniej, wzorce te odgrywają dużą rolę w kryptoanalizie. W szczególności wykorzystywane są przy konstrukcji sformalizowanych kryteriów tekstu jawnego, które umożliwiają zastosowanie metod statystyki matematycznej w problematyce rozpoznawania tekstu jawnego w strumieniu komunikatów. W przypadku stosowania specjalnych alfabetów wymagane są podobne badania charakterystyk częstotliwościowych „tekstów otwartych”, powstających na przykład podczas wymiany informacji między maszynami lub w systemach transmisji danych. W takich przypadkach skonstruowanie sformalizowanych kryteriów „czytelnego tekstu” jest zadaniem znacznie trudniejszym.

Jako przykład podajemy charakterystykę częstotliwościową liter alfabetu angielskiego wchodzących w skład kodu ASCII.

Oprócz kryptografii charakterystyka częstotliwości otwartych wiadomości jest znacząco wykorzystywana w innych obszarach. Przykładowo klawiatura komputerowa, maszyna do pisania czy Linotype to wspaniałe ucieleśnienie idei przyspieszenia pisania, związanej z optymalizacją ułożenia liter alfabetu względem siebie, w zależności od częstotliwości ich używania.

Literatura:

Alferow A.P. i in., „Kryptografia”

Yaglom A.M., Yaglom I.M., Prawdopodobieństwo i informacja, M.: Nauka, 1973.

Baudouin C., Elementy kryptografii / wyd. Pedon A. – Paryż, 1939.

Friedman WF, Callimahos D., Kryptanaliza wojskowa, część i, tom 2, Aegean Park Press, Laguna Hills CA, 1920.

Ciasto „Niech jedzą ciasto”

Składniki:

2 uncje zmielonych migdałów,

6 uncji samorosnącej mąki,

2 łyżeczki proszku do pieczenia,

4 uncje jasnego cukru muscovado

150 ml oleju kukurydzianego,

200–250 ml mleka sojowego,

skórka z dwóch niewoskowanych cytryn,

sok z dwóch cytryn,

1 łyżka wody zapachowej z kwiatu pomarańczy,

1 łyżeczka naturalnego ekstraktu waniliowego.


Rozgrzej piekarnik do 190 stopni lub mniej, jeśli piekarnik jest zasilany termoobiegiem.

Nasmaruj formę do ciasta. Najlepsza jest głęboka, sześciocalowa patelnia, ale każda patelnia też się nada.

Do miski wsyp mąkę i proszek do pieczenia, następnie dodaj cukier. Wymieszaj zmielone migdały i skórkę z cytryny. Dodaj masło i mleko. Im mniej płynu, tym bardziej danie będzie wyglądało jak ciasto, a nie budyń. W przypadku tego ciasta nie trzeba odmierzać płynów ze 100% dokładnością.

Teraz dodaj sok z cytryny i dokładnie wymieszaj. Dodać wodę kwiatową i ekstrakt waniliowy, ponownie wymieszać. Rezultatem powinno być gęste ciasto wolne od drożdży.

Wlać do formy i wstawić do piekarnika na około czterdzieści minut. Skórka powinna być brązowa, a nadzienie bardzo miękkie. Zdjąć z patelni, ostudzić i udekorować świeżymi listkami mięty i truskawkami.

Najpopularniejszą literę alfabetu rosyjskiego można bezpiecznie nazwać „o”. Nie „a”, choć wszystkie dzieci uczą się pierwszych słów właśnie z tą literą: „mama”, „tata” czy „daj”. Nie „i”, chociaż może się wydawać, że często używamy go jako spójnika łączącego.

Jak pokazują dane, to właśnie litera „o” ma częstotliwość przekraczającą 0,1% w porównaniu do innych samogłosek alfabetu, których częstotliwość wynosi np. 0,07-0,08%, co jest całkiem sporo

Wśród spółgłosek na pierwszym miejscu znajduje się litera „n”.

Dane takie uzyskuje się poprzez analizę częstotliwości w NCRY – Narodowym Korpusie Języka Rosyjskiego, przy użyciu specjalnego wzoru. NKRY to elektroniczne archiwum tekstów pisanych i mówionych, które zawiera około 230 milionów użycia słów.

Biorąc pod uwagę najpopularniejszą literę naszego alfabetu, warto wspomnieć o ciekawym zjawisku zwanym „tautogramem”. To rodzaj rozgrzewki literackiej, podczas której trzeba ułożyć opowiadanie lub wiersz rozpoczynający się na tę samą literę. Nawiasem mówiąc, literą, od której zaczyna się większość słów w języku rosyjskim (nie mylić jej z częstotliwością użycia), jest „p”, ale wśród samogłosek niewątpliwe przywództwo należy do naszego obecnego faworyta.

"Sam. Bardzo. Odłamki uroku rozpłynęły się w jesiennej monotonii. Olimp pozostał odległym rynkiem zbytu. Bardzo odległe. Pozostały urazy, pochopne definicje rozmrożonej odwilży, spowodowanej ogniem dotyku. Reszta okazała się negatywna, odrzucona, oszukana przez społeczeństwo. Potomstwo jesieni potykało się i latało z resztkami oczu jeziora. Niektóre okna pozostały otwarte. Wściekłe ślady poszczególnych homonimów przyćmiewają odrzucone szaty personifikacji. Pomarańczowe odcienie rokitnika zarysowane są przez ogromne odbicie samotności. Reszta to skostnienie i odrętwienie zagłady. Wyspy porośnięte są przysięgami z esejów o pewności. Chłodzące sadzonki olchy tworzyły kręgi o tej samej nazwie z powodu ochrypłych krzyków. Urzędnik stał się odbiciem generała, znosząc negatywne pewniki. Utrwalone obrazy z urazą wyjaśniały jesienne bzdury, nazywając coś przeciwnego oszustwem. Młodzież z desperacją nakreślała zaczarowaną jesień, zaprzeczając obiektywnej postawie... Jesień przeleciała jak pomarańczowe kawałki rokitnika, pozostawiając męczące spory samotnym odpowiedziom..."

To zabawne, prawda? Przecież to nie są takie bzdury :)

Nawiasem mówiąc, w języku angielskim najczęstszą literą jest „e”, a spółgłoską jest „t”

Cóż, i tautogram w języku angielskim:

Majestatyczna Mary porusza się niczym Minerwa.

Prawo, łacina, wolność, nauczyła się, że Lucy kocha.

Elegancja Elizy dostrzega każde oko.

Spokojnie ciche uśmiechy Susan zaskakują.

Od bzdur, głupców, pochlebstw, najpiękniejszych much Fanny.

Częstotliwość używania liter w języku rosyjskim

Czy wiesz, że niektóre litery alfabetu występują w wyrazach częściej niż inne... Co więcej, częstość występowania w języku samogłosek jest większa niż spółgłosek.

Które litery alfabetu rosyjskiego najczęściej lub najrzadziej występują w słowach używanych do zapisywania tekstu?

Statystyka zajmuje się identyfikacją i badaniem ogólnych wzorców. Za pomocą tego kierunku naukowego możesz odpowiedzieć na postawione powyżej pytanie, licząc liczbę każdej litery alfabetu rosyjskiego, użyte słowa i wybierając fragment dzieł różnych autorów. Dla własnego interesu i żeby mieć co robić z nudów, każdy może to zrobić we własnym zakresie. Odniosę się do statystyk z już przeprowadzonego badania...

Alfabet rosyjski, cyrylica. W czasie swojego istnienia przeszedł kilka reform, w wyniku których powstał nowoczesny system alfabetu rosyjskiego, obejmujący 33 litery.

o — 9,28%
a — 8,66%
mi — 8,10%
i - 7,45%
n — 6,35%
t — 6,30%
p — 5,53%
s — 5,45%
l - 4,32%
w — 4,19%
k — 3,47%
n — 3,35%
m — 3,29%
r - 2,90%
d — 2,56%
Ja - 2,22%
s — 2,11%
b — 1,90%
z — 1,81%
b — 1,51%
g — 1,41%
t — 1,31%
godz. — 1,27%
ju — 1,03%
x — 0,92%
f — 0,78%
w — 0,77%
c — 0,52%
sch — 0,49%
f — 0,40%
mi — 0,17%
ъ — 0,04%

Najczęściej używaną rosyjską literą jest samogłoska „ O„, jak już tutaj słusznie zasugerowano. Istnieją również typowe przykłady, takie jak „ OBRONA„(7 sztuk jednym słowem i nic egzotycznego ani zaskakującego; bardzo powszechne w języku rosyjskim). Dużą popularność litery „O” w dużej mierze tłumaczy się takim zjawiskiem gramatycznym, jak pełna samogłoska. Oznacza to, że „zimno” zamiast „zimno” i „mróz” zamiast „szumowiny”.

A na samym początku słów najczęściej znajduje się spółgłoska „”. P" To przywództwo jest również pewne i bezwarunkowe. Najprawdopodobniej wyjaśnienie zapewnia duża liczba przedrostków zaczynających się na literę „P”: pere-, pre-, pre-, pri-, pro- i inne.

Podstawą kryptoanalizy jest częstotliwość używania liter.

Ogólnie rzecz biorąc, istnieje taki temat - analiza częstotliwości tekstu. Argumentuje się, że dla danego języka częstotliwość występowania poszczególnych liter w tekście znaczącym jest wartością stałą. Kombinacje dwóch, trzech (digramów, trygramów) i czterech liter są również stabilne.
Fakt ten w szczególności wykorzystano w kryptografii do łamania szyfrów.

Nie jestem zbyt dobry w kryptografii i jedyne, co przychodzi mi na myśl, to złamanie szyfru bezpośredniego podstawienia. Trzeba powiedzieć, że najbardziej prymitywny szyfr ma miejsce wtedy, gdy znaki oryginalnego alfabetu użyte w wiadomości są zamieniane na inne znaki według określonej zasady. Nawiasem mówiąc, takie szyfry można otworzyć bez użycia analizy statystycznej (gdzie, aby zmniejszyć błąd, wymagana jest oczywiście obecność dość dużych fragmentów tekstu), ale po prostu poprzez odgadnięcie niektórych słów - patrz historia „The Tańczący Mężczyźni”.

I ostatni szlif (opcjonalnie). Czasami (na razie prawie zawsze) kalkulator potrzebuje opisu - jakie ma parametry, jakich formuł używa i w ogóle, po co to wszystko - tak jak to robię teraz. Aby to zrobić, pisze się artykuł, a kalkulator wstawia się bezpośrednio do artykułu. Aby napisać artykuł, wybierz z menu opcję „Utwórz...” -> „Artykuł” na stronie głównej sekcji „Moje kalkulatory” i zacznij pisać. Aby wstawić kalkulator, należy nacisnąć przycisk z dużą, podkreśloną literą A i w otwartym oknie dialogowym wybrać nowo utworzony kalkulator.