 |
|
|
.: Criptotaller
:. |
|
|
|
Frecuencias
en textos españoles |
En el criptoanálisis de algunos
métodos clásicos es interesante conocer la frecuencia
de letras, pares de letras y palabras en el idioma en que suponemos
que está escrito dicho mensaje. He aquí algunos
datos útiles:
Frecuencia de las letras
Letras
de alta frecuencia. |
|
Frecuencia % |
E |
16.78 |
A |
11.96 |
O |
8.69 |
L |
8.37 |
S |
7.88 |
N |
7.01 |
D |
6.87 |
|
Letras
de frecuencia media. |
Letra |
Frecuencia % |
R |
4.94 |
U |
4.80 |
I |
4.15 |
T |
3.31 |
C |
2.92 |
P |
2.76 |
M |
2.12 |
|
El resto de las letras: G,F,V,W,J,Z,X,K
tienen frecuencias inferiores a 0.5% y se pueden considerar por
tanto "raras". Resumiendo los datos anteriores y aplicándolos
por grupos de letras podríamos decir que:
-
Las vocales ocuparán alrededor
del 47% del texto.
-
Sólo la E y la A se identifican
con relativa fiabilidad porque destacan mucho sobre las demás.
-
Las letras de frecuencia alta
suponen un 68% del total.
-
Las consonantes más frecuentes:
L, S, N, D (alrededor del 30%)
-
Las seis letras menos frecuentes:
V, Ñ, J, Z, X y K (poco más del 1%)
Frecuencia de las palabras
Palabras más frecuentes.
Palabras más
frecuentes. |
Palabra |
Frecuencia (%00) |
DE |
778 |
LA |
460 |
EL |
339 |
EN |
302 |
QUE |
289 |
Y |
226 |
A |
213 |
LOS |
196 |
DEL |
156 |
SE |
119 |
LAS |
114 |
|
Palabras de dos
letras. |
Palabra |
Frecuencia (%00) |
DE |
778 |
LA |
460 |
EL |
339 |
EN |
302 |
SE |
119 |
UN |
98 |
NO |
74 |
SU |
64 |
AL |
63 |
ES |
47 |
|
Palabras de tres
letras. |
Palabra |
Frecuencia (%00) |
QUE |
289 |
LOS |
196 |
DEL |
156 |
LAS |
114 |
POR |
110 |
CON |
82 |
UNA |
78 |
MAS |
36 |
SUS |
27 |
HAN |
19 |
|
Palabras de cuatro
letras. |
Palabra |
Frecuencia (%00) |
PARA |
67 |
COMO |
36 |
AYER(*) |
25 |
ESTE |
23 |
PERO |
18 |
ESTA |
17 |
AÑOS(*) |
14 |
TODO |
11 |
SIDO |
11 |
SOLO |
10 |
|
(*) Estas palabras parecen exageradamente frecuentes, lo que
se debe al tipo de textos elegidos para la estadística.
Fuente: "CODIGOS Y CLAVES SECRETAS: programas en Basic,
Anaya Multimedia 1986" basado a su vez en un estudio lexicográfico
del diario "El País".
|
|
|
|
|

|
Area
On-Line
|
Todo
tipo de material, para disfrutar de él completamente On-Line, sin
necesidad de descargar archivos ni tener que andar descomprimiendo estos.
No te olvides de pasar por el Diccionario, y las secciones Origami y Geointeractiva.
Son de lo más interesante. |
|