Frecuencia de letras

El estudio citado de Quilis y Esgueva, de clara orientación fonético/fonológica, no consideró los fenómenos de frecuencia de las letras. Es lo que hizo, en cambio, E. García Camarero, en su artículo “Algunos datos cuantitativos del español”[14], orientado hacia los procedimientos de compresión de la información en los sistemas informáticos.

Es necesario aclarar que, puesto que los programas de computadora utilizados no distinguen las letras dígrafas <ch> y <ll>, no obtuvimos los resultados correspondientes, lo cual quita la precisión requerida cuando se busca conocer adecuadamente el sistema de escritura. Los resultados obtenidos al respecto en nuestro estudio son:

Frecuencia de letras en orden alfabético

letra

frec.abs.

porcentaje

a

631

12.4286

b

68

1.339374

c

309

6.086271

d

191

3.762064

e

584

11.502856

f

46

0.906047

g

78

1.53634

h

31

0.610597

i

379

7.465038

j

27

0.53181

k

0

0

l

193

3.801458

m

174

3.427221

n

324

6.381721

ñ

11

0.216663

o

425

8.371085

p

173

3.407524

q

18

0.35454

r

611

12.034666

s

239

4.707504

t

282

5.554461

u

180

3.545401

v

52

1.024227

w

0

0

x

11

0.216663

y

15

0.29545

z

25

0.492417

Total

5077

Letras en orden descendente de frecuencias

letra

Frecuencia absoluta

porcentaje

a

631

12.4286

r

611

12.034666

e

584

11.502856

o

425

8.371085

i

379

7.465038

n

324

6.381721

c

309

6.086271

t

282

5.554461

s

239

4.707504

l

193

3.801458

d

191

3.762064

u

180

3.545401

m

174

3.427221

p

173

3.407524

g

78

1.53634

b

68

1.339374

v

52

1.024227

f

46

0.906047

h

31

0.610597

j

27

0.53181

z

25

0.492417

q

18

0.35454

y

15

0.29545

ñ

11

0.216663

x

11

0.216663

k

0

0

w

0

0

García Camarero, sobre la base de las 70,858 entradas de la 18ª edición delDiccionario de la lengua española, de la Real Academia Española, ofrece resultados comparables con los obtenidos en México. En el orden decreciente de frecuencias de las letras, las discrepancias son las siguientes: <e> y <r> cambian su posición: mientras que en nuestro estudio <r> ocupa el segundo lugar después de <a>, y <e> el tercero, en el suyo el orden es <a, e, o>. Se enrocan también <l> y <s>, <b> y <g>. En las frecuencias más bajas las diferencias son mayores: <v> en nuestro estudio ocupa el lugar 17 antes de <f> y <h>, en el de García Camarero el orden es <f, h, v>; la <z> que en García Camarero sigue a las anteriores, en el nuestro cae cuatro lugares.


El Colegio de México © 2017. DEM.