[1]Véanse: Luis Fernando Lara , Isabel García Hidalgo y Roberto Ham Chande,Investigaciones lingüísticas en lexicografía,El Colegio de México, Centro de Estudio Lingüísticos y Literarios, México, 1980, vii, 266 pp. ; Luis Fernando Lara ,Dimensiones de la lexicografía. A propósito del Diccionario del español de México, El Colegio de México, Diccionario del Español de México, México, 1990, 249 p. y Luis Fernando Lara ,De la definición lexicográfica, El Colegio de México, Centro de Estudios Lingüísticos y Literarios, México, 2004, 183 p.
[2]La conformación del corpus fue obra de todos los integrantes del equipo de trabajo del Diccionario del español de México (DEM); los métodos cuantitativos utilizados, de Roberto Ham Chande; el cálculo de los resultados del uso de fonemas, letras y patrón silábico, de Boris Fridman; el cálculo de los resultados finales del vocabulario fundamental, de Gilberto Anguiano; los procesos de cómputo, de Francisco Segovia.
[3]Providence , Rhode Island : Brown University Press, 1970.
[4] Cf.Dictionnaire alphabétique de fréquences, CRNS, Nancy, 1973.
[5] Acerca de la distinción entre ocurrencia, tipo y vocablo, véaseInvestigaciones lingüísticas, op. cit.,§ 2, n. 9 y Luis Fernando Lara ,Curso de lexicología, El Colegio de México, México, 2006. Cap. 6.
[6]El número exacto de vocablos obtenidos no depende solamente de la lematización descontextualizada de las ocurrencias de vocablos en el corpus, sino de la nomenclatura definitiva del DEM, en la que se han considerado casos de homonimia, cuya identificación depende en última instancia del análisis semántico del contexto. En consecuencia, lo daremos a conocer una vez terminada la redacción y revisión definitiva del diccionario.
[7]Véase al respecto los capítulos 7 y 8 de miCurso de lexicología,op. cit.
[8]Por supuesto, estas medidas están a disposición de quien se interese en ellas en la oficina del Diccionario del español de México, en El Colegio de México.
[9] A excepción deayyora, cuyos índices C son de 0.35 y 0.38 respectivamente. Como el cálculo se hizo sumando frecuencias absolutas, y estos dos vocablos tienen alta frecuencia, forman parte del vocabulario fundamental; sin embargo, como su uso predomina en géneros orales, cuyos tamaños son menores, al calcular KF, que pondera la dispersión considerando el tamaño de los géneros, el efecto es indicar su poca dispersión en todo el Corpus.
[10] Si sumáramos las cifras de esta columna, no obtendríamos como resultado 1'418,293.5 ocurrencias —es decir, el 75% exacto de la muestra— sino algo más: 1'487,627 (una diferencia de 69,333.5 ocurrencias). Esto se debe a que el vocabulario fundamental se hizo sobre los 1,139 tipos más frecuentes en elCEMC, que lematizados dieron 842 vocablos, pero a estos vocablos luego se añadieron los tipos que, aun correspondiéndoles legítimamente, no alcanzaban la frecuencia necesaria para aparecer entre los 1,139 tipos más frecuentes. Así, por ejemplo, la cuenta de ocurrencias absolutas de la última palabra de nuestra lista,zona, es de 450, que vienen de los tiposzona (273),zonas (176) yzona~ (1); evidentemente, el último tipo, que sólo apareció una vez, es una errata y no formó parte de los 1,139 tipos considerados al principio, pero se sumó a los cálculos finales.
[11]En “Frecuencia de fonemas en el español hablado”,Lingüística Española Actual, 2 (1980), 1-25.
[12] Paul M. Lloyd y Ronald D. Schnitzer, “A Statistical Study of the Structure of the Spanish Syllable”,Linguistics, 37 (1967), 58-72. Según refieren estos autores, el estudio en cuestión se basó en 70,755 “palabras” –nosotros diríamos vocablos- tomadas de “las principales entradas delDiccionario de la lengua española de la RAE (18ª. ed., 1956), más algunas palabras adicionales de la sección A del Diccionario inglés y español (New York, 1962) de Edwin B. Williams”.Apud Quilis y Esgueva, ob. cit., p. 2.
[13]Quilis y Esgueva (Ob. cit., p. 17) observan que en Lloyd-Schnitzer, /s/ cae a la cuarta posición “posiblemente a causa de la ausencia en su lexicón de formas en plural y de los paradigmas verbales”. Puesto que ese puede ser nuestro caso, probablemente lo que contribuye a elevar /s/ al segundo rango es precisamente nuestro sistema fonológico.
[14]EnLingüística Española Actual 3 (1981), 337-357.
[15] En “The Statistical Properties of the Spanish Lexicon”,Cahiers de lexicologie, 79-95.
[16]En “Los tipos silábicos del español”,Revista argentina de lingüística, 1, 2 (1985), 133-146. En nuestro estudio no exploramos la posición inicial, intermedia o final de cada estructura silábica, como ella lo hizo y habría convenido hacerlo.