De las 1,891,045 ocurrencias de palabras gráficas encontradas en el Corpus obtuvimos 64,183 tipos [5], que han dado un poco más de 30,000 vocablos [6]. A base de estos resultados compusimos la nomenclatura del Diccionario del español de México; para redactarlo tomamos en cuenta todos los vocablos cuya frecuencia absoluta fuera mayor o igual a tres; para la nomenclatura de la primera edición del Diccionario del español usual en México, versión inicial de nuestro diccionario, tomamos exclusivamente los vocablos cuya frecuencia absoluta fuera mayor a 10.
Con la experiencia obtenida del manejo diario de nuestros resultados, podemos afirmar que el vocabulario encontrado forma parte del español mexicano, pero también corresponde, en gran medida, a la intersección de todos los vocabularios de las variedades españolas e hispanoamericanas del español. Sólo puedo afirmar esto en gran medida , porque hacen falta análisis como el nuestro en cada país o en cada región hispánica, para que podamos hacer las comparaciones necesarias y descubrir el tan ansiado “español general o panhispánico”, que la Academia Española y otros grupos lexicográficos suelen falsificar
Un corpus como el nuestro es necesario para conocer objetivamente el uso de la lengua en una región o en un país. Es mal método aquel que consiste en dar a un conjunto de personas una lista de palabras y preguntar cuáles conocen y cuáles no, pues el conocimiento individual del léxico es siempre parcial y fragmentario. También es un mal método suponer que el vocabulario contenido en los diccionarios de la Academia Española corresponde al “español general”, pues la Academia no dispone de la investigación descriptiva necesaria para hacer comparaciones y encontrar la intersección correspondiente entre todos los dialectos del español o todos los españoles nacionales. Debería ser obvio para todo mundo que el diccionario académico es selectivo, pancrónico y sesgado hacia los conocimientos parciales de los miembros de la Academia y sus correspondientes americanas, que incluso desconocen la realidad léxica contemporánea de sus países. Por el contrario, nuestro método nos permite afirmar que hemos encontrado un núcleo léxico del español mexicano, correspondiente al vocabulario que se utiliza en toda la república y, sobre todo, en los usos cultos y populares nacionales. Nuestro CEMC, en cambio, no documenta aceptablemente los usos regionales, debido a su orientación hacia la tradición culta nacional y tampoco reúne todo el vocabulario usado en México, sino sólo el que apareció en los textos considerados.
En meses recientes preparamos la segunda edición del Diccionario del español usual en México , corregida y aumentada para tomar en cuenta vocablos cuya frecuencia absoluta fuera menor de 10 e igual a 8. Nos ha sorprendido cómo, al revisar 1,300 vocablos con esas características, notamos que su aparición se ha vuelto más aleatoria, pues encontramos voces que nos parecen de uso muy restringido y echamos de menos otras que, como hablantes, reconocemos muy usuales. Esto quiere decir que el núcleo léxico del español mexicano está formado por 12,000 a 15,000 vocablos y quizá también que los límites del “español panhispánico” contemporáneo, descriptivamente considerado, pueden estar en ese orden cuantitativo. El “español total”, entendido como el mayor conjunto de vocablos que se pudiera reunir en todo el mundo hispánico y en todas las épocas, prescindiendo de su uso activo, será seguramente de varios cientos de miles de palabras.
De nuestro corpus derivamos otra clase de medidas, que expongo en este artículo. El interés de estas medidas corresponde a una rama de la lingüística casi desconocida, la lingüística cuantitativa, una disciplina que puede llegar a ser un elemento determinante para comprender las lenguas como sistemas dinámicos complejos, a diferencia del estado actual de nuestra ciencia, que se concentra en la búsqueda de sistemas formales cualitativos.
Los datos que hemos obtenido son igualmente interesantes para otras ciencias, como la neurología, la audiología y la ingeniería de las comunicaciones.
Todos ellos estarán disponibles para consultas puntuales en la página de Internet de nuestro diccionario, bajo el portal de El Colegio de México, en los próximos meses. Igualmente planeamos una edición en disco compacto. Quienes ya han utilizado nuestros materiales saben, además, que es posible obtenerlos dirigiéndose a nosotros expresamente.