Introducción

Cuando se trata de un diccionario, su historia no se puede desimbricar de la historia de sus autores. María Moliner, Paul Robert —iniciador de la gran tradición lexicográfica francesa de los diccionarios “Robert”— o Sir James Murray —quien dedicó toda su vida al Oxford English Dictionary— han dejado testimonios de la manera en que la elaboración de sus diccionarios determinó sus propias historias y del modo en que sus propias historias dejaron su huella en los diccionarios. La historia del Diccionario del español de México tampoco puede separarse de la vida de sus autores y particularmente de la mía. Por eso le pido al lector que disculpe el entrelazamiento de historia personal e historia del diccionario que advertirá al comienzo de estas páginas. Corro el riesgo de que piense que tienen una finalidad autocelebratoria, pero espero que lo que cuento lo convenza de que, lejos de eso, mi objetivo es explicar no sólo la manera en que hicimos este diccionario, sino también sus avatares.

Hay veces en que la fortuna, que es una diosa, se junta con la generosidad, que es una virtud. Cuando eso sucede, hay algunos que reciben, inmerecidamente, sus dones. Este es mi caso y este es el origen del Diccionario del español de México (DEM).

En algún momento de comienzos del año de 1972, don Antonio Carrillo Flores, antiguo secretario de Relaciones Exteriores, de Hacienda, embajador de México en Washington y, en ese entonces, director del Fondo de Cultura Económica, se encontró con el presidente de El Colegio de México, don Víctor L. Urquidi, y le expuso su inquietud, basada en su propia experiencia internacionalista, de que México no tuviera un diccionario propio, que correspondiera a su historia y a su cultura, como sí lo tenía Estados Unidos de América en la tradición de los diccionarios de Noah Webster, ese patriota de la época de fundación de su país, continuada por la casa Merriam- Webster, de Massachussets. Don Antonio Carrillo Flores notaba, como muchos mexicanos, hispanoamericanos e incluso españoles, que los diccionarios de la Academia Española no correspondían ni al estado actual de la lengua, ni mucho menos a la manera en que había evolucionado en cada región hispanohablante, arraigándose en sus propias experiencias históricas. De ahí que le preguntara si El Colegio de México sería capaz de emprender la elaboración de un diccionario que, a la larga, se convirtiera en un “Webster mexicano”. Don Víctor, cuya visión del futuro y cuya capacidad para imaginar nuevos ámbitos de investigación impulsó tantos estudios nuevos en El Colegio, pasó la pregunta a nuestro director del Centro de Estudios Lingüísticos y Literarios, mi maestro Antonio Alatorre.

Una tarde pasó Antonio por mi cubículo y me contó aproximadamente la inquietud de don Antonio Carrillo Flores y la pregunta de don Víctor Urquidi: “Dijo Carrillo Flores que si alguno de los ‘genios’ de El Colegio sería capaz de escribir ese diccionario. ¿Tú crees que puedas?”. Me quedé sorprendido, asustado y halagado y, quizá en pocos segundos, con una audacia temeraria, le contesté que creía que sí. Entonces me pidió que escribiera un dictamen, de unas cuantas páginas, acerca de la posibilidad de escribir el diccionario.

La fortuna me había dado cinco profesores que me habían formado y que me habían llevado a tener unas cuantas ideas acerca de la lengua española contemporánea y de su carácter mexicano: Antonio Alatorre y Margit Frenk, cuya concepción abierta y rica de la lengua española y cuya flexibilidad normativa se nos habían transmitido como estudiantes; Juan M. Lope Blanch, hispanista pero no españolista, quien había iniciado los estudios de geografía lingüística y dialectología en México; Klaus Heger, teórico de la semántica y de los primeros en tomar en serio el papel de la cuantificación y de la computación electrónica en lingüística; y Kurt Baldinger, antiguo colaborador de Walther von Wartburg en la elaboración del gran y todavía insuperado diccionario etimológico del francés Französisch Etymologisches Wörterbuch. Nunca imaginé, cuando cursaba con ellos materias y seminarios, que algún día podría conjuntar sus enseñanzas en la construcción de un nuevo diccionario.

El caso es que escribí el dictamen “Sobre la justificación de un diccionario de la lengua española hablada en México”, exclusivamente como un documento para Antonio Alatorre, don Víctor y don Antonio Carrillo Flores. Pocas semanas después, supe que don Antonio había presentado mi dictamen a la Junta de gobierno del Fondo de Cultura Económica y que nos invitaba a Antonio, a Lope Blanch y a mí, a desayunar en su casa de la calle de Texas, en la colonia Nápoles. Una mañana soleada nos presentamos a su casa y, durante un desayuno mexicano, con jugo de naranja, toronja, huevos rancheros, frijoles y café, que me produjo un ataque inmediato de gastritis, debido al nerviosismo que me consumía, don Antonio cedió la palabra a Antonio. Él, a su vez, dándole su lugar a Lope Blanch, se la cedió a éste. Lope Blanch, como lo demuestra su biografía, no se arredraba ante grandes empresas y por eso fue capaz de planear, dirigir y llevar a cabo el Atlas lingüístico de México; sin embargo, ese día sostuvo que un diccionario mexicano era irrealizable, pues había que tomar en cuenta que la Academia Española, todavía después de 250 años, era incapaz de ofrecernos un diccionario de la calidad del Webster, como lo deseaba Carrillo Flores. Antonio, cuidadosa y gallardamente, sostuvo en su intervención que Lope tenía muy buenos argumentos, pero que se trataba de comenzar una empresa de esa clase y que alguien tendría que hacerlo alguna vez. Finalmente me cedieron la palabra y defendí mi dictamen, temeroso de la reacción de Lope Blanch, cuya capacidad para romper lanzas en cualquier lisa conocía yo bien de mis años de estudiante. También agregué que me era imposible saber cuánto nos tardaríamos, pues la historia de la lexicografía demuestra que todos los autores de diccionarios se han equivocado en sus cálculos, y en la época del presidente Luis Echeverría ya sabíamos que él quería que todas las cosas se hicieran “para ayer”. Don Antonio concluyó el desayuno ofreciéndonos hablar con el presidente de la república para que financiara el proyecto y agregó: “Por mis largos años de experiencia en el gobierno mexicano, le aseguro que ningún gobierno se atreverá a interrumpir el financiamiento de un trabajo como este”.

Salimos de la casa de don Antonio y, al llegar a El Colegio, Lope, imperativo, me dijo: “Le invito un café”. En la cafetería de El Colegio, inclinado hacia mí me dijo: “¿Se da usted cuenta del lío en que se ha metido?” Debo haberle contestado, tartamudeando, que sí.

Pocas semanas después se presentó ante mí Martín Casillas para decirme que en IBM se habían enterado de lo que planeaba hacer y que esa empresa nos ofrecía todo el trabajo de cómputo gratuitamente. Sorprendido, le contesté que lo consultaría con don Víctor Urquidi y éste lo descartó, pues prefería que todo el trabajo se hicieran en máquinas del sector público (años después, Antonio Zampolli, director del Centro Nazionale Universitario di Calcolo Elettronico, de Pisa, me contó que IBM se había apresurado a plantearle la posibilidad de hacer un sistema de cómputo para un diccionario como el nuestro, una propuesta que llevaron a cabo, independientemente, años después).

Aunque IBM y el ABC de Madrid se habían enterado antes del proyecto, éste no se dio a conocer hasta que se publicó en La Gaceta del Fondo de Cultura Económica en su número 19 de 1972, páginas 1 a 6. Las paredes oyen.

El presidente Echeverría nos concedió un fideicomiso con capital para cuatro años de trabajo. El Colegio alquiló un departamento enfrente de su edificio, en la calle de Guanajuato, y me dediqué a buscar los colaboradores necesarios. Así se integraron Luz Fernández Gordillo y Carmen Delia Valadez, ambas egresadas también de El Colegio. Se agregaron a ellas dos alumnas mías en el Centro: María Ángeles Soler y Paulette Levy. Omitiré mencionar otros colaboradores, que pasaron poco tiempo con nosotros. Invertimos parte del dinero del fideicomiso en formar una biblioteca de obras de consulta y de libros y revistas especializados que nos pudieran ayudar a planear bien la investigación y la redacción del diccionario. Por supuesto, también gastamos en muebles, archiveros y máquinas de escribir; al terminar de darle sustancia al proyecto, también sirvió para que viajara yo a consultarlo con Kurt Baldinger, Paul Imbs (Director del Trésor de la langue française), Bernard Quemada (Director del Centro de Estudios del Vocabulario Francés, de Besançon), Alain Rey y Josette Rey-Debove (Director y redactora en jefe de los diccionarios Le Robert) y Jean Dubois (Director de lexicografía de la casa Larousse). El resto, la mayor parte, se consumió en nuestros salarios.

Al comienzo teníamos dos problemas centrales: cómo saber cuál era el vocabulario usado en el español de México y cómo reunirlo. La tradición lexicográfica mexicana de García Icazbalceta, Feliz Ramos i Duarte, Francisco J. Santamaría, Marcos E. Becerra y varios más era regionalista y prescriptivista. Es decir, sus diccionarios recogían sólo voces que se considerasen “indigenismos”, “vicios”, “barbarismos” y “solecismos” que se usaran en México y no en España o en otras regiones del mundo hispánico. Era una tradición de registro de voces pintorescas y diferentes de las que aparecían en los diccionarios de la Academia y se seleccionaban precisamente por no estar incluidas en ese diccionario. Muchos de ellos titularon sus diccionarios para destacar lo incorrecto de las voces que contenían, aunque con un gusto casi perverso por ellas: afirmaban la incorrección de nuestros regionalismos, pero gozaban apuntándolos. Así, los diccionarios de mexicanismos se ocupan tradicionalmente de un vocabulario marginal para la Academia y para la idea de la lengua que ésta difunde. He llamado “conciencia del desvío” al modo en que trata el vocabulario la práctica lexicográfica regionalista, que caracteriza a la tradición lexicográfica mexicana y, en general, a la lexicografía hispánica, pues tanto Hispanoamérica como España están de acuerdo en esa concepción, aunque desde sus diferentes posiciones: metropolitana y periférica. En consecuencia, un nuevo diccionario de regionalismos mexicanos, de mexicanismos, no podía responder al reto inicial de escribir un diccionario de la lengua española tal como la usamos los mexicanos, según el modelo de Webster, pues ese diccionario es precisamente un diccionario estadounidense de la lengua inglesa, que se centra en el uso de su país, no un diccionario de regionalismos estadounidenses.

Günther Haensch es el autor de la distinción entre “lexicografía diferencial”, la de la tradición de los regionalismos, y “lexicografía integral”, la de la tradición académica, hasta entonces sólo practicada por la Academia misma en España (y las editoriales comerciales dependientes de su diccionario) y con clara delimitación metropolitana; no olvidemos el lamentable dicho de Leopoldo Alas: “los españoles somos los dueños del idioma”. En cambio, lo que nosotros queríamos era un diccionario integral del español, basado en el uso mexicano. No, como lo publicó alarmado el ABC de Madrid, para “dar nuestro nuevo grito de independencia”, ahora lingüística, y producir un “cisma de la lengua española”, sino para corresponder a una lengua que, en México, está en el origen de nuestra nacionalidad y de nuestra cultura, sin negar la siempre deseada unidad del español y también sin menospreciar la rica actualidad de las lenguas indígenas.

Así que teníamos que construir una base de datos que nos permitiera conocer el uso del vocabulario del español en México. Una base que registrara nuestra manera de hablar, que comparte con España e Hispanoamérica un gran porcentaje de vocablos, pero que tiene sus diferencias en el significado y en el uso, aun en vocablos muy comunes, para darle el reconocimiento que se merece.

La tradición lexicográfica hispánica ha estado dominada por la Academia Española. Todo vocablo que ella no introduzca —“que no acepte”— en sus diccionarios, “no existe” para los hispanohablantes; todo significado que difiera de los que define, es sospechoso de barbarismo. A lo largo de los siglos el predominio ideológico y prescriptivo de la Academia logró que cualquier otro diccionario integral del español no fuera sino una refundición del académico, con algunos retoques. Esto se puede afirmar, incluso, del Diccionario de uso del español de doña María Moliner. A la vez, los diccionarios de regionalismos, diferenciales, determinan su vocabulario y sus significados comparándolos con el de la Academia, bajo la suposición, completamente falsa, de que el diccionario académico refleja mejor la realidad del español “general”. En consecuencia, nuestro método de trabajo no podía consistir, como alguien propuso en las primeras reuniones, en repartirnos los folios del último diccionario de la Academia (abreviado DRAE) entre los integrantes del grupo, ir marcando qué vocablos conocíamos y apuntando los que nos fueran brotando de la memoria y no estuvieran incluidos en el DRAE. De haber actuado así, habríamos logrado un caprichoso acervo de vocablos que sólo por coincidencia corresponderían al uso mexicano.

Necesitábamos, por lo tanto, construir nuestra base de datos de otra manera, que nos garantizara un acervo fidedigno del uso del español en México, sin intervención alguna ni de nuestros propios y limitados conocimientos, ni de nuestras preferencias normativas. Lo mejor sería reunir una gran cantidad de textos y grabaciones para sacar de ellos imparcial y objetivamente, el vocabulario buscado. Pero ¿cuántos, cuáles y cómo? Sería imposible ponernos a leer nosotros mismos todo lo publicado y asequible e ir entresacando de ellos todos sus vocablos, pues entonces de veras 250 años no nos habrían bastado. En cambio, el uso de la computadora electrónica, que ya estaba entronizado en las ciencias naturales y en la administración, nos podía permitir “leer” grandes cantidades de textos sin intervención de nuestros juicios, registrar todas las palabras contenidas en ellos, contar cuántas veces aparecía cada una de ellas y elaborarles una ficha con los contextos en que se presentaran.

Había dos experiencias previas de esta manera de proceder: la de Henry Kučera y W. Nelson Francis en el Computational Analysis of Present Day American English, y la de Paul Imbs, para el Trésor de la Langue Française. En la primera investigación, Kučera y Francis reunieron poco más de un millón de apariciones de palabras, entresacadas aleatoriamente de una muestra de textos; en la segunda, con el gran impulso nacionalista francés del general De Gaulle, habían alimentado con miles de obras francesas su computadora, para reunir cerca de 70 millones de apariciones de palabras. Lo que fue nuestra primera enseñanza cuantitativa, fue comprobar que, mientras Kučera y Francis habían obtenido de su corpus 50 000 vocablos distintos, Imbs sacó del suyo sólo 71 mil diferentes. Eso quería decir que, como enseñaban todos los estadígrafos lingüísticos, lo importante no era la cantidad de las obras fuente, sino la calidad de su selección.

Al comenzar el trabajo se formó un Consejo de redacción del diccionario, integrado por Antonio Alatorre, Raúl Ávila, Margit Frenk, Beatriz Garza, Juan M. Lope Blanch y Tomás Segovia, del Centro de Estudios Lingüísticos y Literarios, y Jaime García Terrés, Andrés Henestrosa, Carlos Monsiváis, Tito Monterroso y Gabriel Zaid. La función de ese Consejo consistió en ayudarnos a determinar el tratamiento que recibirían los vocablos, seleccionar una muestra de obras literarias y revisar las primeras redacciones que se fueran produciendo.

Para seleccionar los textos que habrían de conformar el Corpus del español mexicano contemporáneo (CEMC), siguiendo las enseñanzas relatadas y de acuerdo con los métodos de la estadística lingüística, era necesario reunir muestras de toda clase de géneros textuales y hablados, de autor o emisor mexicano, y crear con ellas varias agrupaciones distintas, que permitieran calcular la difusión del uso de cada vocablo (dispersión, técnicamente hablando) junto con su frecuencia de aparición. Pero antes de eso teníamos que definir lo que entendíamos por “español mexicano contemporáneo”. La lexicógrafa francesa Josette Rey Debove proponía que se considerara “vocabulario contemporáneo” (correspondiente a una sincronía práctica, en términos técnicos) aquel compartido por tres generaciones de hablantes que se comunican entre sí: abuelos, padres e hijos, de acuerdo con la esperanza de vida de cada época. Respecto de 1973, nuestro vocabulario mexicano contemporáneo tendría que corresponder al comienzo del siglo XX, pero hay lugar para sospechar que la Revolución mexicana, entre 1910 y 1921, haya dejado una huella todavía inexplorada en la vida de las palabras, debido a los grandes movimientos de población que provocó la guerra civil y al enfrentamiento cultural e ideológico que estaba en juego. Por eso Carlos Monsiváis propuso que tomáramos como punto de partida de nuestra contemporaneidad tres acontecimientos históricos casi simultáneos: el fin del período armado de la Revolución, que asentó la población; la publicación de Los de abajo de Mariano Azuela, primera novela del México contemporáneo; y el comienzo de las emisiones radiales de la XEW, principio de la difusión nacional de noticias, costumbres y símbolos ideológicos. Así decidimos tomar en cuenta textos escritos desde 1921 hasta 1974.

En seguida pasamos a diseñar la clasificación de textos y grabaciones que conformarían el Corpus. Tratamos de identificar cada clase o “género” de acuerdo con su pertinencia social. Así por ejemplo, en el género del periodismo se incluyeron junto a las noticias nacionales y los editoriales, algunos textos de crónica taurina; en el de textos religiosos, sermones y catecismos no sólo católicos, sino también algunos protestantes. Para seleccionar los textos literarios acudimos a un informe de la Biblioteca Nacional, en que se asentaba el número de ediciones y ejemplares vendidos de cada obra, y seleccionamos los supuestamente más leídos. Para los textos de ciencias y técnicas, pedimos a muchos asesores universitarios que nos dieran listas de los libros de texto más usados y de las revistas especializadas publicadas en México, etc. Se puede conocer pormenorizadamente la conformación del CEMC si se lee el libro conjunto de Isabel García Hidalgo, Roberto Ham y yo, Investigaciones lingüísticas en lexicografía, El Colegio de México, 1980.

El CEMC quedó formado por 996 "textos" de dos mil palabras gráficas cada uno, dividido en 14 géneros. Esos “textos” están compuestos por párrafos aleatoriamente entresacados de las fuentes, por dos razones: la primera, contarrestar el predominio del estilo de cada autor, que tendería a privilegiar unos vocablos sobre otros; la segunda, aumentar el número de palabras diferentes que se encontraran. Es decir, es un corpus más grande que el de Kučera y Francis, pero mucho más pequeño que el del Trésor de la Langue Française; a diferencia del primero, que aisló palabras, el CEMC las conserva en su contexto, lo que es necesario para poder hacer posteriormente el análisis semántico de cada vocablo.

En 1973 era todavía raro utilizar la computadora electrónica en la investigación lingüística. La máquina se utilizaba sobre todo para hacer comparaciones entre listas de palabras, lo que nos planteaba la cuestión de la lista que habría de servirnos de referencia para el reconocimiento de las palabras del corpus. La práctica de esa época en Francia, en Italia, en Estados Unidos de América consistía en tomar un diccionario y cotejar con él las palabras de los corpus. En nuestro caso eso habría significado tomar el DRAE como referencia y reconocer nuestro vocabulario en relación con él. ¿Qué pasaría con vocablos nuestros que el DRAE no contuviera? Que no los reconocería y, además, significaba seguir tomando como marco de referencia el diccionario académico. Por eso opté por hacer nuestro propio sistema de análisis automático de las palabras basado en sus propiedades morfológicas y de distribución sintáctica en los textos. Se puede leer una explicación amplia de este procedimiento en mi artículo “Méthode en lexicographie: valeur et modalité du dictionnaire de machine”, Cahiers de lexicologie, 29,2 (1976), 103-128. Pasamos cerca de un año elaborando el Analizador gramatical automático del DEM, que resultó ser el primer trabajo de esta clase en lengua española y el único —incluso hasta ahora— basado en reglas morfológicas y sintácticas. El Analizador significó para la matemática Isabel García Hidalgo el Premio Dr. Arturo Rosenblueth a Sistemas de Cómputo en 1981.

La capacidad de la computadoras en esos años era infinitamente menor que la que tiene hoy cualquier máquina portátil. Por principio, no se podía alimentar los materiales directamente a la máquina, sino que había que hacerlo mediante tarjetas perforadas. Como nuestro pequeño grupo de trabajo no tenía habilidades de perforista y habría significado una gran pérdida de tiempo si tratáramos de hacer ese trabajo nosotros mismos, contratamos una empresa especializada en ello y le entregamos todos los textos que habíamos coleccionado. Esas empresas se comprometían, bajo contrato, a perforar las tarjetas y verificarlas, pero con cierto margen admitido de errores. Así alimentamos la gran máquina UNIVAC 1106 del Centro Dr. Arturo Rosenbueth de la Secretaría de Educación Pública, gracias al apoyo de su director, el Dr. Enrique Calderón Azati.

Aquella máquina, de las mayores en México, sólo tenía 64 kilobytes de memoria de acceso directo (hoy, cualquier máquina de juegos infantiles la supera varias veces), por lo que los procesos de análisis y producción de resultados ocupaban toda la capacidad de la máquina y tenían que hacerse por partes. Llevó cerca de ocho meses, todas las noches, mientras la SEP dormía, hacer el análisis del CEMC.

Para finales de 1976 nuestro Corpus estaba analizado. Habíamos obtenido 1 891 045 palabras gráficas, que se redujeron a 64 183 diferentes, un resultado un poco mayor que el de Kučera y Francis y un poco menor que el del Trésor. El CEMC fue el primer corpus de datos lingüísticos de la lengua española elaborado con la ayuda de una computadora electrónica. Junto con el Analizador, fue una primicia en la investigación contemporánea del español. La experiencia del Corpus confirmaba todas las predicciones de los estadígrafos que nos precedieron. Se terminaba el primer plazo del fideicomiso y el gobierno federal lo amplió por otros cuatro años.

Al reconocimiento automático de las palabras agregamos un sistema de cálculo de la frecuencia de aparición de cada palabra, tanto en cada género, por ejemplo, cuántas veces aparece la palabra parámetro en los textos científicos y técnicos, como en todo el CEMC; a partir de esos datos, calculamos la dispersión del uso entre todos los géneros, con lo cual podemos reconocer qué palabras son las más usadas en el Corpus mediante un índice que correlaciona el tamaño de cada género, la frecuencia de aparición de cada palabra y su dispersión. Ha sido este índice el que nos guía en la incorporación de vocablos al diccionario. Fue el estadígrafo Roberto Ham Chande el autor de ese sistema de análisis cuantitativo que, hasta la fecha, no ha sido superado internacionalmente.

Por último, el análisis del CEMC nos dio grandes listados de datos cuantitativos de todas las palabras encontradas y un gran conjunto de concordancias, es decir, para cada palabra, una lista de todos los contextos en que apareció en el Corpus. Armados con esos resultados, podíamos comenzar el análisis cualitativo y después la redacción del diccionario.

La lexicografía forma parte de la lingüística aplicada. Depende de la lingüística, sobre todo, en la concepción del signo y el significado que orienta el análisis semántico, en el análisis gramatical, en la interpretación de la complejidad del uso social de las palabras y los fenómenos normativos ligados a ella, en los planteamientos cuantitativos y en la manera de formular el sistema de análisis computacional; pero por sí misma no es una ciencia, sino una metodología que ofrece criterios y reglas de trabajo que, cuando se ponen en práctica, le dan su existencia real y la convierten en arte, como la definen los diccionarios. Un trabajo como este no podría haberse llevado a cabo sin conocimientos lingüísticos, pero no bastan esos conocimientos para componer el diccionario; para hacerlo, hay que encontrar una práctica lexicográfica que se va definiendo conforme cada vocablo plantea sus propias dificultades y que se consolida con la participación determinante de las personas que participan en el equipo de trabajo. Enseñar los criterios y las reglas de la lexicografía es relativamente sencillo; saber ponerlos en práctica requiere años de trabajo concienzudo y permanente, además de ciertas aptitudes de los lexicógrafos.

Una de las enseñanzas que obtuvimos en este sentido es que la profesión de lingüista no necesariamente lo habilita a uno como lexicógrafo. Para ser lexicógrafo es mucho más importante tener ciertas aptitudes que no se enseñan en la universidad: un interés casi universal por las cosas, que encuentre atractivo lo mismo en una receta de cocina que en un texto de genética; una práctica de la escritura y una voluntad de estilo, y conocimiento de otras lenguas, pues muchas veces ese conocimiento sirve para establecer contrastes con la lengua propia, que le permiten a uno tomar distancia de ella y le develan matices del significado oscuros para cualquier persona monolingüe. Fue así como el equipo del DEM fue modificándose, en un suave proceso de selección, durante el cual aprovechamos la capacidad de varios jóvenes escritores mexicanos que tenían esas aptitudes.

Comenzamos el análisis de los vocablos que nos proporcionó el CEMC entre 1976 y 77. Cuando El Colegio de México se mudó al Pedregal de Santa Teresa, el equipo de trabajo ya había comenzado la tarea. Una parte del equipo se concentró en la documentación de los vocablos, junto con los resultados cuantitativos y las concordancias: la materia prima. Tomamos en cuenta todos los estudios particulares y todos los diccionarios mexicanos de regionalismos que pudimos encontrar. Formamos un grupo de “diccionarios testigo”, a base de trece obras —presididas por el DRAE— tanto integrales como de regionalismos —por ejemplo, el Diccionario de mejicanismos de Francisco J. Santamaría—, que nos sirvieron para verificar ortografías y acepciones, fundamentalmente, pero también para contrastar sus definiciones con las que nosotros mismos íbamos redactando. Otra parte del grupo se dedicó al análisis y redacción. Cada redactor, por su cuenta, tiene que estudiar los textos pertinentes cuando se trata de voces especializadas o de palabras cuyo significado se ha formado en la cultura y en la historia. Así, para poder redactar un vocablo característico de la física, hay que leer algunas obras especializadas que le permitan a uno hacerse una idea clara de su significado. Muchas veces hay que acudir a un consultor para pedirle precisiones o actualizaciones del conocimiento. Tratándose de botánica y de zoología, en especial, tan ricas y diversas, contamos con tres consultores que nos proporcionaron la información necesaria: los doctores Ramón Riba (de la Universidad Autónoma Metropolitana), y Javier Valdés y R. Martín del Campo (de la Universidad Nacional Autónoma de México). Para las demás materias hacemos consultas esporádicas a los demás asesores, listados en la página 8.

El DEM es un diccionario original; es decir, no refunde textos de obras anteriores sino que se basa en análisis nuevos e independientes de cada vocablo y sus significados. Para lograrlo seguimos el siguiente procedimiento: cada lexicógrafo debe analizar el vocablo sin tomar en cuenta estudios y diccionarios anteriores, basándose exclusivamente en los datos del CEMC y su propio conocimiento de la lengua; el primer producto de ese análisis es un borrador de la estructura de cada artículo lexicográfico (es decir, de cada texto presidido por una entrada en el diccionario, seguido por las abreviaturas de categoría gramatical, flexión y conjugación, y una serie de acepciones ordenadas, seguidas la mayor parte de las vece por ejemplos sacados de los textos del CEMC y por ejemplos de los usos habituales de las palabras, colocaciones, técnicamente hablando). Una vez escrito ese borrador, se enriquece con la lectura de obras especializadas de los temas en que suele utilizarse la palabra y después se contrasta con los “diccionarios testigo”, se corrige y se refina. Terminada esa primera redacción, pasa a un revisor, que repite el procedimiento como si el primero no hubiera existido y luego confronta su trabajo con el anterior.

Al principio el Consejo de redacción leía lo que producíamos y, aunque cada sesión era provechosa y divertida —hay que ver quiénes eran nuestros consejeros, con alguna excepción—, el tiempo que se consumía en ellas era demasiado y nosotros no lográbamos establecer una práctica homogénea y definida, sujetos a tan diversas y espontáneas opiniones. Las sesiones con el Consejo, naturalmente, no podían ser muy frecuentes ni durar mucho tiempo. He de reconocer que me costó trabajo identificar las causas de nuestras dificultades iniciales de redacción y asumir por completo, en consecuencia, mi responsabilidad como director del proyecto. Un equipo lexicográfico tiene que desarrollar una práctica especializada propia que lo profesionaliza y, para lograrlo, las opiniones externas, por bien intencionadas y muchas veces correctas que sean, se convierten en obstáculo, debido a su espontaneidad. El Consejo fue determinante en el planteamiento inicial del diccionario y del CEMC, pero después resultó disfuncional, y dejé de reunirlo.

Para 1979 el equipo del DEM estaba en plena actividad. No sólo avanzábamos en la redacción, sino que habíamos abierto varios campos de investigación que hasta entonces eran desconocidos en México. Además de mantener activo nuestro Analizador, que deseábamos poder mejorar (un interés de investigación, ligado a la vez al desarrollo de la gramática formal y de la lingüística computacional), María Pozzi elaboró un sistema reductor de concordancias, la llamada “Horquilla”, que tenía la función de revisar automáticamente las concordancias de vocablos de alta frecuencia para seleccionar sólo las que nos mostraran patrones sintácticos diferentes, pero garantizando, a la vez, que no perdíamos información. Un trabajo así contribuía a reducir el tiempo de análisis por parte de los redactores. Nuestro contacto con los vocabularios especializados de las ciencias y de las técnicas nos llevó a hacer los primeros estudios de terminología del español en México y a tratar de difundir el interés por ese nuevo campo de la lingüística aplicada en el país. Igualmente, los resultados cuantitativos nos permitían ofrecer datos interesantes para audiólogos, psicólogos, neurólogos y maestros de escuela, interesados por conocer el vocabulario fundamental del español de México y sus características fonológicas y silábicas.

Creímos que, para poder avanzar más rápido —puesto que el fideicomiso lo exigía—, lo que hacía falta era aumentar el número de redactores, por lo que el equipo de trabajo creció; pero el efecto de ese aumento fue un crecimiento correlativo de las divergencias en el análisis y en los estilos de la redacción, que implicaba aumentar también el número de segundas, terceras y hasta cuartas revisiones, con lo que no había ganancia temporal y sí un mayor gasto en salarios.

En 1980 estalló un serio conflicto laboral en El Colegio. No sólo por el tiempo perdido mientras las instalaciones estuvieron cerradas, sino también por el enfrentamiento que se produjo entre el personal académico de El Colegio, nuestro trabajo se vio reducido y, hasta cierto punto, puesto injustamente en tela de juicio. Remontar ese daño implicó mucho esfuerzo, tanto colectivo como personal, durante varios de los años siguientes.

El país se acercaba al final del gobierno de José López Portillo, a la gran crisis económica, a la derrota presidencial a cargo de los especuladores y al comienzo del derrumbamiento del sistema político resultante de la Revolución. El Presidente de la república formó la “Comisión Nacional para la Defensa del Idioma Español” y muy pronto el Secretario de educación, Fernando Solana, nos pidió que colaboráramos con ella, dándole, en el plazo de un año, un pequeño diccionario para uso de la escuela elemental.

Como todos los diccionarios, nosotros habíamos comenzado por el principio del abecedario: de la letra A pasaríamos a la B y así sucesivamente. Para poder entregar en un año un pequeño diccionario con esas características teníamos que suspender ese orden y, sobre todo, seleccionar los vocablos que debieran constituir el Diccionario fundamental del español de México. Así que opté por tomar el vocabulario fundamental, que habíamos sacado de nuestro estudio cuantitativo, y agregarle el vocabulario temático de los libros de texto gratuitos vigentes en esa época. Para reunir este último vocabulario, el equipo e dedicó a leer esos libros y entresacar el vocabulario, pues no podíamos esperar a que todos ellos pasaran por el proceso de perforación en tarjetas. Es decir que, después de seguir un proceso lineal en la redacción, pasamos a otro de ampliación concéntrica, en que se recorría el abecedario de la A a la Z dentro de unos límites fijados cada vez por el estudio cuantitativo. La Comisión del español, con el Fondo de Cultura Económica, publicó ese mínimo diccionario a mediados de 1982. Gabriel Zaid lo reseñó, justamente, en un artículo cuyo título, juguetón, era: “Jitomate, solanácea” (Vuelta 77, 1983), como un trabajo fallido a causa de la premura impuesta por la Comisión.

Pero la petición de Fernando Solana tuvo dos buenos efectos sobre nosotros: primero, fue una especie de examen para comprobar que estábamos trabajando; segundo, nos ayudó a consolidar finalmente una práctica y un estilo de la redacción guiados por criterios claros.

Como decía al principio, todos los autores de diccionarios se han equivocado al calcular el tiempo que les toma terminar un diccionario. En ocho años de trabajo habíamos completado una investigación muy valiosa del español de México, tanto para nosotros como, en general, para la lingüística hispánica; habíamos construido con éxito el primer sistema de análisis automático del español; habíamos ideado un sistema de cálculo cuantitativo que eliminaba la subjetividad en la selección de vocablos para el diccionario; pero habíamos terminado solamente un pequeño diccionario de 2500 artículos. Sin embargo, al ver plasmados en el Diccionario fundamental una idea clara del diccionario que queríamos hacer, un estilo de la redacción y un resultado que se comentó críticamente, me pareció que era más conveniente abandonar el proceso lineal de redacción y que continuáramos con procesos de ampliación concéntrica de nuestros diccionarios, que nos permitieran ofrecer novedades al público y a nuestras autoridades en plazos menores. Así fue como compusimos el Diccionario básico del español de México, publicado en 1986, a base del diccionario anterior y el vocabulario utilizado en la educación secundaria. Así llegamos a 7000 vocablos. Uno y otro de esos dos primeros y pequeños diccionarios pasaron por la revisión del Consejo Nacional Técnico de la Educación, que hizo comentarios sobre su contenido y nos solicitó adecuar varios de sus textos a las necesidades del alumno de escuela primaria y secundaria.

Al terminar 1982, cuando el presidente López Portillo cedió la cúspide el poder político a los administradores, se dio por terminado el fideicomiso y el trabajo quedó totalmente a cargo de El Colegio de México.

El equipo lexicográfico había comenzado a reducirse a raíz del conflicto laboral de 1980. A partir de entonces, con la práctica bien consolidada y unos colaboradores que llevaban ya años de trabajar juntos, el análisis y la redacción siguieron avanzando. El grupo nuclear quedó formado por Luz Fernández Gordillo, Francisco Segovia, Laura Sosa, Carmen Delia Valadez y Carlos Villanueva (más tarde se incorporó el documentalista Gilberto Anguiano). En promedio, un redactor termina tres artículos lexicográficos por jornada de trabajo. Ha habido artículos que han llegado a costar hasta un mes de trabajo, debido a la complejidad de los significados y los usos de las palabras. Una de las características de la lexicografía, que generalmente se toma en cuenta sólo como anécdota, pero que incide profundamente en el trabajo es que, al hacer el análisis semántico de la propia lengua se produce un fenómeno psicológico notable: la necesidad de objetivar el vocablo en estudio para poder notar todos los elementos que contribuyen a la formación de su significado conduce a una enajenación total de la lengua, que se traduce en una inquietante opacidad, que impide continuar el análisis por varias horas; tiene uno que dejar pasar cierto tiempo, distrayéndose con otra actividad, para recuperar el sentido de la lengua y poder terminar el análisis y la redacción. La lexicografía es una dedicación de 24 horas diarias, pues la mente sigue trabajando las dificultades que plantea el significado de cada palabra incluso durante el sueño. Esa peculiaridad y el tiempo que debe uno ceder al proceso personal de recuperación del significado es, probablemente, uno de los motivos para que la redacción de un diccionario tome tanto tiempo.

El siguiente paso, a partir de 1986, consistió en prolongar el procedimiento de ampliación concéntrica de la redacción, tomando como nuevo objetivo terminar un Diccionario del español usual en México (DEUM 1), formado por todos los vocablos que tuvieran una frecuencia mínima de diez apariciones en el CEMC. Escogimos esa cuota mínima porque nos garantiza que el vocabulario que cumple con ella es verdaderamente usual. El DEUM 1 se publicó en 1996 y fue muy bien recibido tanto en México como en el extranjero. Finalmente habíamos ofrecido un pequeño diccionario con las características que debía tener, de acuerdo con el proyecto y el compromiso inicial: la selección de vocablos garantiza que se trata de voces realmente utilizadas en el español nacional de México; se orientan hacia la tradición culta de la lengua, pero corresponden a los usos más extendidos de una lengua común, en la que las voces coloquiales y populares, con las que tan fácilmente se identifican los mexicanos a sí mismos, aparecen bien explicadas y tratadas sin sospecha de incorrección, ni “conciencia del desvío”. He definido el DEUM como un diccionario para el ciudadano medio, que lee periódicos y desea poder comprender la mayor parte de lo que se dice en el ámbito nacional, sobre la base de su propio sentimiento de la lengua. Buscamos develar para ese ciudadano una lengua rica y arraigada en la experiencia mexicana. En vista del éxito del DEUM 1 y para poder seguir ofreciendo, sobre todo a los estudiantes, un diccionario en un solo tomo y relativamente fácil de manejar, pusimos en circulación una segunda edición, corregida y aumentada con vocablos cuya frecuencia mínima en el CEMC fuera de ocho apariciones; ese es el DEUM 2, que ahora circula.

El vocabulario de una lengua es ilimitado e innumerable. Tiene que morir una comunidad lingüística completa para que su vocabulario deje de crecer y, aun así, es imposible hacer un diccionario que lo contenga todo. Por más que las casas comerciales editoras de diccionarios compitan entre sí, desde el siglo XIX, anunciando cada vez más cientos y miles de vocablos incorporados a ellos, la idea de “riqueza” cuantitativa de una lengua que difunden en sus sociedades no significa nada en relación con la real complejidad y variedad léxica de las lenguas. Una enseñanza notable de nuestro estudio cuantitativo, que se hizo patente al reflexionar acerca de los vocablos cuya frecuencia fue menor de diez y mayor o igual a ocho en el CEMC es que existe un núcleo léxico de nuestro español cercano a los 15000 vocablos, que es el que constituye el “español mexicano nacional”, es decir, el que se utiliza en todo el país, sin distinción de regiones y de correlaciones exclusivas con grupos sociales determinados. Más allá de esa cifra, la aleatoriedad constitutiva del Corpus se ha vuelto evidente. Se puede explicar con una imagen biológica o astronómica: notamos un núcleo léxico como el de un sol o como el de una célula, en torno al cual el resto del vocabulario de frecuencia más baja aparece como un deshilachado de su orilla, como una periferia caótica. Apartir de esa “membrana”, encontramos muchos nahuatlismos específicos, muchas voces propias de diversas ciencias y técnicas, muchos nombres de seres de la naturaleza, que no forman campos léxicos completos y bien estructurados, sino que apuntan a un horizonte cambiante, que depende completamente de las características y de los textos que forman este CEMC.

En estas condiciones lo que podemos afirmar, tanto para las dos versiones del DEUM como para este diccionario, es que garantizamos que todo el vocabulario contenido en ellos se usa o se ha usado en el español mexicano del siglo XX y principios del XXI. También, que no incluye todo el vocabulario del español de México, pero que los faltantes que encuentre cada uno de sus lectores no obedecen a ninguna exclusión normativa o prescriptiva, como nos tenía acostumbrados la tradición lexicográfica española (pues la Real Academia parece estar cambiando). Es decir, la ausencia de un vocablo en el diccionario no quiere decir, ni que “no exista”, ni que “no lo aceptemos”.

No apelamos a que nuestros lectores nos concedan a priori una autoridad propia, derivada de la institución en la que trabajamos o de la calidad de nuestros grados universitarios o nuestros diplomas individuales. Si el DEM gana alguna autoridad, algún ascendiente en los juicios normativos que cada persona haga sobre su vocabulario, será resultado de su fidelidad al español de México, a los ricos matices que adquiere el significado de nuestras palabras, a los usos que hemos podido comprobar. Lo que queremos, como hemos dicho desde nuestra primera publicación, es devolver a los hispanohablantes mexicanos el vocabulario de su propia lengua, tal como se usa, para que lo conozcan y aprecien mejor. En cuanto a la gran comunidad hispanohablante, en América, Europa, Asia y África, lo que le ofrece el DEM es un vocabulario de uso mexicano que hace evidente la unidad de la lengua por la que tanto nos hemos esforzado desde la época de nuestras independencias, a la vez que muestra la riqueza derivada de un español arraigado en la experiencia histórica de México, seguramente semejante a la variedad que se encuentra en los otros veintiún países que forman la comunidad hispánica, y que históricamente ha sido soslayada por el centralismo académico y la idea de la lengua a que ha dado lugar.

Este diccionario es el comienzo de una empresa que debe perdurar. Estamos lejos de haber creado un diccionario semejante, en tamaño, a los afamados Merriam-Webster, pero creemos que hemos echado los cimientos y el primer piso de una gran construcción.

Nos hemos tardado treinta y siete años en elaborar el diccionario. Para nosotros, sus autores, es el plazo completo de nuestra vida profesional. Hemos visto nacer a nuestros hijos y, algunos de nosotros, a nuestros nietos. Una de las experiencias peculiares que ofrece la lexicografía es precisamente la de la vivencia diferente del tiempo: empeñados a diario en unas cuantas palabras, no miramos hacia la finalización del trabajo, como la hormiga no calcula el tamaño final del agujero que excava para hacer su hormiguero; se trabaja y se teje a diario y, como Penélope, se desteje por las noches para llegar al día siguiente a corregir los textos producidos el día anterior. El tiempo que nos rige es el tiempo calendárico, el tiempo público, pero el tiempo en que está inmersa la construcción de un diccionario es el de la propia vida, de su acontecer diario; quizá esta experiencia se acerque más a la de los antiguos constructores de pirámides, para quienes el tiempo de su vida se diluía en el tiempo cósmico y su propia historia en la de la obra terminada, que a la que fuerzan los plazos y los calendarios administrativos. Ojalá que el público mexicano así lo comprenda, y sea benévolo, aunque crítico, con nuestro trabajo. Como dice el viejo dicho latino: “Lo perfecto es enemigo de lo bueno”; hemos tratado de escribir un buen diccionario, que dista de ser perfecto. Como la “materia oscura”, que la cosmología contemporánea juzga existir en el universo y ser mucho mayor que el universo que vemos, lo que falta recoger en nuestro diccionario es mayor que lo que ofrecemos, pero había que comenzar a hacerlo.

Renovamos a nuestros lectores el agradecimiento por su acogida y les agradeceremos aún más que nos hagan llegar sus observaciones, para que en un futuro, que deseamos próximo, este Diccionario llegue a convertirse en el mejor catálogo del vocabulario del español de México*.

Pueden comunicarse con nosotros a través de la red de Internet, a la dirección siguiente: dem@colmex.mx. También pueden escribirnos a:

Diccionario del Español de México.
El Colegio de México.
Camino al Ajusco 20.
Pedregal de Santa Teresa,
10740 México, D. F.

Luis Fernando Lara



*Al lector interesado en los métodos utilizados para elaborar este Diccionario, así como en los pormenores de nuestra investigación, le sugerimos leer Investigaciones lingüísticas en lexicografía (El Colegio de México, 1979) de L. F. Lara, R. Ham Chande e I. García Hidalgo, así como Dimensiones de la lexicografía. A propósito del Diccionario del español de México (El Colegio de México, 1990) y Teoría del diccionario monolingüe (El Colegio de México, 1996) de L. F. Lara.

¿Cómo citar el diccionario?

renata taketa mezcal.colmex.mx mezcal colmex mx medina sanchez medina sánchez


El Colegio de México © 2017. DEM.