Cuando se trata de un diccionario, su historia no se puede desimbricar de la historia de sus autores. María Moliner, Paul Robert —iniciador de la gran tradición lexicográfica francesa de los diccionarios “Robert”— o Sir James Murray —quien dedicó toda su vida al Oxford English Dictionary— han dejado testimonios de la manera en que la elaboración de sus diccionarios determinó sus propias historias y del modo en que sus propias historias dejaron su huella en los diccionarios. La historia del Diccionario del español de México tampoco puede separarse de la vida de sus autores y particularmente de la mía. Por eso le pido al lector que disculpe el entrelazamiento de historia personal e historia del diccionario que advertirá al comienzo de estas páginas. Corro el riesgo de que piense que tienen una finalidad autocelebratoria, pero espero que lo que cuento lo convenza de que, lejos de eso, mi objetivo es explicar no sólo la manera en que hicimos este diccionario, sino también sus avatares.
Hay veces en que la fortuna, que es
una diosa, se junta con la
generosidad, que es una
virtud. Cuando eso sucede, hay
algunos que
reciben, inmerecidamente,
sus dones. Este es mi caso y
este es el
origen del Diccionario del
español de México (DEM).
En algún momento de comienzos
del año de 1972, don Antonio
Carrillo
Flores, antiguo secretario de
Relaciones Exteriores, de
Hacienda,
embajador de México en
Washington y, en ese entonces,
director del
Fondo de Cultura Económica, se
encontró con el presidente
de El
Colegio de México, don Víctor L.
Urquidi, y le expuso su
inquietud,
basada en su propia
experiencia
internacionalista, de que
México no
tuviera un diccionario
propio, que correspondiera a
su historia y a su
cultura, como sí lo tenía Estados
Unidos de América en la
tradición de
los diccionarios de Noah
Webster, ese patriota de la época
de
fundación de su país,
continuada por la casa Merriam-
Webster, de
Massachussets. Don Antonio
Carrillo Flores notaba, como muchos
mexicanos,
hispanoamericanos e
incluso españoles, que los
diccionarios
de la Academia Española no
correspondían ni al estado
actual de la
lengua, ni mucho menos a la
manera en que había
evolucionado en cada
región hispanohablante,
arraigándose en sus propias
experiencias
históricas. De ahí que le preguntara
si El Colegio de México sería
capaz de emprender la
elaboración de un
diccionario que, a la larga,
se convirtiera en un “Webster
mexicano”. Don Víctor, cuya
visión del
futuro y cuya capacidad para
imaginar nuevos ámbitos de
investigación
impulsó tantos estudios
nuevos en El Colegio, pasó la
pregunta a
nuestro director del Centro de
Estudios Lingüísticos y
Literarios, mi
maestro Antonio Alatorre.
Una tarde pasó Antonio por mi
cubículo y me contó
aproximadamente la
inquietud de don Antonio
Carrillo Flores y la pregunta de don
Víctor
Urquidi: “Dijo Carrillo Flores que si
alguno de los ‘genios’ de El
Colegio sería capaz de escribir
ese diccionario. ¿Tú crees
que
puedas?”. Me quedé
sorprendido, asustado y
halagado y, quizá en pocos
segundos, con una audacia
temeraria, le contesté que creía que
sí.
Entonces me pidió que
escribiera un dictamen, de
unas cuantas páginas,
acerca de la posibilidad de
escribir el diccionario.
La fortuna me había dado cinco
profesores que me habían formado y
que
me habían llevado a tener unas
cuantas ideas acerca de la
lengua
española contemporánea y de
su carácter mexicano: Antonio
Alatorre y
Margit Frenk, cuya concepción
abierta y rica de la lengua
española y
cuya flexibilidad normativa se
nos habían transmitido como
estudiantes; Juan M. Lope Blanch,
hispanista pero no
españolista,
quien había iniciado los
estudios de geografía
lingüística y
dialectología en México; Klaus
Heger, teórico de la semántica y de
los
primeros en tomar en serio el
papel de la cuantificación y
de la
computación electrónica en
lingüística; y Kurt Baldinger, antiguo
colaborador de Walther von Wartburg
en la elaboración del gran y
todavía insuperado
diccionario etimológico del
francés Französisch
Etymologisches Wörterbuch. Nunca
imaginé, cuando cursaba con
ellos
materias y seminarios, que algún
día podría conjuntar sus
enseñanzas
en la construcción de un
nuevo diccionario.
El caso es que escribí el
dictamen “Sobre la
justificación de un
diccionario de la lengua
española hablada en México”,
exclusivamente
como un documento para
Antonio Alatorre, don Víctor y don
Antonio
Carrillo Flores. Pocas semanas
después, supe que don
Antonio había
presentado mi dictamen a la
Junta de gobierno del Fondo
de Cultura
Económica y que nos invitaba a
Antonio, a Lope Blanch y a mí, a
desayunar en su casa de la
calle de Texas, en la colonia
Nápoles. Una
mañana soleada nos
presentamos a su casa y,
durante un desayuno
mexicano, con jugo de naranja,
toronja, huevos rancheros, frijoles
y
café, que me produjo un ataque
inmediato de gastritis,
debido al
nerviosismo que me consumía,
don Antonio cedió la palabra a
Antonio.
Él, a su vez, dándole su lugar a Lope
Blanch, se la cedió a éste. Lope
Blanch, como lo demuestra su
biografía, no se arredraba ante
grandes
empresas y por eso fue capaz
de planear, dirigir y llevar a cabo
el
Atlas lingüístico de México; sin
embargo, ese día sostuvo que
un diccionario mexicano
era irrealizable, pues había que
tomar en
cuenta que la Academia
Española, todavía después de 250
años, era
incapaz de ofrecernos un
diccionario de la calidad
del Webster, como
lo deseaba Carrillo Flores.
Antonio, cuidadosa y
gallardamente,
sostuvo en su intervención
que Lope tenía muy buenos
argumentos, pero
que se trataba de comenzar una
empresa de esa clase y que
alguien
tendría que hacerlo alguna vez.
Finalmente me cedieron la
palabra y
defendí mi dictamen, temeroso
de la reacción de Lope Blanch,
cuya
capacidad para romper lanzas
en cualquier liza conocía yo
bien de mis
años de estudiante. También
agregué que me era imposible
saber cuánto
nos tardaríamos, pues la
historia de la lexicografía
demuestra que
todos los autores de
diccionarios se han
equivocado en sus cálculos, y
en la época del presidente
Luis Echeverría ya sabíamos que él
quería
que todas las cosas se
hicieran “para ayer”. Don
Antonio concluyó el
desayuno ofreciéndonos
hablar con el presidente de la
república para
que financiara el proyecto y agregó:
“Por mis largos años de
experiencia en el gobierno
mexicano, le aseguro que
ningún gobierno se
atreverá a interrumpir el
financiamiento de un trabajo
como este”.
Salimos de la casa de don
Antonio y, al llegar a El Colegio, Lope,
imperativo, me dijo: “Le invito
un café”. En la cafetería de El
Colegio, inclinado hacia mí me
dijo: “¿Se da usted cuenta del
lío en
que se ha metido?” Debo haberle
contestado, tartamudeando, que
sí.
Pocas semanas después se
presentó ante mí Martín Casillas para
decirme
que en IBM se habían
enterado de lo que planeaba
hacer
y que esa empresa nos ofrecía
todo el trabajo de cómputo
gratuitamente. Sorprendido, le
contesté que lo consultaría con
don
Víctor Urquidi y éste lo descartó,
pues prefería que todo el trabajo
se hicieran en máquinas del
sector público (años después,
Antonio
Zampolli, director del Centro
Nazionale Universitario di
Calcolo
Elettronico, de Pisa, me contó que
IBM se había
apresurado a plantearle la
posibilidad de
hacer un sistema de cómputo
para un diccionario como el
nuestro, una
propuesta que llevaron a cabo,
independientemente, años
después).
Aunque IBM y el ABC de Madrid se habían
enterado antes del proyecto,
éste no se dio a conocer hasta
que se
publicó en La Gaceta del Fondo
de Cultura Económica en su
número 19 de 1972, páginas 1 a 6. Las
paredes oyen.
El presidente Echeverría nos
concedió un fideicomiso
con capital para
cuatro años de trabajo. El Colegio
alquiló un departamento enfrente
de
su edificio, en la calle de
Guanajuato, y me dediqué a
buscar los
colaboradores necesarios.
Así se integraron Luz Fernández
Gordillo y
Carmen Delia Valadez, ambas
egresadas también de El Colegio. Se
agregaron a ellas dos alumnas
mías en el Centro: María Ángeles Soler y
Paulette Levy. Omitiré mencionar otros
colaboradores, que pasaron
poco
tiempo con nosotros. Invertimos
parte del dinero del
fideicomiso en
formar una biblioteca de obras
de consulta y de libros y
revistas
especializados que nos
pudieran ayudar a planear
bien la investigación
y la redacción del
diccionario. Por supuesto,
también gastamos en
muebles, archiveros y máquinas de
escribir; al terminar de darle
sustancia al proyecto, también
sirvió para que viajara yo a
consultarlo con Kurt Baldinger, Paul
Imbs (director del Trésor de
la langue française), Bernard
Quemada (director del Centro de
Estudios del Vocabulario
Francés, de Besançon), Alain Rey y
Josette
Rey-Debove (director y redactora en
jefe de los diccionarios Le
Robert) y Jean Dubois (director de
lexicografía de la casa
Larousse). El resto, la mayor parte,
se consumió en nuestros
salarios.
Al comienzo teníamos dos
problemas centrales: cómo saber
cuál era el
vocabulario usado en el
español de México y cómo
reunirlo. La
tradición lexicográfica
mexicana de García Icazbalceta,
Feliz Ramos i
Duarte, Francisco J. Santamaría,
Marcos E. Becerra y varios más era
regionalista y prescriptivista.
Es decir, sus diccionarios
recogían
sólo voces que se
considerasen
“indigenismos”,
“vicios”, “barbarismos”
y “solecismos” que se
usaran en México y no en
España o en otras
regiones del mundo
hispánico. Era una tradición
de registro de voces
pintorescas y diferentes de
las que aparecían en los
diccionarios de
la Academia y se
seleccionaban
precisamente por no estar
incluidas en
ese diccionario. Muchos de
ellos titularon sus
diccionarios para
destacar lo incorrecto de las
voces que contenían, aunque
con un gusto
casi perverso por ellas:
afirmaban la incorrección de
nuestros
regionalismos, pero gozaban
apuntándolos. Así, los
diccionarios de
mexicanismos se ocupan
tradicionalmente de un
vocabulario marginal
para la Academia y para la idea
de la lengua que ésta difunde. He
llamado “conciencia del
desvío” al modo en que trata el
vocabulario la
práctica lexicográfica
regionalista, que caracteriza a la
tradición
lexicográfica mexicana y, en
general, a la lexicografía
hispánica,
pues tanto Hispanoamérica
como España están de acuerdo
en esa
concepción, aunque desde
sus diferentes
posiciones: metropolitana y
periférica. En consecuencia,
un nuevo diccionario de
regionalismos
mexicanos, de
mexicanismos, no podía
responder al reto inicial de
escribir un diccionario
de la lengua española tal como la
usamos los
mexicanos, según el modelo de
Webster, pues ese
diccionario es
precisamente un
diccionario
estadounidense de la
lengua inglesa, que
se centra en el uso de su país,
no un diccionario de
regionalismos
estadounidenses.
Günther Haensch es el autor de la
distinción entre
“lexicografía
diferencial”, la de la tradición
de los regionalismos, y
“lexicografía
integral”, la de la tradición
académica, hasta entonces sólo
practicada por la Academia
misma en España (y las
editoriales
comerciales dependientes
de su diccionario) y con
clara delimitación
metropolitana; no olvidemos el
lamentable dicho de Leopoldo
Alas: “los
españoles somos los
dueños del idioma”. En
cambio, lo que nosotros
queríamos era un diccionario
integral del español, basado
en el uso
mexicano. No, como lo publicó
alarmado el ABC
de Madrid, para “dar nuestro
nuevo grito de
independencia”, ahora
lingüística, y producir un
“cisma de la lengua
española”, sino para
corresponder a una lengua que,
en México, está en el origen de
nuestra
nacionalidad y de nuestra
cultura, sin negar la siempre
deseada unidad
del español y también sin
menospreciar la rica
actualidad de las
lenguas indígenas.
Así que teníamos que construir
una base de datos que nos
permitiera
conocer el uso del
vocabulario del español en
México. Una base que
registrara nuestra manera de
hablar, que comparte con España e
Hispanoamérica un gran
porcentaje de vocablos, pero
que tiene sus
diferencias en el
significado y en el uso, aun
en vocablos muy
comunes, para darle el
reconocimiento que se
merece.
La tradición lexicográfica
hispánica ha estado
dominada por la
Academia Española. Todo
vocablo que ella no introduzca
—“que no
acepte”— en sus
diccionarios, “no
existe” para los
hispanohablantes;
todo significado que difiera
de los que define, es
sospechoso de
barbarismo. A lo largo de los siglos
el predominio ideológico y
prescriptivo de la Academia logró
que cualquier otro
diccionario
integral del español no fuera
sino una refundición del
académico, con
algunos retoques. Esto se
puede afirmar, incluso, del
Diccionario
de uso del español de
doña María Moliner. A la vez, los
diccionarios de
regionalismos,
diferenciales, determinan su
vocabulario y sus
significados comparándolos
con el de la Academia,
bajo la suposición,
completamente falsa, de que el
diccionario
académico refleja mejor la
realidad del español
“general”. En
consecuencia, nuestro
método de trabajo no podía
consistir, como
alguien propuso en las
primeras reuniones, en
repartirnos los folios
del último diccionario de la
Academia (abreviado DRAE)
entre los integrantes del grupo,
ir marcando qué vocablos
conocíamos y
apuntando los que nos fueran
brotando de la memoria y no
estuvieran
incluidos en el DRAE.
De haber actuado así, habríamos
logrado un caprichoso acervo
de vocablos que sólo por
coincidencia
corresponderían al uso
mexicano.
Necesitábamos, por lo tanto,
construir nuestra base de
datos de otra
manera, que nos garantizara un
acervo fidedigno del uso del
español en
México, sin intervención
alguna ni de nuestros
propios y limitados
conocimientos, ni de
nuestras preferencias
normativas. Lo mejor sería
reunir una gran cantidad de
textos y grabaciones para
sacar de ellos
imparcial y objetivamente, el
vocabulario buscado. Pero
¿cuántos,
cuáles y cómo? Sería imposible
ponernos a leer nosotros
mismos todo lo
publicado y asequible e ir
entresacando de ellos todos
sus vocablos,
pues entonces de veras 250
años no nos habrían bastado.
En cambio, el
uso de la computadora
electrónica, que ya estaba
entronizado en las
ciencias naturales y en la
administración, nos podía
permitir “leer”
grandes cantidades de
textos sin intervención de
nuestros juicios,
registrar todas las palabras
contenidas en ellos, contar
cuántas veces
aparecía cada una de ellas y
elaborarles una ficha con los
contextos
en que se presentaran.
Había dos experiencias
previas de esta manera de
proceder: la de Henry
Kucera y W. Nelson Francis en el
Computational Analysis of
Present Day American English, y la de
Paul Imbs, para el Trésor
de la langue française. En la
primera investigación, Kucera y
Francis reunieron poco más
de un millón de apariciones
de palabras,
entresacadas aleatoriamente
de una muestra de textos; en la
segunda,
con el gran impulso
nacionalista francés del
general De Gaulle, habían
alimentado con miles de obras
francesas su computadora,
para reunir
cerca de 70 millones de
apariciones de palabras. Nuestra
primera enseñanza
cuantitativa fue comprobar que,
mientras
Kucera y Francis habían
obtenido de su corpus 50?000
vocablos
distintos, Imbs sacó del suyo
sólo 71?000 diferentes. Eso quería
decir
que, como enseñaban todos
los estadígrafos lingüísticos, lo
importante
no era la cantidad de las
obras fuente, sino la calidad
de su
selección.
Al comenzar el trabajo se formó un
Consejo de redacción del
diccionario, integrado por
Antonio Alatorre, Raúl Ávila, Margit Frenk,
Beatriz Garza, Juan M. Lope Blanch y Tomás
Segovia, del Centro de
Estudios Lingüísticos y
Literarios, y Jaime García Terrés, Andrés
Henestrosa, Carlos Monsiváis,
Tito Monterroso y Gabriel Zaid. La
función de ese Consejo
consistió en ayudarnos a
determinar el
tratamiento que recibirían los
vocablos, seleccionar una
muestra de
obras literarias y revisar las
primeras redacciones que se
fueran
produciendo.
Para seleccionar los textos que
habrían de conformar el Corpus
del
español mexicano
contemporáneo (CEMC),
siguiendo las
enseñanzas relatadas y de
acuerdo con los métodos de la
estadística
lingüística, era necesario
reunir muestras de toda clase
de géneros
textuales y hablados, de autor o
emisor mexicano, y crear con
ellas
varias agrupaciones
distintas, que permitieran
calcular la difusión
del uso de cada vocablo
(dispersión, técnicamente
hablando)
junto con su frecuencia de
aparición. Pero antes de eso
teníamos que
definir lo que entendíamos por
“español mexicano
contemporáneo”. La
lexicógrafa francesa Josette Rey
Debove proponía que se
considerara
“vocabulario
contemporáneo”
(correspondiente a una
sincronía
práctica, en términos técnicos)
aquel compartido por tres
generaciones de hablantes
que se comunican entre sí:
abuelos, padres e
hijos, de acuerdo con la
esperanza de vida de cada
época. Respecto de
1973, nuestro vocabulario
mexicano contemporáneo
tendría que
corresponder al comienzo del
siglo XX, pero hay lugar
para sospechar que la
Revolución
mexicana, entre 1910 y 1921, haya dejado
una huella todavía
inexplorada en la vida de las
palabras, debido a los
grandes
movimientos de población que
provocó la guerra civil y al
enfrentamiento cultural e
ideológico que estaba en
juego. Por eso
Carlos Monsiváis propuso que
tomáramos como punto de partida
de
nuestra contemporaneidad
tres acontecimientos
históricos casi
simultáneos: el fin del período
armado de la Revolución, que
asentó la
población; la publicación de
Los de abajo de Mariano
Azuela,
primera novela del México
contemporáneo; y el comienzo de
las
emisiones radiales de la XEW, principio de la
difusión nacional de
noticias,
costumbres y símbolos
ideológicos. Así decidimos
tomar en cuenta
textos escritos desde 1921 hasta
1974.
En seguida pasamos a
diseñar la clasificación de
textos y grabaciones
que conformarían el Corpus.
Tratamos de identificar cada
clase
o “género” de acuerdo con
su pertinencia social. Así por
ejemplo, en
el género del periodismo se
incluyeron junto a las
noticias nacionales
y los editoriales, algunos
textos de crónica taurina; en el
de textos
religiosos, sermones y
catecismos no sólo católicos,
sino también
algunos protestantes. Para
seleccionar los textos
literarios acudimos
a un informe de la Biblioteca
Nacional, en que se asentaba
el número
de ediciones y ejemplares
vendidos de cada obra, y
seleccionamos los
supuestamente más leídos. Para
los textos de ciencias y
técnicas,
pedimos a muchos asesores
universitarios que nos
dieran listas de los
libros de texto más usados y de
las revistas especializadas
publicadas
en México, etc. Se puede
conocer pormenorizadamente la
conformación del
CEMC si se lee el libro
conjunto de Isabel García Hidalgo,
Roberto Ham y yo, Investigaciones
lingüísticas en lexicografía,
El Colegio de México, 1980.
El CEMC quedó formado por 996
"textos" de dos mil palabras
gráficas cada uno, dividido
en 14 géneros. Esos “textos”
están
compuestos por párrafos
aleatoriamente entresacados
de las fuentes,
por dos razones: la primera,
contarrestar el predominio del
estilo de
cada autor, que tendería a
privilegiar unos vocablos
sobre otros; la
segunda, aumentar el número de
palabras diferentes que se
encontraran.
Es decir, es un corpus más
grande que el de Kucera y Francis,
pero mucho más pequeño que el
del Trésor de la Langue
Française; a diferencia del
primero, que aisló palabras, el CEMC las conserva en su
contexto, lo que es necesario
para
poder hacer posteriormente el
análisis semántico de cada
vocablo.
En 1973 era todavía raro utilizar la
computadora electrónica en la
investigación lingüística. La
máquina se utilizaba sobre
todo para
hacer comparaciones entre
listas de palabras, lo que nos
planteaba la
cuestión de la lista que habría de
servirnos de referencia para
el
reconocimiento de las
palabras del corpus. La práctica
de esa época en
Francia, en Italia, en Estados
Unidos de América consistía
en tomar un
diccionario y cotejar con él las
palabras de los corpus. En
nuestro
caso eso habría significado
tomar el DRAE como
referencia
y reconocer nuestro
vocabulario en relación con él.
¿Qué pasaría con
vocablos nuestros que el DRAE no contuviera? Que no
los
reconocería y, además,
significaba seguir tomando
como marco de
referencia el diccionario
académico. Por eso opté por hacer
nuestro
propio sistema de análisis
automático de las palabras
basado en sus
propiedades morfológicas y de
distribución sintáctica en
los textos.
Se puede leer una
explicación amplia de este
procedimiento en mi
artículo “Méthode en
lexicographie: valeur et modalité
du dictionnaire
de machine”, Cahiers de
lexicologie, 29,2 (1976), 103-128.
Pasamos cerca de un año
elaborando el Analizador
gramatical
automático del DEM, que
resultó ser el primer trabajo de
esta clase en lengua
española y el único —incluso
hasta ahora— basado
en reglas morfológicas y
sintácticas. El Analizador
significó
para la matemática Isabel García
Hidalgo el Premio Dr. Arturo
Rosenblueth a Sistemas de
Cómputo en 1981.
La capacidad de la
computadoras en esos años
era infinitamente menor
que la que tiene hoy cualquier
máquina portátil. Por principio,
no se
podía alimentar los materiales
directamente a la máquina, sino
que
había que hacerlo mediante
tarjetas perforadas. Como nuestro
pequeño
grupo de trabajo no tenía
habilidades de perforista y
habría
significado una gran pérdida
de tiempo si tratáramos de hacer
ese
trabajo nosotros mismos,
contratamos una empresa
especializada en ello
y le entregamos todos los textos
que habíamos coleccionado.
Esas
empresas se comprometían, bajo
contrato, a perforar las tarjetas y
verificarlas, pero con cierto
margen admitido de errores. Así
alimentamos la gran máquina UNIVAC 1106 del Centro Dr.
Arturo Rosenbueth de la Secretaría
de Educación Pública, gracias al
apoyo de su director, el Dr.
Enrique Calderón Azati.
Aquella máquina, de las mayores en
México, sólo tenía 64 kilobytes de
memoria de acceso directo (hoy,
cualquier máquina de juegos
infantiles
la supera varias veces), por lo
que los procesos de análisis
y
producción de resultados
ocupaban toda la capacidad
de la máquina y
tenían que hacerse por partes. Llevó
cerca de ocho meses, todas las
noches, mientras la SEP
dormía, hacer el análisis del CEMC.
Para finales de 1976 nuestro
Corpus estaba analizado.
Habíamos
obtenido 1?891?045 palabras gráficas,
que se redujeron a 64?183
diferentes, un resultado un
poco mayor que el de Kucera y
Francis
y un poco menor que el del Trésor. El
CEMC fue
el primer corpus de datos
lingüísticos de la lengua
española elaborado
con la ayuda de una
computadora electrónica. Junto
con el
Analizador, fue una primicia
en la investigación
contemporánea
del español. La experiencia
del Corpus confirmaba todas
las
predicciones de los
estadígrafos que nos
precedieron. Se terminaba el
primer plazo del fideicomiso y el
gobierno federal lo amplió por
otros
cuatro años.
Al reconocimiento automático
de las palabras agregamos un
sistema de
cálculo de la frecuencia de
aparición de cada palabra,
tanto en cada
género, por ejemplo, cuántas veces
aparece la palabra parámetro
en los textos científicos y
técnicos, como en todo el CEMC; a partir de esos datos,
calculamos la dispersión del
uso entre todos los géneros,
con lo cual podemos
reconocer qué
palabras son las más usadas
en el Corpus mediante un
índice que
correlaciona el tamaño de
cada género, la frecuencia de
aparición de
cada palabra y su dispersión.
Ha sido este índice el que
nos guía en
la incorporación de vocablos
al diccionario. Fue el
estadígrafo
Roberto Ham Chande el autor de ese
sistema de análisis
cuantitativo
que, hasta la fecha, no ha sido
superado
internacionalmente.
Por último, el análisis del CEMC nos dio grandes
listados
de datos cuantitativos de
todas las palabras
encontradas y un gran
conjunto de
concordancias, es decir,
para cada palabra, una
lista de todos los contextos
en que apareció en el Corpus.
Armados con esos resultados,
podíamos comenzar el análisis
cualitativo
y después la redacción del
diccionario.
La lexicografía forma parte de la
lingüística aplicada. Depende
de la
lingüística, sobre todo, en la
concepción del signo y el
significado
que orienta el análisis
semántico, en el análisis
gramatical, en la
interpretación de la
complejidad del uso social
de las palabras y los
fenómenos normativos ligados a
ella, en los planteamientos
cuantitativos y en la manera de
formular el sistema de análisis
computacional; pero por sí
misma no es una ciencia,
sino una
metodología que ofrece criterios y
reglas de trabajo que, cuando se
ponen en práctica, le dan su
existencia real y la convierten
en
arte, como la definen los
diccionarios. Un trabajo como
este no
podría haberse llevado a cabo
sin conocimientos
lingüísticos, pero no
bastan esos
conocimientos para
componer el diccionario;
para hacerlo,
hay que encontrar una práctica
lexicográfica que se va
definiendo
conforme cada vocablo plantea
sus propias dificultades y
que se
consolida con la
participación determinante
de las personas que
colaboran en el equipo de
trabajo. Enseñar los criterios y
las reglas
de la lexicografía es
relativamente sencillo; saber
ponerlos en
práctica requiere años de
trabajo concienzudo y
permanente, además de
ciertas aptitudes de los
lexicógrafos.
Una de las enseñanzas que
obtuvimos en este sentido
es que la
profesión de lingüista no
necesariamente lo habilita a
uno como
lexicógrafo. Para ser lexicógrafo es
mucho más importante tener
ciertas aptitudes que no se
enseñan en la universidad:
un interés casi
universal por las cosas, que
encuentre atractivo lo mismo en
una
receta de cocina que en un
texto de genética; una práctica
de la
escritura y una voluntad de
estilo, y conocimiento de
otras lenguas,
pues muchas veces ese
conocimiento sirve para
establecer contrastes
con la lengua propia, que le
permiten a uno tomar distancia
de ella y
le develan matices del
significado oscuros para
cualquier persona
monolingüe. Fue así como el
equipo del DEM fue
modificándose, en un suave
proceso de selección,
durante el cual
aprovechamos la capacidad de
varios jóvenes escritores
mexicanos que
tenían esas aptitudes.
Comenzamos el análisis de los
vocablos que nos proporcionó
el CEMC entre 1976 y 1977. Cuando El
Colegio de México se mudó
al Pedregal de Santa Teresa, el
equipo de trabajo ya había
comenzado
la tarea. Una parte del equipo se
concentró en la documentación
de los
vocablos, junto con los
resultados cuantitativos y las
concordancias:
la materia prima. Tomamos en
cuenta todos los estudios
particulares y
todos los diccionarios
mexicanos de regionalismos
que pudimos
encontrar. Formamos un grupo de
“diccionarios testigo”, a
base de
trece obras —presididas por
el DRAE— tanto integrales
como de
regionalismos —por ejemplo, el
Diccionario de
mejicanismos de
Francisco J. Santamaría—, que nos
sirvieron para verificar
ortografías
y acepciones,
fundamentalmente, pero también
para contrastar sus
definiciones con las que
nosotros mismos íbamos
redactando. Otra parte
del grupo se dedicó al
análisis y redacción. Cada
redactor, por su
cuenta, tiene que estudiar los
textos pertinentes cuando
se trata de
voces especializadas o de
palabras cuyo significado
se ha formado en
la cultura y en la historia. Así, para
poder redactar un vocablo
característico de la física, hay que
leer algunas obras
especializadas
que le permitan a uno hacerse
una idea clara de su
significado. Muchas
veces hay que acudir a un
consultor para pedirle
precisiones o
actualizaciones del
conocimiento. Tratándose de
botánica y de
zoología, en especial, tan ricas y
diversas, contamos con tres
consultores que nos
proporcionaron la información
necesaria: los
doctores Ramón Riba (de la
Universidad Autónoma
Metropolitana), y
Javier Valdés y R. Martín del Campo (de la
Universidad Nacional
Autónoma de México). Para las demás
materias hacemos consultas
esporádicas a los demás
asesores, listados en la página 8.
El DEM es un
diccionario original; es
decir, no refunde
textos de obras anteriores
sino que se basa en
análisis nuevos e
independientes de cada
vocablo y sus significados.
Para lograrlo
seguimos el siguiente
procedimiento: cada
lexicógrafo debe analizar el
vocablo sin tomar en cuenta
estudios y diccionarios
anteriores,
basándose exclusivamente
en los datos del CEMC y
su propio
conocimiento de la lengua; el
primer producto de ese
análisis es un
borrador de la estructura de
cada artículo lexicográfico (es
decir, de cada texto
presidido por una entrada
en el
diccionario, seguido por
las abreviaturas de categoría
gramatical,
flexión y conjugación, y una
serie de acepciones
ordenadas,
seguidas la mayor parte de las
veces por ejemplos sacados
de
los textos del CEMC y por
ejemplos de los usos
habituales de
las palabras, colocaciones,
técnicamente hablando). Una vez
escrito ese borrador, se
enriquece con la lectura de
obras
especializadas de los temas
en que suele utilizarse la
palabra y
después se contrasta con los
“diccionarios testigo”, se
corrige y se
refina. Terminada esa primera
redacción, pasa a un revisor,
que repite
el procedimiento como si el
primero no hubiera existido y
luego
confronta su trabajo con el
anterior.
Al principio el Consejo de
redacción leía lo que
producíamos y, aunque
cada sesión era provechosa y
divertida —hay que ver quiénes
eran
nuestros consejeros, con
alguna excepción—, el tiempo
que se consumía
en ellas era demasiado y
nosotros no lográbamos
establecer una
práctica homogénea y definida,
sujetos a tan diversas y
espontáneas
opiniones. Las sesiones
con el Consejo, naturalmente, no
podían ser
muy frecuentes ni durar mucho
tiempo. He de reconocer que me
costó
trabajo identificar las causas
de nuestras dificultades
iniciales de
redacción y asumir por completo,
en consecuencia, mi
responsabilidad
como director del proyecto. Un
equipo lexicográfico tiene
que
desarrollar una práctica
especializada propia que lo
profesionaliza y,
para lograrlo, las opiniones
externas, por bien
intencionadas y muchas
veces correctas que sean, se
convierten en obstáculo,
debido a su
espontaneidad. El Consejo
fue determinante en el
planteamiento inicial
del diccionario y del CEMC, pero después resultó
disfuncional, y dejé de
reunirlo.
Para 1979 el equipo del DEM
estaba en plena actividad. No
sólo
avanzábamos en la redacción,
sino que habíamos abierto
varios campos
de investigación que hasta
entonces eran
desconocidos en México.
Además de mantener activo
nuestro Analizador, que
deseábamos
poder mejorar (un interés de
investigación, ligado a la vez al
desarrollo de la gramática formal y de
la lingüística computacional),
María Pozzi elaboró un sistema
reductor de concordancias,
la llamada
“Horquilla”, que tenía la función
de revisar automáticamente las
concordancias de vocablos
de alta frecuencia para
seleccionar sólo las
que nos mostraran patrones
sintácticos diferentes, pero
garantizando,
a la vez, que no perdíamos
información. Un trabajo así
contribuía a
reducir el tiempo de análisis
por parte de los redactores.
Nuestro
contacto con los vocabularios
especializados de las
ciencias y de las
técnicas nos llevó a hacer los
primeros estudios de
terminología del
español en México y a tratar de
difundir el interés por ese
nuevo
campo de la lingüística
aplicada en el país. Igualmente,
los
resultados cuantitativos nos
permitían ofrecer datos
interesantes para
audiólogos, psicólogos,
neurólogos y maestros de
escuela, interesados
por conocer el vocabulario
fundamental del español de
México y sus
características fonológicas y
silábicas.
Creímos que, para poder avanzar más
rápido —puesto que el
fideicomiso
lo exigía—, lo que hacía falta era
aumentar el número de redactores,
por lo que el equipo de trabajo
creció; pero el efecto de ese
aumento
fue un crecimiento correlativo
de las divergencias en el
análisis y en
los estilos de la redacción,
que implicaba aumentar también
el número
de segundas, terceras y hasta
cuartas revisiones, con lo que
no había
ganancia temporal y sí un mayor
gasto en salarios.
En 1980 estalló un serio conflicto
laboral en El Colegio. No sólo por
el tiempo perdido mientras las
instalaciones estuvieron
cerradas, sino
también por el enfrentamiento que
se produjo entre el personal
académico de El Colegio, nuestro
trabajo se vio reducido y, hasta
cierto punto, puesto
injustamente en tela de
juicio. Remontar ese daño
implicó mucho esfuerzo, tanto
colectivo como personal,
durante varios
de los años siguientes.
El país se acercaba al final del
gobierno de José López Portillo, a la
gran crisis económica, a la
derrota presidencial a cargo
de los
especuladores y al comienzo
del derrumbamiento del sistema
político
resultante de la Revolución. El presidente de la República formó la
“Comisión Nacional para la
Defensa del Idioma Español” y
muy pronto el secretario de Educación,
Fernando Solana, nos pidió
que colaboráramos
con ella, dándole, en el plazo de
un año, un pequeño
diccionario para
uso de la escuela elemental.
Como todos los
diccionarios, nosotros
habíamos comenzado por el
principio del abecedario:
de la letra A pasaríamos a la B y así
sucesivamente. Para poder
entregar en un año un
pequeño diccionario
con esas características
teníamos que suspender ese
orden y, sobre
todo, seleccionar los
vocablos que debieran
constituir el
Diccionario fundamental del
español de México. Así que opté
por
tomar el vocabulario fundamental,
que habíamos sacado de
nuestro
estudio cuantitativo, y agregarle
el vocabulario temático de los
libros de texto gratuitos
vigentes en esa época. Para
reunir este
último vocabulario, el equipo e
dedicó a leer esos libros y
entresacar
el vocabulario, pues no
podíamos esperar a que todos
ellos pasaran por
el proceso de perforación en
tarjetas. Es decir que, después
de seguir
un proceso lineal en la
redacción, pasamos a otro de
ampliación
concéntrica, en que se recorría
el abecedario de la A a la Z dentro
de
unos límites fijados cada vez
por el estudio cuantitativo. La
Comisión
del español, con el Fondo de
Cultura Económica, publicó ese
mínimo
diccionario a mediados
de 1982. Gabriel Zaid lo reseñó,
justamente, en
un artículo cuyo título, juguetón, era:
“Jitomate, solanácea”
(Vuelta 77, 1983), como un trabajo fallido
a causa de la
premura impuesta por la
Comisión.
Pero la petición de Fernando
Solana tuvo dos buenos
efectos sobre
nosotros: primero, fue una
especie de examen para
comprobar que
estábamos trabajando; segundo,
nos ayudó a consolidar
finalmente una
práctica y un estilo de la
redacción guiados por
criterios claros.
Como decía al principio,
todos los autores de
diccionarios se han
equivocado al calcular el tiempo
que les toma terminar un
diccionario.
En ocho años de trabajo habíamos
completado una investigación
muy
valiosa del español de México,
tanto para nosotros como, en
general,
para la lingüística hispánica;
habíamos construido con éxito
el primer
sistema de análisis
automático del español;
habíamos ideado un sistema
de cálculo cuantitativo que
eliminaba la subjetividad en
la selección
de vocablos para el
diccionario; pero habíamos
terminado solamente un
pequeño diccionario de 2?500
artículos. Sin embargo, al ver
plasmados
en el Diccionario
fundamental una idea clara del
diccionario
que queríamos hacer, un estilo de
la redacción y un resultado que
se
comentó críticamente, me pareció
que era más conveniente
abandonar el
proceso lineal de redacción y
que continuáramos con
procesos de
ampliación concéntrica de
nuestros diccionarios, que
nos permitieran
ofrecer novedades al público y a
nuestras autoridades en
plazos
menores. Así fue como
compusimos el Diccionario
básico del español
de México, publicado en 1986, a
base del diccionario
anterior y el
vocabulario utilizado en la
educación secundaria. Así
llegamos a 7?000
vocablos. Uno y otro de esos
dos primeros y pequeños
diccionarios
pasaron por la revisión del
Consejo Nacional Técnico de la
Educación,
que hizo comentarios sobre su
contenido y nos solicitó
adecuar varios
de sus textos a las
necesidades del alumno de
escuela primaria y
secundaria.
Al terminar 1982, cuando el
presidente López Portillo cedió la
cúspide
el poder político a los
administradores, se dio por
terminado el
fideicomiso y el trabajo quedó
totalmente a cargo de El Colegio de
México.
El equipo lexicográfico había
comenzado a reducirse a raíz del
conflicto laboral de 1980. A partir de
entonces, con la práctica
bien
consolidada y unos
colaboradores que llevaban ya
años de trabajar
juntos, el análisis y la
redacción siguieron
avanzando. El grupo
nuclear quedó formado por Luz
Fernández Gordillo, Francisco
Segovia,
Laura Sosa, Carmen Delia Valadez y
Carlos Villanueva (más tarde se
incorporó el documentalista
Gilberto Anguiano). En promedio,
un
redactor termina tres artículos
lexicográficos por jornada de
trabajo.
Ha habido artículos que han
llegado a costar hasta un mes de
trabajo,
debido a la complejidad de
los significados y los usos
de las
palabras. Una de las
características de la
lexicografía, que
generalmente se toma en cuenta
sólo como anécdota, pero que
incide
profundamente en el trabajo es
que, al hacer el análisis
semántico de
la propia lengua se produce
un fenómeno psicológico
notable: la
necesidad de objetivar el
vocablo en estudio para
poder notar todos los
elementos que contribuyen a la
formación de su significado
conduce a
una enajenación total de la
lengua, que se traduce en una
inquietante
opacidad, que impide
continuar el análisis por
varias horas; tiene uno
que dejar pasar cierto tiempo,
distrayéndose con otra
actividad, para
recuperar el sentido de la
lengua y poder terminar el
análisis y la
redacción. La lexicografía es
una dedicación de 24 horas
diarias, pues
la mente sigue trabajando las
dificultades que plantea el
significado
de cada palabra incluso
durante el sueño. Esa
peculiaridad y el tiempo
que debe uno ceder al
proceso personal de
recuperación del
significado
es, probablemente, uno de los
motivos para que la redacción de
un
diccionario tome tanto
tiempo.
El siguiente paso, a partir de 1986,
consistió en prolongar el
procedimiento de ampliación
concéntrica de la redacción,
tomando como
nuevo objetivo terminar un
Diccionario del español
usual en
México (DEUM 1), formado
por todos los vocablos que
tuvieran una frecuencia mínima
de diez apariciones en el CEMC. Escogimos esa
cuota mínima porque nos
garantiza que
el vocabulario que cumple con
ella es verdaderamente usual. El
DEUM 1 se publicó en 1996 y
fue muy bien recibido tanto
en México como en el extranjero.
Finalmente habíamos ofrecido
un
pequeño diccionario con
las características que debía
tener, de
acuerdo con el proyecto y el
compromiso inicial: la
selección de
vocablos garantiza que se trata de
voces realmente utilizadas en
el
español nacional de México;
se orientan hacia la tradición
culta de la
lengua, pero corresponden a
los usos más extendidos de
una lengua
común, en la que las voces
coloquiales y populares, con
las que tan
fácilmente se identifican los
mexicanos a sí mismos,
aparecen bien
explicadas y tratadas sin
sospecha de incorrección,
ni “conciencia del
desvío”. He definido el DEUM como un diccionario
para el
ciudadano medio, que lee
periódicos y desea poder
comprender la mayor
parte de lo que se dice en el
ámbito nacional, sobre la base
de su
propio sentimiento de la
lengua. Buscamos develar para
ese ciudadano
una lengua rica y arraigada en la
experiencia mexicana. En
vista del
éxito del DEUM 1 y para
poder seguir ofreciendo,
sobre
todo a los estudiantes, un
diccionario en un solo tomo
y relativamente
fácil de manejar, pusimos en
circulación una segunda
edición,
corregida y aumentada con
vocablos cuya frecuencia
mínima en el CEMC fuera de
ocho apariciones; ese es el
DEUM 2, que ahora
circula.
El vocabulario de una lengua es
ilimitado e innumerable.
Tiene que
morir una comunidad
lingüística completa para que su
vocabulario deje
de crecer y, aun así, es
imposible hacer un
diccionario que lo
contenga todo. Por más que las
casas comerciales editoras
de
diccionarios compitan
entre sí, desde el siglo XIX, anunciando cada vez más
cientos y
miles de vocablos
incorporados a ellos, la idea
de “riqueza”
cuantitativa de una lengua que
difunden en sus
sociedades no significa
nada en relación con la real
complejidad y variedad léxica
de las
lenguas. Una enseñanza
notable de nuestro estudio
cuantitativo, que se
hizo patente al reflexionar
acerca de los vocablos cuya
frecuencia fue
menor de diez y mayor o igual a
ocho en el CEMC es
que existe un núcleo léxico
de nuestro español cercano
a los 15?000
vocablos, que es el que
constituye el “español
mexicano nacional”, es
decir, el que se utiliza en todo
el país, sin distinción de
regiones y
de correlaciones
exclusivas con grupos
sociales determinados. Más allá
de esa cifra, la aleatoriedad
constitutiva del Corpus se ha
vuelto evidente. Se puede
explicar con una imagen
biológica o
astronómica: notamos un núcleo
léxico como el de un sol o como
el de
una célula, en torno al cual el
resto del vocabulario de
frecuencia
más baja aparece como un
deshilachado de su orilla, como
una periferia
caótica. A partir de esa
“membrana”, encontramos
muchos nahuatlismos
específicos, muchas voces
propias de diversas
ciencias y técnicas,
muchos nombres de seres de la
naturaleza, que no forman campos
léxicos
completos y bien
estructurados, sino que
apuntan a un horizonte
cambiante, que depende
completamente de las
características y de los
textos que forman este CEMC.
En estas condiciones lo que
podemos afirmar, tanto para las
dos
versiones del DEUM
como para este diccionario,
es que
garantizamos que todo el
vocabulario contenido en
ellos se usa o se ha
usado en el español
mexicano del siglo XX
y principios del XXI.
También, que no incluye
todo el vocabulario del
español de México, pero que
los
faltantes que encuentre cada
uno de sus lectores no
obedecen a ninguna
exclusión normativa o
prescriptiva, como nos tenía
acostumbrados la
tradición lexicográfica
española (pues la Real
Academia parece estar
cambiando). Es decir, la
ausencia de un vocablo en
el diccionario no
quiere decir, ni que “no
exista”, ni que “no lo
aceptemos”.
No apelamos a que nuestros
lectores nos concedan a
priori una
autoridad propia, derivada
de la institución en la que
trabajamos o de
la calidad de nuestros grados
universitarios o nuestros
diplomas
individuales. Si el DEM gana alguna autoridad, algún
ascendiente en los
juicios normativos que cada
persona haga sobre su
vocabulario, será resultado de
su fidelidad al español de
México, a
los ricos matices que
adquiere el significado de
nuestras palabras, a
los usos que hemos podido
comprobar. Lo que queremos, como
hemos dicho
desde nuestra primera
publicación, es devolver a los
hispanohablantes
mexicanos el vocabulario de
su propia lengua, tal como se
usa, para
que lo conozcan y aprecien
mejor. En cuanto a la gran
comunidad
hispanohablante, en América,
Europa, Asia y África, lo que le
ofrece
el DEM es un
vocabulario de uso
mexicano que hace evidente la
unidad de la lengua por la que
tanto nos hemos esforzado
desde la
época de nuestras
independencias, a la vez que
muestra la riqueza
derivada de un español
arraigado en la experiencia
histórica de
México, seguramente semejante a
la variedad que se encuentra
en los
otros veintiún países que forman
la comunidad hispánica, y que
históricamente ha sido
soslayada por el centralismo
académico y la
idea de la lengua a que ha dado
lugar.
Este diccionario es el
comienzo de una empresa que
debe perdurar.
Estamos lejos de haber creado
un diccionario semejante,
en tamaño, a
los afamados Merriam-Webster, pero
creemos que hemos echado los
cimientos y el primer piso de
una gran construcción.
Nos hemos tardado treinta y siete
años en elaborar el
diccionario.
Para nosotros, sus autores, es
el plazo completo de nuestra
vida
profesional. Hemos visto nacer
a nuestros hijos y, algunos de
nosotros, a nuestros nietos.
Una de las experiencias
peculiares que
ofrece la lexicografía es
precisamente la de la vivencia
diferente del
tiempo: empeñados a diario
en unas cuantas palabras, no
miramos hacia
la finalización del trabajo, como la
hormiga no calcula el tamaño
final del agujero que excava para
hacer su hormiguero; se trabaja y se
teje a diario y, como Penélope, se
desteje por las noches para
llegar
al día siguiente a corregir los
textos producidos el día
anterior. El
tiempo que nos rige es el
tiempo calendárico, el tiempo
público, pero
el tiempo en que está inmersa la
construcción de un
diccionario es el
de la propia vida, de su
acontecer diario; quizá esta
experiencia se
acerque más a la de los antiguos
constructores de pirámides,
para
quienes el tiempo de su vida
se diluía en el tiempo cósmico y
su
propia historia en la de la obra
terminada, que a la que fuerzan los
plazos y los calendarios
administrativos. Ojalá que el
público
mexicano así lo comprenda, y
sea benévolo, aunque crítico,
con nuestro
trabajo. Como dice el viejo dicho
latino: “Lo perfecto es enemigo
de
lo bueno”; hemos tratado de
escribir un buen
diccionario, que dista de
ser perfecto. Como la “materia
oscura”, que la cosmología
contemporánea juzga existir en
el universo y ser mucho mayor que el
universo que vemos, lo que falta
recoger en nuestro
diccionario es
mayor que lo que ofrecemos, pero
había que comenzar a hacerlo.
Renovamos a nuestros lectores
el agradecimiento por su
acogida y les
agradeceremos aún más que nos
hagan llegar sus observaciones,
para que
en un futuro, que deseamos
próximo, este Diccionario
llegue a
convertirse en el mejor catálogo
del vocabulario del español
de
México*.
Luis Fernando Lara
*Al lector interesado
en los métodos
utilizados para elaborar este
Diccionario, así como en los
pormenores de nuestra
investigación, le sugerimos leer
Investigaciones lingüísticas
en lexicografía (El Colegio de
México, 1979) de L. F. Lara, R. Ham Chande e I.
García Hidalgo, así
como Dimensiones de la
lexicografía. A propósito del
Diccionario del español de
México (El Colegio de México, 1990) y
Teoría del diccionario
monolingüe (El Colegio de México,
1996)
de L. F. Lara.
¿Cómo citar el diccionario?