SciELO - Scientific Electronic Library Online

 
vol.8Secuencias vs. unidades en las lenguas otomangues: los casos del tlapaneco (mè’phàà) y el zapoteco (dixsa:)Fonotáctica consonántica y rasgos laríngeos de las lenguas mazatecas índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay artículos similaresSimilares en SciELO

Compartir


Cuadernos de Lingüística de El Colegio de México

versión On-line ISSN 2007-736X

Cuad. Lingüíst. Col. Méx. vol.8  Ciudad de México ene./dic. 2021  Epub 04-Abr-2022

https://doi.org/10.24201/clecm.v8i0.234 

Dossier

La complejidad de la epéntesis vocálica en mazahua

The complexity of vowel epenthesis in Mazahua

Francisco Arellanes Arellanes1 

Antonio Romero Hernández2 

1Universidad Nacional Autónoma de México, farellan@comunidad.unam.mx

2Universidad Nacional Autónoma de México, romero_antonio11@hotmail.com


Resumen.

En este trabajo nos enfocamos en el análisis de la epéntesis vocálica en mazahua tanto respecto de su motivación como del timbre de las vocales epentéticas. En el primer aspecto, mostramos que las vocales epentéticas permiten conformar pies trocaicos silábicos a partir de raíces tanto nominales como verbales, las cuales son subyacentemente monosilábicas. Cuando las raíces están seguidas de un sufijo, las vocales epentéticas no son necesarias. En cambio, los enclíticos no pueden incorporarse al pie principal de la palabra fonológica. En el segundo aspecto mostramos que el mazahua tiene tres tipos de vocales epentéticas: mínimamente marcadas, coloreadas por el contexto y mixtas (parcialmente no marcadas y parcialmente coloreadas por el contexto). Tal tipo de sistema no ha sido reportado previamente para ninguna lengua humana. Analizamos este fenómeno en el marco de la teoría de la optimidad y a partir de eso proponemos una reformulación de la tipología factorial de Kager (1999) sobre los timbres de los segmentos epentéticos.

Palabras clave: mazahua; epéntesis; estructura prosódica; timbres vocálicos; teoría de la optimidad

Abstract.

In this work, we focus on the analysis of vowel epenthesis in Mazahua, both regarding its motivation and the quality of the epenthetic vowels. The first aspect shows that epenthetic vowels allow the formation of syllabic trochaic feet from both nominal and verbal roots, which are underlyingly monosyllabic. When the suffix follows the roots, the epenthetic vowel is not necessary. In contrast, enclitics cannot be incorporated into the main foot of the phonological word. The second aspect shows that Mazahua has three types of epenthetic vowels: minimally marked, contextually colored, and mixed (partially unmarked and partially contextually colored). Such type of system has not been previously reported for any human language. We analyze this phenomenon within the optimality theory framework, and we propose a reformulation of the factorial typology of quality of the epenthetic segments by Kager (1999).

Key words: Mazahua; epenthesis; prosodic structure; vowel quality; optimality theory

1. INTRODUCCIÓN

1.1. Propósito del trabajo

El presente trabajo discute la epéntesis vocálica en el mazahua. Un primer tópico gira en torno a la motivación de la epéntesis, orientada hacia el cumplimiento de un requisito prosódico sobre el tamaño de la palabra y no encaminada a reparar una estructura silábica marcada, como se reporta en muchas lenguas según se revisará en §1.2. Efectivamente, la epéntesis es el recurso del mazahua para alcanzar el tamaño prosódico mínimo de la palabra fonológica: un pie trocaico silábico.1 El segundo tópico tiene que ver con el timbre de las vocales epentéticas. Obsérvense los datos de (1):

(1) Epéntesis vocálica en mazahua (datos tomados de Romero en proceso)

a. Epéntesis a favor de lo no marcado
i. /ɾí=ʔún/ 1PRES=dar [ɾí.(ˈʔúː.nɨ́)] ‘doy’
ii. /ɾí=póɗ/ 1PRES=sembrar [ɾí.(ˈpóː.ɗɨ́)] ‘siembro’
iii. /ɾí=pɔ́ʔtˀ/ 1PRES=matar [ɾí.(ˈpɔ́ʔ.tˀɨ́)] ‘mato’
iv. /ɾí=máʔtˀ/ 1PRES=gritar [ɾí.(ˈmáʔ.tˀɨ́)] ‘grito’
b. Epéntesis coloreada por el contexto
i. /ɾí=ʔɨ̂tˀ/ 1PRES=alimentar [ɾí.(ˈʔɨ̂ː.tˀɨ́)] ‘lo alimento’
ii. /ɾí=tə̂tˀ/ 1PRES=clavar [ɾí.(ˈtə̂ː.tˀə́)] ‘estoy clavando’
iii. /ɾí=ʃíʔɓ/ 1PRES=lavar.trastes [ɾí.(ˈʃíʔ.ɓí)] ‘lavo trastes’
iv. /ɾí=pèjˀ/ 1PRES=lavar.ropa [ɾí.(ˈpèː.djé)] ‘lavo ropa’
c. Epéntesis mixta
i. /ɾí=kɛ́ɓ/ 1PRES=quebrar.maíz nixtamalizado [ɾí.(ˈkɛ́ː.ɓí)] ‘estoy quebrando maíz nixtamalizado’

Los ejemplos de (1a) muestran que cuando la vocal de la raíz es fonéticamente posterior /u, o, ɔ/ o es central y baja /a/, la vocal epentética es una [ɨ]; estos casos constituyen evidencia de una epéntesis a favor de lo no marcado, donde la vocal epentética es la menos marcada en la lengua. Los ejemplos de (1b) muestran que cuando la vocal de la raíz es fonéticamente central o anterior y no es baja /ɨ, ə, i, e/ la vocal epentética copia su timbre; estos casos constituyen evidencia de una epéntesis coloreada por el contexto, donde el timbre de la vocal epentética depende del timbre de una vocal circundante -en este caso, del timbre de la vocal de la raíz. Hasta este punto, la epéntesis del mazahua constituye un caso tipológicamente bien documentado en el que en un mismo sistema lingüístico concurren una epéntesis a favor de lo no marcado y una epéntesis coloreada por el contexto, tal y como lo reporta Kager (1999: 107-109, 126-130) para el lenakel, sistema que revisaremos brevemente en §1.2. Sin embargo, (1c) muestra que en mazahua la epéntesis constituye un fenómeno todavía más complejo que en lenakel: efectivamente, cuando la vocal de la raíz es anterior y baja (/ɛ/), la vocal epentética no es la menos marcada del sistema (es decir, no es [ɨ]) como en los casos de (1a), pero tampoco tiene el mismo timbre que la vocal de la raíz como en los casos típicos de epéntesis coloreada por el contexto (1b); más bien, es un caso intermedio o mixto en el que la vocal epentética es parcialmente -y no mínimamente- marcada (en tanto no es baja ni posterior) y está parcialmente condicionada por el contexto (en tanto comparte con la vocal de la raíz su anterioridad). Esta epéntesis mixta es inesperada en la tipología desarrollada por Kager (1999) y constituye, al mismo tiempo, a) un hallazgo descriptivo de gran importancia debido a que la literatura especializada sobre epéntesis no lo consigna para ninguna lengua, y b) un reto analítico que pone en juego la capacidad explicativa de la teoría de la optimidad. Así, el segundo objetivo de este trabajo consiste en la descripción detallada y el análisis formal bajo el marco de la teoría de la optimidad de la epéntesis en mazahua, la cual no solo ocurre en el dominio verbal, como se muestra en (1), sino también en el dominio nominal, como se mostrará en §5.

1.2. Aspectos tipológicos y teóricos de la epéntesis

En la fonología, dentro del marco de la teoría de la optimidad, se reconocen dos aspectos de interés analítico respecto de la epéntesis. El primero es la motivación para su ocurrencia y el segundo es la cualidad o timbre de los elementos epentéticos.

Respecto del primero, los elementos epentéticos sirven fundamentalmente para reparar secuencias silábicas marcadas2 (Kager 1999: 98), ya sea codas (2) o constituyentes complejos (3) cuando el elemento epentético es una vocal3 y para dotar de inicio a sílabas carentes de este cuando el elemento epentético es una consonante (4):

(2) Epéntesis vocálica en ponapeano para evitar codas (Rehg & Sohl 1981; Itô 1989)

a/ak-dei/ [a.ke.dei] ‘concurso de lanzamiento’
b. /kitik-men/ [ki.ti.ki.men] ‘una rata’

(3) Epéntesis vocálica en lenakel para evitar complejidad (Lynch 1974; Blevins 1995)

a/t-n-ak-ol/ [tɨ.na.ɡɔl] ‘tú lo harás’
b. /ark-ark/ [ar.ɡa.rɨkʰ] ‘gruñir’

(4) Epéntesis consonántica en axininca para evitar sílabas sin inicio (Kager 1999)

a/no-n-koma-i/ [noŋ.ko.ma.ti] ‘chapoteará’
b. /no-n-koma-aː-i/ [noŋ.komataː.ti] ‘chapoteará de nuevo’

Respecto del segundo aspecto, translingüísticamente se han reconocido dos tendencias: o bien, los elementos epentéticos son mínimamente marcados (tales como vocales centrales [ɨ], [ə] y consonantes coronales [t], [j] o sin punto de articulación [ʔ]) o bien está sujetos a colorearse contextualmente, es decir a tener propiedades de los segmentos circundantes (Selkirk 1981; Itô 1986; Lowenstamm & Kaye 1986). En (5) y (6) se ilustran estas dos tendencias con datos respectivos de los plurales del inglés y de la resolución de inicios silábicos complejos en español no estándar:

(5) Epéntesis mínimamente marcada de [ɨ] en inglés4 (Roca & Johnson 1999)

a/feɪs-z/ [feɪ.sɨz] ‘rostros’
b. /feɪz-z/ [feɪ.zɨz] ‘etapas’
c. /dɪʃ-z/ [dɪ.ʃɨz] ‘platos’
d. /biʧ-z/ [bi.ʧɨz] ‘playas’
e. /bɻɪːʤz/ [bɻɪːʤɨz] ‘puentes’

(6) Epéntesis coloreada por el contexto en inicios complejos en español no estándar5

a/eɡlesia/ [e.ɡe.le.sja] ‘iglesia’
b. /kɾisto/ [ki.ɾis.to] ‘Cristo’
c. /tiɡɾe/ [ti.ɣe.ɾe] ‘tigre’
d. /ʧoklo/ [ʧo.ko.lo] ‘choclo, maíz’

En la teoría de la optimidad estas dos tendencias se explican a partir del conflicto entre dos tipos de restricciones de marcación: marcación general (free-context) y marcación contextual. Las primeras favorecen los elementos universalmente menos marcados mientras que las segundas favorecen los elementos mejor adaptados al entorno fónico. Por ejemplo (cf. Kager 1999: 28), la restricción de marcación general *Ṽ penaliza bajo cualquier circunstancia las vocales con corriente de aire nasal. Por su parte, la restricción de marcación contextual *VN penaliza la secuencia de vocal oral más consonante nasal. Entonces, mientras la primera restricción favorece las vocales orales sobre las nasales de manera general -es decir, independientemente del contexto- la segunda restricción favorece las vocales nasales sobre las orales en un contexto en específico, lo que revela un conflicto entre restricciones de marcación.6 En la teoría de la optimidad los conflictos son la base para la conformación de tipologías factoriales.

Si bien las tipologías factoriales pueden implicar la interacción entre restricciones de fidelidad y de marcación (cf. Kager 1999: 36), también es posible establecer tipologías en las que la interacción básica ocurre entre restricciones de marcación general y restricciones de marcación contextual. Ahora bien, dado que los elementos epentéticos no tienen una contraparte en el input, las restricciones de fidelidad no son relevantes en el análisis sobre la determinación del timbre de dichos segmentos.7 Por ello, la tipología de Kager (1999) sobre el timbre de los segmentos epentéticos solo considera la interacción entre restricciones de marcación general y restricciones de marcación contextual:

(7) Tipología factorial del timbre de los segmentos epentéticos (Kager 1999: 126)

  1. Marcación general » Marcación contextual El segmento epentético es mínimamente marcado.

  2. Marcación contextual » Marcación general El segmento epentético es contextualmente coloreado.

El autor advierte que esta tipología es esquemática por naturaleza y que dado que no se refiere a restricciones en particular, sino a tipos de restricciones, los efectos pueden ser diferentes en cada caso. Así, analiza la epéntesis vocálica en lenakel, lengua en la que, como vimos en (3), se epentetiza una [ɨ] para evitar inicios o codas complejas. Sin embargo, la [ɨ] solo se epentetiza si la consonante precedente es coronal. En los demás casos, la vocal epentética es una [ə] como se observa en los datos siguientes:

(8) Epéntesis de [ə] en lenakel después de consonantes no coronales (Lynch 1974)

a/to-rm-n/ [tɔr.mən] ‘a su padre’
b. /apn-apn/ [ab.na.bən] ‘libre’
c. /k-ar-pkom/ [kar.bə.ɡɔm] ‘son pesados’
d. /r-m-əŋn/ [rɨ.mə.ŋən] ‘tenía miedo’

Es decir, en lenakel [ɨ] aparece condicionada por el contexto mientras que [ə] es la vocal por default, la no marcada. Las restricciones de marcación general *[+bajo], *[-post] y *[+red] favorecen estas dos vocales sobre el resto del sistema y ocupan una posición alta en la jerarquía (solo debajo de las restricciones de fidelidad que impiden que las vocales fonológicas se reduzcan a los dos timbres de las epentéticas); enseguida aparece la restricción de marcación contextual COR-alto que pide que las vocales que siguen a una consonante coronal sean altas; finalmente, en la posición más baja de la jerarquía aparece la restricción *[+alto] que favorece a [ə] sobre [ɨ]. Así, cuando hay una consonante coronal en el input la restricción COR-alto determina que la vocal epentética sea [ɨ] mientras que, en ausencia de una consonante coronal en el input, la restricción cor-alto está inactiva y es la restricción más baja en la jerarquía, *[+alto], la que determina que la vocal epentética sea [ə].

En resumen, la tipología de Kager contempla tres situaciones: i) casos como el del inglés (cf. 5) en que todas las restricciones relevantes de marcación general dominan a las restricciones relevantes de marcación contextual; ii) casos como el del español (cf. 6) en que todas las restricciones relevantes de marcación contextual dominan a las restricciones relevantes de marcación general; y, iii) casos como el del lenakel (cf. 3 y 8) en los que hay al menos una restricción de marcación contextual que aparece en una posición jerárquica intermedia (COR-alto), dominada por algunas restricciones de marcación general (*[+bajo], *[-post], *[+red]) y dominando, al menos, a otra restricción de marcación general (*[+alto]). Resáltese que este tercer caso es una combinación de los dos órdenes jerárquicos propuestos en la tipología de Kager de (7). Obsérvese (7bis):

(7bis) Tipología factorial del timbre de los segmentos epentéticos (revisión)

  1. Marcación general » Marcación contextual El segmento epentético es mínimamente marcado.

  2. Marcación contextual » Marcación general El segmento epentético es contextualmente coloreado.

  3. Marcación general » Marcación contextual » Marcación general Concurren elementos epentéticos mínimamente marcados con elementos epentéticos coloreados por el contexto.

La organización del resto del trabajo es la siguiente. En §2 se proporciona información general sobre la lengua respecto de su filiación genética y la ubicación de las comunidades en que se habla. En §3 se describe el sistema fonológico del mazahua con atención particular a la caracterización de los timbres vocálicos mediante articuladores y rasgos terminales. En §4 se justifica, luego de desechar las nociones de formativo y radical -de uso extendido en trabajos previos en la descripción morfológica del mazahua-, que las raíces en la lengua son fonológicamente monosilábicas. En §5 se discute la motivación de la epéntesis, el recurso que, en ausencia de sufijos, emplea la lengua para cumplir con el requisito prosódico sobre el tamaño mínimo de la palabra: un pie trocaico silábico. Este requisito y la epéntesis, en tanto proceso reparador, se verifican tanto en el dominio nominal (§5.1) como en el verbal (§5.2). En §6 se analiza formalmente, bajo el marco de la teoría de la optimidad, el timbre de las vocales epentéticas y se propone una ampliación de la tipología factorial de Kager (1999) sobre el timbre de los segmentos epentéticos resumida en (7) y (7bis). Finalmente, en §7 se hace un resumen general sobre los aportes del presente trabajo.

2. ASPECTOS GENERALES DE LA LENGUA

El mazahua es una lengua que pertenece al tronco lingüístico otomangue; más específicamente a la familia lingüística otopameana que a su vez pertenece al subgrupo otopameano-chinanteco. En el siguiente diagrama mostramos la clasificación que se ha propuesto para explicar el grado de relación de los subgrupos de las lenguas que conforman el tronco otomangue (Campbell 2017 basado en Kaufman 1988).

Figura 1 Clasificación lingüística otomangue (Campbell 2017 basado en Kaufman 1988). 

A su vez el otopameano se divide en dos subgrupos, el otomiano y el pameano (Knapp 2008 basado en Soustell 1993), como se muestra en la Figura 2.

Figura 2 Clasificación de las lenguas otopames (Knapp 2008 basado en Soustell 1993

El INALI (2010) consigna dos variantes dialectales del mazahua; por un lado, el jñatrjo o mazahua del oriente y, por otro, el jñatjo o mazahua de occidente. De acuerdo con el INEGI (2010) existen aproximadamente 160 000 hablantes de mazahua repartidos en 16 municipios del noroeste del Estado de México y en cuatro municipios de Michoacán. Las poblaciones mazahuas que se localizan al noroeste del Estado de México son los municipios de El Oro, Temascalcingo, Jocotitlán, Atlacomulco, San Felipe del Progreso, San José del Rincón, Ixtlahuaca, Villa Victoria, Villa de Allende, Donato Guerra, Villa Victoria, Morelos, Ixtapan del Oro, Jiquipilco, Almoloya de Juárez y Amanalco de Becerra; en Michoacán, los municipios mazahuas son Susupuato, Zitácuaro, Ocampo y Angangueo.

La variante de estudio corresponde al mazahua de Pastores perteneciente al municipio de Temascalcingo en el Estado de México (mazahua del occidente). El mapa de la Figura 3 muestra la ubicación del municipio.

Figura 3 Municipios de la región mazahua (Jiménez sf

3. SISTEMA FONOLÓGICO

Nuestra propuesta del sistema consonántico toma como base la de Knapp (2008):8

Tabla 1 Fonemas consonánticos del mazahua9  

LABIAL CORONAL DORSAL GLOTAL
bilabial anterior no anterior plano labia-lizado
Oclusivas fortis p t k ʔ
kʰʷ
kˀʷ
lenis k̆ʷ ʔ̆
h h k̆ʰ k̆ʰʷ
t̆ˀ k̆ˀ
ɓ ɗ
Africadas fortis ʦ ʧ
tsʰ ʧʰ
tsˀ ʧˀ
Fricativas fortis β s ʃ h
lenis
z ʒ
Nasales lenis m n ɲ
ʰm ʰn ʰɲ
Laterales l
Vibrantes ɾ
Aproximantes fortis w j
ʰw ʰj = [hj]
lenis jˀ = [dj]

En el dominio vocálico, todos los trabajos referidos coinciden en postular quince segmentos vocálicos, los cuales se dividen en nueve orales y seis nasales, como se puede ver, respectivamente, en las Tablas 2 y 3:

Tabla 2 Vocales orales 

ANTERIOR CENTRAL POSTERIOR
alto i ɨ u
medio e ə o
bajo ɛ a ɔ

Tabla 3 Vocales nasales 

ANTERIOR CENTRAL POSTERIOR
alto ɨ͂
no alto /ã/ = [ə̃] /õ/ = [ɔ̃]

En el subsistema oral hay cuatro niveles fonéticos de altura, pues /a/ es fonéticamente más abierta que /ɛ/ y /ɔ/; sin embargo, en concordancia con Knapp (2008: 22) asumimos solo tres niveles fonológicamente, lo que se justifica mediante el comportamiento fonológico de estas vocales, que se revisará en detalle en los párrafos siguientes y en §6. Es de resaltarse que estos tres niveles se reducen a solo dos en el subsistema nasal.

Siguiendo la propuesta de Clements (1993) sobre puntos de articulación vocálicos y considerando los tres niveles de altura con valor fonológico, a continuación mostramos la caracterización fonológica de los timbres orales del mazahua:

De esta caracterización se sigue naturalmente que las vocales menos marcadas en el mazahua son /ɨ/ y /ə/, justamente por carecer de articulador. Nótese que /a/ no entra en este grupo debido a que tiene como articulador la raíz de la lengua, lo que no se refleja en la Tabla 2 cuya lógica organizativa es puramente fonética. Considerando, además, que universalmente [CORONAL] es el articulador menos marcado, las vocales del mazahua pueden organizarse en tres grupos, tal y como se expresa en (9):

(9) Escala de marcación vocálica según el articulador vocálico

-marcado +marcado
[ ] > [CORONAL] > [DORSAL], [RADICAL]
/ɨ, ə/ /i, e, ɛ/ /u, o, ɔ, a/

Esta escala se valida empíricamente -salvo por un detalle que se discutirá enseguida- si se considera que no todos los timbres vocálicos ocurren en las vocales epentéticas, tal y como ya se mostró en los ejemplos de (1) en §1.1: exceptuando a /ɛ/, las vocales epentéticas se corresponden con los dos grados más altos de la escala de (9). En (10) se resume la correspondencia entre los timbres de las vocales epentéticas y los timbres de la vocal de la raíz:10

Las vocales de raíz que están más bajas en la escala de (9) toman como vocal epentética una [ɨ]; en el resto de los casos, exceptuando /ɛ/, la vocal epentética copia el timbre de la vocal de la raíz. Este comportamiento inesperado de /ɛ/ se tratará en detalle en §6. Por lo pronto, basta con reafirmar que la caracterización fonológica del sistema vocálico detallada en la Tabla 4 es esencialmente correcta.

Tabla 4 Caracterización fonológica de los timbres vocálicos del mazahua11  

i ɨ u e ə o ɛ a ɔ
CORONAL
DORSAL
RADICAL
alto + + + - - - - - -
bajo - - - - - - + + +

Finalmente, el mazahua cuenta con tres patrones tonales con valor fonológico: alto (A), bajo (B) y descendente (AB) (Pike 1951: 37; Amador 1976: 8; Romero 2017). Estos patrones tonales son contrastivos en las raíces; en cambio, las vocales epentéticas reciben un tono A, como ya se mostró en los ejemplos de (1) en §1.1. Este tono A no es epentético, sino que es un tono flotante que marca el linde final de cada pie dentro de la palabra fonológica (Romero en proceso). En §5 se describe en detalle este fenómeno, y también se argumenta que los sufijos y los enclíticos carecen de especificación tonal, mientras que los proclíticos sí tienen un tono propio, el cual puede ser A o B, pero no AB a diferencia de lo que ocurre con las raíces.

4. LA FORMA DE LAS RAÍCES EN MAZAHUA

En este apartado discutimos críticamente las nociones de formativo y radical, de uso tradicional en el estudio de las lenguas otopames y, particularmente, del mazahua (Spotts 1953: 254; Bartholomew 1965: 89-113; Amador 1976: 45-50; Knapp 2008: 100-119), pero no consideradas en la terminología morfológica contemporánea ni teórica ni tipológica. En §4.1, mostramos que los formativos no tienen un estatus morfológico claro y que los radicales no se distinguen de las raíces mediante ningún criterio morfológico o sintáctico. A partir de eso, en §4.2 desechamos estas nociones y, en cambio, proponemos que las raíces en mazahua pueden ser tanto de la forma (C)CV como de la forma (C)CVC(C), es decir que pueden terminar tanto en vocal como en consonante pero siempre son subyacentemente monosilábicas. Proponemos también que en todas las raíces puede aparecer una vocal epentética y que además hay un cierre glotal, también epentético, cuando la raíz termina en vocal. Finalmente, distinguimos dos tipos de epéntesis: una que implica una copia del timbre de la vocal de la raíz cuando la vocal está precededida por una glotal, sea el cierre glotal epentético [ʔ] o una fricativa glotal /h/, y otra, que sigue el mecanismo resumido en la Tabla 5 de §3, cuando la raíz termina en cualquier otra consonante.

Tabla 5 Timbres de las vocales epentéticas según el timbre de la vocal de la raíz (cf. 1) 

VOCAL DE LA RAÍZ VOCAL EPENTÉTICA TIPO DE EPÉNTESIS
/ɨ/ [ɨ] Coloreada por el contexto
/ə/ [ə] Coloreada por el contexto
/i/ [i] Coloreada por el contexto
/e/ [e] Coloreada por el contexto
/u/ [ɨ] A favor de lo no marcado
/o/ [ɨ] A favor de lo no marcado
/ɔ/ [ɨ] A favor de lo no marcado
/a/ [ɨ] A favor de lo no marcado

4.1. Raíces, radicales y formativos

Tradicionalmente, se ha asumido que en mazahua los lexemas simples -es decir, no compuestos- se dividen en dos grupos: aquellos conformados únicamente por la raíz y aquellos conformados por la raíz más un formativo. Típicamente, se asume que tanto las raíces como los formativos son monosílabos con la forma (C)CV, con la salvedad de que la vocal del formativo tiene un timbre predecible o armónico. A la unidad conformada por una raíz más un formativo se le denomina radical. De tal modo, algunos lexemas están constituidos solamente por raíces mientras que otros son radicales (cf. Knapp 2010: 16). En (10) se presentan algunos ejemplos lexemáticos tanto de raíces (10a, 10a’) como de radicales (10b, 10b’) bajo esta perspectiva analítica:

(10) Raíces y radicales en mazahua

a. raíces nominales a’. raíces verbales
/ɗà/ [ˈɗàː.ʔá] ‘pene’ /sà/ [ˈsàː.ʔá] ‘morder’
/sɛ́/ [ˈsɛ́ː.ʔɛ́] ‘frío’ /βɛ̀/ [ˈβɛ̀ː.ʔɛ́] ‘llorar’
/kʰí/ [ˈkʰíː.ʔí] ‘sangre’ /mp̆ì/ [ˈmbìː.ʔí] ‘temblar’
/ʰɲɨ́/ [ˈʰɲɨ́ː.ʔɨ́] ‘aliento’ /nɨ̂/ [ˈnɨ̂ː.ʔɨ] ‘caerse’
/jˀô/ [ˈdʲôː.ʔó] ‘perro’ /sô/ [ˈsôː.ʔó] ‘caerse (al gua)’
/kʷè/ [ˈkʷèː.ʔé] ‘coraje’ /pè/ [ˈpèː.ʔé] ‘tejer’
/kʰɔ̀/ [ˈkʰɔ̀ː.ʔɔ́] ‘nuera’ /sɔ́/ [ˈsɔ́ː.ʔɔ́] ‘probar’
/sú/ [ˈsúː. ʔú] ‘esposa’ /jù/ [ˈjùː.ʔú] ‘bramar’
/thə̂/ [ˈthə̂ː.ʔə́] ‘salitre’ /ʧə̂/ [ˈʧə̂ː.ʔə́] ‘montar’
b. radicales nominales b’. radicales verbales
/ŋɡù-mɨ́/ [ˈŋɡùː.mɨ́] ‘casa’ /ʔû-nɨ́/ [ˈʔûː.nɨ́] ‘dar’
/sˀɔ̀-nɨ́/ [ˈsˀɔ̀ː.nɨ́] ‘ombligo’ /ɓɔ̂-ɓɨ́/ [ˈɓɔ̂ː.ɓɨ́] ‘estar parado’
/tʰɛ́-jˀí/ [ˈtʰɛ́ː.dʲí] ‘cuchillo’ /pɛ̂-phí/ [ˈpɛ̂ː.phí] ‘trabajar’
/ɓâ-ɾɨ́/ [ˈɓâː.ɾɨ́] ‘listón’ /páʔ-tˀɨ́/ [ˈpáʔ.tˀɨ́] ‘calentar’
/mê-ʃé/ [ˈmêː.ʃé] ‘araña’ /tʰê-ɲé/ [ˈtʰêː.ɲé] ‘reír’
/jˀì-zí/ [ˈdʲìː.zí] ‘cuello’ /ʃíʔ-ɓí/ [ˈʃíʔ.ɓí] ‘lavar trastes’
/sˀə̂-ɓə́/ [ˈsˀə̂ː.ɓə́] ‘olla’ /ʔə̀-nə́/ [ˈʔə̀ː.nə́] ‘gatear’
/ʧˀò-pʰɨ́/ [ˈʧˀòː.pʰɨ́] ‘dinero’ /póʃ-kɨ́/ [ˈpóʃ.kɨ́] ‘ensuciar algo’
/ʃɨ̂-tʰɨ́/ [ˈʃɨ̂ː.tʰɨ́] ‘espalda’ /pɨ́-nɨ́/ [ˈpɨ́ː.nɨ́] ‘voltear’

En los casos de (10a-10a’) asumimos, siguiendo a Knapp (2010: 16), que el cierre glotal es epentético, lo mismo que la vocal postónica -la cual es siempre idéntica en su timbre a la vocal de la raíz- y que su inclusión se debe a las razones prosódicas que discutiremos en detalle en §5. Sin embargo, nos alejamos de la suposición de que en mazahua existen los radicales como un constructo morfológico diferente a las raíces. La razón principal consiste en que no es claro el estatus morfológico ni de los formativos ni de los propios radicales. Respecto de los primeros, no es posible atribuirles ningún significado o función gramatical. Por ejemplo, no es el caso que los lexemas constituidos por raíces sean intransitivos mientras que los constituidos por raíz más formativo sean transitivos, ni viceversa. Tampoco es el caso que los formativos se añadan a raíces con ciertas propiedades semánticas, tales como animacidad -en el dominio nominal- o el aktionsart -en el dominio verbal. Menos todavía es el caso que todas las raíces nominales requieran de un formativo y ninguna raíz verbal lo requiera, ni viceversa. Finalmente, tampoco es el caso que todas las raíces requieran de un formativo para poder tener usos morfológicos o sintácticos. Tanto las raíces de (10a-10a’) como los radicales de (10b-10b’) pueden constituir núcleos de frases sintácticas y recibir directamente la modificación de los enclíticos de persona. Dicho en términos más simples, los formativos no tienen ninguna propiedad morfológica -ningún significado léxico-referencial o gramatical- que permita caracterizarlos como afijos. Más bien, la única generalidad que podemos obtener bajo esta perspectiva analítica es que no es posible predecir cuáles raíces requieren de un formativo y cuáles no, de modo que es necesario estipular léxicamente esta diferencia. Por otro lado, el problema también es fonológico, pues mientras que el timbre de la(s) consonante(s) de los formativos en (10b-10b’) es por completo impredecible, el timbre de las vocales de los formativos es predecible de acuerdo con lo resumido en la Tabla 5 en §3. Esto significa que la información referida a las consonantes de los formativos es impredecible, debe estar estipulada léxicamente y, por lo tanto, forma parte de la representación fonológica de los lexemas, pero que la información sobre las vocales es por completo predecible, no debe estipularse léxicamente y, fundamentalmente, no debe representarse fonológicamente. De manera general, lo anterior nos conduce a negar la pertinencia y la existencia misma de los formativos -y, con ellos, de los radicales- como entidades morfológicas diferentes a las raíces en mazahua.

4.2. Un análisis alternativo

Como consecuencia de lo discutido en §4.1, es necesario reconocer que las raíces en mazahua pueden diferir en si terminan en vocal o en consonante en su forma fonológica, pero que en cualquiera de los dos casos son subyacentemente monosilábicas. Obsérvese la reinterpretación de los datos de (10) que hacemos en (11):

(11) Raíces con vocal final y con consonante final en mazahua (cf. 10)

a. raíces nominales con vocal final a’. raíces verbales con vocal final
/ɗà/ [ˈɗàː.ʔá] 12 ‘pene’ /sà/ [ˈsàː.ʔá] ‘morder’
/sɛ́/ [ˈsɛ́ː.ʔɛ́] ‘frío’ /βɛ̀/ [ˈβɛ̀ː.ʔɛ́] ‘llorar’
/kʰí/ [ˈkʰíː.ʔí] ‘sangre’ /mp̆ì/ [ˈmbìː.ʔí] ‘temblar’
/ʰɲɨ́/ [ˈʰɲɨ́ː.ʔɨ́] ‘aliento’ /nɨ̂/ [ˈnɨ̂ː.ʔɨ́] ‘caerse’
/jˀô/ [ˈdʲôː.ʔ] ‘perro’ /sô/ [ˈsôː.ʔó] ‘caerse (al agua)’
/kʷè/ [ˈkʷèː.ʔ] ‘coraje’ /pè/ [ˈpèː.ʔé] ‘tejer’
/kʰɔ̀/ [ˈkʰɔ̀ː.ʔɔ́] ‘nuera’ /sɔ́/ [ˈsɔ́ː.ʔɔ́] ‘probar’
/sú/ [ˈsúː. ʔ] ‘esposa’ /jù/ [ˈjùː.ʔ] ‘bramar’
/thə̂/ [ˈthə̂ː.ʔə́] ‘salitre’ /ʧə̂/ [ˈʧə̂ː.ʔə́] ‘montar’
b. raíces nominales con consonante final b’. raíces verbales con consonante final
/ŋɡùm/ [ˈŋɡùː.mɨ́] ‘casa’ /ʔûn/ [ˈʔûː.nɨ́] ‘dar’
/sˀɔ̀n/ [ˈsˀɔ̀ː.nɨ́] ‘ombligo’ /ɓɔ̂ɓ/ [ˈɓɔ̂ː.ɓɨ́] ‘estar parado’
/tʰɛ́jˀ/ [ˈtʰɛ́ː.dʲí] ‘cuchillo’ /pɛ̂ph/ [ˈpɛ̂ː.phí] ‘trabajar’
/ɓâɾ/ [ˈɓâː.ɾɨ́] ‘listón’ /páʔtˀ/ [ˈpáʔ.tˀɨ́] ‘calentar’
/mêʃ/ [ˈmêː.ʃ] ‘araña’ /tʰêɲ/ [ˈtʰêː.ɲé] ‘reír’
/j’ìz/ [ˈdʲìː.z] ‘cuello’ /ʃíʔɓ/ [ˈʃíʔ.ɓí] ‘lavar trastes’
/sˀə̂ɓ/ [ˈsˀə̂ː.ɓə́] ‘olla’ /ʔə̀n/ [ˈʔə̀ː.nə́] ‘gatear’
/ʧˀòpʰ/ [ˈʧˀòː.pʰɨ́] ‘dinero’ /póʃk/ [ˈpóʃ.kɨ́] ‘ensuciar algo’
/ʃɨ̂tʰ/ [ˈʃɨ̂ː.tʰɨ́] ‘espalda’ /pɨ́n/ [ˈpɨ́ː.nɨ́] ‘voltear’

Hay una diferencia fundamental entre los dos tipos de raíces en mazahua: en las raíces que terminan en vocal la epéntesis no es vocálica sino silábica -pues incluye un cierre glotal-, mientras que en las raíces que terminan en consonante la epéntesis es solamente vocálica. Adicionalmente, en los casos de (11a-11a’) se nota que la vocal epentética tiene siempre el mismo timbre que la vocal de la raíz mientras que en los casos de (11b-11b’) se sigue el patrón complejo ya resumido en la Tabla 5 en §3. Sin embargo, esta diferencia no es entre raíces terminadas en vocal y raíces terminadas en consonante, sino que depende más bien de si en el nivel fonético la consonante intermedia entre la vocal de la raíz y la vocal epentética tiene articulador o carece de él. Efectivamente, la vocal es completamente armónica -es decir, tiene el mismo timbre que la de la raíz- no solo cuando la consonante intermedia es el cierre glotal epentético, como en los casos de (11a-11a’), sino también cuando la consonante final de la raíz es una /h/, como se ve en los ejemplos de (12):13

(12) Raíces terminadas en /h/

a. raíces nominales terminadas en /h/ a’. raíces verbales terminadas en /h/
/hjɔh/ [ˈhʲɔ̀ː.hɔ́] ‘hombro’ /jˀɔ̂h/ [ˈdʲɔ̂ː.hɔ́] ‘vomitar’
/nt̆êh/ [ˈndêː.h] ‘agua’ /hè/ [ˈhèː.hé] ‘toser’
/ʦíh/ [ˈʦíː.h] ‘color’ /kîh/ [ˈkîː.hí] ‘traer en la mano’
/pʰôh/ [ˈpʰôː.h] ‘excremento’ /móh/ [ˈmóː.hó] ‘ir (1PL.INCL)’
/hwàh/ [ˈhwàː.h] ‘ala’ /ʃàh/ [ˈʃàː.há] ‘bañarse’
/tˀə̀h/ [ˈtˀə̀ː.hə́] ‘surco’ /tə̂h/ [ˈtə̂ː.hə́] ‘mandar’
/hjɛ́h/ [ˈhjɛ́ː.hɛ́] ‘ladeado’ /ʧɛ̂h/ [ˈʧɛ̂ː.hɛ́] 14 ‘cobijar’

Lo anterior no es sorprendente debido a la sabida transparencia de las consonantes glotales a los procesos fonológicos a distancia.

En resumen, las raíces en mazahua pueden terminar en vocal o en consonante pero subyacentemente siempre son monosilábicas. En ambos casos, se epentetiza una vocal -debido a requerimientos prosódicos que se revisarán en §5- pero en el primero también se epentetiza un cierre glotal para evitar que la sílaba de la vocal epentética carezca de inicio. Finalmente, cuando la consonante intermedia entre la vocal de la raíz y la vocal epentética es el cierre glotal epentético [ʔ] (11a-11a’) o es una /h/ final de raíz (12), la vocal epentética siempre tiene el mismo timbre que la vocal de la raíz, mientras que cuando la consonante a final de raíz es cualquiera excepto /h/ (1, 11b-11b’) el timbre de la vocal epentética sigue el patrón complejo resumido en la Tabla 5 de §3. En el análisis en el marco de la teoría de la optimidad que haremos en §6 nos enfocaremos en este último tipo de epéntesis, pero antes de eso, en §5, hablaremos sobre las causas prosódicas que motivan la ocurrencia de la epéntesis.

5. LA MOTIVACIÓN DE LA EPÉNTESIS

En este apartado mostraremos que la epéntesis vocálica en mazahua es producto de un requerimiento prosódico sobre el tamaño mínimo de la palabra fonológica: un pie trocaico silábico con el requerimiento adicional de que la sílaba prominente sea bimoraica. Mostraremos también que mientras los sufijos forman parte del pie, los clíticos no. En construcciones con un número grande de morfemas, además del pie principal puede haber un pie adicional dentro de la palabra fonológica conformado por dos enclíticos, y un tercer pie, externo a la palabra fonológica pero incorporado al grupo clítico, conformado por dos proclíticos. En general, las raíces requieren de un sufijo o de una vocal epentética para cumplir con el requerimiento prosódico sobre el tamaño mínimo de la palabra fonológica. Esto es verdad tanto en el dominio nominal (§5.1) como en el dominio verbal (§5.2).

5.1. Dominio nominal

La frase nominal mínima en mazahua consta de un determinante en forma de proclítico más una raíz nominal. El determinante expresa definitud y número (13a-b) o bien expresa al poseedor (13c-e). Nótese que en estas construcciones aparece la vocal epentética:15

(13) Frases nominales mínimas en mazahua

a. /nù=mbɨǹtˀ/DEF.SG=faja [nùm.(ˈbɨ̰ ǹ .tˀɨ́)] ‘la faja’
b. /jò=mbɨǹ tˀ/DEF.PL=faja [jòm.(ˈbɨ̰ ǹ .tˀɨ́)] ‘las fajas’
c. /í=mbɨǹ tˀ/1POS=faja [ím.(ˈbɨ̰ ǹ .tˀɨ́)] ‘mi faja’
d. /ì=mbɨǹ tˀ/2POS=faja [ìm.(ˈbɨ̰ ǹ .tˀɨ́)] ‘tu faja’
e. /ó=mbɨǹ tˀ/3POS=faja [óm.(ˈbɨ̰ ǹ .tˀɨ́)] ‘su faja’

Una propiedad morfosintáctica interesante de las frases nominales en mazahua es que el determinante puede tener una doble expresión: como proclítico que precede a la raíz nominal y como sufijo que la sigue.16 Contrástese las frases nominales mínimas de (13) con las frases nominales con doble determinante de (14):

(14) Frases nominales con doble determinante en mazahua (proclítico y sufijo)

a. /nù=mbɨǹ tʔ-nu/ DEF.SG=faja-def.sg [nùm.(ˈbɨ̰ ǹ tˀ.nú)] ‘la faja’
b. /jò=mbɨǹ tʔ-jo/ DEF.PL=faja-def.pl [jòm.(ˈbɨ̰ ǹ tˀ.jó)] ‘las fajas’
c. /í=mbɨǹ tʔ-khɔ/ 1POS=faja-1 [ím.(ˈbɨ̰ ǹ tˀ.kʰɔ́)] ‘mi faja’
d. /ì=mbɨǹ tˀ-khe/ 2POS=faja-2 [ìm.(ˈbɨ̰ ǹ tˀ.kʰé)] ‘tu faja’
e. /ó=mbɨǹ tˀ-hnu/ 3POS=faja-3 [óm.(ˈbɨ̰ ǹ tˀ.ʰnú)] ‘su faja’

Llaman la atención dos hechos fonológicos en estas construcciones. El primero es que en presencia de los sufijos determinantes, las vocales epentéticas ya no aparecen. El segundo es que los sufijos determinantes carecen de un tono propio y manifiestan sistemáticamente el mismo tono A flotante que aparece en las vocales epentéticas. Asumiremos que estos dos hechos son suficientes para considerar que tanto las vocales epentéticas como los sufijos determinantes forman parte de la palabra fonológica mínima en mazahua y que ésta constituye, en términos prosódicos, un pie trocaico silábico, con una condición adicional: la sílaba prominente debe ser bimoraica.17 Obsérvese la representación de (15):18

(15) Tamaño mínimo de la palabra en mazahua: un pie trocaico silábico sensible al peso

Las raíces en mazahua, debido a su condición fonológica monosilábica, no se ajustan al tamaño prosódico descrito en (15) y requieren, o bien la incorporación de la sílaba del sufijo como parte del pie (cf. 14), o bien, en ausencia de sufijación, la epéntesis vocálica (cf. 13). En ningún caso el proclítico forma parte del pie.

Existe también una construcción de doble determinante en la que la raíz está seguida de un enclítico y no de un sufijo. Obsérvense los datos de (16) y contrástense con los de (14):

(16) Frases nominales con doble determinante en mazahua (proclítico y enclítico)

a. /nù=mbɨǹ tʔ=nu/ DEF.SG=faja=def.sg [nùm.(ˈbɨ̰ ǹ.tˀɨ́).nú] ‘la faja’
b. /jò=mbɨǹ tʔ=jo/ DEF.PL=faja=def.pl [jòm.(ˈbɨ̰ ǹ .tˀɨ́).jó] ‘las fajas’
c. /í=mbɨǹ tʔ=khɔ/ 1POS=faja=1 [ím.(ˈbɨ̰ ǹ .tˀɨ́).kʰɔ́] ‘mi faja’
d. /ì=mbɨǹ tˀ=khe/ 2POS=faja=2 [ìm.(ˈbɨ̰ ǹ .tˀɨ́).kʰé] ‘tu faja’
e. /ó=mbɨǹ tˀ=hnu/ 3POS=faja=3 [óm.(ˈbɨ̰ ǹ .tˀɨ́).ʰnú] ‘su faja’

El contraste entre (14) y (16) muestra la necesidad de distinguir entre sufijos y enclíticos en la misma posición lineal de superficie y con la misma función morfosintáctica. Mientras los primeros forman parte del pie, los segundos no y por tanto se requiere de la vocal epentética. Así, en los datos de (16) el enclítico constituye una sílaba desamparada que se liga directamente a la palabra fonológica sin formar parte del pie mientras que la vocal epentética ocupa la posición de núcleo en la sílaba débil del pie:19

(17) Posición prosódica de los enclíticos (únicos)

Por lo demás, en los datos de (16) -al igual que en los de (13) y (14)- la vocal de la sílaba débil del pie recibe un tono A flotante (18a), solo que en (16) este tono se propaga hacia la sílaba del enclítico (18b) que, al igual que un sufijo, carece de tono propio:

(18) Asociación y propagación de tono A flotante:

La sílaba de la raíz (la tónica) y la del proclítico, por su parte, siempre manifiestan fonéticamente su tono léxico.

Las frases nominales en mazahua permiten también la combinación de una doble expresión del poseído con una doble expresión de la definitud. En tales casos, las piezas morfológicas que siguen a la raíz son necesariamente enclíticos:20

(19) Frases nominales con doble expresión de poseedor y de definitud

a. /nù=í=ndzùm=khɔ=nu/ DEF.SG=1POS=casa=1=DEF.SG [(ˌnù.ín).<(ˈdzùːmɨ́).(ˌkʰɔ̀.nú)>] ‘mi casa’
b./nù=ì=mbɨǹtˀ=khe=nu/ DEF.SG=2POS=faja=2=DEF.SG [(ˌnù.ìm).<(ˈbɨ̰ǹ.tˀɨ́).(ˌkʰè.nú)>] ‘tu faja’
c. /nù=ó=pʰâɗ=hnu=nu/ DEF.SG=3POS=caballo=3=DEF.SG [(ˌnù.ó).<(ˈpʰâːˀ.ɗɨ́).(ˌʰnù.nú)>] ‘su caballo’

Estos enclíticos conforman un pie adicional que, dentro de la palabra fonológica, sigue inmediatamente al pie principal. Como ya se adelantó desde §3, los enclíticos en general -al igual que los sufijos y a diferencia de los proclíticos- carecen de tono léxico. De modo que en el pie adicional, la sílaba prominente -que no tiene el requerimiento de bimoraicidad que sí tiene la sílaba prominente del pie principal- recibe un tono B por default (20a) mientras que la sílaba débil recibe un tono A flotante del mismo modo que la sílaba débil del pie principal (20b):

(20) Asignación de tono B por default y asociación de tono A flotante:

De esta manera se aclara la función de los tonos A flotantes: estos son marcadores de linde final en los pies que están dentro de la palabra fonológica pero no en los que están fuera, como el conformado por los dos proclíticos. Estos proclíticos -como la sílaba de la raíz- tienen tonos léxicos, de modo que sobre el primer proclítico no se puede aplicar la asignación de tono B por default y sobre el segundo no se asocia un tono A flotante.

Finalmente, también existen construcciones con tres morfemas posteriores a la raíz nominal. En estos casos, el morfema inmediatamente posterior a la raíz puede ser un sufijo (21a) o un enclítico (21b), pero los dos restantes son necesariamente enclíticos:

(21) Frases nominales con tres morfemas posteriores a la raíz:

a. /nù=í=ʣùm-kʰɔ=ɓe=nu/ → [(ˌnù.ín).<(ˈʣùːŋ.ɡɔ́).(ˌɓè.nú)>]
DEF.SG=1POS=casa-1=DUAL.EXCL=DEF.SG
‘nuestra casa (dual exclusivo)’
b. /nù=í=ʣùm=kʰɔ=ɓe=nu/ → [(ˌnù.ín).<(ˈʣùː.mɨ́).(ˌkʰɔ̀.ɓé).nú>]
DEF.SG=1POS=casa=1=DUAL.EXCL=DEF.SG
‘nuestra casa (dual exclusivo)’

En (21a) no hay vocal epentética porque el sufijo de primera persona /-khɔ/ forma parte del pie principal de la palabra fonológica y recibe un tono A flotante (cf. 20b). A su vez, los dos enclíticos conforman un pie adicional dentro de la palabra fonológica. El primero de ellos, /=ɓe/, recibe un tono B por default por ocupar la posición fuerte dentro de su pie (cf. 20a), mientras que el enclítico /=nu/ -que está en la posición débil- recibe, al igual que el sufijo /-khɔ/, un tono A flotante (cf. 20b). Por otro lado, en (21b) el morfema inmediatamente posterior a la raíz no es un sufijo sino un enclítico: /=khɔ/, lo que provoca que aparezca una vocal epentética en la posición débil del pie principal. Esta vocal recibe un tono A flotante (cf. 20b). A su vez, el enclítico /=khɔ/ conforma junto con el enclítico /=ɓe/ un pie adicional. El primero de estos enclíticos recibe un tono B por default (cf. 20a) mientras que el segundo recibe un tono A flotante (cf. 20b). Finalmente, el enclítico /=nu/ queda fuera del pie adicional y se adjunta directamente a la palabra fonológica, posición prosódica a la que se le propaga el tono A flotante del enclítico inmediatamente precedente (cf. 18b). Resáltese que el enclítico /=ɓe/, que expresa el valor de dual exclusivo, manifiesta fonéticamente un tono B en (21a) y un tono A en (21b); esto sería inesperado si se tratara de un morfema con tono léxico propio. Pero hemos argumentado que los enclíticos en general -y también los sufijos- carecen de especificación tonal de modo que todos estos morfemas reciben tono en virtud de las reglas tonales formuladas en (18) y (20), las cuales son sensibles a la posición que cada enclítico o sufijo ocupa dentro de la estructura prosódica.

En resumen, hemos visto que dada la condición prosódica sobre el tamaño mínimo de la palabra fonológica en mazahua, las raíces nominales -subyacentemente monosilábicas- requieren de una vocal epentética (cf. 13) o de un sufijo (cf. 14, 21a) para poder constituir un pie silábico trocaico. En cambio, un enclítico (cf. 16) o dos (cf. 19) o tres (21b) no evitan la ocurrencia de la vocal epentética porque los enclíticos, a diferencia de los sufijos, no pueden formar parte del pie principal de la palabra fonológica. Sin embargo, dos enclíticos sí pueden conformar un pie adicional (cf. 19, 21), mientras que un enclítico no contenido en un pie queda como sílaba desamparada que se liga directamente a la palabra fonológica (cf. 16, 21b). Hay una condición prosódica fuerte que restringe los contrastes tonales dentro de la palabra fonológica: solo las raíces tienen tonos léxicos contrastivos; por tanto, ni los sufijos ni los enclíticos tienen especificación tonal y su tono lo obtienen en virtud de la asociación de un tono A flotante (cf. 18a, 20b), de la asignación de un tono B por default (cf. 20a) o de la propagación progresiva del tono A flotante (cf. 18b) dependiendo de la posición prosódica que ocupen dentro de la palabra fonológica. Finalmente, a diferencia de los sufijos y los enclíticos, los proclíticos sí están especificados tonalmente y no participan de las reglas de (18) y (20) debido a que no forman parte de la palabra fonológica sino que conforman con esta un grupo clítico.21

En el siguiente apartado mostraremos que esta caracterización de los constituyentes prosódicos en el dominio nominal y la ocurrencia de las vocales epentéticas son exactamente las mismas en el dominio verbal.

5.2. Dominio verbal

Al igual que en el dominio nominal (cf. 13), la frase verbal mínima consta de un proclítico más una raíz. El proclítico es un morfema pormanteau que expresa, al mismo tiempo, valores tempo-aspectuales y la persona del sujeto. Obsérvense los datos de (22):

(22) Frases verbales mínimas en mazahua

a. /ɾí=ʔêɲ/ 1PRES=jugar [ɾí.(ˈʔêː.ɲé)] ‘juego’
b. /í=ʔêɲ/ 2PRES=jugar [í.(ˈʔêː.ɲé)] ‘juegas’
c. /ø=ʔêɲ/ 3PRES=jugar [(ˈʔêː.ɲé)] ‘juega’

Igual que en el dominio nominal, los proclíticos no forman parte del pie principal de la palabra fonológica de modo que la ocurrencia de vocales epentéticas es inevitable. La sílaba de esta vocal epentética recibe un tono A flotante (cf. 18a, 20b).

Cuando la raíz verbal está acompañada de un sufijo que codifica la persona del sujeto, la vocal epentética ya no es necesaria. Estos sufijos también están subespecificados tonalmente y reciben un tono A flotante como las vocales epentéticas:

(23) Frases verbales con sufijo en mazahua

a. /ɾí=ʔêɲ-khɔ/ 1PRES=jugar-1 [ɾí.<(ˈʔêːŋ.ɡɔ́)>] ‘juego’
b. /í=ʔêɲ-khe/ 2PRES=jugar-2 [í.<(ˈʔêːŋ.ɡé)>] ‘juegas’
c. /ø=ʔêɲ-hnu/3PRES=jugar-3 <(ˈʔêː.ʰnú)>] 22 ‘juego’

Las construcciones de (23) son análogas a las de (14c-e). De hecho, debe resaltarse que es el mismo paradigma de sufijos el que en el dominio nominal indica la persona del poseedor y en el dominio verbal indica la persona del sujeto. El contraste entre (22) y (23) muestra que también en el dominio verbal la construcción del pie principal de la palabra fonológica recurre a la epéntesis en ausencia de sufijación.

Por su parte, los ejemplos de (24) y (25) -análogos a los de (16) en el dominio nominal- muestran que cuando la raíz verbal está seguida de un enclítico, este no puede formar parte del pie principal de la palabra fonológica y, de nueva cuenta, la epéntesis vocálica es inevitable:

(24) Frases verbales con un enclítico de sujeto

a. /ɾí=ʔêɲ=khɔ/ 1PRES=jugar=1 [ɾí.<(ˈʔêː.ɲé).kʰɔ́>] ‘juego’
b. /í=ʔêɲ=khe/ 2PRES=jugar=2 [í.<(ˈʔêː.ɲé).kʰé>] ‘juegas’
c. /ø=ʔêɲ=hnu/ 3PRES=jugar=3 [<(ˈʔêː.ɲé).ʰnú>] ‘juega’

(25) Frases verbales con un enclítico adverbial

a. /ɾí=ʔêɲ=ja/ 1PRES=jugar=ya [ɾí.<(ˈʔêː.ɲé).já>] ‘ya juego’
b. /í=ʔêɲ=ja/ 2PRES=jugar=ya [í.<(ˈʔêː.ɲé).já>] ‘ya juegas’
c. /ø=ʔêɲ=ja/ 3PRES=jugar=ya [<(ˈʔêː.ɲé).já>] ‘ya juega’

Respecto de los datos de (24), llama la atención que el contraste entre sufijos y enclíticos de poseedor que existe en el dominio nominal (cf. 14c-e vs 16c-e) existe también en el dominio verbal entre sufijos y enclíticos de sujeto (cf. 23 vs. 24). En cambio, el enclítico adverbial /=ja/ de (25) no tiene una contraparte en forma de sufijo. Por lo demás, tanto en (24) como en (25) los enclíticos -subespecificados tonalmente- reciben la propagación del tono A flotante de la sílaba inmediatamente precedente, la de la vocal epentética (cf. 18b).

Por su parte, en (26) -que es la contraparte verbal a los datos nominales de (19)- la raíz está seguida de dos enclíticos; el primero expresa la persona del sujeto y el segundo es el mismo enclítico adverbial que aparece en los datos de (25):

(26) Frases verbales con dos enclíticos

a. /ɾí=ʔêɲ=khɔ=ja/ 1PRES=jugar=1=ya [ɾí.<(ˈʔêː.ɲé).(ˌkʰɔ̀.já)>] ‘ya juego’
b. /í=ʔêɲ=khe=ja/ 2PRES=jugar=2=ya [í.<(ˈʔêː.ɲé).(ˌkʰè.já)>] ‘ya juegas’
c. /ø=ʔêɲ=hnu=ja/ 3PRES=jugar=3=ya [<(ˈʔêː.ɲé).(ˌʰnù.já)>] ‘ya juega’

Como en el dominio nominal, los dos enclíticos conforman un pie adicional. El primero recibe un tono B por default de (20a) y el segundo un tono A flotante, lo mismo que la vocal epentética (20b).

Finalmente, los ejemplos de (27) son la contraparte de los de (21) en el dominio nominal. Estos muestran que también en el dominio verbal la raíz puede estar seguida de tres morfemas y que el inmediatamente posterior a esta puede ser un sufijo (27a) o un enclítico (27b):

(27) Frases verbales con tres morfemas posteriores a la raíz:

a. /ɾí=ʔêɲ-kʰɔ=ɓe=ja/
1PRES=jugar-1=dual.excl=ya
‘ya estamos jugando nosotros’.
[ɾí.<(ˈʔêːŋ.kʰɔ́).(ˌɓè.já)>]
b. /ɾí=ʔêɲ=kʰɔ=ɓe=ja/
1PRES=jugar=1=dual.excl=ya
‘ya estamos jugando nosotros’.
[ɾí.<(ˈʔêː.ɲé).(ˌkʰɔ̀.ɓé).já>]

Las alternancias tonales que manifiestan los enclíticos según su posición prosódica responden perfectamente a las reglas de (18) y (20). Obsérvese en particular la alternancia tonal del enclítico /=ɓe/: mientras que en (27a) ocupa la posición prominente del pie adicional y recibe un tono B por default (cf. 20a), en (27b) ocupa la posición débil del pie adicional y por lo tanto recibe un tono A flotante (cf. 20b).

De manera general, hemos mostrado que tanto en el dominio nominal como en el dominio verbal: i) los sufijos forman parte del pie principal de la palabra fonológica, pero no así los enclíticos, ii) en ausencia de sufijos la epéntesis vocálica es obligatoria para conformar el pie principal de la palabra fonológica, iii) los sufijos y los enclíticos carecen de especificación tonal y reciben tono en virtud de la interacción de las reglas de (18) y (20), las cuales son sensibles a la estructura prosódica de la palabra fonológica, iv) esta puede tener un pie adicional al principal y también puede tener una sílaba desamparada, independientemente de si tiene o no un pie adicional, y, v) los proclíticos sí están especificados tonalmente, no participan de las reglas tonales ni constituyen un factor que determine la aparición o ausencia de vocales epentéticas; por tanto, están fuera de la palabra fonológica y conforman con esta el grupo clítico.23

6. ANÁLISIS DEL TIMBRE DE LAS VOCALES EPENTÉTICAS

En este apartado proponemos un análisis formal bajo el marco de la teoría de la optimidad para explicar los timbres de las vocales epentéticas; particularmente, en los casos en que están precedidas por una consonante oral. Para tal efecto, repetimos a continuación la caracterización fonológica de los timbres vocálicos (Tabla 4) y la correspondencia entre los timbres de las vocales de las raíces y los timbres de las vocales epentéticas (Tabla 5).

Posteriormente, proponemos una ampliación de la tipología factorial de Kager (1999) sobre el timbre de las vocales epentéticas.

Para efectos del análisis formal, consideraremos, en primera instancia algunas restricciones de marcación general que permitan descartar los timbres [u, o, ɔ, a, ɛ], los cuales no ocurren nunca en las vocales epentéticas. Considerando la escala de (9) en §3, es obvio que lo marcado de la mayoría de estos timbres se debe a su articulador, ya sea [DORSAL], en el caso de /u, o, ɔ/, o [RADICAL], en el caso de /a/:

(28) Restricciones de marcación general sobre los articuladores

  1. *[DORSAL] Las vocales no emplean como articulador el dorso de la lengua

  2. *[RADICAL] Las vocales no emplean como articulador la raíz de la lengua

Estas restricciones favorecen a las vocales que emplean como articulador la corona de la lengua24 o que carecen de articulador, justamente las que se permiten como vocales epentéticas en la lengua. Con lo anterior, el único timbre que queda por descartar en las vocales epentéticas es el de [ɛ]. Claramente, dado que los timbres [i, e] sí se permiten en vocales epentéticas, la restricción para descartar a [ɛ] no puede ser *[coronal]. Por otro lado, es obvio que [ɛ] comparte con [a] y [ɔ] su valencia del rasgo [bajo], de modo que la restricción que permite descartar [ɛ] debe referirse a este rasgo:

(29) Restricción de marcación general sobre el rasgo [bajo]

*[+bajo]

Las vocales son medias o altas

En su conjunto, las restricciones de (28) y (29) penalizan al conjunto conformado por [u, o, ɔ, a, ɛ]. Por el contrario, el conjunto conformado por [i, e, ɨ, ə] cumple con estas tres restricciones.

Por otro lado, para que las restricciones de (28) y (29) afecten solo los timbres de las vocales epentéticas, pero no los de las vocales de las raíces, es necesario que estén dominadas por las restricciones de fidelidad de (30), tal y como se muestra en (31):

(30) Restricciones de fidelidad sobre articuladores y sobre el rasgo [bajo]

  1. IDENT-IO(ARTICULADOR) Los segmentos correspondientes del input y el output tienen el mismo ARTICULADOR

  2. IDENT-IO(bajo) Los segmentos correspondientes del input y el output tienen la misma valencia para el rasgo [bajo]

(31) Jerarquía entre restricciones para la epéntesis en mazahua (primera versión)

IDENT-IO(ARTC), IDENT-IO(bajo) » *[DORSAL], *[RADICAL], *[+bajo]

La jerarquía de (31) asegura que las vocales de las raíces conservarán sus timbres incluso si incumplen una o más de las restricciones de marcación general de (28) y (29) con tal de cumplir con las restricciones de fidelidad de (30). Por el contrario, las vocales epentéticas son vocales del output que no tienen una contraparte en el input y por tanto cumplen vacuamente las restricciones de fidelidad de (30). De tal modo, su timbre se determina exclusivamente por restricciones de marcación como las de (28) y (29).

Hasta este punto, la jerarquía de (31) asegura que las vocales epentéticas serán [i, e, ɨ, ə]. El siguiente paso es reconocer que en varios casos existe armonía vocálica, lo que corresponde a la epéntesis coloreada por el contexto de la tipología de Kager (1999) resumida en (7) y (7bis) en §1.2. De acuerdo con la Tabla 5, la armonía es total cuando la vocal de la raíz es /i, e, ɨ, ə/ y es parcial cuando la vocal de la raíz es /ɛ/. En el modelo de Clements & Hume (1995), la estructura interna de una vocal -así como de las consonantes con articulaciones secundarias- incluye un nodo vocálico (Voc) del cual dependen los nodos punto de articulación vocálico (PAV) y apertura (Apert).25

(32) Estructura interna del nodo vocálico (Clements & Hume 1995)

A partir de la propuesta de Clements & Hume (1995), asumimos que en los casos de armonía total la vocal de la raíz y la vocal epentética comparten el nodo Voc, mientras que en el caso de armonía parcial (cuando la vocal de la raíz es /ɛ/ y la vocal epentética es [i]) las vocales comparten solamente el nodo PAV. Las restricciones de marcación contextual que favorecen la epéntesis coloreada por el contexto aparecen en (33):

(33) Restricciones de marcación contextual

  1. Conc(Voc)/Σ Las vocales del pie principal concuerdan en el nodo vocálico

  2. Conc(PAV)/Σ Las vocales del pie principal concuerdan en el nodo punto de articulación vocálico

Estas dos restricciones están en una relación de rigor (stringency relation, cf. McCarthy 2002: 20), lo cual significa que las infracciones a una de ellas conforman un subconjunto propio de las infracciones a la otra: si no hay concordancia en el PAV no puede haber concordancia en el nodo vocálico, pero lo contrario no es cierto: puede haber concordancia en el nodo PAV sin haber concordancia en todo el nodo Voc; eso es justamente lo que ocurre cuando la vocal de la raíz es /ɛ/ y la vocal epentética es [i]. Claramente, en mazahua se prefiere la armonía total sobre la armonía parcial -por tanto, (33a) domina a (33b)-, y la armonía parcial solo ocurre a costa de no infringir la restricción de marcación general de (29) que penaliza las vocales bajas. Así, la jerarquía parcial de (31) se complejiza al incorporar las restricciones de marcación contextual de (33) en su parte baja:

(34) Jerarquía entre restricciones para la epéntesis en mazahua (segunda versión)

IDENT-IO(ARTC), IDENT-IO(bajo) » *[DORSAL], *[RADICAL], *[+bajo] » CONC(Voc) » CONC(PAV)

Hasta este punto, la jerarquía de (34) determina que las vocales epentéticas sean [i, e, ɨ, ə] y que cada una de ellas se emplee en casos de armonía total. La jerarquía también determina que cuando la vocal de la raíz sea /ɛ/ la armonía no sea total (debido a que se infringiría *[+bajo]); sin embargo, esta jerarquía no determina que la vocal epentética ante /ɛ/ sea [i] y no [e], pues ambas concuerdan con /ɛ/ en su PAV. El hecho de que se prefiera [i] a [e] revela que en mazahua se prefieren las altas a las medias como vocales epentéticas. Esta preferencia se codifica formalmente mediante la restricción de marcación general de (35):

(35) Restricción de marcación general sobre el rasgo [alto]

[+alto]

Las vocales son altas

Finalmente, incluso si incluimos la restricción de (35) a la jerarquía de (34) todavía queda pendiente el asunto de por qué la vocal epentética en los casos restantes (es decir, cuando la vocal de la raíz es /u, o, ɔ, a/) es [ɨ] y no [i], pues ambas son vocales altas.26 La diferencia entre ambas consiste en que aunque [i] tiene el articulador menos marcado -es decir, [CORONAL]-, [ɨ] es todavía menos marcada porque carece de articulador. La restricción de marcación general de (36) codifica este hecho y, con ello, se completa la jerarquía en (37):

(36) Restricción de marcación general sobre articuladores

*[ARTICULADOR]

Las vocales carecen de articulador

(37) Jerarquía entre restricciones para la epéntesis en mazahua (versión definitiva)

IDENT-IO(ARTC), IDENT-IO(bajo) » *[DORSAL], *[RADICAL], *[+bajo] » CONC(Voc) » CONC(PAV) » [+alto], *[ARTIC]

A continuación, evaluaremos la validez de esta jerarquía en tres tablones, correspondientes a cada uno de los tres tipos de epéntesis reconocidos en este trabajo: i) epéntesis coloreada por el contexto típica (es decir, con armonía total) (38), ii) epéntesis con marcación mínima (39), y, iii) epéntesis mixta, es decir, parcialmente adaptada al contexto y parcialmente no marcada (40).

(38) Epéntesis vocálica coloreada por el contexto en mazahua:

a. /ɾí=ʔɨ̂tˀ/ 1pres=alimentar [ɾí.ˈʔɨ̂ː.tˀɨ́] ‘lo alimento’
b. /ɾí=tə̂tˀ/ 1pres=clavar [ɾí.ˈtə̂ː.tˀə́] ‘estoy clavando’
c. /ɾí=ʃíʔɓ/ 1pres=lavar.trastes [ɾí.ˈʃíʔ.ɓí] ‘lavo trastes’
d. /ɾí=pèjˀ/ 1pres=lavar.ropa [ɾí.ˈpèː.djé] ‘lavo ropa’

(39) Epéntesis vocálica con marcación mínima en mazahua

a. /ɾí=ʔún/ 1pres=dar [ɾí.ˈʔúː.nɨ́] ‘doy’
b. /ɾí=póɗ/ 1pres=sembrar [ɾí.ˈpóː.ɗɨ́] ‘siembro’
c. /ɾí=pɔ́ʔtˀ/ 1pres=matar [ɾí.ˈpɔ́ʔ.tˀɨ́] ‘mato’
d. /ɾí=máʔtˀ/ 1pres=gritar [ɾí.ˈmáʔ.tˀɨ́] ‘grito’

(40) Epéntesis vocálica mixta en mazahua

/ɾí=kɛ́ɓ/
1pres=quebrar.maíz
nixtamalizado
[ɾí.ˈkɛ́ː.ɓí] ‘estoy quebrando maíz nixtamalizado’

Revisemos primero un caso de epéntesis coloreada por el contexto, el correspondiente a (38c). Obsérvese el tablón de (41):27

(41) Tablón de epéntesis vocálica coloreada por el contexto en mazahua

Input: /ʃíʔɓ/ *[DORSAL] *[RADICAL] *[+bajo] CONC(Voc) CONC(PAV) [+alto] *[ARTIC]
a. [ˈʃíʔ.ɓí] *
b. [ˈʃíʔ.ɓɨ́] *! *
c. [ˈʃíʔ.ɓú] *! * * *
d. [ˈʃíʔ.ɓé] *! * *
e. [ˈʃíʔ.ɓə́] *! * *
f. [ˈʃíʔ.ɓó] *! * * * *
g. [ˈʃíʔ.ɓɛ́] *! * * *
h. [ˈʃíʔ.ɓá] *! * * * * *
i. [ˈʃíʔ.ɓͻ́] *! * * * * *

Los candidatos (41c), (41f) y (41i) contienen vocales epentéticas con el articulador DORSAL (respectivamente, [u], [o] y [ͻ]), el candidato (41h) contiene una [a] epentética con el articulador radical, y el candidato (41g) -lo mismo que los candidatos (41h), y (41i)-, contiene una vocal con el rasgo [+bajo]; estos cinco candidatos se eliminan por infringir una o dos de las tres restricciones más altas en la jerarquía, las cuales son de marcación general y penalizan los timbres vocálicos más marcados, a saber: [u], [o], [ͻ] y [a]. De los cuatro candidatos restantes, (41b), (41d) y (41e) incumplen la siguiente restricción en la jerarquía, Conc(Voc), que pide que la vocal de la raíz y la vocal epentética compartan el nodo vocálico, es decir, tengan exactamente el mismo timbre. La eliminación de estos tres candidatos deja como único candidato restante a (41a), el único que cumple con CONC(Voc). Este candidato óptimo corresponde a la forma fonética empleada por los hablantes en circunstancias normales.

En el tablón de (42) revisamos un caso de epéntesis con marcación mínima, el de (39a):

(42) Tablón de epéntesis vocálica con marcación mínima en mazahua

Input: /ʔún/ *[DORSAL] *[RADICAL] *[+bajo] CONC(Voc) CONC(PAV) [+alto] *[ARTIC]
a. [ˈʔúː.ní] * * *!
b. ( [ˈʔúː.nɨ́] * *
c. [ˈʔúː.nú] *! *
d. [ˈʔúː.né] * * *! *
e. [ˈʔúː.nə́] * * *!
f. [ˈʔúː.nó] *! * * *
g. [ˈʔúː.nɛ́] *! * * * *
h. [ˈʔúː.ná] *! * * * * *
i. [ˈʔúː.nͻ́] *! * * * *

De nueva cuenta, los candidatos con las vocales epentéticas más marcadas [u, o, ͻ, a, ɛ] (42c), (42f), (42g), (42h) y (42i) se eliminan en virtud de que infringen una o dos de las restricciones de marcación general que encabezan la jerarquía. De los candidatos restantes, (42a), (42b), (42d) y (42e), ninguno comparte con la /u/ de la raíz ni el nodo Voc por entero ni el PAV. Por tanto, estos candidatos infringen las dos restricciones de marcación contextual: Conc(Voc)/ Σ y CONC(PAV)/Σ. Por tal motivo, la elección del candidato ganador depende de las restricciones de marcación general más bajas en la jerarquía. Solo el candidato (42b) tiene por vocal epentética una [ɨ], vocal que simultáneamente carece de articulador (es decir, cumple con *[ARTICULADOR]) y es alta (es decir, cumple con [+alto]). En cambio, la [i] epentética de (42a) incumple *[ARTICULADOR], la [ə] epentética de (42e) incumple [+alto] y la [e] epentética de (42d) incumple con ambas restricciones. Por tanto, el candidato (42b) es el óptimo y corresponde a la forma fonética que los hablantes emplean en circunstancias normales.

Finalmente, en el tablón (43) revisamos un caso del único tipo de epéntesis mixta en la lengua, ejemplificado en (40), donde la vocal de la raíz es /ɛ/ y la vocal epentética es [i]. Recordemos que esta epéntesis es mixta porque está parcialmente motivada por el contexto, en tanto la vocal epentética comparte con la vocal de la raíz el articulador, y es parcialmente no marcada, en tanto la vocal epentética tiene por articulador el menos marcado: [CORONAL] y es una vocal alta.

(43) Tablón de epéntesis vocálica mixta en mazahua

Input: /tʰɛ́jˀ/ *[DORSAL] *[RADICAL] *[+bajo] CONC(Voc) CONC(PAV) [+alto] *[ARTIC]
a. ( [ˈtʰɛ́ː.dʲí] * *
b. [ˈtʰɛ́ː.dʲɨ́] * *!
c. [ˈtʰɛ́ː.dʲú] *! * * *
d. [ˈtʰɛ́ː.dʲé] * *! *
e. [ˈtʰɛ́ː.dʲə́] * *! *
f. [ˈtʰɛ́ː.dʲó] *! * * * *
g. [ˈtʰɛ́ː.dʲɛ́] *! * *
h. [ˈtʰɛ́ː.dʲá] *! * * * * *
i. [ˈtʰɛ́ː.dʲͻ́] *! * * * * *

Como en los dos tablones anteriores, los candidatos que tienen las vocales más marcadas [u, o, ͻ, a, ɛ] (43c), (43f), (43g), (43h) y (43i) se eliminan en virtud de que infringen una o dos de las tres restricciones de marcación general que ocupan la parte alta en la jerarquía. Los cuatro candidatos restantes, (43a), (43b), (43d) y (43e), infringen CONC(Voc)/Σ porque en ninguno de ellos la vocal epentética tiene el mismo timbre que el de la vocal de la raíz, a saber /ɛ/. Sin embargo, dos de ellos sí cumplen con la restricción CONC(PAV)/Σ pues comparten con la /ɛ/ de la raíz el articulador: (43a) cuya vocal epentética es [i] y (43d) cuya vocal epentética es [e], mientras que los dos restantes, (43b) y (43e), cuyas vocales epentéticas son, respectivamente, [ɨ] y [ə], incumplen CONC(PAV)/Σ. Por tanto, estos dos últimos candidatos se eliminan. Los dos candidatos restantes infringen *[ARTICULADOR] al tener vocales epentéticas coronales, de modo que es la restricción [+alto] la determinante en elegir a (43a) como el candidato óptimo.

Como resumen del análisis propuesto, podemos decir que la jerarquía de restricciones de (37) tiene validez empírica, pues permite obtener como óptimos, dependiendo de cuál sea el timbre de la vocal de la raíz, a los candidatos adecuados en cada caso, tanto si se trata de una epéntesis coloreada por el contexto (cf. 41), como si se trata de una epéntesis con marcación mínima (cf. 42) o si se trata de una epéntesis mixta (cf. 43). Esto, a su vez, confirma la adecuación del modelo de la teoría de la optimidad para lidiar con un sistema que posee un grado de complejidad en la elección del timbre de la vocal epentética que no había sido reportado previamente en ninguna otra lengua.

A partir de lo anterior, estamos en condiciones de proponer una revisión a la tipología factorial de Kager (1999) -resumida en (7) y (7bis)- sobre el timbre de las vocales epentéticas. Obsérvese nuestra propuesta de tipología factorial en (44):

(44) Tipología factorial del timbre de los segmentos epentéticos

  1. Marcación general » Marcación contextual El segmento epentético es mínimamente marcado.

  2. Marcación contextual » Marcación general El segmento epentético es contextualmente coloreado.

  3. Marcación general » Marcación contextual » Marcación general El segmento epentético es contextualmente coloreado en un contexto y mínimamente marcado en el resto de los contextos

  4. Marcación general » Marcación contextual + relación de rigor » Marcación general El segmento epentético es contextualmente coloreado en un conjunto de casos, es mínimamente marcado en otro conjunto y es un elemento epentético mixto en el resto.

(44a) corresponde a sistemas con vocales epentéticas mínimamente marcadas, como el inglés (cf. 5); (44b) corresponde a sistemas con vocales epentéticas que siempre son coloreadas contextualmente, como el español no estándar (cf. 6); (44c) corresponde a sistemas que tienen vocales coloreadas por el contexto en un contexto y vocales mínimamente marcadas en el resto de los contextos, como el lenakel (cf. 3, 8); finalmente, (44d) corresponde a sistemas donde existen tres tipos de elementos epentéticos: mínimamente marcados, coloreados por el contexto y mixtos, como el mazahua. Resáltese que la estructura jerárquica es muy similar en los casos (44c) y (44d). La única diferencia relevante es que en (44d) debe haber mínimamente dos restricciones de marcación contextual en la parte media de la jerarquía y entre estas restricciones debe haber una relación de rigor en el sentido de McCarthy (2002: 20). Es esta relación de rigor la que permite que la epéntesis mixta sea posible.

7. RESUMEN GENERAL

En este trabajo nos hemos enfocado en los aspectos de la epéntesis reconocidos como relevantes en el marco de la teoría de la optimidad: su motivación y el timbre de los elementos epentéticos.

En cuanto al primer aspecto, hemos mostrado que tanto en el dominio nominal como en el verbal las raíces son subyacentemente monosilábicas y que la epéntesis vocálica es el mecanismo que la lengua emplea para alcanzar el tamaño mínimo de la palabra fonológica: un pie trocaico silábico. La epéntesis vocálica no es necesaria cuando la raíz está inmediatamente seguida de un sufijo. En cambio, si la raíz está seguida de uno o más enclíticos la epéntesis vocálica sigue siendo necesaria pues los enclíticos no pueden formar parte del pie principal de la palabra fonológica -aunque sí pueden conformar un pie adicional. Por su parte, los proclíticos no forman parte de la palabra fonológica sino que se adjuntan a esta para conformar el grupo clítico. Tanto los sufijos como los enclíticos carecen de especificación tonal, mientras que los proclíticos y las raíces tienen tono léxicamente especificado. Las reglas que determinan los tonos que los sufijos y los enclíticos manifiestan fonéticamente confirman que la estructura prosódica propuesta para la palabra fonológica en mazahua es esencialmente correcta.

Respecto del segundo aspecto, hemos reconocido tres tipos de vocales epentéticas en mazahua: mínimamente marcadas, coloreadas por el contexto y mixtas (es decir, parcialmente no marcadas y parcialmente condicionadas por el contexto). Para lidiar con esta complejidad, hemos propuesto, en el marco de la teoría de la optimidad, una jerarquía de restricciones con una estructura similar -aunque con mayor complejidad- a la propuesta por Kager (1999) para el lenakel, con un conjunto de restricciones de marcación general en la parte alta, un conjunto de restricciones de marcación contextual en la parte media, y otro conjunto de restricciones de marcación general en la parte baja. La interacción entre las restricciones de la parte alta y las de la parte media asegura que habrá epéntesis mínimamente marcada. La interacción entre las restricciones de la parte media y las de la parte baja asegura que habrá, también, epéntesis coloreada por el contexto. Finalmente, la interacción entre las restricciones de la parte media de la jerarquía -las de marcación contextual que deben guardar entre sí una relación de rigor- asegura que habrá un tercer tipo de epéntesis: la mixta. El reconocimiento de este tercer tipo de epéntesis y su tratamiento formal nos ha permitido reformular y enriquecer la tipología factorial de Kager (1999) sobre el timbre de los elementos epentéticos.

AGRADECIMIENTOS

En primer lugar queremos agradecer la invaluable ayuda de María Elena Hernández García, nativohablante del mazahua de Pastores y nuestra colaboradora lingüística principal. Agradecemos también los comentarios, sugerencias y críticas de los dos dictaminadores anónimos gracias a cuya cuidadosa lectura pudimos solventar una serie importante de erratas e inconsistencias que la primera versión de este trabajo tenía. Finalmente, agradecemos los comentarios y consejos de Hiroto Uchihara y Néstor Hernández-Green, particularmente respecto del quinto apartado de este trabajo, el cual constituye un resumen de la investigación doctoral de uno de los autores. Cualquier falla o carencia de la presente investigación debe atribuirse exclusivamente a los autores.

REFERENCIAS BIBLIOGRÁFICAS

Amador Hernández, Mariscela. 1976. Gramática del mazahua de San Antonio Pueblo Nuevo. México: ENAH-INAH. (Tesis de licenciatura). [ Links ]

Arellanes Arellanes, Francisco. 2021. Contraste fortis-lenis en zapoteco: Aspectos sincrónicos y diacrónicos. En Arellanes F. & Guerrero L. (eds.), Estudios lingüísticos y filológicos en lenguas indígenas mexicanas: Celebración de los 30 años del Seminario de Lenguas Indígenas, 395-450. México: Instituto de Investigaciones Filológicas-UNAM. [ Links ]

Bartholomew, Doris A. 1965. The reconstruction of Otopamean (Mexico). Chicago: Universidad de Chicago, Illinois. (Tesis doctoral). [ Links ]

Blevins, Juliette. 1995. The syllable in phonological theory. En Goldsmith, J.A. (ed.), The handbook of phonological theory, 206-244. Cambridge: Blackwell/ Cambridge MA/ Oxford. [ Links ]

Broselow, Ellen. 1995. Skeletal positions and moras. En Goldsmith, J.A. (ed.), The handbook of phonological theory, 175-205. Cambridge: Blackwell, Cambridge MA/Oxford. [ Links ]

Campbell, Eric W. 2017. Otomanguean historical linguistics: Exploring the subgroups. Language y Linguistics Compass 11(7). 1-23. https://doi.org/10.1111/lnc3.12244 [ Links ]

Clements, G.N. 1993. Place of articulation in consonants and vowels. A Unified Theory, Working Papers of the Cornell Phonetics Laboratory 5. Nueva York: Cornell University. [ Links ]

Clements, G.N. & Hume, Elizabeth V. 1995. The internal organization of speech sounds. En Goldsmith, J.A. (ed.), The handbook of phonological theory, 245-306. Cambridge: Blackwell. [ Links ]

González, Carolina. 2017. Tipología de los sistemas métricos de veinticinco lenguas Pano. Amerindia 39(1). 129-172. [ Links ]

Hayes, Bruce. 1995. Metrical stress theory: Principles and case studies. Chicago: University of Chicago Press. [ Links ]

Hayes, Bruce. 1989. Compensatory lengthening in moraic phonology. Linguistic Inquiry 20. 253-306. [ Links ]

Itô, Junko. 1986. Syllable theory in prosodic phonology. Massachusetts: University of Massachusetts, Amherst. [Published 1988, Nueva York: Garland.]. (Tesis doctoral). [ Links ]

Itô, Junko. 1989. A prosodic theory of epenthesis. Natural Language and Linguistic Theory 7. 217-260. [ Links ]

Jiménez Ovando, Roberto. s.f. Testimonio gráfico del pueblo mazahua. México: Gobierno del Estado de México. [ Links ]

Kager, René. 1999. Optimality theory. Cambridge: Cambridge University Press. [ Links ]

Kaufman, Terrence. 1988. Otomanguean tense/aspect/mood, voice, and nominalization markers. Unpublished monograph. [ Links ]

Muro, Mildred Kiemele. 1973. Un breve diccionario mazahua-español y español- mazahua. ]anzi jñatjo kja jñangica ñe jñangi,ca kja jñatjo. San Miguel Tenochtitlán: Talleres de Tipografía Indígena. [ Links ]

Knapp, Michael. 2008. Fonología segmental y léxica del mazahua. Primera edición. México: INAH. [ Links ]

Knapp, Michael. 2010. La nasalidad en mazahua: diacronía y sincronía. En Herrera, Z.E. (ed.), Entre cuerdas y velo. Estudios fonológicos de lenguas otomangues, 11-33. México: El Colegio de México. [ Links ]

Ladefoged, Peter & Maddieson, Ian. 1996. The sounds of the world’s languages. Oxford / Malden, Massachusetts: Blackwell. [ Links ]

Lowenstamm, Jean & Kaye, Jonathan. 1986. Compensatory lengthening in Tiberian Hebrew. En Wetzels, L. & Sezer, E. (eds.), Studies in compensatory lengthening. Dordrecht: Foris. 97-146. [ Links ]

Lynch, John D. 1974. Lenakel phonology. Honolulu: University of Hawaii. (Tesis doctoral). [ Links ]

Maddieson, Ian. 1984. Patterns of sounds. Cambridge: Cambridge University Press . [ Links ]

McCarthy, John & Prince, Alan. 1990. Foot and word in prosodic morphology: The Arabic broken plural. Natural Language & Linguistic Theory 8. 209-283. [ Links ]

McCarthy, John. & Prince, Alan. 1995. Prosodic morphology. En Goldsmith, J.A. (ed.), The handbook of phonological theory, 318-366. Cambridge: Blackwell . [ Links ]

McCarthy, John. 2002. A thematic guide to optimality theory. Cambridge: Cambridge University Press . [ Links ]

Menéndez Pidal, R. 1929. Orígenes del español. Madrid: Hernando. [ Links ]

Nespor, Marina & Vogel, Irene. 2007 [1986]. Prosodic phonology. Nueva York: Mouton de Gruyter. [ Links ]

Pike, Eunice. 1951. Tonemic-intonemic correlation in Mazahua (Otomí). International Journal of American Linguistics 17. 37-41. [ Links ]

Rehg, Kenneth L. & Sohl, Damien G. 1981. Ponapean reference grammar. Honolulu: University of Hawaii Press. [ Links ]

Roca, Iggy & Johnson, Wyn. 1999. A course in phonology. Oxford & Malden, Mass.: Blackwell Publishers. [ Links ]

Romero, Antonio. 2017. Procesos fonológicos y morfológicos en la flexión nominal del mazahua. (Ponencia presentada en la VIII Conference on Indigenous Languages of Latin America, CILLA, Universidad de Texas, Austin, 27 de octubre de 2017). [ Links ]

Romero, Antonio. (En proceso). Fonología y morfología del mazahua. México: Universidad Nacional Autónoma de México. (Tesis doctoral). [ Links ]

Selkirk, Elisabeth O. 1981. Epenthesis and degenerate syllables in Cairene Arabic. En Borer, H. & Aoun, Y. (eds.), Theoretical issues in the grammar of Semitic languages. (MIT Working papers in linguistics 3). Cambridge, Mass.: Department of Linguistics and Philosophy, MIT. [ Links ]

Soustell, Jacques. 1993. [1937]. La familia otomí-pame del México central. FCE: México. [ Links ]

Spotts, Hazel. 1953. Vowel harmony and consonant sequences in Mazahua (Otomí). International Journal of American Linguistics 19(4). 253-258. [ Links ]

Spotts, Hazel. 1956. Some post-conquest changes in Mazahua. International Journal of American Linguistics 22(3). 208-211. [ Links ]

1En los datos de (1) el pie está conformado por la sílaba de la raíz más la de la vocal epentética -marcada en negritas-, lo que se indica mediante el uso de paréntesis. La sílaba del proclítico queda fuera del pie y de la palabra fonológica. En §5 se describe la estructura de la palabra fonológica en mazahua y las condiciones bajo las que aparecen las vocales epentéticas.

2Ciertamente, el vínculo entre la epéntesis y la estructura silábica se reconoció desde la fonología generativa derivacional, antes del surgimiento de la teoría de la optimidad (cf. Selkirk 1981; Itô 1986)

3La epéntesis vocálica también se reporta como mecanismo para conformar un pie silábico a partir de una raíz monosilábica en ausencia de procesos de afijación que agreguen sílabas a la palabra, como en árabe iraquí: /drus/ → [i.drus] ‘estudio’ (Broselow 1995). Como ya se adelantó en §1.1 -y se verá en detalle en §5- la motivación para la epéntesis en mazahua también es de este tipo.

4Debe resaltarse que esta epéntesis en los plurales del inglés solo ocurre ante consonantes sibilantes mientras que otras codas complejas sí se admiten.

5Los dos primeros ejemplos corresponden al castellano de los siglos X y XI (Menéndez Pidal 1929: 195)

6Esto va claramente en contra de una concepción unidimensional de la marcación. McCarthy (2002: 15) señala acertadamente que la noción de marcación dentro de la teoría de la optimidad es multidimensional y por tanto se aleja de la definición de marcación tradicional surgida a partir del Círculo Lingüístico de Praga. Dada la multidimensionalidad de la marcación en la teoría de la optimidad, es esperable el conflicto entre restricciones de marcación y no solo entre restricciones de fidelidad y de marcación.

7Uno de los dictaminadores anónimos señala muy acertadamente que en el análisis de la epéntesis es relevante la restricción de fidelidad DEP-IO, la cual -justamente- penaliza la ocurrencia de elementos epentéticos, los cuales son parte de la forma fonética sin tener una contraparte en la forma fonológica de la cual dependan. Efectivamente, en el análisis de la motivación de la epéntesis la inclusión de DEP-IO resulta indispensable. Más específicamente, dicha restricción debe estar dominada por un conjunto de restricciones de buena formación prosódica que definan: i) que la palabra fonológica mínima es mínimamente un pie (cf. Kager 1999: 143-144), ii) que dicho pie es trocaico y no yámbico -es decir, que su prominencia es inicial y no final- (McCarthy & Prince 1990, Hayes 1989), y iii) que el pie trocaico debe ser asimétrico, es decir que uno de sus elementos constitutivos tenga mayor peso prosódico que el otro (σμμσμ). Sin embargo, la restricción de fidelidad DEP-IO no es relevante en el análisis de la determinación del timbre del elemento epentético.

8En los primeros trabajos sobre el sistema fonológico de la lengua (Spotts 1953; 1956; Bartholomew 1965; Amador 1976) el inventario consonánticos constaba de solo veintitrés elementos. Knapp (2008) retoma los criterios de Maddieson (1984: 376) sobre gestos laríngeos y presenta una nueva propuesta -con la que estamos de acuerdo- bajo un modelo autosegmental que considera a la aspiración y la glotalización como parte de los segmentos consonánticos. Además, seguimos a Romero (en proceso) en que existe evidencia segmental y prosódica a favor de la existencia del contraste fortis-lenis por lo que el sistema es todavía más complejo que el propuesto por Knapp (2008). Las consonantes fortis, por un lado, no muestran alofonía, y tienen valor moraico cuando se encuentran en posición de coda. Por el contrario, las consonantes lenis muestran alofonía; particularmente en coda, posición en la que las oclusivas lenis se neutralizan entre sí; y respecto de las nasales lenis a favor de una nasal subespecificada en su punto de articulación. El segmento resultante y el resto de los segmentos lenis en la lengua son semimoraicos en esta posición.

9A diferencia del mazahua de San Miguel Tenochtitlán estudiado por Knapp (2008: 42), en el mazahua de Pastores no hay evidencia de que exista una serie de nasales glotalizadas con valor fonológico /mˀ/ /nˀ/ y /ɲˀ/. Además, no consideramos como fonológicas las oclusivas prenasalizadas que ocurren en inicio de palabra [nd, ndz, ndʒ, ŋɡ, ŋɡw, mb], sino que asumimos que son secuencias de nasales más obstruyentes lenis (v. gr. /nt̆/ → [nd]). Por su parte, la yod (pre)aspirada /ʰj/ y la yod glotalizada /jˀ/ se realizan, respectivamente, como una aspiración palatalizada [hʲ] y como una oclusiva alveolar sonora palatalizada [dʲ] en la superficie (cf. Knapp 2008: 44). En las oclusivas y las fricativas existen dos grandes series por su participación de la oposición fortis-lenis, mientras que todas las africadas se comportan como fortis y, al contrario, todas las nasales se comportan como lenis.

10La primera descripción de esta armonía vocálica se la debemos a Spotts (1953: 254).

11Nuestra caracterización del sistema vocálico difiere de la de Knapp (2008) en que asumimos que /ɨ/ y /ə/ carecen de articulador, siguiendo a Clements (1993: 80). Por otro lado, conservamos los rasgos [alto] y [bajo] de uso extendido en el ámbito fonológico en vez del rasgo [apertura] en distintos registros empleado por Clements (1993). Finalmente, hemos omitido el articulador [labial] pues en mazahua es completamente predecible: todas y solo las vocales con el articulador [dorsal] tienen también el articulador [labial]. Esta predictibilidad se ajusta a la fuerte tendencia solidaria entre la elevación del dorso de la lengua y el redondamiento de los labios consignada en Ladefoged & Maddieson (1996: 292).

12La realización fonética del cierre glotal en las raíces del tipo CV es plena cuando el tono de la raíz es A, mientras que si las raíces tienen tono B o AB la glotal es menos enfática y se realiza como una laringización de la vocal epentética. Este tema merece un estudio detallado de base acústica que sobrepasa los propósitos del presente trabajo.

13De nueva cuenta, el primero en establecer esta generalidad fue Spotts (1953: 254).

14En su vocabulario mazahua de San Miguel Tenochtitlán, Kiemele (1973) asume que en algunas entradas léxicas donde la vocal de la raíz es /ɛ/ seguida de una /h/ la vocal epentética se realiza como [e]; sin embargo en la variante analizada en este trabajo se trata de una [ɛ].

15Como en los datos de (1), en las formas fonéticas los paréntesis indican los lindes de pie mientras que las vocales epentéticas aparecen resaltadas en negritas.

16Debe resaltarse que la expresión sufijante del determinante es en algún sentido complementaria, mientras que su expresión como proclítico es obligatoria. Por tanto, no son gramaticales las frases nominales conformadas únicamente por la raíz nominal más el sufijo determinante. Queda fuera de los intereses de este trabajo la determinación de si existe alguna diferencia de interpretación semántica, de uso pragmático o de distribución sintáctica entre las frases nominales mínimas de (13) y las frases nominales con doble determinante de (14).

17Aunque el tema de cómo se cumple la bimoricidad de la sílaba tónica en mazahua es de gran interés fonológico, merece ser tratado en detalle en otra investigación. Baste observar que cuando en la sílaba tónica no hay coda la vocal debe ser necesariamente larga en el plano fonético mientras que cuando hay coda, el que haya o no alargamiento vocálico depende del tipo de consonante en coda. Por lo demás, este requerimiento prosódico es tipológicamente raro. Hayes (1995: 62-74) propone tres tipos básicos de pies: (i) trocaicos silábicos, conformados por una sílaba prominente y una débil, sin importar su composición segmental ni su peso; (ii) trocaicos moraicos, conformados por dos sílabas ligeras -la primera prominente y la segunda débil- o por una única sílaba pesada; y (iii) yámbicos conformados por una sílaba ligera más una pesada o por una sola sílaba pesada. De esta tipología se sigue la ley yámbico-trocaica (Hayes 1995: 80) según la cual en los sistemas trocaicos la prominencia se manifiesta en la intensidad mientras que en los yámbicos se manifiesta en la duración. Aunque (15) incumple la ley yámbico-trocaica, este tipo de pies ha sido reportado en otras lenguas otomagues, particularmente de la familia zapoteca (cf. Arellanes 2021), mientras que el trabajo de González (2017) sobre veinticinco lenguas pano (amazónicas) muestra que la ley yámbico-trocaica tampoco se valida empíricamente en su otro sentido, pues varias de estas lenguas tienen sistemas yámbicos sin tener contrastes de duración vocálica.

18Cf. (15) con la regla de acentuación de Knapp (2008: 95) que no hace referencia a ningún tipo de estructura prosódica: “siempre se acentúa la primer sílaba del radical” (Knapp 2008: 95). Aunque dicha regla es descriptivamente correcta, no permite definir todas las demás posiciones prosódicas dentro de la palabra fonológica y el grupo clítico

19Los siguientes esquemas siguen las convenciones y presupuestos de la teoría prosódica canónica (Nespor & Vogel, 1986): σ=sílaba, Σ=pie, ω=palabra fonológica y C=grupo clítico. Los elementos prominentes en cada nivel se señalan mediante subrayado en sustitución de los subíndices s(trong) y w(eak).

20En los ejemplos siguientes empleamos los ángulos franceses de manera ad hoc para indicar los lindes de la palabra fonológica.

21Para una formulación más detallada de las reglas y el estudio de un mayor número de casos véase Romero (en proceso).

22Esta forma suena un poco extraña a juicio de nuestra colaboradora principal, quien prefiere la forma en la que el morfema inmediatamente posterior a la raíz es un enclítico: /=hnu/ (cf. 24c). La razón para esta preferencia parece ser el evitar la adyacencia o la elisión de una consonante nasal frente a otra.

23El hecho de que en los casos en que hay dos proclíticos precediendo a una raíz nominal o verbal el primero de ellos no manifieste jamás un alargamiento vocálico es prueba de que esos dos proclíticos no conforman un pie principal de su propia palabra fonológica.

24Sobre la condición de [CORONAL] como el articulador menos marcado véase Kager (1999: 44) y las fuentes allí citadas.

25 Clements & Hume (1995) siguen a Clements (1993) en suponer que debajo del nodo apertura aparece el rasgo [apertura] iterado en distintos registros. Como ya lo dijimos en la nota a pie de página 10, en vez del rasgo [apertura] empleamos los rasgos [alto] y [bajo] de uso más extendido.

26Nótese, sin embargo, que la restricción de (35) sí excluye la posibilidad de que las vocales epentéticas en estos casos sean [e] o [ə].

27En los tablones siguientes hemos omitido las restricciones de fidelidad IDENT-IO(ARTC) e IDENT-IO (bajo) que en (38) ocupan la parte más alta de la jerarquía; en consecuencia, hemos omitido también los candidatos en los que el timbre de la vocal de la raíz difiere entre el input y el output y, por lo tanto, en cada tablón los candidatos solo difieren en el timbre de su vocal epentética. Finalmente, aunque la palabra morfosintáctica mínima en mazahua requiere obligatoriamente de un proclítico, en los tablones también hemos omitido cualquier proclítico porque éstos no desempeñan ningún papel en la elección del timbre de la vocal epentética.

28Cómo citar: Arellanes Arellanes, Francisco & Romero Hernández, Antonio. 2021. La complejidad de la epéntesis vocálica en mazahua. Cuadernos de Lingüística de El Colegio de México 8, e234. doi: 10.24201/clecm.v8i0.234.

Recibido: 14 de Agosto de 2020; Aprobado: 16 de Julio de 2021; Revisado: 12 de Enero de 2021

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons