Capítulo 12. Fisiología de la audición

Resumen: En este capítulo se estudia la anatomía y la fisiología del oído humano, desde la captura de la vibración sonora en el oído externo, pasando por su análisis frecuencial en la membrana basilar de la cóclea y la transducción mecano-eléctrica realizada por las células pilosas del órgano de Corti, hasta su codificación en impulsos nerviosos capaces de llevar la información sonora al cerebro.

Introducción

El sonido no es solamente un acontecimiento físico, una vibración mecánica, sino también un fenómeno psíquico: la imagen que la vibración acústica produce en nuestra mente. Esa imagen está condicionada por las características de nuestro receptor, el oído. Por ello, para entender la manera en la que escuchamos el sonido musical es necesario conocer cómo es y cómo funciona el oído humano, pues es en el oído donde se transforma la vibración mecánica que llega del exterior en un conjunto de impulsos nerviosos que posteriormente serán enviados al cerebro, donde se elaborará nuestra imagen acústica.
En este capítulo vamos a estudiar la morfología y la función de cada una de las partes del oído: las zonas que recogen la vibración sonora del exterior, las que adecúan su presión a los fluidos del oído interno y las que realizan el análisis frecuencial extrayendo los diferentes componentes de la vibración y transformándolos en impulsos eléctricos que llegarán al cerebro mediante el nervio auditivo. Empezaremos con una visión general de la anatomía del oído humano y luego nos detendremos en estudiar cómo es y cómo se comporta la cóclea.

El oído humano

Nuestro oído está formado por tres partes anatómica y funcionalmente diferentes: el oído externo, el oído medio y el oído interno. Veamos un dibujo esquemático de las partes del oído. Es una adaptación de la Figura 1 del capítulo 2 de “Structure and function” del curso Hearing, en Open Learn (The Open University).

Figura 1. Sección transversal del oído.
Figura 1. Sección transversal del oído.

En la figura vemos las tres partes del oído:
a) El oído externo
En el oído externo el pabellón auditivo concentra, a modo de trompa, las ondas sonoras del exterior y las encauza a través del canal auditivo externo hasta el tímpano, la membrana que separa el oído externo del oído medio. El canal auditivo externo mide aproximadamente 25 mm de longitud y 7 mm de diámetro. La membrana timpánica tiene una forma ligeramente cónica y se mueve hacia dentro y hacia fuera siguiendo las variaciones de la presión del aire que constituyen la vibración sonora y que le llegan por el canal auditivo.
b) El oído medio
El oído medio es una cámara llena de aire en cuyo interior se halla una cadena de huesecillos u osículos, llamados por su forma martillo, yunque y estribo, que sirven para transmitir las vibraciones sonoras desde la membrana timpánica hasta el oído interno. Para lograrlo, el mango del martillo está unido al tímpano, mientras que la base del estribo está en contacto con la membrana de la ventana oval, a través de la cual penetran las vibraciones sonoras en la cóclea, que es la parte del oído interno dedicada a la audición.
La principal función del oído medio es posibilitar el incremento de presión necesario para que la energía de la vibración sonora del aire exterior se transmita eficazmente a los fluidos acuosos que llenan el oído interno. En efecto, puesto que el agua tiene mayor impedancia acústica que el aire (es decir, presenta mucha más resistencia a la transmisión de la vibración), si no hubiera un mecanismo que aumentara la presión de las vibraciones, una gran parte de la energía sonora sería absorbida o reflejada por los fluidos acuosos de la cóclea, tal como sucede si tratamos de hablar a una persona que está sumergida en el agua.
Este incremento de la presión se logra principalmente porque la superficie del tímpano que vibra (la membrana que está en contacto con el aire exterior) es unas 17 veces mayor que la superficie de la membrana de la ventana oval (la que está en contacto con el líquido acuoso que hay en el interior de la cóclea). De esta manera se consigue un aumento de presión de unas 17 veces. Además, la acción de palanca que ejerce la cadena de huesecillos del oído medio también contribuye al incremento de presión. En su posición habitual, los osículos pueden aumentar 1,3 veces aproximadamente la presión que llega hasta la ventana oval. Así pues, la acción combinada de ambos mecanismos puede lograr un aumento de presión de unas 22 veces, con lo que la membrana de la ventana oval va a ser ya capaz de transmitir de forma eficaz la vibración sonora a los líquidos que están en el interior de la cóclea.
Otra función muy importante del oído medio es la protección del delicado oído interno frente a sobrepresiones que podrían dañarlo. Cuando la intensidad sonora excede los niveles de tolerancia se activa un mecanismo reflejo mediante el cual dos pequeños músculos que actúan sobre el martillo y sobre el estribo (no incluidos en el dibujo) pueden bloquear la articulación de los osículos, limitando en gran medida la transmisión de las vibraciones.
El oído medio comunica con el exterior a través de la trompa de Eustaquio, un conducto de unos 4 mm de longitud que termina en la región nasofaríngea. La trompa de Eustaquio, que habitualmente está cerrada, se abre con la deglución y con el bostezo. Tiene la finalidad de igualar la presión de aire del oído medio con la del exterior y así permitir que el tímpano pueda vibrar libremente en su posición idónea.
c) El oído interno
El oído interno, también llamado laberinto, está formado por una estructura ósea hueca situada en el hueso temporal y consta de diferentes partes delimitadas por configuraciones óseas y membranosas. Su interior está lleno de dos líquidos acuosos: la perilinfa en las zonas exteriores, que están en contacto con el hueso; y la endolinfa en las interiores, rodeadas por membranas. Mientras que la composición de la perilinfa es similar a la de otros fluidos extracelulares del cuerpo humano, como el líquido cefalorraquídeo, la endolinfa es una sustancia específica del oído interno y se caracteriza por contener una cantidad muy elevada de iones positivos de potasio (K+).
El oído interno cumple dos funciones. Por un lado, sirve para contribuir al mantenimiento del equilibrio corporal, lo cual se realiza mediante el sistema vestibular o laberinto posterior, que está formado por el vestíbulo y los tres canales semicirculares. Por otro lado, y en lo que a la actividad acústica se refiere, el oído interno sirve para transformar las vibraciones mecánicas que provienen del oído medio en impulsos eléctricos, lo que se produce en el laberinto anterior, llamado por su forma cóclea o caracol. Ambas tareas son llevadas a cabo por células sensoriales pilosas capaces de trasformar los movimientos mecánicos en variaciones de la tensión eléctrica, las cuales son codificadas y transmitidas al cerebro por los nervios vestibular y coclear respectivamente. Estos dos nervios se juntan inmediatamente después del oído y forman el nervio vestibulococlear, también llamado VIII par craneal, el cual conduce la información procedente del oído interno al cerebro.
Puesto que en este capítulo nos estamos ocupando de la fisiología de la audición, dejaremos de lado lo que concierne al sistema vestibular, el encargado del equilibrio, para dedicarnos a la parte del oído interno en el que se producen los fenómenos relacionados con la audición, es decir, a la cóclea.
Pero antes de examinar con más detalle la estructura de la cóclea, veamos un vídeo didáctico que nos explica muy bien el mecanismo mediante el cual las ondas sonoras procedentes del exterior son transmitidas por las distintas partes del oído y transformadas en impulsos eléctricos, fenómeno que se denomina “transducción auditiva”. El vídeo Auditory Transduction ha sido creado por Brandon Pletsch y los subtítulos en español se deben a Hermes Carreño y Oscar Guillermo.

Figura 2. Vídeo que muestra un panorama general de la audición.

La cóclea

La cóclea es la parte del oído interno donde se transforma la información auditiva que contiene la vibración sonora en impulsos nerviosos. En primer lugar, la cóclea actúa como un analizador mecánico de frecuencias, descomponiendo mediante resonancias la forma de la vibración sonora en sus componentes sinusoidales; en segundo lugar, transforma esa información frecuencial en señales eléctricas; y, finalmente, codifica todo ese conjunto de datos en impulsos nerviosos que son transmitidos al cerebro.
Para estudiar cómo está constituida la cóclea voy a ir presentando una serie de ilustraciones en las que podremos observarla desde diferentes perspectivas. En ellas iremos avanzando desde una visión general a otra cada vez más detallada. En todas las ilustraciones he utilizado los mismos colores para representar las distintas partes de la cóclea: en color beige están las partes óseas; en color rojizo, las membranosas; en color amarillo, las nerviosas; en azul, las áreas ocupadas por la perilinfa; y en verde, las ocupadas por la endolinfa.

Descripción general de la cóclea

La cóclea está formada por un armazón óseo herméticamente cerrado, lleno de fluidos acuosos, que contiene en su interior diversas membranas, células sensoriales y fibras nerviosas. La cóclea comunica con el oído medio a través de dos orificios cerrados por sendas membranas (figura 1): la ventana oval, mediante la cual el estribo provoca las variaciones de presión en los fluidos que llenan los canales del interior de la cóclea; y la ventana redonda, mediante la cual se compensan las variaciones de presión que han sido introducidas por el estribo.
Veamos dos ilustraciones que presentan el aspecto general de la cóclea. Están basadas en dibujos antiguos, aunque he coloreado cada zona siguiendo los criterios que acabo de mencionar.

Figura 3. Ilustración del aspecto general de la cóclea.
Figura 3. Ilustración del aspecto general de la cóclea.

La ilustración de la izquierda representa la parte ósea de la cóclea. Consiste en una especie de cilindro hueco de aproximadamente 2 mm de diámetro que se enrolla sobre sí mismo de manera helicoidal unas dos veces y media en torno a un eje óseo llamado modiolo. Su aspecto recuerda al de la concha de un pequeño caracol (la palabra cóclea procede del término griego kochlías, caracol). La cóclea está incrustada en el hueso temporal. Su anchura en la base es de algo menos de 1 cm y su altura, desde la base hasta el ápex, es de unos 5 mm. La longitud de la cóclea humana desenrollada es de aproximadamente 35 mm. Esta ilustración incluye también la lámina espiral que divide, sin llegar a cerrarlo, el interior de la cóclea en dos conductos principales, el superior y el inferior.
En la ilustración de la derecha se representa lo que veríamos si hubiéramos retirado la pared exterior de la cóclea. Ahora podemos distinguir el modiolo, que forma la pared interna de la cóclea; la lámina espiral, que surge del modiolo; la membrana basilar, que completa la división principal del interior de la cóclea; y el borde del ligamento espiral, en color naranja, mediante el cual la membrana basilar queda sujeta a la pared exterior de la cóclea.
La membrana basilar sigue todo el recorrido espiral de la cóclea, pero no es igual a lo largo de toda su longitud, sino que es más estrecha en la parte basal —donde mide aproximadamente 0,1 mm de ancho— y más ancha en la parte apical -donde mide unos 0,5 mm. Conforme la membrana basilar gana en anchura, la lámina espiral va haciéndose más estrecha. Además, la membrana basilar es unas 100 veces más rígida en la parte basal que en la apical. El ligamento espiral que sujeta la membrana basilar a la pared externa de la cóclea contribuye a proporcionarle la tensión adecuada que debe tener en cada punto de su longitud.
La división del interior de la cóclea en dos canales principales, llenos de fluidos acuosos y separados por una membrana elástica cuya rigidez varía a lo largo de su longitud, explica el comportamiento de la cóclea como analizador mecánico de espectro. Como veremos más adelante, la diferente elasticidad de la membrana basilar en cada punto de su longitud otorga a cada localización espacial una frecuencia natural de resonancia. De esta manera, la membrana basilar resuena en diferentes localizaciones en función de los componentes sinusoidales que están presentes en la vibración sonora que recibe: los componentes graves generan resonancias en la zona de la membrana basilar situada en la parte apical de la cóclea, mientras que los agudos resuenan en la zona basal. Esta propiedad de la membrana basilar se denomina tonotopía (del griego tónos, altura tonal, y tópos, lugar, espacio).

Estructura interna de la cóclea

Pero para poder realizar las tareas de transducción mecano-eléctrica y de codificación neuronal la cóclea necesita tener una estructura más compleja. Veamos ahora un esquema del oído en el que se representa un corte longitudinal de la cóclea como si estuviera desenrollada.

Figura 4. Ilustración de un corte longitudinal de la cóclea desenrollada.
Figura 4. Ilustración de un corte longitudinal de la cóclea desenrollada.

La novedad más destacada que observamos en este dibujo respecto a los anteriores es que ahora en el interior de la cóclea vemos tres canales bien diferenciados. En realidad, el canal superior de la cóclea está subdividido en dos canales independientes: el canal o rampa vestibular y el canal medio o canal coclear. Ésta división del canal superior en dos canales se realiza mediante una membrana muy fina, de unos 12 micrómetros de grosor, llamada membrana de Reissner. Vemos también que la membrana basilar recorre casi toda la longitud de la cóclea, hasta llegar a la zona apical, donde existe una abertura, llamada helicotrema, que comunica el canal vestibular con el canal inferior. El canal inferior recibe también el nombre de canal o rampa timpánica.
Como se puede ver en la ilustración, los tres canales del interior de la cóclea están llenos de dos tipos de fluidos acuosos de diferentes características electroquímicas: la perilinfa, señalada en color azul, y la endolinfa, en color verde. El canal vestibular y el canal timpánico, contienen perilinfa, mientras que el canal medio tiene en su interior endolinfa, el líquido específico del oído interno, caracterizado por ser muy rico en iones positivos de potasio (K+).
El canal vestibular comienza en el vestíbulo del oído interno, desde donde comunica con el oído medio a través de la membrana de la ventana oval. Puesto que la ventana oval está en contacto directo con la base del estribo del oído medio, cuando éste hace oscilar la membrana de la ventana oval, las vibraciones mecánicas ocasionadas por los cambios de presión del aire debidos al sonido son transmitidas inmediatamente a la perilinfa del canal vestibular. Y estas vibraciones son comunicadas, casi instantáneamente, al canal timpánico a través de la membrana basilar.
El canal timpánico se comunica con el oído medio a través de la ventana redonda, un orificio en el hueso de la cóclea cerrado por una membrana. A diferencia de la ventana oval, esta membrana es pasiva y solamente sirve para compensar los aumentos y disminuciones de la presión que se producen en el interior de la cóclea como consecuencia de la oscilación de la membrana de la ventana oval, variaciones que llegan al canal timpánico mediante la deformación de la membrana basilar. Cuando la membrana oval penetra en el interior del canal vestibular, la membrana de la ventana redonda se abomba hacia afuera, es decir, hacia el espacio del oído medio; por el contrario, cuando la membrana oval retrocede, la membrana de la ventana redonda penetra en el canal timpánico de la cóclea. Si no existiera esta ventana redonda, los fluidos acuosos del interior de la cóclea, al ser incompresibles, no podrían vibrar.
El canal medio o conducto coclear es un contenedor de endolinfa. A pesar de la finura de la membrana de Reissner, su impermeabilidad impide a la endolinfa mezclarse con la perilinfa del canal vestibular. Por su diferente constitución electroquímica, entre la endolinfa y la perilinfa existe una diferencia de potencial de unos 80 mV, y gracias a esa diferencia de potencial la cóclea puede realizar la transducción de las señales mecánicas en señales eléctricas, como veremos más adelante.
Hay que tener en cuenta, por otra parte que, debido a su finura, la membrana de Reissner no supone obstáculo alguno a la vibración de los fluidos. De esta forma, en lo que concierne a la función de la cóclea como analizador mecánico de espectro, el canal vestibular y el canal medio se comportan como si se tratara de un solo canal, el canal superior del dibujo de la izquierda de la figura 3.
En la figura 4 podemos ver también, ligeramente dibujadas, las fibras nerviosas que salen de la cóclea y que forman el nervio coclear. Este nervio será el encargado de llevar al cerebro la información auditiva convertida ya en impulsos nerviosos.
Pero para apreciar mejor cómo se organizan estas estructuras nerviosas, es oportuno observar el interior de la cóclea desde otra perspectiva. Veamos una ilustración que representa las dos vueltas y medio de la cóclea cortada transversalmente. En ella, para mostrar las estructuras nerviosas, se ha prescindido de la pared ósea interior y de la lámina espiral. Los autores son Guy Rebillard y Rémy Pujol y la ilustración procede de Voyage au centre de l'audition.

Figura 5. Ilustración de un corte transversal de la cóclea
Figura 5. Ilustración de un corte transversal de la cóclea.

Podemos distinguir en cada vuelta de la cóclea los tres canales que hay en su interior —el canal vestibular, el canal medio y el canal timpánico—, cada uno de ellos pintado en el color que representa el fluido acuoso que contiene. Pero lo más interesante de esta ilustración es que nos permite apreciar cómo es el ganglio espiral, el cual se forma de la reunión de las fibras nerviosas que se conectan al epitelio sensorial de la membrana basilar, el llamado órgano de Corti. Vemos que el ganglio espiral recorre prácticamente toda la longitud de la cóclea y también que de él surge el haz nervioso que forma el nervio coclear.
Y para concluir el estudio de la organización interna de la cóclea, examinemos sus partes con un poco más de detalle. Veamos un dibujo esquemático de las áreas que se podrían distinguir en un corte transversal de una sola vuelta de la cóclea. Está basada en un dibujo muy difundido en internet. Lo he modificado para hacer coincidir los colores con los del resto de las ilustraciones de la cóclea y, sobre todo, para delimitar con precisión las zonas ocupadas por la endolinfa de aquellas otras ocupadas por la perilinfa, particularmente en la zona inferior del canal medio.

Figura 6. Ilustración de un corte transversal de una vuelta de la cóclea
Figura 6. Ilustración de un corte transversal de una vuelta de la cóclea.

En la figura reconocemos las partes de la cóclea que hemos visto en los dibujos anteriores, si bien ahora, al ser representadas desde otra perspectiva, podemos apreciarlas mejor. Así, reconocemos la cóclea ósea, con la pared exterior, el modiolo y la lámina espiral que sale de él; la membrana basilar, de la cual ahora podemos ver con claridad que completa la división del interior del cilindro coclear en los dos canales principales; los tres canales llenos de líquido del interior de la cóclea, el canal vestibular, el canal medio y el canal timpánico; el ligamento espiral, que sujeta la membrana basilar a la pared exterior de la cóclea; y el ganglio espiral, situado en el interior del modiolo, que va a converger en el nervio coclear.
Pero además, esta ilustración nos muestra otras estructuras que hasta ahora o no habían sido representadas o no lo habían sido con suficiente claridad. Vemos la estría vascular, el epitelio que recubre el ligamento espiral y que cierra el recinto del canal medio por la parte externa, encargándose de dotar de abundantes iones positivos de potasio a la endolinfa de ese canal. También podemos ver con claridad el epitelio sensorial situado sobre la membrana basilar, el órgano de Corti, en el que podemos identificar las células pilosas externas e internas, así como los espacios llenos de perilinfa que hay entre ellas. Así mismo, ahora está dibujada la membrana tectorial, una estructura gelatinosa contra la que chocan las vellosidades las células pilosas del órgano de Corti. Y, finalmente, podemos apreciar las terminaciones nerviosas que conectan las células sensoriales del órgano de Corti y que forman el ganglio espiral.
Por otra parte, este dibujo es muy útil para determinar con precisión qué zonas del interior de la cóclea están ocupadas por perilinfa y cuáles otras están ocupadas por la endolinfa. En efecto, ahora podemos apreciar con más exactitud los límites del canal medio, en el que está encerrado el fluido endolinfático, lo cual es muy importante para entender cómo se realiza la transducción mecano-eléctrica.
Podemos distinguir sin dificultad los límites del canal medio por la zona superior y por la exterior: por un lado, la membrana de Reissner separa por arriba el canal medio del canal vestibular y, por el otro, la estría vascular delimita el canal medio por la zona exterior de la cóclea.
Y ahora podemos delimitar con más claridad los bordes inferiores del canal medio, en la zona donde está ubicada la membrana basilar y el órgano de Corti. En el dibujo este límite inferior aparece delineado en color rojo. En líneas generales, se puede decir que ese límite está formado por la parte superior del epitelio sensorial que recubre la membrana basilar. Pero, si nos fijamos un poco, podemos apreciar que no es todo el epitelio sensorial, sino que las vellosidades de las células sensitivas del órgano de Corti están dentro del canal medio y, por lo tanto, están bañadas en endolinfa, mientras que el cuerpo de esas células ya permanece fuera del canal medio, en contacto directo o indirecto con la perilinfa que proviene del canal timpánico. Pero esto lo veremos con más detalle a continuación, al estudiar el órgano de Corti.

El órgano de Corti

El órgano de Corti es un epitelio sensorial que está situado sobre la membrana basilar a lo largo de todo su recorrido, por lo que vibra solidariamente con ella. El órgano de Corti es el encargado de transformar los movimientos vibratorios resonantes de la membrana basilar en variaciones de la tensión eléctrica, las cuales posteriormente serán codificadas por las neuronas del ganglio espiral y convertidas en impulsos nerviosos. Para entender cómo se produce la transducción mecano-eléctrica es conveniente estudiar antes, con un poco de detenimiento, cómo está organizado el órgano de Corti.
Veamos una ilustración de un pequeño segmento del órgano de Corti, creada por Robert Jackler y Christine Gralapp, que se encuentra en la página Ear Anatomy, Stanford School of Medicine. He cambiado algunos colores para adecuarlos a los ilustraciones anteriores.

Figura 7. Ilustración de un segmento del órgano de Corti
Figura 7. Ilustración de un segmento del órgano de Corti.

A la izquierda del dibujo tendríamos el modiolo, como podemos deducir por la presencia del ganglio espiral, mientras que a la derecha se encontraría la pared exterior de la cóclea.
En el órgano de Corti hay dos tipos de células: las células sensitivas, llamadas por su aspecto células pilosas, y otros tipos de células que les sirven de aislamiento, de soporte y de relleno.
Las células pilosas son las células mediante las cuales propiamente se realiza la transducción mecano-eléctrica. En todo el epitelio sensorial hay unas 15.000 o 16.000 células pilosas. La longitud media de estas células es de unos 50 micrómetros. Su diámetro es inferior a los 10 micrómetros. De la membrana de la parte superior de cada una de las células pilosas salen una especie de vellosidades rígidas, llamados estereocilios. En cada célula pilosa hay aproximadamente un centenar de estereocilios, unidos entre sí y agrupados en un ramillete. Los estereocilios de cada ramillete tienen distinta longitud (los más largos miden unos 6 micrómetros) y están ordenados por su altura, de tal modo que el estereocilio más largo está hacia el exterior de la cóclea y los más cortos hacia el interior.
Por su forma y su función se distinguen dos tipos de células pilosas: las células pilosas internas, más próximas a la pared interna de la cóclea, y las células pilosas externas, más próximas a la pared externa.
Las células pilosas internas son células exclusivamente sensoriales. Tienen una forma bulbosa, similar a la de una pera, y se disponen en una sola hilera. En total hay unas 3.500 células pilosas internas dispuestas a lo largo de la membrana basilar. Su tamaño no presenta muchas variaciones. Están rodeadas por otras células no sensoriales que les sirven de soporte y de aislamiento. Hacia la parte exterior se encuentran las células pilares que forman el túnel de Corti, un hueco que está lleno de perilinfa.
Por su parte, las células pilosas externas tienen un cuerpo cilíndrico. Se agrupan en filas de tres o de cuatro células y también se disponen en hileras. Hay unas 12.000 células pilosas externas, distribuidas a lo largo de la membrana basilar. Las células pilosas externas están ancladas en otras células que las soportan. Entre ellas hay espacios llenos de perilinfa, los llamados espacios de Nuel. La altura de las células pilosas externas varía de la zona basal a la apical de la cóclea: en la zona basal miden unos 30 micrómetros, mientras que en la apical llegan a tener hasta los 70 micrómetros.
La característica de las células pilosas externas es que son células contráctiles: no solamente captan mediante sus estereocilios el estímulo mecánico que reciben, sino que también reaccionan, acortándose o alargándose, en respuesta al estímulo recibido, de modo que retroalimentan el movimiento mecánico de la membrana basilar en la localización exacta en la que se hallan. Con ello logran que la resonancia en ese punto sea más acentuada.
Tanto en las células pilosas externas como en las internas, los estereocilios están separados del cuerpo de la célula a la que pertenecen por una especie de pletina. Esta pletina está unida estrechamente a la superficie de las células que bordean cada célula sensorial y que la aíslan de sus vecinas. Mediante esa estrecha unión se crea una lámina impermeabilizadora capaz de cerrar el canal medio por su parte inferior, impidiendo a la endolinfa de ese conducto mezclarse con la perilinfa que llena las lagunas que existen entre las células del órgano de Corti, es decir, el túnel de Corti y los espacios de Nuel. De estas manera, mientras que los estereocilios de cada célula pilosa están dentro del canal medio y están bañados por el líquido endolinfático de éste, el cuerpo de la célula está en contacto directo o indirecto con la perilinfa que procede del canal timpánico.
Como veremos cuando estudiemos la transducción mecano-eléctrica, esta lámina impermeable hace que los iones positivos de Potasio (k+) que abundan en la endolinfa solamente puedan pasar al otro lado a través del cuerpo de las células pilosas. La flexión de los estereocilios al chocar contra la membrana tectorial, como consecuencia de la vibración de la membrana basilar, abrirá o cerrará los canales iónicos, permitiendo o impidiendo el establecimiento de una corriente eléctrica entre la endolinfa y la perilinfa.
Para hacernos una idea de la disposición de los estereocilios de las células pilosas internas y externas, veamos una fotografía realizada con microscopio electrónico de la parte superior del órgano de Corti, en la que se ha retirado la membrana tectorial. Está obtenida de la galería de imágenes de Yale Medical Cell Biology.

Figura 8. Fotografía de las células pilosas del órgano de Corti vistas desde arriba.
Figura 8. Fotografía de las células pilosas del órgano de Corti vistas desde arriba.

Vemos la parte superior de las células pilosas y de las células de soporte, así como la película impermeabilizadora que forman. Observamos que los estereocilios de las células sensoriales internas están dispuestos casi en hilera. Y también que los estereocilios de las células externas tienen una forma casi de uve doble. Aunque ni en esta fotografía ni en la ilustración anterior están representados, los estereocilios están unidos entre sí por unos enlaces flexibles situados aproximadamente en el medio de su longitud, mediante los cuales están agrupados unos con otros formando un ramillete.
Además, los estereocilios poseen en su extremo superior unas pequeñas aberturas cuya puerta, por así decir, está unida mediante un microfilamento proteínico, el tip link, al estereocilio contiguo más alto. Estas aberturas son los canales iónicos y se abren o se cierran en función de la mayor o menor separación de los estereocilios según el momento de la oscilación, permitiendo o impidiendo el paso de los iones positivos al interior del cuerpo celular.

Figura 9. Ilustración de la apertura y cierre de los canales iónicos de los estereocilios.
Figura 9. Ilustración de la apertura y cierre de los canales iónicos de los estereocilios.

Se podría considerar que las células pilosas son los micrófonos de nuestro sistema auditivo. De algún modo, podríamos decir que nuestro membrana basilar está equipada con unos 15.000 micrófonos colocados sobre ella, capaces de recoger y transformar en señales eléctricas las vibraciones de cada una de las localizaciones de esta membrana. Las células pilosas internas están dispuestas de tal modo que forman algo así como una hilera de 3.500 micrófonos situados sobre la membrana basilar y son la principal y más directa fuente de información del movimiento de oscilación de cada zona de esta membrana. Teniendo en cuenta que la longitud media de la membrana basilar es de 35 mm, la separación entre las células pilosas internas es de unas 10 micras, una separación ligeramente superior al diámetro de cada célula. Así pues, podríamos decir que cada 10 micras una célula sensorial recoge, a modo de micrófono, el movimiento resonante de esa zona de la membrana basilar.

El ganglio espiral

Para terminar la descripción de la cóclea, antes de pasar a analizar las funciones que realiza, nos queda el estudio de su sistema nervioso.
El ganglio espiral o coclear recorre el interior de la cóclea por un orificio situado dentro del modiolo llamado el canal de Rosenthal, a la altura de la división creada por la lámina espiral y la membrana basilar, como hemos podido ver en las figuras 5, 6 y 7. El ganglio espiral es el encargado de codificar las señales eléctricas que provienen de las células pilosas del órgano de Corti y de regular su actividad. Está formado por los cuerpos de unas 50.000 neuronas.
Las dendritas de estas neuronas establecen sinapsis con las células pilosas, mientras que sus axones constituyen el nervio auditivo o coclear. El conjunto de dendritas y axones forman las fibras nerviosas que comunican el órgano de Corti con los primeros núcleos del cerebro especializados en la audición. Las fibras nerviosas que salen del ganglio espiral pueden ser imaginadas como líneas de comunicación entre la cóclea y la parte del cerebro dedicada a procesar la información auditiva. Veamos una hermosa ilustración, realizada por Andréa Zariwny.

Figura 10. Ilustración del ganglio espiral.
Figura 10. Ilustración del ganglio espiral.

En esta ilustración podemos apreciar el ganglio coclear, con las dendritas que salen de él a lo largo de todo su recorrido espiral y los axones que, reunidos en forma de haz, constituyen el nervio coclear.
Las neuronas aferentes del ganglio espiral codifican las señales eléctricas recibidas de las células sensoriales del órgano de Corti y transmiten la información hacia los núcleos auditivos del cerebro, en concreto, hacia el núcleo coclear. Por su parte, las neuronas eferentes reciben información desde el complejo olivar superior y la comunican a las células pilosas.
En el ganglio espiral existen dos tipos de neuronas que se diferencian por su morfología y su constitución: las llamadas neuronas cocleares de tipo I, bipolares, caracterizadas por tener una dendrita y un axón, ambos gruesos y mielinizados; y las neuronas cocleares de tipo II, unipolares, con un axón delgado y sin mielina dividido en dos ramas, una de las cuales cumple la función de dendrita. Debido a ello, mientras las neuronas de tipo I dan lugar a fibras de conducción rápida, las fibras de las neuronas de tipo II son más lentas. El 90% de las neuronas del ganglio espiral son del tipo I. Las neuronas eferentes son todas del tipo II, pero las aferentes pueden ser tanto del tipo I como del tipo II.
La inervación de las células pilosas del órgano de Corti es diferente según sean internas o externas.
Cada célula pilosa interna es inervada por entre 10 y 15 fibras nerviosas aferentes del tipo I. Además, cada una de estas fibras está conectada solamente con una célula sensorial interna. De esa manera, para transmitir la información que ha generado, cada célula sensorial interna dispone de entre 10 ó 15 líneas de comunicación independientes y rápidas. Esto explica el gran porcentaje de neuronas del tipo I que hay en el ganglio espiral.
Por su parte, cada célula pilosa externa se conecta a unas 6 fibras nerviosas aferentes. Pero la célula tiene que compartir cada fibra con unas 10 ó 20 células pilosas externas más y, además, las fibras nerviosas aferentes son ahora neuronas del tipo II. Por ello la información que transmiten las fibras nerviosas que proceden de las células sensoriales externas es mucho más lenta y mucho menos especializada que la enviada por las fibras nerviosas que proceden de las células sensoriales internas.
Tanto las células pilosas externas como las internas tienen conexiones con neuronas eferentes, todas ellas del tipo II. En las células pilosas internas la conexión no se establece directamente con la célula sensorial, sino con alguna fibra nerviosa a la que está unida. En ese caso la finalidad de estas fibras eferentes parece ser el control de las sinapsis aferentes. En las células pilosas externas, que son contráctiles, parece que la función de las neuronas eferentes es el control de su motilidad.
Veamos un sencillo esquema de las conexiones de las células sensoriales del órgano de Corti con las neuronas del ganglio espiral donde se procesa la información auditiva.

Figura 11. Esquema de las conexiones neuronales del órgano de Corti.
Figura 11. Esquema de las conexiones neuronales del órgano de Corti.

La cóclea como analizador mecánico de frecuencias

El análisis espectral es la primera de las tres tareas que debe realizar la cóclea para transformar en impulsos nerviosos la información sonora contenida en la vibración mecánica. Para llevar a cabo este trabajo la cóclea cuenta con la membrana basilar y con los fluidos acuosos que llenan sus canales.
Este análisis da lugar a que la información frecuencial que contiene la señal en el tiempo se traduzca en información espacial, dando como resultado una organización tonotópica de la membrana basilar. En cierto sentido, el comportamiento de la cóclea como analizador mecánico de frecuencias se asemeja al del piano imaginario de miles de cuerdas utilizado para explicar la descomposición espectral en el capítulo “Análisis espectral de los sonidos musicales”.
En ambos casos, la detección de los componentes frecuenciales que constituyen la vibración sonora se logra mediante un sistema mecánico de resonancias: en el caso del piano ideal entran en resonancia las cuerdas que están afinadas a la frecuencia de los componentes sinusoidales presentes en el sonido analizado; en el caso de la cóclea resuenan aquellas pequeñas secciones de la membrana basilar cuyas frecuencias naturales de vibración coinciden con las de los componentes de la onda sonora que penetra en el canal vestibular por la ventana oval.
Ahora bien, a diferencia de las cuerdas del piano, la membrana basilar es un continuo. Su frecuencia de resonancia en cada punto a lo largo de su longitud (la afinación de ese punto, por decirlo así) depende tanto de la elasticidad de la membrana en esa localización concreta, como de su distancia respecto a la ventana oval. Así mismo, las frecuencias de resonancia de la membrana basilar no se distribuyen linealmente como en nuestro piano ideal, sino logarítmicamente. De hecho, si tomamos como inicio la zona apical de la membrana basilar, cada 3,5 mm aproximadamente se dobla la frecuencia, es decir, se aumenta una octava.

Tonotopía de la membrana basilar

La cuestión que hay que explicar ahora es: ¿Cómo es posible que un sistema formado por dos canales llenos de fluido acuoso y separados por una membrana elástica de rigidez variable pueda resonar en diferentes localizaciones en función de los componentes frecuenciales de la señal de entrada? Recordemos que, en lo que concierne a la transmisión de la vibración mecánica, el canal vestibular y el canal medio funcionan como si se tratara de uno solo, ya que la membrana de Reissner, debido a su finura, no supone obstáculo alguno a la transmisión de las vibraciones entre los fluidos acuosos.
Mi exposición va a seguir el planteamiento propuesto por Jan Schnupp, Israel Nelken y Andrew King en su libro Auditory Neuroscience, Making Sense of Sound (The MIT Press, 2011), según el cual la vibración sonora se propaga por el fluido del canal superior y pasa al canal inferior a través de la membrana basilar justamente en aquellas localizaciones cuya frecuencia natural de vibración coincide con la de los componentes frecuenciales presentes en el sonido analizado.
Veamos, así pues, las razones por las que la membrana basilar resuena en distintas localizaciones según la frecuencia de la vibración que recibe.
Como todo movimiento ondulatorio, la vibración sonora tiende a buscar el camino más fácil, aquél que presenta un obstáculo menor. En la cóclea, la transmisión de la onda desde el canal superior al inferior se ve afectada por dos fuerzas cuyos gradientes van en sentido contrario. Por un lado, la rigidez de la membrana basilar disminuye conforme se aleja de la ventana oval ofreciendo menos resistencia a la vibración. Por otro, la inercia de los líquidos que llenan los canales es mayor conforme la zona está más alejada de la ventana oval, pues la cantidad de líquido que la vibración tendrá que mover será mayor.
Así mismo, el obstáculo que supone la inercia depende de la frecuencia de la vibración: cuanto mayor sea la frecuencia, más difícil le resultará a la vibración mover los líquidos que llenan los canales de la cóclea. Para entender esto último nos basta recurrir a una sencilla experiencia: si tratamos de desplazar en vaivén el líquido de una botella a medio llenar comprobaremos que, conforme más rápido lo queramos hacer oscilar, más nos costará.
Por todo ello, para una frecuencia determinada de la onda vibratoria, el punto en el que la inercia de los fluidos y la rigidez de la membrana basilar se compensan será el punto en el que ésta se deformará más, oscilando en resonancia con esa frecuencia y transmitiendo la vibración al líquido del canal inferior.
El hecho de que cada componente frecuencial de la vibración encuentre su propio camino para transmitirse desde el conducto superior al conducto inferior hace que las ondas sonoras se dispersen, produciéndose la descomposición de la señal en sus componentes sinusoidales. De este modo se realiza el análisis espectral.
Este fenómeno es similar al que ocurre con un rayo de luz al que se le hace pasar a través de un prisma de cristal. En ese caso, cuando las ondas lumínicas se dispersan buscando el camino más eficaz para cada componente frecuencial —es decir, para cada color— surge el arco iris. En el caso del sonido, la dispersión que se produce en la cóclea permite que se cree una especie de mapa de frecuencias en la membrana basilar. Al transmitirse las vibraciones por diferentes zonas de la membrana según su frecuencia, los componentes sinusoidales que están presentes en la señal sonora quedan registrados en diferentes localizaciones espaciales. Esta organización tonotópica va a estar presente a lo largo de todo el camino que lleva la información sonora al cerebro.
Para ayudar a entender todo esto de una manera intuitiva, he fabricado un vídeo en el que se simula el comportamiento de un analizador mecánico de frecuencias con una estructura parecida a la de la cóclea. Se trata de un cilindro que contiene en su interior dos canales llenos de líquido, separados por una membrana elástica de rigidez variable. Ambos canales están comunicados por una abertura que simula el helicotrema. Los colores con los que está pintada la membrana siguen la escala del arcoiris, de manera que los rojos representan las zonas que vibran en resonancia con las frecuencias bajas y los azules las que vibran con las altas. Por la ventana superior, que se comporta como la ventana oval, penetra la vibración mecánica producida por la onda sonora. La ventana inferior, que imita la ventana redonda, sirve para compensar los aumentos y disminuciones de presión que se crean en el interior del cilindro. El aumento y disminución de la cantidad de partículas que flotan en el líquido simboliza el aumento y la disminución de la presión de los fluidos.
El vídeo simula cuatro situaciones vibratorias diferentes, cada una de ellas con un solo componente sinusoidal: la primera es una vibración cuya frecuencia pertenece a la zona de los infrasonidos, en torno a los 16 Hz; la segunda tiene una frecuencia de 220 Hz, un la3 en la afinación convencional; la frecuencia de la tercera es de 880 Hz, un la5; y la de la última, 3.520 Hz, un la7. El vídeo está ralentizado 440 veces. El sonido es solamente ilustrativo.

Figura 12. Vídeo con una simulación de la resonancia en la cóclea.

En el vídeo podemos observar que las vibraciones que penetran en el cilindro pasan del canal superior al inferior por una u otra zona en función de su frecuencia, haciendo resonar la membrana en diferentes localizaciones, a excepción del primer caso donde la transmisión de la vibración se realiza por la abertura del final que simula el helicotrema, de modo que la membrana no se ve afectada.
Al estar el vídeo muy ralentizado, podemos apreciar cómo la vibración introducida a través de la ventana elástica superior se compensa mediante la ventana elástica inferior. Vemos que cada vez que, como consecuencia del movimiento vibratorio, la ventana superior penetra en el cilindro, el aumento de la presión que se crea en su interior hace que la ventana inferior se mueva hacia fuera; y, a la inversa, cada vez que la ventana superior sale hacia fuera, la ventana inferior se mueve hacia dentro.
El inicio del vídeo muestra una situación en la que la frecuencia de la vibración real estaría por debajo del rango de los sonidos audibles, es decir, sería menor de 20 Hz. Dado que se trata de una frecuencia muy baja, el obstáculo que supone la inercia del líquido es escaso, por lo que el camino elegido por la vibración para pasar del conducto superior al inferior es la abertura del final. En esta situación la membrana no sufre ninguna deformación y, por lo tanto, tampoco hay ninguna percepción de sonido.
El segundo caso ilustra lo que sucede con una frecuencia vibratoria de 220 Hz. Ahora la inercia del fluido ya supone cierto obstáculo, un obstáculo lo suficientemente importante como para que la vibración prefiera vencer la rigidez de la membrana elástica y pasar a través de ella al canal inferior. Esa zona en la que vemos oscilar la membrana es la que posee una frecuencia natural de resonancia de 220 Hz, resultado de la conjunción de las dos fuerzas que crecen o decrecen en sentido opuesto: la inercia de los fluidos en esa zona para esa frecuencia y la rigidez de la membrana en ese punto.
El tercer caso se corresponde con un sonido dos octavas más agudo, de 880 Hz, por lo que el movimiento oscilatorio que vemos en el vídeo es cuatro veces más rápido que en el caso anterior. Ahora la oscilación es tan rápida que el obstáculo que presenta la inercia del líquido es mucho más importante, por lo que a la onda vibratoria le resulta más eficaz pasar al canal inferior en una localización más próxima a la entrada de la vibración, pues, a pesar de que en ese punto la membrana presenta ya una resistencia bastante grande, la cantidad de líquido que debe mover es mucho menor.
El cuarto caso presenta la situación correspondiente a un sonido de 3.520 Hz, es decir, un sonido cuya frecuencia de vibración es cuatro veces mayor que la del caso anterior y dieciséis veces mayor que el segundo caso del vídeo. Al ser la vibración muy rápida, el obstáculo derivado de la inercia de los líquidos es muy grande, por lo que la onda vibratoria elige un punto donde tiene que mover menos cantidad de líquido, aunque ahora la resistencia de la membrana sea ya muy grande.
Este vídeo nos ayuda a entender por qué cada localización de la membrana basilar a lo largo de su longitud posee una frecuencia natural de resonancia, lo cual explica la capacidad de la cóclea para transformar los componentes sinusoidales presentes en la vibración en localizaciones espaciales. A esto es a lo que llamamos la tonotopía de la membrana basilar.

Comportamiento de la membrana basilar ante un sonido complejo

Una vez entendido el fenómeno de la resonancia en la membrana basilar, nos interesa examinar cómo vibra esa membrana ante un sonido complejo, es decir, ante un sonido que consta de varios componentes sinusoidales (recordemos que todo sonido, sea o no musical, puede ser descompuesto en componentes sinusoidales).
En primer lugar, hay que tener en cuenta que las zonas de la membrana basilar que resuenen ante los distintos componentes frecuenciales vibrarán siempre —al menos de forma ideal— con un movimiento armónico simple, oscilando de arriba a abajo con una amplitud que, en principio, será proporcional a la del componente que la ha hecho resonar.
Así mismo, como ocurre en el caso de las cuerdas del piano ideal, no solamente resonará el lugar específico de la membrana basilar cuya frecuencia natural coincida con la del componente presente en la vibración de entrada, sino también las zonas próximas. Ahora bien, como sucede en toda vibración provocada, cada una de las localizaciones de la membrana basilar que entre en resonancia oscilará siempre a la frecuencia del componente que la hace resonar, con independencia de cuál sea la frecuencia natural de resonancia de esa localización concreta. Es decir, si en la onda vibratoria está presente, pongamos por caso, un componente de 220 Hz, resonará la localización de la membrana cuya frecuencia natural sea de 220 Hz, pero también se verán afectadas y resonarán, aunque en menor medida, las localizaciones vecinas, aquellas que posean una frecuencia natural próxima, por ejemplo, las que estén entre 200 Hz y 240 Hz. Ahora bien, todas ellas oscilarán siempre a la frecuencia excitadora —es decir, a 220 Hz— y no a la suya propia.
Y, finalmente, los oscilaciones sinusoidales de las distintas localizaciones de la membrana que entren en resonancia conservarán también las diferencias de fase relativas que puedan existir entre los componentes sinusoidales de la onda vibratoria. Así pues, el análisis espectral que realiza la membrana basilar no sólo conserva la amplitud de cada componente, sino también sus diferencias de fase. Esto explica que, en la medida en la que esta información sea recogida y procesada por nuestro cerebro, podamos ser sensibles a fenómenos tales como los batidos de segundo orden.
Para ilustrar la manera en la que vibra la membrana basilar ante un sonido formado por varios componentes sinusoidales, he creado un vídeo en el que se simula su movimiento oscilatorio ante una onda vibratoria que se va haciendo progresivamente más compleja. Se trata de la nota la3, de 220 Hz, en la que se van introduciendo nuevos componentes armónicos, con amplitudes y fases diferentes. El vídeo está ralentizado y el sonido es solamente ilustrativo.

Figura 13. Vídeo que simula la tonotopía de la membrana basilar.

Debemos tener presente que en la realidad los desplazamientos oscilatorios de cada zona de la membrana basilar son muy pequeños (en un sonido de intensidad media del orden de nanómetros, es decir, de millonésimas de milímetro). Por ello, en este vídeo la longitud de la membrana se corresponde con los 35 milímetros que viene a medir la membrana basilar, mientras que el desplazamiento vertical de cada zona que resuena representa solamente unos pocos nanómetros.
Podemos ver que cada localización de la membrana oscila de forma sinusoidal. Y también que lo hace solamente a la frecuencia de los componentes presentes en la señal de entrada. Apreciamos también que en cada zona de resonancia no oscila solamente un único punto de la membrana —el que tiene la misma frecuencia natural de resonancia que el componente de entrada—, sino que también oscilan, a la misma frecuencia, los puntos vecinos, creándose pequeños montículos y hondonadas.
Como el vídeo está también ralentizado 440 veces, podemos apreciar que cuando el componente de 220 Hz, el más grave, hace una oscilación completa han transcurrido dos segundos, y cuando el siguiente componente, el de 440 Hz, realiza una oscilación completa ha transcurrido uno, y así sucesivamente.
El principio del vídeo ilustra la vibración de la membrana basilar cuando el sonido está formado por un solo componente, el de 220 Hz. Luego, al entrar el segundo componente, el de 440 Hz, la membrana basilar resuena además en una nueva localización, más próxima a la zona basal, donde oscila con el doble de frecuencia que en la primera. Y cuando entra el tercer componente se crea una nueva zona de resonancia, aún más próxima a la zona basal, y su frecuencia de oscilación es el triple de la primera. Lo mismo sucede cuando entran el cuarto y el quinto componente, cuyas frecuencias de oscilación son cuatro y cinco veces la de la primera.
Por otra parte, en el vídeo podemos observar que las oscilaciones de las diferentes zonas de la membrana basilar conservan la información de la fase relativa que tenían los componentes que constituyen la onda vibratoria. Si paramos el vídeo en el momento en el que el componente más grave alcanza su desplazamiento máximo, podremos apreciar los desfases con los demás componentes. Estos desfases estaban presentes en la señal de entrada que he fabricado.

Retroalimentación de las células pilosas externas sobre la membrana basilar

Como se estudia en el capítulo dedicado al análisis espectral, para que un analizador de frecuencias sea capaz de discriminar componentes próximos presentes en la señal de entrada, es necesario que la respuesta sea lo suficientemente picuda, es decir, que la anchura de la banda de frecuencias afectada por el derrame espectral sea pequeña. Sin embargo, el análisis mecánico que resulta del movimiento resonante de la membrana basilar está lejos de lograr esa buena respuesta.
Pero la cóclea dispone de un sistema de retroalimentación que le permite reducir el derrame espectral y mejorar significativamente la respuesta puramente mecánica que le proporciona la simple resonancia de la membrana basilar: el movimiento de las células pilosas externas del órgano de Corti. Como hemos visto, estas células sensoriales no se limitan a enviar a las terminaciones nerviosas con las que están conectadas información sobre la zona de la membrana basilar afectada por la resonancia, sino que, al ser contráctiles, pueden alargarse y encogerse cuando son excitadas por el movimiento de la membrana basilar o de la membrana tectorial, con las que están en contacto directo.
En efecto, cuando un ramillete de células pilosas externas son afectadas por la vibración del punto de la membrana basilar sobre el que se sitúan, chocan contra la membrana tectorial, de modo que el cuerpo de estas células se contrae y se dilata, y lo hace siguiendo el ritmo de la oscilación en ese punto. Así, estas células actúan como pequeños motores que refuerzan el movimiento de la membrana basilar en un punto, incrementando notablemente la amplitud de la resonancia en la localización exacta sobre la que se hallan y logrando, por lo tanto, una respuesta más picuda. Esta función de retroalimentación es particularmente importante en las señales débiles, donde pueden llegar a multiplicar por 100 veces la amplitud de la oscilación de un punto de la membrana basilar.
Este mecanismo de retroalimentación explica, por una parte, el importante margen perceptivo de la intensidad sonora que poseemos (aproximadamente de 120 dB) y, por otra, que la anchura de la banda de frecuencias en la que dos componentes no interfieren entre sí sea los suficientemente amplia como para que seamos capaces de distinguir individualmente seis o siete armónicos de un sonido compuesto (recordemos que los armónicos superiores, aunque no sean individualizables por nuestra percepción, contribuyen también a la cualidad del sonido).

Transducción mecano-eléctrica en la cóclea

A continuación vamos a estudiar cómo los movimientos oscilatorios de cada una de las posiciones de la membrana basilar se transforman en variaciones de la tensión eléctrica, las cuales reproducen analógicamente esas oscilaciones.
Esta transformación se realiza gracias a dos tareas complementarias que llevan a cabo las células sensoriales del órgano de Corti: en primer lugar, se produce una transformación exclusivamente mecánica, mediante la cual los movimientos ascendentes y descendentes de una localización concreta de la membrana basilar se convierten en movimientos transversales de los estereocilios de las células pilosas que están sobre ella; en segundo lugar, se origina la transformación eléctrica propiamente dicha, mediante la cual los movimientos de izquierda y derecha de los estereocilios sirven para modular la corriente que circula a través del cuerpo de las células sensoriales.
La primera parte, la conversión de los desplazamientos verticales de la membrana basilar en movimientos transversales de los estereocilios, se produce como consecuencia de la fuerza ejercida sobre ellos por la membrana tectorial. Esta membrana pivota ligeramente arriba y abajo, pero su pivote es independiente de la membrana basilar, de modo que cuando ésta asciende, la membrana tectorial crea una fuerza de cizalladura sobre los estereocilios que los obliga a inclinarse hacia el lado externo de la cóclea —es decir, hacia el estereocilio más alto—, mientras que cuando la membrana basilar desciende, los hace inclinarse hacia el lado interno. Veamos un diagrama esquemático de este movimiento en una imagen obtenida del curso Hearing en OpenLearn Works, de la que solamente he traducido los nombres.

Figura 14. Esquema del movimiento de cizalladura de los estereocilios.
Figura 14. Esquema del movimiento de cizalladura de los estereocilios.

El dibujo presenta las tres situaciones características del movimiento derivado de las fuerzas de cizalladura en una sola célula pilosa.
En la posición de equilibrio (b), vemos que la zona de la membrana basilar donde se encuentra la célula sensorial mantiene su horizontalidad y que los estereocilios de esa célula están en vertical.
Cuando esa zona de la membrana basilar asciende (a), desplazándose hacia el canal vestibular, los estereocilios empujan hacia arriba la membrana tectorial, que, al pivotar ligeramente en el sentido contrario al de las agujas del reloj, se desplaza un poco también hacia arriba, con lo que provoca una fuerza de cizalladura sobre los estereocilios que los hace inclinarse en el sentido del estereocilio más alto, es decir, hacia el exterior de la cóclea (en el dibujo hacia la derecha). Aunque en el esquema no se puede apreciar, hay que pensar que, al inclinarse en este sentido los estereocilios, se separan ligeramente unos de otros, de modo que los filamentos que unen la puerta del canal iónico de cada uno de ellos con su correspondiente estereocilio adyacente se abre más.
Cuando esa zona de la membrana basilar desciende (c), la membrana tectorial pivota ligeramente en el sentido de las agujas del reloj, desplazándose hacia abajo, de modo que ahora la fuerza de cizalladura sobre los estereocilios se produce en sentido inverso, es decir, hacia el interior de la cóclea (en el dibujo hacia la izquierda). Entonces los estereocilios se juntan unos con otros, cerrándose las puertas de los canales iónicos.
Así pues, estas deflecciones de los estereocilios siguen el ritmo y la amplitud de los movimientos oscilatorios de la membrana basilar donde se asientan. Hay que tener en cuenta que, conforme mayor sea la amplitud del movimiento de ascenso o descenso de una determinada localización de la membrana basilar, mayor será también la amplitud del movimiento transversal de los estereocilios. Por otra parte, aunque este desplazamiento de los estereocilios es muy pequeño (en un sonido muy intenso el desplazamiento máximo en la parte superior del estereocilio más alto es del orden 100 nm), basta que se desplacen menos de un nanómetro para que percibamos sonido.
La segunda parte, la transformación eléctrica a partir del movimiento transversal de los estereocilios, es posible gracias a la diferencia de potencial (de unos 80 mV) que existe entre el líquido endolinfático del canal medio, muy rico en iones positivos de potasio (K+), y el líquido perilinfático del canal timpánico, cuyo contenido en iones positivos de potasio es muy escaso. Debido a que los estereocilios de las células pilosas están dentro de la endolinfa, mientras que el cuerpo de estas células está en contacto directo o indirecto con la perilinfa y, al ser totalmente impermeable la lámina que separa ambos líquidos, la única forma en la que se puede establecer una corriente eléctrica entre estos fluidos es a través del interior de las células sensoriales, cuyos canales iónicos abiertos en sus estereocilios permiten que penetre un mayor o menor número de iones positivos.
En efecto, los iones positivos de la endolinfa son atraídos por la mayor negatividad del cuerpo de las células pilosas. Cuando el cuerpo celular recibe estos iones se positiviza y, en consecuencia, los iones positivos son atraídos por las cargas negativas del líquido semejante a la perilinfa que llena las lagunas del órgano de Corti. Finalmente, los iones positivos son asimilados por la perilinfa del canal timpánico, debido a la permeabilidad de la membrana basilar al paso de los iones. Y mientras tanto, la estría vascular se encarga de suministrar constantemente nuevos iones positivos de potasio a la endolinfa, reponiendo los que va perdiendo.
Pero esa corriente eléctrica no es constante, sino que varía según el movimiento de los estereocilios de las células sensoriales. El movimiento de vaivén de los estereocilios, producido como consecuencia de la oscilación de la localización de la membrana basilar donde se encuentra la célula sensorial, abre más o menos los canales iónicos, como acabamos de ver, modulando de ese modo el paso de la corriente desde la endolinfa a la perilinfa.
Cuando esa localización de la membrana basilar está en una posición de equilibrio y los estereocilios están en vertical, el flujo de iones de potasio que penetra a través de sus canales iónicos es reducido, con lo que la corriente eléctrica que atraviese el cuerpo de la célula será moderada. Cuando esa zona asciende hacia el canal vestibular, abriéndose más los canales iónicos en los estereocilios, penetran por ellos muchos más iones de potasio positivos, aumentando la corriente eléctrica. Y, por el contrario, cuando esa zona de la membrana basilar se desplaza hacia abajo y se tienden a cerrar los canales iónicos, penetran por ellos una cantidad más reducida de iones positivos, quedando entonces el flujo de la corriente muy atenuado. De este modo, el movimiento transversal de carácter mecánico de los estereocilios se transforma en variaciones de la corriente eléctrica.
Así pues, el resultado de la transducción mecano-eléctrica es que las variaciones de la corriente eléctrica que atraviesa el cuerpo de cada célula sensorial son capaces de reproducir de manera analógica los movimientos oscilatorios de la membrana basilar en la posición en la que se encuentra la célula. La vibración de ese punto es transformada en una señal eléctrica analógica, de manera similar a lo que hace un micrófono respecto a las variaciones de la presión del aire en el lugar en el que está situado. Finalmente, conviene insistir en que el movimiento de la oscilación de los estereocilios que va a dar lugar a las oscilaciones de la tensión eléctrica ya no reproduce la forma de la onda vibratoria que ha llegado a la cóclea a través del estribo, la cual es una señal en el tiempo, sino la forma de la oscilación que resuena en cada localización de la membrana basilar. Idealmente esta forma es una señal sinusoidal, con sus propios parámetros de frecuencia, amplitud y fase, resultado de la descomposición de la señal en el tiempo que ha realizado la membrana basilar para ese componente concreto.

Codificación de la información sonora en impulsos eléctricos

A continuación vamos a estudiar cómo el conjunto de señales analógicas que nos proporcionan las células sensoriales son codificadas por las neuronas y transformadas en impulsos nerviosos. Gracias a esta codificación nuestro cerebro extraerá e interpretará la información pertinente a nuestra audición, es decir, los componentes frecuenciales que están presentes en la vibración de entrada y su correspondiente amplitud, e incluso la fase relativa entre ellos.
Podríamos pensar que, de algún modo, la codificación que realizan las neuronas en el ganglio espiral supone la transformación de una información analógica en una información de tipo digital. Mientras las variaciones de la corriente eléctrica que pasa a través de las células sensoriales del órgano de Corti reproducen analógicamente las oscilaciones de la zona de la membrana basilar correspondiente, las neuronas del sistema auditivo se comportan, como todas las demás neuronas, de una manera que podríamos calificar de discontinua o digital. En efecto, las neuronas siempre siguen la ley de todo o nada, es decir, disparan un impulso o no lo disparan.
Los medios de los que dispone cada una de las neuronas del sistema auditivo para codificar la información que proporcionan las células sensoriales y transmitirla a otras neuronas ubicadas en sus respectivos centros de proceso son básicamente dos: el número de veces que cada neurona se excita por segundo, es decir, su tasa de disparos; y el momento preciso en el que lo hace, es decir, la circunstancia concreta en la que dispara el impulso, como por ejemplo, cuando la oscilación de la corriente eléctrica en la célula sensorial con la que está conectada alcanza un máximo.
Junto a estos medios individuales, hay otro muy importante en el que están implicadas todo el conjunto de neuronas que se comunican con las células sensoriales del órgano de Corti: la disposición tonotópica de las neuronas del sistema auditivo. En efecto, estas neuronas mantienen a lo largo de su recorrido, hasta llegar a la capa exterior del cortex auditivo, la organización tonotópica que posee la membrana basilar. Dicho de otra manera, cada neurona va asociada a una determinada frecuencia de resonancia de la membrana basilar y esta asociación se mantiene de neurona en neurona, dando lugar a una especie de mapa de frecuencias en la zona del cerebro especializada en la audición.
Puesto que cada célula pilosa interna transmite su información a unas 10 o 12 fibras nerviosas aferentes que son exclusivas para esa célula concreta, la tonotopía por sí sola podría explicar nuestra capacidad para apreciar los componentes frecuenciales. Teniendo en cuenta que el rango de frecuencias que distinguimos los humanos va desde 20 Hz a 20.000 Hz (es decir, prácticamente 10 octavas ó 120 semitonos) y puesto que contamos con una hilera de aproximadamente 3.500 células pilosas internas, podemos deducir que la separación interválica entre las células sensoriales internas se corresponde aproximadamente a unas tres centésimas de semitono (120/3500 = 0,0343). Este margen viene a coincidir con las mediciones psicoacústicas sobre nuestra capacidad para apreciar las diferencias mínimas entre intervalos sucesivos.
Además, la información sobre la frecuencia también lleva consigo la información sobre la amplitud. Una parte importante de esas 10 ó 12 neuronas que hacen sinapsis con cada célula pilosa interna transmiten la información de la amplitud mediante su tasa de disparos. Cuando la amplitud de la oscilación eléctrica en el cuerpo de la célula sensorial es grande, el número de disparos por segundo de cada neurona es elevado, mientras que si la amplitud es pequeña hay un reducido número de disparos por segundo (el número máximo de disparos que es capaz de efectuar una neurona está en torno a los 500 disparos por segundo). Así mismo, el número de neuronas pertenecientes a cada célula sensorial que resultan activadas es mayor cuanto mayor sea la amplitud de la oscilación eléctrica.
La combinación de estos dos medios, tonotopía y tasa de disparos de las neuronas, pueden constituir los mecanismos básicos por los que se codifica la frecuencia y la amplitud. Sin embargo, no son suficientes para explicar fenómenos psicoacústicos, tales como la detección de la fase relativa entre los componentes, como ocurre, por ejemplo, cuando oímos los batidos de segundo orden.
El elevado número de conexiones neuronales por cada célula sensorial interna invita a pensar que pudieran existir otros mecanismos complementarios que refuercen y precisen esa codificación. Por un lado, parece ser que alguna de las neuronas a las que están conectadas las células pilosas están especializadas en dispararse cuando la oscilación eléctrica de la célula pasa por un máximo. Y esto, en principio, ocurre de forma periódica, pues cada célula que transmite la resonancia de la membrana basilar debe oscilar con un movimiento armónico simple. Esto implica que si la frecuencia de oscilación eléctrica es baja, la neurona tendrá tiempo para rearmarse y disparará un impulso por cada máximo, pero si la frecuencia de la oscilación es alta, no podrá rearmarse y disparará cada dos, cada tres o cada más máximos. El resultado será un tren de impulsos que, aunque tenga lagunas, será predominantemente periódico. Estas lagunas podrán ser completadas por otras neuronas de esa célula especializadas en este mecanismo, actuando en su conjunto como si estuvieran jugando un partido de voleibol.
Así pues, el disparo de estas neuronas no tendría que ver con la amplitud, sino con la fase de la oscilación, es decir, con un estado de la oscilación, el punto en el que se alcanza el máximo. Este mecanismo, que se denomina bloqueo de fase, serviría para reforzar la codificación de la frecuencia y también para trasmitir la información de fase relativa entre los componentes de una señal.
Hay que tener en cuenta que, aunque como consecuencia del derrame espectral las células pilosas internas vecinas también oscilarán, lo harán no a su frecuencia natural de resonancia, sino a la del componente frecuencial presente en la señal de entrada. Por ello, el tren de impulsos enviado por las neuronas vecinas especializadas en este mecanismo de bloqueo de fase tendrá siempre la misma frecuencia, lo que explicaría, entre otras cosas, la percepción de los batidos de segundo orden.
Por otra parte, en lo que concierne a la codificación de la amplitud, contamos con dos medios complementarios. El primero es la mayor o menor extensión de la zona afectada por el derrame espectral, es decir, el número de células vecinas estimuladas por la presencia de un determinado componente frecuencial presente en la señal de entrada. Conforme mayor sea la amplitud del componente, mayor número de células vecinas se verán afectadas. El segundo es que la información que transmite la neurona aferente conectada a un pequeño grupo de células pilosas externas contribuye a codificar la mayor o menor amplitud de la pequeña zona en la que están ubicadas. Dado que estas células pilosas externas son las encargadas de retroalimentar los movimientos resonantes de la membrana basilar, la mayor o menor tasa de disparos de la neurona a la que están conectadas contribuirá a informar sobre la mayor o menor amplitud de la oscilación en esa zona.
Así pues, la forma en la que se realiza la codificación de la información auditiva explica que, a pesar de que nuestra audición es esencialmente frecuencial (es decir, procede del análisis espectral realizado mecánicamente por la membrana basilar), haya tanta coincidencia, como hemos podido comprobar en otros capítulos, entre lo que vemos en la forma temporal de la vibración sonora y el sonido que percibimos.
Todo este conjunto de mecanismos neuronales que sirven para codificar las señales analógicas provenientes de las células pilosas del órgano de Corti suministran la base sobre la cual se realizan complejos algoritmos de procesamiento de la información auditiva, a lo largo de los diversos centros cerebrales por los que atraviesa. Pero el funcionamiento preciso de todo ello no es todavía suficientemente conocido y se escapa del objetivo de este capítulo.

Conclusión

Podemos concluir que nuestra percepción del sonido se fundamenta en el análisis frecuencial que se realiza en la membrana basilar en el interior de la cóclea. La evidente afinidad entre la forma de la vibración y nuestra percepción auditiva se debe a que el analizador mecánico de la cóclea conserva una gran parte de la información que se encuentra en la señal en el tiempo, pues no sólo recoge y transmite la amplitud de cada componente presente en la señal, sino que también atiende en cierta medida a la fase. La gran densidad de información frecuencial que llega a nuestro cerebro le permite recuperar una parte importante del contenido temporal de la señal sonora.

- Capítulo siguiente: Capítulo 13. Psicoacústica musical

- Capítulo anterior: Capítulo 11. El timbre