Capítulo 3. Características de los sonidos musicales

RESUMEN: Este capítulo explica cuáles son las características específicas del sonido musical y en qué se diferencia del resto de los sonidos. Mediante vídeos fabricados a partir de imágenes obtenidas mediante Matlab, a modo de un osciloscopio virtual, compara las vibraciones de diferentes tipos de sonidos, musicales y no musicales: ruido blanco, sonido simple, ruido de tráfico, notas de clarinete, sonido de campanas, notas de piano, sonidos del habla y del canto. De ese modo permite comprender que un sonido musical se caracteriza porque su vibración es lo suficientemente periódica y duradera como para que podamos reconocer en ella una altura tonal.

Introducción

Imaginemos que hacemos escuchar a un grupo de personas de distintas edades, culturas y formación musical varios fragmentos sonoros y les pedimos que nos digan en cada caso cuándo se trata de música y cuándo no. Con independencia de instrumentos, de afinaciones y escalas o de su procedencia cultural, nadie dudará en decir si lo que está escuchando es música o no lo es.
En efecto, distinguimos con facilidad los sonidos propios de la música del ruido que produce un atasco de tráfico, o del murmullo de una fuente de agua, o de las palabras de una conversación, por poner unos ejemplos. Ciertamente, hay circunstancias en las que esta distinción no resulta tan obvia, como, por ejemplo, cuando en una obra musical contemporánea se utilizan los ruidos procedentes de una fábrica. Pero, al margen de casos similares, todos sabemos reconocer si lo que está sonando son o no son sonidos musicales.
Ahora bien, ¿en qué consisten estas diferencias que percibimos? ¿Las señales de audio que contienen información musical tienen alguna particularidad que las hace distintas de otros tipos de señales sonoras? ¿Por qué el ruido se considera lo opuesto al sonido musical? Este capítulo va a tratar de responder a estas cuestiones, mostrando las peculiaridades que poseen las vibraciones de los sonidos que consideramos musicales.

Ruido y sonido musical

Habitualmente se contrapone el sonido musical al ruido. Si bien esta oposición es de gran utilidad para ayudarnos a entender qué es lo específico del sonido musical, necesitamos precisar antes qué entendemos por sonido musical y en qué sentido usamos la palabra ruido, pues este término tiene varias acepciones.
Cualquier sonido puede ser utilizado con un propósito musical, como, por ejemplo, los sonidos de los instrumentos de percusión, los efectos sonoros que se generan en la música electrónica o los ruidos diversos que se pueden incluir dentro de una obra de música. Pero por sonido musical, en sentido estricto, vamos a entender aquí solamente aquel sonido en el que podemos identificar una altura tonal, es decir, aquél del que podemos decir que es un re o un la o cualquier otra nota.
Por otra parte, en el sentido cotidiano del término, ruido es cualquier sonido no deseado. Así, si el vecino de al lado está escuchando ópera y a mí no me apetece nada oír la ópera que pone mi vecino, esa ópera, paradójicamente, es ruido para mí. Este es el sentido en el que se utiliza la palabra ruido en acústica ambiental, donde el objetivo es atenuar las molestias que el sonido indeseado puede ocasionar.
Así mismo, desde el punto de vista de la Teoría de la Información, ruido es cualquier perturbación en la transmisión del mensaje. Por poner un ejemplo similar al anterior, si estoy hablando por el móvil en una cafetería en la que está sonando música a un volumen muy elevado, el sonido de la música, aunque parezca también paradójico, es un ruido que perturba mi comunicación y que altera la transmisión de la información al colarse en el canal por el que viaja la conversación.
Aquí, sin embargo, vamos a usar el término ruido en un sentido distinto. Ruido va a ser lo opuesto al sonido musical. Así pues, ruido será una masa de sonido indiferenciado de la que nunca podríamos extraer notas musicales individuales. Del ruido, cómo mucho, podremos decir que es grave o que es agudo o que predominan en él los tonos medios, pero nunca podremos intuir, ni siquiera remotamente, una nota musical.
Pero, ¿son tan claras las cosas?, ¿es tan nítida esta separación?, ¿qué es el habla, ruido o sonido musical?, ¿y el sonido de una campana? A continuación intentaré responder a estas cuestiones, utilizando una serie de ejemplos que nos van a permitir comparar por medio del osciloscopio las vibraciones de los sonidos específicamente musicales con las de otros sonidos que no lo son.

Ruido blanco y sonido simple

Antes de entrar en la observación de señales reales, voy a presentar dos sonidos generados artificialmente que definen los polos opuestos entre los que se mueven los sonidos naturales: el ruido blanco y el sonido simple. En un extremo, el ruido blanco —llamado así por analogía con la luz blanca— contiene todas las frecuencias del espectro con la misma intensidad. En el otro extremo, el sonido simple posee una sola frecuencia que se mantiene estable durante toda su duración y es el paradigma del sonido musical.
Para comparar cómo es la forma de la vibración en ambos casos, he construido un vídeo en el que se observa en el osciloscopio un fragmento de ruido blanco seguido de un sonido simple de 440 Hz.

Figura 1. Vídeo que simula un osciloscopio con un fragmento de ruido blanco y otro de un sonido simple de 440 Hz.

Durante toda la primera parte del vídeo, cuando suena el ruido blanco, resulta imposible identificar alturas tonales, notas musicales. Aun es más, ni siquiera podríamos responder a la pregunta de si este sonido es agudo o grave. En principio, el chisporroteo de la parte aguda es lo que resulta más evidente, pero con un poco de esfuerzo podemos distinguir también el ronroneo de los graves. Esta diferencia de apreciación se debe a que nuestro oído no responde a todas las frecuencias por igual, sino que es más sensible a la banda situada entre los 2.000 y los 5.000 Hz. Pero, al margen de las irregularidades de nuestra sensibilidad auditiva, en el vídeo podemos apreciar que este sonido contiene todas las frecuencias del espectro audible, de la misma manera que la luz blanca contiene todos los colores visibles.
En la segunda parte del vídeo, sin embargo, la situación es completamente distinta. Todos oímos una nota musical, en concreto, un la4 afinado a 440 Hz, la nota que habitualmente sirve de referencia para definir la afinación estándar.
Atendamos ahora a la señal de audio, al dibujo que traza la vibración y que se observa en el osciloscopio. Cuando suena el ruido blanco la gráfica va cambiando aleatoriamente a lo largo del tiempo y no hay manera de reconocer en ella ningún orden. Si paramos el reproductor del vídeo en un cuadro cualquiera, veremos una imagen similar a la siguiente:

Figura 2. Gráfica de la señal de audio de ruido blanco.
Figura 2. Gráfica de la señal de audio de ruido blanco.

Vemos en esta gráfica que el movimiento de la vibración no posee forma alguna, ni siquiera se aprecia una tendencia. Por consiguiente, no hay nada que nos permita predecir cómo va a continuar, es absolutamente indeterminado. Esto se debe a la manera en la que ha sido generada esta señal: para calcular el valor de las muestras he utilizado una secuencia de números aleatorios, como si hubiera echado a suertes el valor de cada muestra en una lotería en la que estuvieran todos los números posibles, sin que los valores que hubieran salido previamente influyeran en las probabilidades de los siguientes. Así pues, la señal de audio del ruido blanco es completamente aleatoria.
Por el contrario, en la segunda parte del vídeo, mientras suena el sonido simple, la gráfica que dibuja la vibración en la pantalla del osciloscopio tiene una forma definida: una serie de eses iguales. Si paramos el reproductor del vídeo obtendremos una imagen como ésta:

Figura 3. Gráfica de la señal de audio de un sonido simple de 440 Hz.
Figura 3. Gráfica de la señal de audio de un sonido simple de 440 Hz.

Al ver la gráfica de esta nota simple podemos predecir con total seguridad cómo va a continuar. Ello se debe a que los valores de las muestras de esta señal han sido obtenidos mediante una función matemática. Por ello decimos que la señal de audio de un sonido simple es puramente determinista.
Y, lo que es más importante, en esta gráfica distinguimos que la forma se repite en intervalos de tiempo exactamente iguales, es decir, existe un periodo de repetición. Podemos apreciar que en las 50 milésimas de segundo de la gráfica se han sucedido 22 oscilaciones completas; en un segundo, por lo tanto, se habrán producido 440 oscilaciones. Vemos, así pues, que la frecuencia de este sonido, el número de oscilaciones completas que se producen en un segundo, es de 440 hercios. Nos encontramos con un concepto que es esencial al sonido musical: la periodicidad de la vibración. Esta periodicidad de la vibración es la que posibilita que nuestro sistema auditivo reconozca una altura tonal, es decir, una nota musical.
Mediante este vídeo hemos podido observar las dos referencias extremas de las señales sonoras: la señal puramente aleatoria, la indeterminación absoluta, por un lado, y la señal totalmente predecible, la determinista pura, por otro. O, visto de otra manera, la máxima complejidad, la reunión infinita de todas las frecuencias audibles posibles, frente a la máxima simplicidad, un sonido con una sola frecuencia siempre estable.
Pero la realidad no es nunca ni totalmente impredecible ni completamente determinada. Solo en el caso de sonidos generados artificialmente podremos obtener tanto una máxima predictibilidad como una máxima impredecibilidad. Ambas señales, el ruido blanco y el sonido simple, son dos formas paradigmáticas de los constituyentes que están presentes en la mayoría de los sonidos reales, es decir, vienen a ser las referencias ideales entre las que se mueven los sonidos naturales.

Tráfico con lluvia y notas de clarinete

Comparemos ahora dos situaciones acústicas naturales de índole opuesta: por un lado, el ambiente sonoro de una ciudad en un día de lluvia y con tráfico abundante y, por otro, unas pocas notas de clarinete tomadas de los compases iniciales de la Rapsodia para piano y clarinete de Claude Debussy.

Figura 4. Vídeo que simula un osciloscopio con ruido de tráfico en un día lluvioso, en la primera parte, y cinco notas de clarinete de la Rapsodia para piano y clarinete de C. Debussy, en la segunda.

Durante la primera parte, el ambiente sonoro de fondo del tráfico con lluvia nos recuerda el ruido blanco que hemos oído en el vídeo anterior. Sin embargo, nos damos cuenta enseguida que ahora tienen más presencia los componentes graves. Podríamos decir, siguiendo la analogía de los colores, que esta sonoridad tiende al rojo, la parte inferior del espectro. Esto es debido a la aportación que hace el tráfico al sonido de la lluvia.
Si detenemos el vídeo en los segundos iniciales observaremos una imagen similar a la siguiente:

Figura 5. Gráfica de la señal de audio de ruido de tráfico con lluvia.
Figura 5. Gráfica de la señal de audio de ruido de tráfico con lluvia.

Vemos en esta señal que, igual que en el caso del ruido blanco, ni hay periodicidad alguna ni resulta posible predecir con seguridad el valor de cualquier muestra a partir de las que le preceden. Sin embargo, el grado de aleatoriedad es ahora menor, pues las muestras anteriores sí influyen en las posibilidades de la que viene a continuación. En efecto, en la gráfica podemos apreciar, tomando como referencia una muestra cualquiera, que los valores más próximos a las muestras inmediatamente anteriores son más frecuentes que los más alejados. Esto explica que la gráfica, aun siendo una línea quebrada, mantenga una cierta continuidad. Cuando analicemos esta señal mediante el análisis espectral entenderemos mejor el significado de todo esto.
Por otro lado, en medio de este ruido rojo de fondo, podemos distinguir varios acontecimientos sonoros. Oímos el motor de un coche que acelera, con lo que su sonido se va haciendo más agudo y se incrementa su volumen. Oímos también otros coches más lejanos. Y ya casi al final de esta primera parte del vídeo escuchamos la bocina de un coche. Si prestamos atención, nos damos cuenta de que esta bocina está dando una nota musical, en concreto, una nota que podríamos situar entre un sol4 y un lab4. En el osciloscopio podemos ver que la señal, que hasta entonces era claramente aleatoria, parece adquirir en ese momento cierta periodicidad.
En la segunda parte del vídeo, sin embargo, todos oímos con claridad las cinco notas del clarinete (la4, si4, solb4, mib4, re4). Puede que quien no tenga oído absoluto o sus conocimientos de música sean menores no sea capaz de darles nombre, es decir, no pueda determinar si se trata de un la o de un si, pero todos sabemos que lo que suena son notas musicales.
Podemos observar también que mientras está sonando cada una de las notas, la gráfica que aparece en la pantalla del osciloscopio es bastante estable, pues la vibración se repite de manera parecida durante la duración de la nota. Por eso, ahora también podemos hablar de una forma de la vibración, como ocurría en el caso del sonido simple, si bien se trata de una forma más compleja que una sencilla ese. Como se explica en el capítulo dedicado al sonido armónico, la forma de ese dibujo tiene que ver con la cualidad del sonido, con el hecho de que sea más suave o más áspero, por poner un ejemplo.
Si paramos el reproductor del vídeo cuando suena la nota si4, obtendremos una gráfica parecida a la siguiente:

Figura 6. Gráfica de la señal de audio de una nota de clarinete.
Figura 6. Gráfica de la señal de audio de una nota de clarinete.

Puesto que hay una forma que se repite, podremos hablar aquí también de periodo de la oscilación y, a partir de ahí, deducir su frecuencia. En efecto, en esta gráfica, que representa 50 milésimas de segundo, podemos distinguir casi 25 oscilaciones, pues la última no está del todo completa, por lo que deducimos que en un segundo se habrán producido un poco menos de 500 oscilaciones. Esta frecuencia de 500 Hz es ligeramente superior al valor que esperaríamos para la nota si4 en la afinación estándar (493,9 Hz), pero se aproxima bastante a la frecuencia real de la nota que estamos escuchando (497 Hz).
Y, puesto que existe una forma, es posible también predecir cómo va a continuar la señal en las próximas milésimas de segundo, a no ser, claro está, que se produzca algún cambio repentino, como, por ejemplo, que empiece a sonar otra nota.
Así pues, hemos podido observar que durante la primera parte del vídeo, en el tráfico con lluvia, predomina la aleatoriedad, por lo que la señal de audio que vemos en el osciloscopio tiene muchos rasgos en común con la del ruido blanco que hemos analizado en el apartado anterior. Durante la segunda parte del vídeo, sin embargo, cuando suenan las notas del clarinete, hemos comprobado que la señal tiende a ser de tipo determinista y también hemos podido apreciar con claridad su periodicidad.
Mediante los ejemplos que hemos estudiado hasta ahora podemos obtener la idea general de que el ruido se corresponde con el desorden, con la aleatoriedad, con la imposibilidad de predecir lo que va a suceder a continuación, mientras que el sonido musical tiene que ver con el orden, la predictibilidad y, lo que es más importante, con la periodicidad.

Campanadas y notas de piano

Ahora bien, ¿son tan claras las cosas? ¿Hay una línea que delimita con nitidez las vibraciones propias de los sonidos musicales? ¿Podemos determinar con precisión dónde empieza el sonido musical y dónde termina el ruido? E incluso más, ¿hay siempre una separación clara entre los sonidos periódicos y los que no lo son? La respuesta es que no, que en medio hay un amplio territorio difuso. Ciertamente, hay sonidos que no pueden ser considerados como ruidos, pero que tampoco son propiamente periódicos; y hay sonidos que son claramente musicales, pero que están lejos de ser estrictamente periódicos.
A continuación vamos a comparar dos sonidos que pertenecen a esta zona intermedia que se encuentra lejos de los extremos opuestos de la pura aleatoriedad y la periodicidad estricta, es decir, lejos del ruido blanco y del sonido simple. Se trata del sonido de una campana de iglesia y el de una nota de piano, en concreto un sol3.

Figura 7. Vídeo que simula un osciloscopio con el sonido de una campana, en la primera parte, y el de una nota de piano, en la segunda.

Podemos apreciar en el vídeo que existe un gran parecido en la forma en la que evoluciona la vibración de los dos sonidos. Ciertamente, ambos son sonidos percutidos, por lo que las vibraciones que observamos en el osciloscopio tienen bastantes semejanzas: el ataque es muy rápido y abrupto, ruidoso en ambos casos, y va seguido de un decrecimiento inmediato que conduce a un nivel sonoro considerablemente más bajo; una vez alcanzado ese nivel, el sonido prolonga su duración durante bastante tiempo, decayendo lentamente.
Todo este proceso va acompañado de un cambio constante en la cualidad del sonido, pues con el paso del tiempo se van extinguiendo progresivamente los componentes más agudos. Por eso vemos en el osciloscopio que la forma de la vibración se va haciendo cada vez más sencilla, hasta recordar al final la gráfica de un sonido simple.
Pero, aunque el sonido de la campana y el del piano tienen todos estos rasgos en común, ambos se diferencian en algo que es fundamental para discernir si son sonidos musicales: la posibilidad de atribuirles una altura tonal. Cuando suenan las notas del piano todos percibimos una altura tonal que permanece constante, aquí en concreto un sol3. Pero si tratamos de responder a la pregunta de qué nota está dando la campana, nos encontraremos que durante la mayor parte de su duración no podemos dar una respuesta, y sólo al final, en la parte que queda resonando, podemos apreciar una altura tonal clara, un lab4 un poco bajo. Por ello, podemos afirmar que en el caso del sonido de esta campana estamos al otro lado de la frontera que delimita el sonido musical.
Esta diferencia que percibimos al oír ambos sonidos responde a las diferencias que se producen en la vibración, como podemos observar en las dos señales de audio. En el caso de la campana, a excepción de la resonancia final donde la forma de la vibración es similar a la de un sonido simple, no podemos reconocer en la gráfica ninguna periodicidad, si bien comprobamos que está muy lejos de las gráficas del ruido blanco o del ruido de tráfico que hemos observado en los vídeos anteriores.
Para apreciar esto con claridad, veamos las gráficas que se obtienen si paramos el vídeo en un momento cualquiera en pleno sonido de la campana, primero, y del piano, después.

Figura 8. Gráfica de la señal de audio de un sonido de campana.
Figura 8. Gráfica de la señal de audio de un sonido de campana.

La gráfica de la campana no muestra ninguna periodicidad, lo que explica que no podamos apreciar una nota determinada, pero lo cierto es que tampoco presenta una gran complejidad. Su aspecto no es el de una señal aleatoria. Más bien su forma nos llevaría a pensar que pudiera tratarse de varias notas musicales sencillas de frecuencias diferentes que estuvieran sonando a la vez. De hecho, una persona entrenada o un profesional de la afinación podría extraer algunos de los componentes frecuenciales que constituyen este sonido.

Figura 9. Gráfica de la señal de audio de una nota de piano.
Figura 9. Gráfica de la señal de audio de una nota de piano.

En la gráfica del piano la situación es diferente. A pesar de que ni siquiera durante este breve intervalo de 50 milésimas de segundo, la forma que dibuja la vibración se repite idénticamente igual, sí es posible reconocer en ella una forma compleja que, aun con variaciones, se renueva cada cierto intervalo exacto de tiempo. Por lo tanto, aunque no podamos decir que esta señal sea estrictamente periódica, sí podemos afirmar sin ninguna duda que posee un periodo de oscilación que se mantiene constante y que posibilita el reconocimiento de una altura tonal. En efecto, en esta gráfica podemos contar aproximadamente unas nueve oscilaciones y media, lo cual correspondería a una frecuencia de 190 Hz, muy próxima a la frecuencia real del sol3 que está sonando, 196 Hz.
Movimiento vibratorio periódico, en un sentido estricto, significa que el movimiento tiene que repetirse exactamente igual cada cierto intervalo de tiempo, su periodo. Pero en el caso de una nota musical real, como ésta que estamos observando, con toda su complejidad, la periodicidad no es perfectamente estricta. Su oscilación es compleja, por lo que la forma que se repite no es exactamente igual, sino que va evolucionando con el paso del tiempo, y eso es lo que le proporciona su riqueza sonora. Y no sólo su forma va cambiando, sino que también con el paso del tiempo varía su amplitud.
No obstante, a pesar de todos estos cambios e inestabilidades, en ese intervalo de tiempo de 50 milésimas de segundo que estamos observando, la forma de la vibración de esta nota de piano resulta lo suficientemente periódica como para poder percibir una altura tonal. Este es el estado que predomina en los sonidos musicales reales, salvo en los momentos en los que se producen cambios abruptos, como, por ejemplo, en el inicio de una nueva nota.
Así pues, la frontera que delimita el sonido musical reside en que su vibración sea lo suficientemente periódica como para poder percibir una altura tonal determinada.

Habla y canto

Hemos visto hasta ahora que la periodicidad es esencial al sonido musical. Pero, ¿podemos afirmar que todos los sonidos que muestran cierta periodicidad son musicales? ¿Qué sucede con los sonidos del habla? Vamos a comparar ahora en el osciloscopio las vibraciones de los sonidos del habla con los del canto, a fin de precisar con más nitidez qué es lo específico del sonido musical.
Para estudiar estas diferencias he fabricado un vídeo en el podremos observar con detalle las particularidades que adquieren los sonidos del habla cuando reciben música. En la primera parte se presenta la señal de audio de un breve fragmento hablado de una locutora de radio y, en la segunda, la señal de un pequeño fragmento cantado, en concreto, el inicio del Lamento de Ariadna de Claudio Monteverdi. En ambos casos se trata de sonidos propios del habla; la única diferencia es que en el segundo la prosodia natural del lenguaje hablado ha sido sustituida por la melodía del canto. Mediante este vídeo podremos ver en qué se diferencia la vibración de los sonidos en los que podemos reconocer de qué vocal se trata (si es una a o es una e, por poner un ejemplo) de otros sonidos en los que, además de reconocer su fonema, percibimos claramente una nota musical.

Figura 10. Vídeo que simula un osciloscopio con un fragmento de una locutora de radio, en la primera parte, y el inicio del Lamento de Ariadna, en la segunda.

El texto de la locutora es:
“Dice: Pero no se pueden aceptar normas éticas a la carta. La sociedad necesita criterios reconocibles, saber que las varas de medir se aplican a todos por igual”.
La letra del Lamento de Ariadna es:
Lasciáte mi morire”.
Y las notas musicales que van sobre cada sílaba, respectivamente, son:
la4, sib4, fa4, fa4, mi4, mi4, mi4.
En la primera parte, durante el enunciado de la locutora, podemos ver en el osciloscopio que la vibración va alternando rápidamente entre unas formas breves, pero periódicas, que recuerdan a las de los sonidos musicales, y otras, mucho más breves todavía, de aspecto aleatorio, similares a las del ruido. Esta alternancia corresponde, simplificando un poco, a la que se produce en el habla entre las vocales y las consonantes.
Por el contrario, en el fragmento del canto vemos constantemente formas periódicas claramente reconocibles. Podemos apreciar que cambian con el texto y con la música, incluso que durante la emisión de la misma vocal van modificando su forma y su amplitud, pero se reconoce en ellas un patrón lo suficientemente estable como para concluir que son sonidos musicales, incluso si simplemente los viéramos en el osciloscopio, sin oír lo que suena.
Veamos la gráfica de un pequeño fragmento de la primera parte del vídeo en la que podemos apreciar muy bien cómo se articula el lenguaje hablado, es decir, cómo los sonidos consonánticos se unen con los vocálicos para formar la cadena hablada. La gráfica corresponde al momento en el que la locutora pronuncia la palabra “éticas”. He elegido ahora una duración más extensa que la ventana de observación que he utilizado en los vídeos del osciloscopio, a fin de presentar un panorama general de la vibración cuando se emite una palabra completa. La duración de este fragmento es de 400 milésimas de segundo, es decir, ocho veces mayor que el de la ventana del vídeo, lo que explica que las formas de la vibración se vean ahora mucho más apretadas.

Figura 11. Gráfica de la señal de audio correspondiente a la emisión de la palabra “éticas”.

La parte de la señal correspondiente a cada fonema está delimitada por unos corchetes. Aunque es imposible una separación precisa, responde bastante fielmente a la realidad de lo que oímos. Podemos apreciar que existe una diferencia muy clara entre la forma de la vibración de las consonantes y la de las vocales: las vocales son claramente periódicas, mientras que las consonantes no son periódicas y tienden al ruido. Observamos también que las consonantes oclusivas, la t y la k, son muy breves, mientras que la s es bastante más larga y relativamente parecida al ruido blanco.
Si midiéramos mediante un editor de sonido el periodo de cada una de las vocales y, a partir de ello, dedujéramos su altura tonal, comprobaríamos que la sílaba acentuada é es casi un semitono más aguda que la vocal siguiente i y cerca de semitono y medio más alta que la tercera vocal a, cuya sílaba, sin embargo, es la que tiene más intensidad sonora y mayor duración.
Comprobamos que en español el acento de la palabra no se produce ni por una mayor intensidad sonora ni por un alargamiento de la duración, sino por una elevación de la altura tonal, lo cual justifica que se llame “sílaba tónica” a la que va acentuada. Así pues, al margen de la entonación general propia de la prosodia, la relación de agudeza y gravedad entre los sonidos de la cadena hablada explica nuestra distinción entre sílabas acentuadas y sin acentuar, como podemos apreciar si volvemos a escuchar con detenimiento cómo suena la palabra “éticas”.
Pero lo que interesa ahora es responder a la pregunta siguiente: ¿las vocales, cuyo movimiento vibratorio es periódico, son propiamente sonidos musicales? Lo cierto es que no oímos una nota musical cuando suenan. La razón de que, en principio, en la cadena hablada no identifiquemos una nota musical cuando se emite una vocal, a pesar de que se trata de un sonido periódico, reside en la brevedad de la parte periódica. En efecto, vemos que cada vocal apenas llega a completar unos pocos ciclos. Esto, debido al constante entrecortarse en su articulación con el sonido consonántico vecino, impide que reconozcamos esa periodicidad y que la apreciemos como un sonido musical.
Para observar un detalle de la forma de la vibración cuando se emite la sílaba ti, presento una gráfica que tiene la misma duración que la ventana de observación de los vídeos y en la que he hecho zoom en la amplitud, que ha quedado delimitada entre -0,4 y 0,4.

Figura 12. Gráfica de la señal de audio correspondiente a la emisión de la sílaba ti.
Figura 12. Gráfica de la señal de audio correspondiente a la emisión de la sílaba “ti”.

Vemos que el periodo de la vocal i es un poco más de 5 milésimas de segundo, lo que corresponde a una frecuencia ligeramente inferior a 200 Hz, es decir, se trata aproximadamente de un sol3. Pero la duración de este sonido es muy breve: solo se observan entre cuatro y cinco ciclos completos, lo que explica que no oigamos ninguna nota musical cuando suena esta sílaba.
En el fragmento del canto, sin embargo, la situación es totalmente distinta. En la gráfica de abajo, correspondiente a la vocal a de la primera sílaba, las, podemos ver que la señal permanece claramente estable al menos durante todo el tiempo que dura la observación.

Figura 13. Gráfica de la señal de audio correspondiente a la vocal “a” cantada.

Vemos que durante las 50 milésimas de duración la señal permanece estable, lo cual es suficiente para que se pueda percibir una altura tonal. Conforme evolucione el sonido, incluso durante la propia emisión de la vocal a, se modificará la forma, la amplitud e incluso el periodo, pero, al margen de estas modificaciones, el sonido en el canto es lo suficientemente estable y duradero como para permitirnos apreciar con claridad una altura tonal. Por poner un ejemplo, si emitimos al hablar la vocal a, no pensaremos que estamos dando una nota musical; ahora bien, si prolongamos la duración de la vocal y nos esforzamos en mantener constante la misma altura tonal, enseguida nos daremos cuenta de que estamos emitiendo una nota musical.
Así pues, el requisito de “suficientemente periódico”, que hemos reconocido en el apartado anterior como necesario para determinar que un sonido sea musical, exige también una cierta duración, es decir, necesitamos que la periodicidad se mantenga durante el suficiente tiempo como para que nuestro sistema perceptivo sea capaz de apreciar una frecuencia, y con ella, una altura tonal.

Conclusión

A lo largo de este capítulo hemos podido apreciar las características que posee el sonido musical. Ayudándonos de la señal de audio que queda representada en el osciloscopio, hemos comparado lo que oímos cuando escuchamos un sonido musical, con lo que oímos cuando se trata de sonidos ruidosos y de otros de cualidad intermedia, de modo que hemos podido experimentar que un sonido es considerado por nuestra percepción auditiva como musical cuando su vibración es lo suficientemente periódica y duradera cómo para que podamos reconocer una altura tonal.


No hay comentarios: