L'orecchio come analizzatore critico sonoro
La capacità critica soggettiva e oggettiva dell'orecchio
compilato da Marco Stefanelli, PhD
L'orecchio, come l'occhio, è in grado di "mettere a
fuoco" e analizzare particolari bande di frequenze.
Quando si ascolta un'orchestra siamo in grado di
concentrare l'attenzione e quindi l'ascolto su alcuni singoli strumenti oppure
se ascoltiamo un gruppo di cantanti siamo in grado di individuare il primo
tenore, il baritono o il basso.
Cio' è possibile grazie ad una sorprendente capacità
della combinazione orecchio/cervello/osservatore, l'osservatore in questo caso
corrisponde all'ascoltatore, che in ultima analisi è il nostro sé interiore.
Nel canale uditivo tutti i suoni sono mescolati, come fa
l'orecchio a distinguerli?
La superficie del mare può essere agitata da molti tipi
di onde, uno dovuto al vento locale, uno ad una tempesta lontana, altri ancora
creati dal passaggio di imbarcazioni, ma l'occhio, a differenza dell'orecchio,
non è in grado di separare le onde più complesse. Un orecchio ben addestrato è
invece in grado di ascoltare una esecuzione di violino di un brano musicale
individuando le varie armoniche superiori, distinguendole dalla fondamentale.
Se si ascoltano contemporaneamente suoni a 1000, 1200, e
1400 Hz (Hertz), si percepisce anche un suono con frequenza di 200 Hz. Tale
frequenza può essere interpretata come la fondamentale, con 1000 Hz come quinta
armonica, 1200 Hz come sesta armonica ecc.
Questo effetto molto interessante ha spiegazioni
controverse. Le ipotesi scientifiche più recenti suppongono che il sistema
uditivo sappia riconoscere che i segnali superiori sono le armoniche di 200 Hz
e che esso fornisca la fondamentale mancante che le avrebbe generate.
La distinzione tra misurazioni fisiche e sensazioni
soggettive sembrerebbe escludere la possibilità di usare l'orecchio per
misurazioni fisiche. E' vero che non possiamo ottenere letture digitali
fissando qualcuno negli occhi o... negli orecchi, ma questi ultimi sono pur
sempre in grado di operare confronti molto precisi. Un ascoltatore può
riconoscere differenze di livello sonoro di circa 1 dB per quasi tutta la banda
udibile se il livello è ragionevole. In condizioni ideali si riesce a percepire
anche un cambiamento di un terzo di decibel. A livelli ordinari, per frequenze
inferiori a 1000 Hz, l'ascoltatore è in grado di avvertire differenze fra note
separate in frequenza solo dello 0,3 %, ovvero di 0,3 Hz a 100 Hz e di 3 Hz a
1000 Hz.
Harvey Fletcher sottolinea come la straordinaria finezza
dell'udito umano gli sia stato di grande aiuto nelle sue ricerche sulla sintesi
dei suoni.
Studiando i suoni del pianoforte inizialmente pensò che
fosse sufficiente misurare la frequenza e l'ampiezza della fondamentale e delle
armoniche e poi combinarle con i valori di attacco e di caduta, ma il risultato
fu deludente perché gli ascoltatori esperti all'unanimità rilevarono che i
suoni sintetici non assomigliavano a quelli di un pianoforte, ma piuttosto alle
note di un organo. Altri studi rilevarono il fatto, peraltro già noto da tempo,
che le corde del pianoforte sono molto rigide e posseggono le proprietà sia di
canne solide che di corde tese. La conseguenza di ciò è che le parziali del
pianoforte hanno frequenze non armoniche. Correggendo le frequenze di quelle che
si ritenevano essere armoniche (frequenze multiple intere della fondamentale)
gli ascoltatori esperti non erano più in grado di distinguere fra il suono del
pianoforte sintetizzato e quello reale.
La capacità critica dell'orecchio nel confrontare la qualità
del suono aveva fornito la chiave per la soluzione del problema.
Le bande critiche dell'orecchio lo rendono un
analizzatore del suono. Queste bande corrispondono approssimativamente a terzi
di ottava.
La conoscenza delle bande critiche dell'orecchio con
funzione di filtro potrebbe far scattare il desiderio di analizzare rumori con
spettro ampio e continuo, come quello del traffico, del sottofondo subacqueo,
della risacca del mare, del rumore del ruscello ecc. usando l'apparato uditivo
invece di ricorrere ad attrezzature pesanti e costose per l'analisi del suono.
E così sarà successo ad Harvey Fletcher, il primo a proporre l'idea delle bande
critiche, e a molti studiosi in questo campo che hanno successivamente
approfondito l'argomento.
L'approccio generale dell'esperimento è quello di far
partire una registrazione del rumore da analizzare e miscelarla con un segnale
proveniente da un oscillatore a frequenza variabile. La combinazione viene
amplificata e ascoltata in una cuffia con risposta in frequenza piatta.
L'oscillatore viene posizionato per esempio a 1000 Hz e l'ampiezza della sua
uscita viene regolata fino a quando il segnale è coperto o mascherato dal
rumore.
Soltanto il rumore nella banda critica centrata su 1000
Hz contribuisce a mascherare il segnale.
Se la registrazione e tutto il sistema di misurazione
(compreso l'orecchio dell'osservatore/ascoltatore) sono calibrati, si possono
ottenere livelli assoluti per lo spettro del rumore.
Ciò che conta veramente è avere la consapevolezza che nel
nostro orecchio è presente una serie di filtri in grado di realizzare l'analisi
del suono, al di là del fatto che questo metodo possa mai sostituire una buona
attrezzatura per l'analisi del livello sonoro dotata di filtri da un'ottava e
da un terzo di ottava.
Le bande critiche spiegano il fenomeno del
"mascheramento": se in un segnale si trovano più frequenze, tutte
comprese in una di queste bande critiche, esso sarà percepito con la stessa
intensità di un segnale contenente un solo tono puro di frequenza pari al
centrobanda; se la distanza fra le componenti del segnale eccede la banda
critica, l'intensità percepita sarà maggiore.
La larghezza di queste bande critiche è più o meno
costante prima dei 1000 Hz e segue una legge lineare dopo i 1000 Hz; si va da
100-150 Hz con un centrobanda di 150 Hz a 1300 Hz con un centrobanda di 7 kHz.
Esiste ancora un profondo divario fra giudizio soggettivo
sulla qualità del suono, l'acustica di un ambiente ecc. e una misurazione
oggettiva. La questione è in continua evoluzione. Si considerino per esempio i
termini descrittivi che vengono spesso usati per descrivere l'acustica di una
sala da concerto: calore, chiarezza, brillantezza, definizione, risonanza,
riverberazione, bilanciamento, pienezza di tono, miscelazione, vitalità,
intimità, sonorità, scintillazione ecc.
Che tipo di strumento può misurare la
"vitalità" o la "brillantezza"?
E come individuare un test per la loro
"definizione"?
Per questo esame prendiamo in considerazione, appunto, la
"definizione", che corrisponde alla chiarezza e la distiguibilità di
un suono. Essa può essere misurata considerando l'energia di un ecogramma
durante i primi 50-80 ms (millisecondi) e rapportandola con l'energia di tutto
l'ecogramma.
Ciò permette il confronto tra il suono diretto unitamente
ai primi suoni riflessi, che vengono integrati dall'orecchio, e l'intero suono
riverberante.
Questa misurazione relativamente diretta di un suono
impulsivo generato da una pistola o da un pallone che scoppia, lascia
intravedere concrete possibilità di mettere in relazione la definizione del
termine descrittivo e una misurazione oggettiva. Ma, probabilmente, ci vorrà
molto tempo ancora prima che tutti questi termini soggettivi possano tradursi
in misurazioni oggettive, anche se si tratta di questioni fondamentali
dell'acustica e soprattutto della psicoacustica.
A un certo punto dell'analisi anche le letture
strumentali devono cedere il passo ad osservazioni fatte direttamente dall'uomo
e gli esperimenti assumono allora una nuova qualità soggettiva.
Studiando la sensazione, per esempio, agli ascoltatori
esperti vengono proposti suoni diversi e ad ognuno viene chiesto di confrontare
la sensazione prodotta dal suono A rispetto a quella prodotta dal suono B o di
esprimere giudizi critici in altri modi. I dati trasmessi dagli esperti vengono
poi sottoposti ad analisi statistica, valutando così la dipendenza di stime
umane, come la sensazione, da misurazioni fisiche del livello sonoro.
Se il test è stato condotto correttamente e se è stato
coinvolto un numero sufficiente di esperti, i risultati sono attendibili. E' in
questo modo che possiamo venire a conoscenza del fatto che non c'è una
relazione lineare fra livello sonoro e sensazione, fra altezza e frequenza,
oppure fra timbro e qualità del suono.
Il nostro apparato uditivo integra le intensità sonore
per brevi intervalli e funziona praticamente come uno strumento di misurazione
balistico. In altre parole, se ci troviamo in una sala da concerti, l'orecchio
e il cervello mettono in atto la sorprendente abilità di raccogliere tutti i
suoni riflessi che arrivano entro 50 ms dal suono diretto e li combinano
(integrano) dando l'impressione che tutti questi suoni provengano dalla
sorgente originaria, anche se sono presenti suoni riflessi provenienti da altre
direzioni. L'energia sonora che viene integrata durante questo periodo fornisce
inoltre l'impressione di maggiore sensazione.
Non dovrebbe sorprendere il fatto che l'apparato uditivo
umano fonda tutti i suoni che arrivano entro un certo lasso di tempo perché,
dopo tutto, anche l'apparato visivo al cinema o alla televisione fonde una successione
di fotogrammi, dandoci l'impressione (illusione) di un movimento continuo. La
velocità di scorrimento dei fotogrammi è importante: ce ne devono essere almeno
16 al secondo (uno ogni 62 ms) per evitare di vedere una serie di immagini
ferme oppure un tremolio continuo. La fusione uditiva, invece, opera al meglio
durante i primi 20/30 ms; oltre i 50-80 ms cominciano a dominare eco separate.
Il nostro apparato uditivo è in grado di localizzare con
accuratezza la direzione di una sorgente sonora sul piano orizzontale, sul
piano mediano verticale la capacità di localizzazione è meno accurata.
Durante un esperimento, Haas dispose degli ascoltatori a
3 m da due altoparlanti, collocati in modo tale da formare un angolo di 45°,
con l'ascoltatore sulla bisettrice dell'angolo. Le condizioni erano pressoché
anecoiche. Agli ascoltatori veniva richiesto di regolare un attenuatore finché
il suono proveniente dall'altoparlante "diretto" pareggiasse quello
dell'altoparlante "ritardato". Haas passò poi allo studio degli
effetti delle variazioni del ritardo e scoprì che, entro un ritardo compreso
fra 5 e 35 ms, il suono proveniente dall'altoparlante ritardato doveva essere
aumentato di più di 10 dB rispetto a quello diretto affinché suonasse come
un'eco. Si parla in questo caso di effetto precedenza o effetto Haas.
In una stanza, l'energia sonora riflessa che giunge
all'orecchio entro 35 ms viene integrata con il suono diretto e percepita come
parte del suono diretto stesso piuttosto che come suono riverberante. Le prime
riflessioni di un suono servono dunque ad aumentarne la sensazione, come ha
detto Haas, danno luogo a "...una piacevole modificazione dell'impressione
sonora nel senso che ampliano la sorgente sonora primaria, mentre la sorgente
ecoica non è ancora percepita acusticamente in quanto tale".
In precedenza, alcuni ricercatori avevano scoperto che
solo i ritardi molto piccoli (inferiori a 1 ms) influivano sul discernimento
della direzione di una sorgente attraverso tempi di arrivo ai due orecchi
leggermente diversi. Ritardi maggiori di 1 ms non sembravano avere alcun
effetto sul nostro senso direzionale.
La zona temporale di transizione tra l'effetto integrante
per ritardi inferiori a 35 ms e la percezione del suono ritardato come eco
distinta è graduale e, pertanto, in qualche modo indefinita. Alcuni studiosi
ritengono più probabile l'intervallo di 1/16 di s (62 ms), altri quello di 80
ms e altri ancora quello di 100 ms, dopo che la manifestazione dell'eco
separata non è più messa in discussione.
Sebbene l'apparato uditivo non sia uno strumento di
misurazione oggettivo che fornisce valori assoluti, esso è comunque molto
preciso nel confrontare frequenza, livelli e qualità del suono.
Riferimenti web/bibliografici
- Michael Talbot - Smith, Manuale di Ingegneria del
suono, Hoepli 2010
- F. Alton Everest - Manuale di acustica, Hoepli 2010
- fisicaondemusica.unimore.it/Bande_critiche.html