Domanda:
Come puoi distinguere gli strumenti dalle loro caratteristiche timbriche?
Юрій Кравець
2016-05-11 00:41:38 UTC
view on stackexchange narkive permalink

Quello che sto cercando di ottenere è distinguere gli strumenti in base al loro timbro. Quello che ho letto finora mi ha fatto pensare che strumenti diversi abbiano un numero diverso di armoniche.

È possibile identificare uno strumento da un elenco di sovratoni / armoniche per ciascuno (o almeno alcuni) strumento rappresentato come, ad esempio, frequenze? O dipende dallo stato fisico di uno strumento?

O sto andando completamente nella direzione sbagliata e il timbro non è formato, tra l'altro, dal numero di armonici?

I commenti non sono per discussioni estese; questa conversazione è stata [spostata in chat] (http://chat.stackexchange.com/rooms/39587/discussion-on-question-by-yuriy-kravets-how-can-you-distinguish-instruments-by-t) .
http://physics.stackexchange.com/questions/78827/what-are-those-characteristics-by-which-every-sound-can-be-identified-uniquely/78829#78829
Correlati: È abbastanza difficile andare solo dal timbro all'orecchio, dipendiamo molto dall'attacco e dal decadimento di uno strumento https://www.youtube.com/watch?v=thD6TNUoyIk
@ViktorMellgren la migliore risposta è stata data da Todd Wilcox. Lo spiegò in modo più dettagliato di quanto fece Andrew Huang.
Tre risposte:
#1
+17
Todd Wilcox
2016-05-11 02:15:09 UTC
view on stackexchange narkive permalink

Un semplice elenco delle armoniche presenti non ti direbbe molto. Quello che vuoi veramente sono i livelli / intensità relativi di ogni armonica. Un elenco di armonici con intensità relative per uno strumento è chiamato spettro dello strumento. Potresti provare a cercare "spettro" per quelli che ti interessano di più. Ecco un esempio per un violino: enter image description here

Molti strumenti hanno praticamente le stesse identiche armoniche presenti e spesso con ampiezze relative molto simili. Ciò che è diverso in loro sono le ampiezze relative nel tempo . Il cambiamento nell'ampiezza di un armonico nel tempo è il suo inviluppo temporale . Gli inviluppi di tempo combinati dei diversi armonici (lo chiameremo semplicemente "inviluppo" per semplicità) è anche un aspetto critico del riconoscimento dello strumento.

Gli overton che sono relativamente stabili per un certo periodo di tempo sono chiamati parziali . Le sovratoni udibili solo per brevi periodi di tempo sono generalmente chiamate transienti e i transienti iniziali sono importanti per il riconoscimento dello strumento.

Gli aspetti importanti dello strumento intonato timbro riconoscimento sono l'inviluppo e lo spettro completo degli armonici, inclusi parziali e transitori.

Nota che anche i componenti minori del suono di uno strumento (inclusi i rumori , come il rumore del respiro) sono rappresentati nello spettro, principalmente come transienti.

Nota anche che gli strumenti non intonati, come molti strumenti a percussione (ad esempio, i piatti) o strumenti più "rumorosi" hanno più frequenze presenti che non sono armonicamente correlate e sono talvolta chiamate componenti inarmoniche . Le frequenze e le ampiezze di questi armonici meno o non correlati creano lo spettro per un suono non intonato e determinano anche se un suono è un po 'intonato (come un rullante). Anche gli inviluppi e i transitori sono altrettanto importanti per il riconoscimento di strumenti non intonati.

Come dici tu, i transienti iniziali sono una parte davvero importante del timbro percepito e spesso hanno caratteristiche enarmoniche / di rumore. Solo un rapido controllo della terminologia: non pensavo che "parziale" implicasse una mancanza di relazione armonica a meno che tu non abbia specificato "parziale enarmonico"? per esempio. vedere la tabella su https://en.wikipedia.org/wiki/Overtone#Musical_usage_term
La definizione precisa di parziale è una componente di un segnale periodico e stabile che può essere modellato come una sinusoide a variazione lenta nel tempo. I parziali possono essere armonici o inarmonici. Uno spettro di frequenze è composto da parziali (sia armoniche che inarmoniche) e transienti.
@joseem "Formant" è usato con lo stesso significato nell'analisi del suono degli strumenti musicali, per descrivere il modo in cui le risonanze dello strumento stesso (che sono indipendenti dall'altezza della nota suonata) influenzano le ampiezze delle diverse armoniche. Ad esempio, l'esistenza di formanti spiega perché alcuni strumenti hanno qualità di tono molto diverse nei loro registri bassi e alti. Vedi http://music.columbia.edu/cmc/MusicAndComputers/chapter4/04_04.php per esempio.
Articolo abbastanza interessante @alephzero, a prima vista sono d'accordo che restringere l'applicazione del concetto di formante ai soli suoni vocali (l'applicazione originale del concetto) è troppo restrittivo. Tuttavia, è importante notare che le formanti non sono lo spettro, ma solo alcune frequenze specifiche (di risonanza, come dici tu).
#2
+6
Phil Freihofner
2016-05-11 09:53:50 UTC
view on stackexchange narkive permalink

Per l'udito umano, la relazione tra armonico e fondamentale forse non è importante quanto l'area del tono in cui suona l'armonico. Le nostre orecchie si sono evolute per individuare i picchi e le valli di risonanza (vedere il concetto di vocale formanti) pertinenti per distinguere le vocali. Un suono "ah", ad esempio, ha una qualità "ah" indipendentemente dall'altezza fondamentale usata quando si parla o dal rango specifico degli armonici che si trovano all'interno delle aree formanti.

Gli strumenti hanno profili d'onda caratteristici basati su come si formano i suoni: ad esempio, un clarinetto inizierà almeno con solo armonici dispari, una corda produrrà un'onda sonora con qualità di onda a dente di sega quando la corda scivola e viene afferrata dall'arco, uno strumento in ottone avrà alcune qualità delle onde del polso mentre l'aria si forza periodicamente attraverso le labbra. Ma ciò che distingue ulteriormente questi strumenti l'uno dall'altro sono i picchi e le valli risonanti che derivano dalla forma o dalla costruzione, che sono invarianti indipendentemente dall'intonazione suonata. Il suono è il risultato della combinazione di "eccitatore" e "risonatore" per le vibrazioni della sorgente, simile al modello sorgente / filtro utilizzato per il riconoscimento vocale e la sintesi vocale.

E sì, ci sono anche caratteristiche di inviluppo, in particolare relative all'inizio delle note che possono aiutarci a distinguere suoni diversi.

C'è una tecnologia incredibile là fuori ora che può scegliere gli strumenti da un mix . Sto solo condividendo un po 'di quello che so della teoria acustica. Non ho ancora imparato come fare l'analisi per identificare velocemente il profilo armonico. Ho finalmente imparato la matematica di base alla base dell'analisi DFT, tramite The Scientist and Engineer's Guide to Digital Signal Processing, ma penso che sarà un lungo cammino prima di ottenere la programmazione e la matematica per identificare veramente gli strumenti .

#3
+5
José David
2016-05-11 06:47:18 UTC
view on stackexchange narkive permalink

Su un approccio pratico / ingegneristico, una volta che abbiamo l'analisi spettrale (cioè la caratterizzazione dello spettro di frequenze nel tempo in termini di transienti e parziali armoniche e inarmoniche, come spiegato nella risposta di Todd Wilcox), dobbiamo confrontare il nostro strumento a un database di riferimento di strumenti precedentemente catalogati.

Ciò viene fatto utilizzando un numero piuttosto elevato di proprietà spettrali valutate dallo spettro di base, ad esempio, solo per citarne alcuni (ce ne sono dozzine):

  • contrasto spettrale - un confronto dell'inviluppo spettrale con il database di riferimento
  • inarmonicità - peso relativo delle componenti inarmoniche
  • dissonanza - confronto dello spettrale busta con un riferimento di dissonanza percettiva

Il confronto con il database viene fatto con mezzi statistici, poiché ovviamente non esistono due campioni dello stesso tipo di strumento (o anche dello stesso identico strumento) esattamente uguali .

Di solito vengono utilizzati algoritmi di clustering: diversi campioni dello stesso tipo di strumento sono classificati in un "cluster" nel database. Il campione analizzato viene quindi confrontato con ciascun cluster, per trovare dove si adatta meglio. Ecco un esempio del risultato di tale processo (il processo deve essere ripetuto per diverse combinazioni di parametri diversi per ottenere buoni risultati di corrispondenza): enter image description here

Questa immagine è stata ottenuta con sms-tools (una serie di risorse sviluppate dall'università Pompeu Fabra di Barcellona), Essentia (uno strumento software molto potente per l'analisi audio) e raccolte di campioni raccolte da Freesound. Si tratta di risorse inestimabili per chiunque cerchi di eseguire analisi corrette.



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...