Domanda:
Quando è importante la latenza audio e non importa?
hotpaw2
2015-02-28 02:24:28 UTC
view on stackexchange narkive permalink

Quando è importante e / o meno importante la latenza audio (azione fisica per sentire il suono)?

La latenza touch-to-sound di iOS sembra essere dell'ordine di 50 milliSecondi, tuttavia alcuni musicisti riescono a riprodurre app musicali iOS senza troppe lamentele.

Ho anche ascoltato segnalazioni di lamentele anche su 5 mS di latenza, ma i musicisti erano soliti stare ben oltre 10 piedi (diagonale, dal livello del suolo al livello della testa) dai loro altoparlanti del monitor da palco, il che aggiunge oltre 10 mS a qualsiasi latenza del sistema audio.

Allora, quali sono le situazioni in cui pochi milliSecondi di latenza contano davvero? E quali sono le situazioni in cui anche dozzine di milliSecondi di latenza potrebbero ancora consentire una pratica o performance musicale (strumentale) accettabile (virtuale o MIDI)?

Non sento di avere abbastanza conoscenze per fornire una risposta effettiva, ma la mia comprensione è che l'essere umano medio può sentire che due ripetizioni dello stesso suono si sono verificate in momenti diversi quando sono> 30 ms. In questo contesto, immagino che la latenza diventerebbe più evidente intorno ai 30 ms. Questo tende ad avere molta più importanza quando si registrano sovraincisioni, dove troppa latenza è effettivamente evidente, coerente e generalmente si intende ascoltare quella registrazione ripetutamente, quindi i piccoli problemi che potrebbero passare inosservati durante le esibizioni dal vivo risaltano di più.
@Basstickler - Anch'io ho esitato a fornire una risposta effettiva. Puoi "sentire" la latenza a circa 5-7 ms, anche se non "sentirla" strettamente [discrepanza di fase a parte]. Eppure per molto tempo, i primi synth / tastiere midi avevano una latenza di 10 - 25 ms anche quando si suonava solo la tastiera collegata; i musos si sono semplicemente "abituati" e il mondo è cambiato per questo. [Non riesco ancora a produrre una risposta effettiva da queste informazioni]
@Tetsujin - Ho fondamentalmente capito che alcuni lo sentono / lo sentono più di altri. Mi chiedo anche fino a che punto la regola dei 30 ms si applicherebbe effettivamente a due suoni diversi. In genere la condizione umana ci porta a incoerenze nel ritmo, quindi un po 'di latenza non è molto diverso da quello, a parte il fatto che è tutto arretrato da qualunque sia la latenza, rendendo le cose che sono dietro il ritmo più indietro e quelle avanti o meno avanti, in tempo o dietro. In quanto tale, immagino che la differenza delle prestazioni complessive possa essere percepita.
Secondo che "alcuni lo sentono / lo sentono più di altri", anche se penso che tecnicamente chiunque potrebbe essere addestrato a notare le differenze. È davvero una questione di cosa sei abituato, cosa ti aspetti e quali sono i tuoi requisiti di prestazione. Per fare una registrazione rigida, di qualità da studio e per bloccarti davvero nella "zona", suppongo che qualsiasi cosa sopra i 5 o 6 millisecondi possa davvero iniziare a causare problemi. Se sei in una performance dal vivo, mettilo a 20 e nessuno sarà più saggio. Se stai suonando qualcosa con un attacco morbido e lento come i pad di sintetizzatore, oserei dire che anche 500 ms possono andare bene.
Oh, sai chi ha avuto a che fare con la latenza nell'era pre-elettricità? Organisti che suonavano organi con trasmissione pneumatica.
Anche le tastiere d'organo cablate avranno un grosso problema se le canne sono a 30M + di distanza (100+ mS, vicino a un ritardo di una sedicesima nota). Come suona l'organista a tempo con il direttore di coro?
Cinque risposte:
Some Dude On The Interwebs
2015-02-28 03:51:41 UTC
view on stackexchange narkive permalink

Apparentemente l'AES si è chiesto la stessa cosa a un certo punto e ha fatto questo studio: http://lsbaudio.com/publications/AES_Latency.pdf

Avevano un campione che comprendeva diversi strumentisti danno un voto soggettivo a un sistema di monitoraggio configurato con una certa latenza,

Mentre il titolo dice "nel monitoraggio del suono dal vivo", se lo leggi vedrai che il monitor in-ear i test rispondono perfettamente alla tua domanda anche in studio (quelli a cuneo sono comunque interessanti se meno rilevanti).

Potresti anche trovare utile questa tabella, di un autore rispettabile: http: // www.soundonsound.com/sos/jan05/articles/pcmusician.htm#7

Si riduce a valori approssimativamente ottimali di circa:

  • voci < 3 ms;
  • batteria < 6 ms;
  • chitarre < 12 ms;
  • pianoforte < 10 ms;
  • tastiere (pad, ecc.) < 20ms

Nota come, secondo l'autore,

"La velocità del suono nell'aria è approssimativa y mille piedi al secondo, ogni millisecondo di ritardo equivale ad ascoltare il suono da un punto un piede più lontano. Quindi, se riesci a suonare una chitarra elettrica a 12 piedi dal tuo amplificatore, puoi facilmente far fronte a una latenza di 12 ms. "

e

" Voce: Questa è l'esempio più difficile, perché chiunque ascolti la propria voce in "tempo reale" avrà le cuffie e quindi avrà i suoni "dentro la testa". Una latenza anche di 3 ms può essere sconcertante in queste condizioni. "

Al di sopra di questi valori, immagino che sia tutta una questione di quanto sia accettabile per te personalmente (quanto sei schizzinoso) e al tuo lavoro.

Se stai eseguendo più di 100 sovraincisioni vocali (o percussioni a strati), un valore vicino a 0 è un buon valore - semplicemente non vuoi che il ritardo sulle consonanti si accumuli .

Idem se sei Mariah Carey e puoi permetterti il ​​meglio.

Se stai facendo una rapida demo in uno studio casalingo, qualunque cosa, sposterai le "s" con il mouse, giusto?

"Se stai eseguendo più di 100 sovraincisioni vocali (o percussioni a strati), un valore vicino a 0 è un buon valore - semplicemente non vuoi che il ritardo sulle consonanti si accumuli". Non penso sia giusto: qualsiasi software di registrazione può spostare automaticamente le sovraincisioni nella posizione corretta, tutto ciò di cui hai bisogno è una latenza di andata e ritorno che sia nota e prevedibile. Il valore assoluto della latenza conta di più se devi monitorare te stesso attraverso il software (ad esempio, se vuoi che la tua DAW applichi alcuni effetti a ciò che ascolti dal vivo. Se questo non ha importanza, il monitoraggio hardware a latenza zero è solitamente facile.)
Rockin Cowboy
2015-02-28 10:08:19 UTC
view on stackexchange narkive permalink

Vorrei condividere i miei pensieri in relazione alla tua domanda sulla latenza del tocco per il suono di iOS e "pratica o performance (strumento musicale o virtuale)?"

Devo presumere che il tuo l'interesse principale è - la latenza in relazione a strumenti e dispositivi musicali iOS o altri "suoni musicali virtuali e prodotti digitalmente (MIDI) durante" esercitazioni o performance "su questi dispositivi o" strumenti ".

Per il TL; DR vai alla fine. Per capire come sono arrivato alle conclusioni alla fine - continua a leggere.

Gli studi citati in Some Dude La risposta di e alcune delle informazioni aneddotiche citate nei commenti si riferiscono a musicisti che suonano strumenti reali (anziché virtuali). Ma ciò che apprendiamo da questi studi e osservazioni lo farà portaci ad alcune conclusioni logiche in relazione alla tua domanda specifica.

Per prima cosa lasciami aggiungere alle prove aneddotiche dal mio punto di vista chitarrista e vocalist che ha anche suonato alcune tastiere e piano. Mi esibisco spesso in un ambiente totalmente acustico con chitarra acustica non amplificata e nessun microfono. In un caso del genere, la latenza è molto bassa, in particolare sulla voce. Quando suono collegato e canto attraverso un microfono, generalmente uso monitor a cuneo da pavimento abbastanza vicini. Nessuno di questi scenari mi pone problemi.

Quando mi esibisco in locali più grandi con un impianto PA domestico e monitor che possono essere sospesi al soffitto, sono piuttosto a disagio con il ritardo tra il momento in cui pizzico una corda della mia chitarra e il momento in cui la sento attraverso il monitor - e ho difficoltà a eseguire in quelle condizioni. Sono sicuro che se lo facessi tutto il tempo per pratica, alla fine potrei abituarmi e adattarmi.

Quindi diamo un'occhiata a cosa possiamo estrapolare dallo studio AES condiviso da Some Dude . Quindi possiamo trarre alcune conclusioni su ciò che i risultati potrebbero suggerire per gli strumenti virtuali.

In quello studio apprendiamo che i cantanti e i sassofonisti hanno la minima tolleranza per la latenza e il tastierista e i batteristi hanno la maggiore tolleranza e i chitarristi sono nel mezzo. I risultati dello studio mostrano chiaramente che i livelli di tolleranza sono direttamente correlati allo strumento e NON gli individui. Lo stesso individuo che suona strumenti diversi avrebbe livelli di tolleranza alla latenza coerenti con altri risultati sullo strumento dato.

Consideriamo quindi perché potrebbe essere vero. Ogni volta che parli o canti, il tuo cervello si aspetta una risposta immediata a latenza zero al suono che esce dalla tua bocca nello stesso momento esatto in cui diaframma e polmoni spingono l'aria sulle corde vocali. È stato così dal momento in cui sei entrato nel mondo urlando e ascoltando il suono della tua stessa voce per la prima volta. Quindi è facile capire perché un cantante avrebbe una bassa tolleranza per la latenza. Il cervello è abituato a un feedback immediato durante il vocalizzo.

Con il sassofonista, il cervello ha sviluppato un'aspettativa simile. Fare un suono con un corno ha una caratteristica molto significativa di causa ed effetto in comune con la riproduzione di un suono con la tua voce. L'atto di soffiare aria - produce un suono immediato. Sia che canti o suonando un corno si ha un'azione muscolare fisiologica molto consapevole che produce una reazione simultanea ed istantanea. I suonatori di corno sono abituati a soffiare attraverso il loro strumento e a sentire immediatamente un suono.

MODIFICA: il membro della comunità Supercat ha espresso un eccellente punto di vista nei commenti e mi sono sentito obbligato a includerlo in questa risposta. Per cantare una nota con la voce o per suonare una nota con molti tipi di fiati - il i muscoli facciali e i muscoli vocali controllano effettivamente il suono mentre viene creato e devono essere effettuati piccoli aggiustamenti durante il processo di creazione per raggiungere il tono desiderato. Così un cantante, ad esempio, può sentire nel monitor se è un po 'acuto o piatto e apporta immediatamente le modifiche necessarie ai muscoli facciali / vocali per correggere il tono. Un'altra buona spiegazione per una minore tolleranza alla latenza per un cantante o un suonatore di corno.

Ora consideriamo perché il tastierista ha una tolleranza così elevata per la latenza. La maggior parte delle tastiere, compresi i pianoforti acustici, ha un leggero ritardo tra il momento in cui premi un tasto e il momento in cui senti un suono . Sul piano acustico, premendo il tasto si attiva un'azione meccanica, che alla fine fa sì che un martello all'interno del pianoforte colpisca le corde. Ma non è un effetto immediato "colpiscilo e ascoltalo". Sintetizzatori e pianoforti digitali ed elettrici hanno sempre avuto un certo grado di latenza. Quindi il tastierista ha dovuto imparare ad adattarsi all'inevitabile latenza dal momento in cui ha iniziato a suonare. Quindi per un tastierista, la latenza è normale e prevista, quindi ben tollerata. È quello che hanno imparato ad aspettarsi sin dall'inizio.

Con un batterista, è in effetti un colpo e la risposta si sente. Quindi come si spiega la tolleranza di un batterista alla latenza nello studio AES? Lo studio condotto nel 2007 non ha menzionato l'uso di batterie elettroniche per testare la tolleranza del batterista alla latenza, quindi devo presumere che i batteristi nel test abbiano utilizzato un kit acustico.

Un batterista che colpisce una batteria acustica con una bacchetta, francamente non ha bisogno di un monitor per sentire il suono della sua batteria. Un batterista utilizza un monitor NON per ascoltare se stesso (alcuni batteristi indossano persino i tappi per le orecchie perché possono sentire la loro batteria TROPPO bene) ma per ascoltare gli altri musicisti (e gli altri musicisti alzano i monitor in modo che possano sentire se stessi sopra il batterista).

Quindi una conclusione logica che possiamo trarre sulla base dei risultati dello studio AES è che la tolleranza alla latenza è ** appresa . ** Il cervello impara tutti i tipi di utili informazioni che ci mantengono sani di mente. Ad esempio, ogni volta che i tuoi occhi sono aperti, vedi il tuo naso, ma il cervello ha imparato a ignorare quell'immagine, perché il tuo cervello sa che non è importante.

Il cervello ha imparato ad aspettarsi un feedback immediato quando esercitiamo le contrazioni muscolari necessarie per soffiare aria, attraverso un corno o le nostre corde vocali. Se impariamo a suonare un piano o altro strumento a tastiera: il cervello IMPARATO dall'inizio ad adattarsi alla latenza incorporata della tastiera.

Quindi la mia aspettativa sarebbe che possiamo facilmente imparare a tollerare la latenza con la maggior parte degli strumenti virtuali, perché non siamo stati precondizionati ad aspettarci il contrario . Se non impariamo mai ad aspettarci una risposta immediata dagli strumenti virtuali, la latenza non dovrebbe presentare lo stesso problema che avrebbe per un cantante, un sassofonista o un chitarrista.

Mi aspetto anche che con la batteria iOS suonata su un touchscreen, la latenza potrebbe presentare alcuni problemi di temporizzazione. Se tocchi lo schermo e non senti una risposta immediata a il tamburo, potrebbe rendere molto difficile suonare a tempo. Proprio l'opposto di quello che hanno sperimentato i batteristi dal vivo su veri kit acustici nel test di tolleranza alla latenza.

In realtà, non c'è tolleranza per la latenza per un batterista . È impossibile creare o simulare la latenza per un batterista su un kit acustico dal vivo. Ma su una batteria iOS, potresti introdurre la latenza, e sospetto che questo sarebbe l'unico caso, in cui pochi millisecondi di latenza sarebbero importanti.

La registrazione e il monitoraggio delle voci non sono inclusi nell'ambito di questa risposta perché non hai menzionato la voce o anche la registrazione (solo suonare e fare pratica - strumenti) nella domanda. Quindi questa è una discussione completamente diversa.

TL; DR - La risposta in linea di fondo alle tue domande:

  1. Domanda: "Quali sono le situazioni in cui pochi milliSecondi di latenza sono davvero importanti?" Answer: Quando si suona la batteria iOS o MIDI su un pad silenzioso o un touchscreen se si riproduce altra musica in cui il tempo è importante.

  2. Domanda: "Quali sono le situazioni in cui anche dozzine di millisecondi di latenza potrebbero ancora consentire accettabili ( pratica o performance musicale (strumento) virtuale o MIDI? "

Risposta: quando ti eserciti o eseguendo su qualsiasi iOS o MIDI o strumento virtuale diverso dalla batteria.

Quindi, data la tua esperienza, sembra che non solo la batteria, ma anche gli strumenti a corda simulati su qualsiasi iPhone o iPad dovrebbero sembrare inaccettabili per un musicista esperto, supponendo che i rapporti di una latenza minima di circa 50 mS dal tocco fisico all'uscita audio siano corretti . Lo stesso vale per gli strumenti a fiato virtuali "soffiati", con una latenza di circa 15-17 mS dal microfono all'audio, (senza contare il rilevamento del "soffio" DSP) minimo.
@hotpaw2 una chitarra simulata su un iPhone è uno strumento diverso da una chitarra reale. Manca la sensazione tattile di pizzicare una corda, sentire una vibrazione risultante, ecc. Sarà più simile a suonare una tastiera, anche se la "tastiera" è fatta per sembrare e suonare come una chitarra. Ma per suonare seriamente in tasca con altri strumenti, penso che preferirei la minore latenza possibile. Non ho esperienza personale con i corni MIDI soffiati dal vento. Ma leggendo recensioni e forum online, sembra che richiedano un "aggiustamento nel processo di pensiero" e "una curva di apprendimento".
Sospetto che un altro fattore critico con la tolleranza alla latenza su tastiera e batteria sia che tutte le azioni per iniziare una nota devono essere completate prima che qualcosa sia udibile, mentre cantare o suonare un sassofono richiede che si regolino i propri muscoli facciali / vocali in risposta a cosa la voce o lo strumento sta facendo.
@supercat Punto eccellente. In altre parole, i muscoli facciali e vocali controllano effettivamente il suono mentre viene creato e durante il processo di creazione devono essere apportati piccoli aggiustamenti.
slim
2015-02-28 16:53:52 UTC
view on stackexchange narkive permalink

Gli effetti della latenza sono una scala mobile che va da:

  • zero
  • impercettibile
  • percepibile come "sensazione" (come un batterista che sta tirando leggermente)
  • percepibile come "qualcosa di leggermente sbagliato"
  • percepibile come "qualcosa di completamente sbagliato"; rendendo la riproduzione completamente impossibile

L'effetto dipende anche dal tipo di suono che stai creando. Se stai suonando qualcosa con un attacco delicato, come i synth wash, il tempismo esatto non ha molta importanza. Se stai suonando qualcosa di ritmico e staccato come la batteria o una parte di chitarra ritmica, allora il tempismo è cruciale.

Anche una parte di chitarra solista può tollerare abbastanza i cambi di tempo, rispetto alle parti ritmiche che devono essere stretto.

Il ritardo di 50 ms che hai menzionato riguarda il livello di "sensazione" o "qualcosa di sbagliato" e non rovinerebbe completamente la musica, né renderebbe difficile play.

Tuttavia, la latenza si accumula. 50 ms dal touchscreen al suono generato potrebbero essere OK. 50 ms per far viaggiare il suono dall'altoparlante all'orecchio potrebbero essere OK. Aggiungili insieme e avrai 100 ms, il che non va bene.

Una latenza di 5 ms in un pedale effetti potrebbe sembrare insignificante, ma ad alcuni chitarristi piace concatenare 10 o più effetti, quindi ogni millisecondo conta.

Ci sono tutti i tipi di situazioni in cui la latenza si accumula, ad esempio quando si sovraincide più tracce e tu (e / o gli autori del software) dovete tenerlo presente durante la progettazione.

topo Reinstate Monica
2015-02-28 04:18:25 UTC
view on stackexchange narkive permalink

Un esempio di quando la latenza audio conta a malapena:

Stai registrando voci pulite nel tuo PC nella tua interfaccia audio, cantando insieme alle tracce che hai già impostato. Ci sarà un effetto di latenza sia all'ingresso nel PC che all'uscita. Tuttavia, il computer sa quanto è grande il buffer audio in uscita e suona "presto" per compensare; allo stesso modo, la DAW sa che ciò che hai suonato è stato effettivamente riprodotto un po 'prima nel tempo e lo tira avanti nel tempo della lunghezza del buffer. Quindi, sebbene ci siano due fasi di latenza in questo sistema, è quasi tutto affrontato; lo noti a malapena (se tutto funziona, ovviamente)

Dico "quasi" risolto perché ci sono alcuni ritardi nel sistema che non sono così facilmente quantificabili. Ma in pratica sembra esserci molto vicino.

Cioè, se non stai monitorando tramite il PC :)
Sì, nel mio scenario immaginavo che non stessimo monitorando affatto (solo ascoltando te stesso cantare). Ma è vero, se vuoi monitorare ed essere nello scenario che ho descritto, il monitoraggio deve avvenire da un punto prima che il segnale arrivi al mondo digitale del PC.
Laurence Payne
2015-03-03 05:50:46 UTC
view on stackexchange narkive permalink

Quando (ISA) Turtle Beach Pinnacle era il re delle schede audio per PC, con 750 ms di latenza audio, siamo riusciti in qualche modo a realizzare registrazioni multitraccia perfettamente sincronizzate organizzando il monitoraggio diretto dell'ingresso e pre-fetch tracce già registrate.

Ma se vuoi riprodurre un campionatore software in tempo reale da una tastiera MIDI, o per ascoltare una versione elaborata (dal computer) del tuo ingresso audio, devi latenza.

Qualsiasi cosa nella regione di 10 ms o inferiore è generalmente considerata accettabile. Valori bassi a una cifra sono abbastanza facilmente ottenibili. Chiunque contenga 50 ms è molto poco impegnativo o viene illuso dal culto dell'iPad :-)

Quando viene pubblicizzato il "monitoraggio a latenza zero", è fuorviante. Zero è irraggiungibile. Stanno parlando di ripetere in loop un segnale di ingresso direttamente, senza passare attraverso il sistema di elaborazione audio del computer. Non è zero latenza, sta solo evitando completamente la latenza. (Come abbiamo fatto nel primo paragrafo di questa risposta.)



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...