Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
Onset (audio)
Nell'audio l'onset si riferisce all'inizio di un suono o di una nota. In altre parole l'onset si riferisce all'istante in cui un evento ha inizio, la fase di attacco nella modellizzazione ADSR. Nell'onset l'ampiezza cresce da zero al valore di picco. È legato (ma differente) al concetto di transitorio: tutte le note musicali hanno un onset, ma non necessariamente includono un transitorio iniziale (si pensi ad esempio ai legati).
In fonetica il termine è usato in maniera differente.
Indice
Onset detection
Nell'elaborazione numerica dei segnali la ricerca dell'onset è tutt'altro che semplice ed è oggetto di una competizione annuale: l'Audio Onset Detection contest.
I differenti approcci all'onset posso operare nel dominio del tempo, della frequenza, della fase o complesso. È caratterizzato da:
- aumento dell'energia spettrale
- cambiamenti nella distribuzione dell'energia spettrale (flusso spettrale) o nella fase
- cambiamenti nel pitch rilevato, ad esempio usando un algoritmo di polyphonic pitch detection
- pattern spettrali riconoscibili attraverso tecniche di machine learning come ad esempio le reti neurali.
Semplici tecniche basate sulla valutazione dell'incremento dell'ampiezza nel dominio del tempo possono portare a risultati non soddisfacenti. L'auspicio spesso è quello di giudicare l'onset similmente a come un uomo vorrebbe: quindi possono essere usate tecniche motivate dalla psicoacustica. A volte la ricerca dell'onset può essere ristretta ad un dominio particolare (a seconda di cosa si vuole ottenere), per esempio cercando esclusivamente gli onset dei suoni percussivi. Con un obiettivo più preciso è più semplice sviluppare ed utilizzare delle tecniche che permettono di ottenere risultati soddisfacenti.
Metodi di rilevamento dell'onset
Onset detection nel dominio della frequenza
Nel dominio della frequenza l'aumento di energia dovuto ad un transitorio tende a distribuirsi in una banda molto ampia dello spettro. Mentre l'energia di un segnale è normalmente concentrata alle basse frequenze, i cambiamenti dovuti ai transitori sono più visibili alle alte frequenze.
Una successione di frame è come una successione di fotografie dello spettro del segnale che evolve nel tempo. La funzione di HFC (High Frequency Content) è definita per ogni frame come:
dove è il modulo dello spettro del frame j-esimo. Scopo della HFC è quello di enfatizzare le alte frequenze e funziona molto bene per identificare l'onset di suoni di tipo percussivo. La particolarità della HFC è quella di avere una maggiore ampiezza durante il transitorio/attacco del suono.
Onset detection attraverso l'energia locale
Tutti i metodi riferiti al dominio del tempo si basano sul calcolo di una funzione alle differenze del primo ordine dell'inviluppo del segnale per ottenere il punto in cui c'è il massimo gradiente di salita ed identificarlo come onset.
Normalmente si utilizza la funzione di detection : derivata nel tempo dell'energia del segnale
(per i segnali discreti la differenza prima). In questo modo incrementi improvvisi di energia (onset del suono) vengono evidenziati da picchi molto stretti della derivata.
Se si considera anche la percezione di un suono la psicoacustica indica che il volume di un suono è percepito in maniera logaritmica, quindi si avrà una funzione del tipo:
Parallelamente nel dominio discreto calcolando la differenza prima del approssimativamente si simula la percezione uditiva del volume.
Bibliografia
- Dispense del corso di Informatica Musicale dell'Università di Padova del professor DePoli Sito web del corso pubblicate sotto licenza Creative Commons Attribuition-NonCommercial-ShareAlike
- Bello, J.P., Daudet, L., Abdallah, S., Duxbury, C., Davies, M., Sandler, M.B. (2005) "A Tutorial on Onset Detection in Music Signals", IEEE Transactions on Speech and Audio Processing 13(5), pp 1035-1047
- Bello, J.P, Duxbury, C., Davies, M., Sandler, M. (2004). "On the use of phase and energy for musical onset detection in the complex domain". IEEE Signal Processing Letters
- Collins, N. (2005) "A Comparison of Sound Onset Detection Algorithms with Emphasis on Psychoacoustically Motivated Detection Functions". Proceedings of AES118 Convention