Criticità dell’Intelligenza Artificiale nella Produzione Audio

Criticità dell’Intelligenza Artificiale nella Produzione Audio

Criticità dell’Intelligenza Artificiale nella Produzione Audio 150 150 Simone Barbieri

le criticità dell'intelligenza artificiale nella produzione audio

Dopo aver trattato delle sue incredibili possibilità, oggi faremo la parte dell’avvocato del diavolo alla ricerca delle possibili criticità dell’intelligenza artificiale nella produzione audio.
Cercheremo di farlo seguendo i punti dell’articolo precedente, e andando a toccare campi di interesse anche esterni alla produzione audio in senso stretto.

 

  1. Miglioramento della qualità audio:

    Il restauro di un’opera d’arte aiuta a preservare il patrimonio dell’umanità, e a mantenere più ‘contemporaneo’ l’aspetto delle opere (sonore, cinematografiche, pittoriche…).
    Tuttavia esiste anche un’altra scuola di pensiero, che sostiene che le opere dovrebbero essere lasciate a loro stesse, permettendo al tempo e al degrado naturale di manifestarsi.
    Questo approccio è legato all’idea che il degrado faccia parte dell’opera d’arte, raccontando la sua storia e aggiungendo valore storico e artistico.
    Diverse culture, in diversi periodi storici, hanno avuto opinioni diverse sulla questione, e il dibattito riguarda anche aspetti politici ed educativi.
    Purtroppo l’approccio automatizzato di un’IA cancellerebbe alla radice questo dibattito, optando per applicare sempre e comunque i canoni estetici della contemporaneità, che sono mutevoli per definizione.
    Inoltre, molti generi musicali hanno sfruttato le stesse limitazioni tecnologiche rendendole stilemi: è il caso del punk, del noise, del low-fi, la musica jungle… che musica avrebbe finito per fare Jimi Hendrix se il suo sistema di amplificazione fosse stato perfetto, e un’IA avesse risolto per lui i problemi di feedback?

  2. Sintesi audio avanzata:

    L’IA consente di creare nuovi suoni e texture audio tramite la sintesi avanzata.
    Ebbene non è necessariamente positivo dotare gli artisti di infinite soluzioni e possibilità.
    La produzione dei brani finisce per concentrarsi esclusivamente sulla creazione di ear-candy, banalizzando fino al ridicolo armonia, melodia, testi, performance e strutture.
    Le innovazioni apportate in questo modo scatenano trend che si esauriscono subito e collassano su loro stessi, perché provengono da un non-luogo e da un non-tempo (l’IA) che non rappresenta in realtà niente e nessuno, non essendo stati generati da un reale zeitgeist culturale.
    Abbiamo visto in tempi recenti molte innovazioni mirabolanti, scatenare un’eco mediatico enorme e poi essere dimenticate nell’arco di pochi mesi o settimane, e questa è una delle spiegazioni possibili per questo fenomeno.

  3. Automazione e ottimizzazione delle produzioni:

    L’IA può semplificare e velocizzare diverse fasi della produzione audio.
    Per tratteggiarne un possibile limite, prendiamo in considerazione la musica Dub.
    Questo genere musicale, si basa su come la cultura Giamaicana ha interpretato, digerito e declinato le nuove possibilità offerte dalla tecnologia del ‘dubbing‘.
    I mixer e i registratori multitraccia, concepiti altrove, arrivarono nel paese Caraibico nella seconda metà degli anni 70, dove furono ricevuti attraverso gli stilemi della cultura reggae, dando vita ad un genere musicale completamente nuovo che finì con l’influenzare altri stili e creare nuove commistioni.
    Spesso, inoltre, è proprio nell’atto apparentemente ‘tecnico’ della post-produzione che un’opera può trascendere le stesse intenzioni del proprio autore per divenire qualcosa più, che diventa ‘pietra miliare’ di un genere o di un’epoca.
    Un esempio per tutti? I lavori di George Martin per i Beatles!

  4. Riconoscimento e trascrizione audio:

    L’IA ha dimostrato notevoli progressi nel riconoscimento vocale e nella trascrizione audio, ma anche qui ci sono delle criticità.
    Imparare una lingua, soprattutto se lo si intende fare abbastanza approfonditamente da poter lavorare come traduttore, significa anche imparare una cultura.
    Rendere obsoleta la necessità di imparare lingue straniere può significare il passaggio in secondo piano dell’aspetto di confronto culturale.
    Inoltre, per un professionista tradurre un libro significa anche interpretarlo, metterci dentro inevitabilmente sé stesso.
    Prendiamo ad esempio le varie traduzioni pubblicate di un classico della narrativa come Moby Dick: la traduzione fatta da Cesare Pavese è diversa (per quanto mi riguarda, è migliore) delle altre traduzioni.
    Perché? Perché la sensibilità e il talento di Pavese si riversano nelle pagine di Melville, rendendole vive.

  5. Personalizzazione dell’esperienza audio:

    L’IA consente la personalizzazione di playlist e raccomandazioni musicali su misura, in base al gusto musicale e alle abitudini di ascolto dell’utente.
    Tuttavia, quando un conoscente ci introduce ad un nuovo artista, entrano in gioco fattori quali il suo personale entusiasmo, il tipo di rapporto che ha con noi, il suo bisogno di condividere un piacere… tant’è che certi artisti, brani, film… rimarranno indelebilmente associati alla persona che ce li ha fatti scoprire, creando ulteriori legami associativi ed emotivi.
    I consigli e le proposte di un’IA, invece, avranno necessariamente altre motivazioni.
    Nella migliore delle ipotesi saranno semplicemente basati su quello che già ci è piaciuto in passato (rendendo stagnante e autoreferenziale la nostra cultura musicale).
    Nella peggiore delle ipotesi saranno invece meramente basati su obbiettivi di marketing.
    Questo sta già accadendo su alcune grandi piattaforme, che promuovono i propri artisti inserendoli nelle playlist di ‘classici’ magari del jazz e di musica etnica, nonostante siano sconosciuti mestieranti, allo scopo di lucrare sulle royalties.

  6. Ricerca e identificazione del campionamento:

    L’IA può essere impiegata per analizzare grandi database di suoni e campioni audio, facilitando la ricerca e l’identificazione di specifici samples all’interno di una vastissima libreria.
    Il fatto che sia un’IA a fare questo tipo di controlli, unito all’automazione decisionale degli algoritmi, sta creando paradossi imbarazzanti.
    Opere d’arte antica censurate per oscenità, demonetizzazione o cancellazione di video didattici o divulgativi a causa dell’utilizzo di pochi secondi di un brano o di un film, blocco di utenti e canali a causa dell’utilizzo di una parola controversa (che l’IA non è in grado di leggere nelle sfumature del suo contesto)…
    Inoltre: come mai proprio questo periodo, caratterizzato da una straordinaria capacità di scovare potenziali plagi tra le pieghe di milioni di opere, è allo stesso tempo il periodo in cui i nuovi prodotti sono più sfacciatamente derivativi?
    Gli stessi loop, beat, samples, giri di accordi… si possono sentire in milioni di brani, come se il concetto stesso di plagio fosse divenuto obsoleto.

  7. Creazione di musica generativa:

    Gli algoritmi di IA possono essere utilizzati per creare musica generativa, in cui la macchina produce autonomamente nuove composizioni musicali basate su modelli appresi da precedenti opere artistiche.
    Le criticità dell’intelligenza artificiale nelle produzioni audio per questo punto sono simili a quelle fatte per i punti 3 e 5. Qui addirittura non si tratta di aspetti tecnici ma della parte creativa.
    Vogliamo davvero pensare che tutto quello che è stato scritto su questo misteriosa abilità umana, da Platone a Jung passando per Stravinskij e Alan Moore, sia stato un’inutile filosofeggiare intorno al nulla?
    Il processo creativo non può essere ridotto alla semplice applicazione di regole e algoritmi, e in un’IA non esiste niente che trascenda questi processi matematici.
    Addirittura è diventato possibile generare brani che sembrano essere cantati da artisti noti.
    La diffusione di tool adatti a questo scopo ha lanciato il trend dei deepfake, dove per la prima volta si è in grado di ‘far dire’ ad una persona nota quello che si vuole, attraverso un audio (e un video) che sembrerà assolutamente genuino.
    Questo pone chiaramente molte nuove questioni legali ed etiche e diverrà fondamentale sviluppare nuove tecnologie per rilevare e contrastare l’abuso di deepfake, per evitare che il pubblico venga ingannato, non solo in ambito artistico ma anche, per esempio, politico.

  8. Audio source separation:

    L’IA può separare automaticamente le diverse sorgenti audio all’interno di una registrazione complessa, come isolare la voce da una traccia musicale o estrarre gli effetti sonori da un ambiente rumoroso.
    Per quanto questo sia un sogno divenuto realtà per musicisti e sound designer (tra cui il sottoscritto), sul lungo periodo questo tool può avere effetti negativi.
    Un’opera musicale che viene smontata e rimontata continuamente da tutti, crea una giungla di remix che fa scomparire l’opera originale, e con essa il suo contesto storico ed estetico.
    In un’ottica di puro consumo distratto, questo non è un problema, ma la musica non è solo quello, non per tutti quantomeno.
    Trovarsi di fronte a decine di versioni diverse dello stesso brano, come già è successo per quegli artisti morti prematuramente, le cui registrazioni inedite sono finiti nelle mani sbagliate, può finire col creare una situazione caotica, frammentaria, che non riesce più a raccontare l’artista, la sua visione, il suo periodo storico… rendendo impossibile l’approfondimento critico.

  9. Riconoscimento dell’emozione nel suono:

    L’IA può essere addestrata per riconoscere le emozioni presenti nelle voci o nei suoni, consentendo di analizzare e misurare l’impatto emotivo di una produzione audio su un pubblico.
    Questo aspetto non impatta solo sul mondo innocuo dell’intrattenimento, ma ha evidenti applicazioni militari e politiche.
    Il suono come arma è già stato implementato in passato, via via in maniera più raffinata e precisa.
    Già Kubrick e Burgess ne avevano parlato in Arancia Meccanica (la cura Ludovico, sfruttata in malafede per vendetta e che porterà al tentato suicidio del protagonista).
    Già la Germania Nazista l’aveva sperimentato montando sirene eoliche (Jericho Trompete) sotto i bombardieri in picchiata.
    La manipolazione psicologica, se fatta in malafede, può portare a conseguenze tremende, e lasciare che sia un’IA ad occuparsene per conto d’altri può essere controverso.

  10. Ricerca di problemi audio:

    L’IA può essere utilizzata per individuare problemi audio come clic, pop, distorsioni o rumori indesiderati all’interno di una registrazione, aiutando a correggerli prima della pubblicazione.
    Questo rappresenta un ottimo aiuto per un tecnico di post-produzione, ma solo se pensiamo che i difetti siano solo ed esclusivamente lì per essere corretti e non possano avere un’estetica propria (vedi punto 1).
    Prendiamo ad esempio il famosissimo brano di Bernard Hermann “The Murder“, colonna sonora di Psycho di Hitchcock.
    Ce ne sono molte versioni successive, registrate in maniera migliore, più pulita e bilanciata.
    Nessuna di queste versioni, tuttavia, riesce a generare l’impatto emotivo della versione originale.
    Fu registrata attraverso una microfonazione particolarmente ravvicinata, che finì per saturare e distorcere lievemente, accentuandone la violenza.
    Questo è il tipico ‘difetto’ che non dovrebbe mai essere corretto durante un restauro.

Conclusioni

Abbiamo tentato di scovare le criticità dell’intelligenza artificiale nella produzione audio, e a volte è evidente che i pro superano di gran lunga i contro. In qualche caso però, soprattutto quando si parla di Arte con la A maiuscola, l’impatto di certi tool può essere controverso.
In altri casi addirittura occorrerebbe tenere a mente che ci saranno delle conseguenze imprevedibili, che devono essere monitorate.