Képzeld el, hogy arra ébredsz: ellopták a hangod, és bármit tehetnek vele(d)
A zene és a mesterséges intelligencia viszonya sokkal nagyobb gond, mint hinnéd
A kis hableány óta tudjuk: ha valaki ellopja a hangodat, uralni tudja az életedet is. A rossz hír, hogy a mese mára valósággá vált: a mesterséges intelligencia már nemcsak a dalszerzés tudományát sajátította el, de épp az ember egyik legbensőbb, legfontosabb és legszemélyesebb szegmensét ostromolja, mégpedig az énekhangot. Ugyan, kit érdekel a popzene, legyint erre most egy csomó ember. Őket arra kérem, picit engedjék el a slágerekkel kapcsolatos ellenérzéseiket, és velem együtt gondoljanak bele, milyen következményei lehetnek annak, ami most zajlik a mesterséges intelligencia és a zene kérdéskörében. Sajnálom, de nem állítom, hogy optimista cikk ez. Csepelyi Adrienn írása.
–
Képzeld el, hogy énekes vagy. Gyerekkorod óta annak rendeled alá az életed, hogy egyszer befutott előadó lehess. Énekórákra jársz, az utolsó filléred is stúdiózásra költöd, éjjel-nappal melózol, hogy épüljön a branded. Huszonéves korodra, több mint egy évtizednyi meló után végre sikerül: az egyik dalod a felkapottak között landol YouTube-on, TikTok-trend lesz a refrénből, rotációban játsszák a rádiók, a Spotifyon pörögnek a számok. Díjakra jelölnek, turnéra indulsz – végre megtörténik minden, amire vágytál és amiért annyit dolgoztál.
Aztán képzeld el, hogy egyik nap arra ébredsz, magadat hallod a rádióból. Pontosabban: a saját hangodat, de egy olyan számban, amit sosem énekeltél fel. De kétségkívül a te hangod, csak épp semmi közöd a dalhoz, amiben megszólal. És egy büdös fillér nem sok, annyi jogdíjat se kapsz érte.
Nem tévedés: ez nem egy sci-fi novella, hanem a valóság. Merthogy néhány napja Drake és The Weeknd pont erre ébredt, annyi különbséggel, hogy a TikTokon hallotta vissza egy olyan dalban magát, amit ebben a formában sosem rögzített.
Mire a Universal Music Groupnak sikerült eltávolítania a kérdéses videót, az már 15 milliós megtekintés fölött járt – a hangfelvételt pedig 600 ezerszer játszották le Spotifyon.
Üdv a szürkezónában!
Képzeld el, hogy úgy keresel pénzt, hogy valaki más dolgozik meg érte, te pedig csak élvezed az eredményét! Jó, ezt nem nehéz elképzelni, az emberi civilizáció története tele van ilyen sztorikkal. Arra viszont mindeddig ebben a formában nem akadt példa, hogy zenei alkotásokat lehessen létrehozni a művészi szándék teljes hiányával, pusztán a pénzkereset szándékával.
Nyilván nem ez a problémakör veszélyezteti jelenleg a leginkább az életünket vagy a bolygónk fennmaradását, mindamellett fontos látnunk, hogy ez korántsem csak a zenészek jogairól és pénzéről szól: a mesterséges intelligencia és a zene kapcsolata lenyomatot hagy a mindennapjainkon is.
Csak néhány a milliónyi kérdés közül, ami felmerül:
- Milyen hatással van az emberi elmére, agyműködésre, ha nem ember által készített zenét hall?
- Hogyan változtat azon a mesterséges intelligencia, hogy milyen zenék, stílusok stb. jutnak el hozzád a különféle platformokon?
- Ez milyen hatással van a toplisták és a bevételek alakulására?
- Mi történik a hús-vér művészekkel, ha hirtelen generálhatóvá válik a dalszerzés, és jogilag nem vetnek gátat a mesterséges intelligencia alkotta zene terjedésének?
-
Mi történik, ha a kiadók számára kedvezőbbnek tűnik egy-egy nem létező, azaz problémamentes előadó, mint a saját elképzelésekkel bíró és számos költséggel járó élő művész?
- Mi van, ha a streamingszolgáltatóknak külön jól jön, hogy nem kell vaskos pénzkötegekkel tömni a kiadókat, az előadók zsebét, hanem külön megállapodást kötnek a mesterséges intelligenciával „ócsóér’” zenét gyártó IT-szakemberekkel?
- Hogyan tizedeli ez meg a zenészek, előadók bevételi forrásait? Például: a reklámokban, sorozatokban a szerzeményeiket felváltja a generált zene, a streamingfelületek algoritmusa preferálni kezdi az „ócsó” zenét…
- Mit kezdjünk azzal, ha egy már nem élő, nem alkotó előadó hangját felhasználva új dalok, nem létező feldolgozások születnek? (A hologramos koncertek és az eredeti hangsávok felhasználásával ez bizonyos határig eddig is ismert jelenség volt, de mi van, ha ezentúl BÁRMIT megcsinálhatnak például Elvis hangjával a traptől a mulatósig?)
És a legfőbb kérdés, ami valamennyi fenti kérdéskörben kulcsfontosságú: ki és miként élhet vissza mindezzel?
És ez már nemcsak szürke, hanem sötét… nagyon sötét!
Csörög a telefonod, ismerős hang szól bele: a gyereked. Sír, reszket, hallhatóan zaklatott és fél. Valamit magyaráz arról, hogy hazafelé tartott, amikor elkapták egy furgonnal, és most fogalma sincs, hol van, de az elrablói pénzt akarnak.
Biztos, hogy a gyereked hangja, kétséged sincs efelől. Ezer közül is megismered a hangját. Megfenyegettek, hogy ne szólj a rendőrségnek, csak szép csendben utalj a megadott számlaszámra, ha élve akarod viszontlátni. Így teszel – aztán a gyereked megjelenik a szobában. Mindvégig odafent volt, az emeleten.
Nem érted, hogy lehet, hiszen világosan hallottad, amit mondott, nem lehet, hogy valaki ennyire élethűen utánozza… Nem is. Hiszen az valóban az ő hangja volt. Amit elloptak, és csaláshoz használtak. Érted már, miért nem csak az számít, Elvis hangja ellopható-e?
Ja, ezt se én találtam ki. A TikTokon már terjednek a videós beszámolók a hasonló csalásokról.
Az, hogy az emberi hang éppúgy szintetizálható, ahogyan a hangszerek, rég tudjuk. Avatott fül persze felismeri, ha egy hegedű- vagy zongorahang szintetizátorból származik (hozzátenném: ijesztően sokat fejlődött e tekintetben is a technológia), vagy ha egy hang nem egészen emberi.
Igen ám – itt azonban nem erről van szó, hanem arról, hogy
telefonálás vagy videórögzítés közben a tulajdon hangodat lopják el, hangsúlyokkal, beszédhibával, sebességgel, szóhasználattal és minden egyéb sajátossággal együtt. És arra használják, amire csak akarják: pénzt csalhatnak ki a szüleidtől vagy felénekeltethetik veled az Nirvana bármely számát.
És ez itt nem a Disney-féle A kis hableány. Ha kiderül is az átverés, jószerével semmit se tehetsz.
„De hát úgyis csak a háttérben megy”
A kérdés minden újítás esetében a belépési küszöb. Mármint, hogy az hol húzódik. Amikor az Antares stúdió 1996-ban előállt az Auto-Tune nevű plug-innal (azaz egy olyan programmal, ami kijavítja a hamis hangokat az éneksávban), még senki se látta, micsoda lavinát indít majd el. Ha valaki túlzásba vitte a plug-in használatát, sajátságos hangzást kapott az ének – mindenki úgy volt vele, hogy senki se akar ilyen szarul szólni, meg hát eleve mennyire ciki, hogy valaki nem tud tisztán énekelni, mi baj lehet.
Aztán jött Cher és a Believe című, a végletekig auto-tune-olt dala – igen, tudom, hogy a te fejedben is azonnal megy, hogy dujúbilíííív… –, és letarolta nemcsak a zenei piacot, de minden addigi elképzelésünket is belegyalulta a földbe. Cher 1998-ban már eszközként kezdte használni, amit addig rejtegettek – és innentől nem volt megállás.
Az ezredfordulón T-Pain már stílusa egyik fő jellegzetességeként nyúlt az effekthez – és azóta is az a keresztje, hogy „tönkretette a hiphopot”. Azóta ugyanis már egészen hétköznapinak számít a szét-auto-tune-olt rappelés – ennek nyomán pedig új meg új zenei stílusok szökkentek szárba a mumble raptől a trap legkülönfélébb válfajaiig.
Aki tehát azt gondolja, a mesterséges intelligencia megjelenése távoli és bagatell probléma a zenében, nincs azzal semmi gond, ha a Spotifyon beindítja az AI generálta „tanulós” háttérzenét, az nyilvánvalóan alábecsüli az illetékesek rendelkezésére álló eszközöket – és az esetleges ártó (vagy „szimplán” becsvágyó, pénzéhes) szándékot.
És mindez olyan, ártalmatlannak tűnő döntésekkel gyűrűzik be az életünkbe, mint hogy lusta vagy tanuláshoz, munkához „emberi” zenét választani, és az algoritmusokra hagyatkozol.
Ahogyan a deepfake esetében (amikor az arcodat lopják el, és élnek vissza vele, például erotikus tartalmakat készítenek, és azt a látszatot keltik, hogy te személyesen vettél részt például pornófilmben), a következmények itt is lehetnek sokkal, de sokkal súlyosabbak annál, hogy valaki elesik némi bevételtől.
Mi marad az alkotásból?
Ha pedig a téma elvi oldalára vetünk pillantást, akkor sem lehetünk túlzottan optimisták: míg most még az AI segíthet a dalszerzőknek, ha elakadtak a folyamatban (létezik már kifejezetten erre alkotott program),
ne legyenek kétségeink afelől, hogy mindazt az információt, amit az AI így megtud az emberi dalszerzés kognitív, kreatív és egyéb mozzanatairól, épp a hús-vér dalszerzők ellenében fogják majd alkalmazni hamarosan. Ha drámai akarnék lenni (épp elég ijesztő ez anélkül is, mondjuk), azt mondanám: a technológia eléri a dalszerzőknél, hogy vegyenek részt a saját lényegük kivégzésében.
És nagyon, de nagyon nyomasztó abba belegondolni, hogy amire eddig az életünket kellett rászánnunk, gyakorlás, tanulás és végtelen munkaórák nyomán jöhetett csak létre, az egyszeriben pár kattintással lemásolható – és ha nem lépnek gyorsan a döntéshozók, és nem szabályozzák idejében a keretrendszert, el is adható.
Ez pedig már talán nem is csak elvi, hanem egyenesen lelki, mentális és filozófiai kérdéseket vet fel.
Kiemelt képünk illusztráció – Forrás: Getty Images / stockbusters