Milanovich Domi/WMN: Érdekes kettősség, hogy míg pszichológiai szempontból sokan elszigetelten élnek, mondhatni, népbetegség a magány, addig adattudományi megközelítésben a kapcsolatok korát éljük: valójában rengeteg hálózatnak vagyunk a részei – akár úgy, hogy nem is tudunk róla.  

Janosov Milán: Tényleg rengeteg, gyakran láthatatlan háló vesz körül minket. Vegyük azt a példát, hogy leülünk a gép elé. Az már eleve egy komplex hálózatos út, ahogy a laptop eljutott hozzánk: valahol legyártották az alkatrészeket, egy beszállítóhálón keresztül elvitték őket a gyárba, ott összerakták, egy globális logisztikai hálón keresztül pedig megérkezett az üzletbe vagy az otthonunkba. Vélhetően bankkártyával fizettünk érte, ami mögött egy pénzügyi háló húzódik meg, és még csak ott vagyunk, hogy van egy gépünk. Felcsapjuk, csatlakozunk az áram- és az internethálózatra, az újabb két óriási globális hálózat. Utána megnyitjuk a böngészőt, az e-mail fiókunkat, a Facebookot, az Instát – ahol ismerőseinkkel, munkatársainkkal kapcsolódhatunk, ismét csak hálózatok részévé válva. De ide tartozik szinte minden olyan applikáció, ahol vásárolunk, fogyasztunk, ami a háttérben ajánlórendszereket futtat, mint például az Amazon, a Netflix, a Spotify.  

M. D./WMN: Maguk a városok is hálózatok, de nem csak az infrastruktúra vagy az úthálózatok miatt. Mit jelent a városok adatalapú értelmezése, és hogyan segíthet minket abban, hogy hatékonyabban tervezzük meg, illetve működtessük a lakóhelyünket érintő folyamatokat? 

J. M.: A városoknak szerintem három hálózatos szintje van. Az első, amit te is említettél, eléggé statikus: mondhatni, a hardveres rész, ami tényleg ott van betonból, vasból, műanyagból.

A megfogható fizikai része a városnak, például a gyönyörűszép úthálózat, ami olyan látványos a térképeken, és ami annyi mindent elárul egy város múltjáról, meghatározza a jelenét, és sok esetben előrevetíti a jövőjét is.

A második szint már dinamikus, amikor ennek az egésznek egyfajta életet adunk, fizikus kifejezéssel élve nemlineáris dinamikai folyamatokat működtetünk rajtuk, de ez, mondjuk, azt jelenti, hogy zajlik az autós közlekedés.

A harmadik szint pedig az emberek, a társadalom szövete, ami létezik egyfajta elvont formában, ahogy ismerősi kapcsolatainkat építjük, de mindennek van egy földrajzi vonatkozása, hisz a szomszédunkkal nagyobb eséllyel ismerjük egymást, mint valakivel a város másik végéből.

Mindezek pedig szépen előrevetítik, hogy

a városokat ma már könnyen adatosíthatjuk. Az adatalapú városfejlesztés pedig például arra jó, hogy különböző előrejelzéseket tegyünk, mondjuk, egyes üzletek forgalmáról, a levegő- és zajszennyezettség alakulásáról, egy új étterem vagy kávézó ideális helyszínéről, vagy a közúti dugókról

– röviden, hozzásegít minket az adat az élhetőbb városok tervezéséhez, építéséhez és működtetéséhez. 

zene város mesterséges intelligencia hálózatkutatás adatvizualizáció Janosov Milán

M. D./WMN: A fővárosi dugók vagy a Lánchíd autók elől való lezárása napjainkban meglehetősen átpolitizált téma. Ezeknek a vitáknak a feloldásához közelebb tudna vinni minket az adattudomány?

J. M.: Minden bizonnyal, és vannak is erre próbálkozások, de sok „iparágban”, így az önkormányzati szférában a világ nagyobb részén még eléggé gyerekcipőben járnak. A témához kapcsolódik viszont egy személyes példám is: 2022 tavaszán írtam egy cikket a budapesti kerékpáros közlekedés helyzetéről. Többek között az érdekelt, hogy a közbringarendszer állomásai mennyire könnyen közelíthetők meg. Ezt úgy szokás mérni, hogy lebökünk egy pontot a térképre, mondjuk, egy utcasarkot, és megnézzük, onnan hány perc séta, mire eljutunk egy Bubi-állomáshoz. Létezik a 15 perces város elképzelés, ami azt mondja, hogy ha minden hétköznapi élethez szükséges szolgáltatást, intézményt – iskolát, munkahelyet, kórházat, boltot, tömegközlekedési eszközt – el tudunk érni negyedórán belül gyalog vagy biciklivel, akkor az egy élhető lakóhely. (És milyen sokszor teszünk meg ennél sokkal nagyobb távokat akár a napi ingázás során!)

Visszatérve a saját példámra (ami a Qubit-en ITT olvasható): kiszámoltam, és lerajzoltam egy térképen, hogy különböző kerületeken, szomszédságokon belül hány perc elérni a legközelebbi Bubi-állomást. A térképen aztán szépen látszott, hol vannak a vakfoltok.

Kiderült, hogy a Budapestet alkotó 200 városrésznek körülbelül csak az egynegyedéből (főleg a belvárosból) érhető el negyedóra sétával a 150-nél is több kerékpárállomás.

Persze az eredményeket érdemes összevetni lakossági adatokkal (élnek-e ott egyáltalán, milyen sűrű a lakosság, megfordulnak-e ott olyan emberek, akik potenciálisan kerékpároznának stb.), illetve a tömegközlekedés lehetőségivel is, de mindenképp jelzést adnak arra vonatkozóan, hol érdemes még állomást létrehozni. Ezzel párhuzamosan a BKK oldalán viszont kijött egy szavazás, hogy hol legyen még Bubi-állomás. Fontos a közösségi érdek és konszenzus, de mégiscsak ez az én szemszögemből kicsit olyan, mintha legközelebb azt szavaznánk meg, hogy 5 + 5 ezentúl legyen inkább 12. 

M. D./WMN: Ez rávilágít, mennyire félrevihet, ha szakértői kérdéseket bocsátunk szavazásra (pláne úgy, hogy az emberek kerékpározási kedvét ennél biztosabb módszerekkel is lehet mérni). 

J. M.: A városfejlesztés kapcsán eszembe jut egy másik téma is, amivel nemrég foglalkoztam. Összevetettem Bécset és Budapestet a nyilvánosan elérhető defibrillátorok elhelyezkedése alapján. Az, hogy egy ilyen készüléket hány perc alatt lehet sétálva vagy futva elérni, kritikus fontosságú lehet egy járókelő túlélési esélyeit tekintve még akkor is, ha valószínűleg kell szakértelem a defibrillátor használatához. Hozzá kell persze tennem, hogy ez korántsem az egyetlen faktor, és még inkább, hogy nem vagyok orvosszakértő, szóval itt egyrészt kívül merészkedtem a saját szakterületemen, másrészt viszont remek példa arra, ahogy az adattudomány más területeket is tud segíteni döntéstámogató szerepben. 

A cikk módszertana az előző, bubis példához nagyon hasonló: térképes formában elemeztem, a város különböző pontjairól mennyi időbe telik elérni a legközelebbi készülékeket. A kényelmes sétatempó helyett itt versenytempós futással számolva. A probléma ott kezdődik, hogy a készülékek fele Budapesten nincs regisztrálva, így viszont megtalálni is nehezebb őket, ha valaki online, a telefonján keres információkat. Ez a fajta adathiány egyébként viszonylag gyakori technikai probléma a mi szakmánkban.

zene város mesterséges intelligencia hálózatkutatás adatvizualizáció Janosov Milán

Az elérhetőségi idő alapján színezett térképen a piros foltok jelzik, hogy honnan tíz perc, vagy annál több elérni egy defibrillátort – ami eleve csak az odautat jelenti, az eszköz felvételét, és a visszaszaladást nem tartalmazza. Lehet látni, hogy nálunk mennyivel több a piros rész, persze azt is fontos számításba venni, hogy egyes területeken nem feltétlenül laknak. Ezzel együtt is azt találtam, hogy míg Budapesten tíz perc vagy annál több idő gyalogosan elérni egy defibrillátort a fővárosi lakosság kábé 80 százaléka esetén, addig Bécsben körülbelül öt perc alatt le lehet fedni az emberek 90+ százalékát.

A térkép alapján, némi extra matekkal meghatározható, hogy lakosságarányosan mely területekre kellene még defibrillátor, de az is nagy kérdés, hogy az egészségügy mit tud, akar kezdeni az ilyesfajta számításokkal – ezúton is szeretném jelezni, szívesen átadom ezeket az elemzéseket, ha elfogadják. 

M. D./WMN: Amellett, hogy az adat- és hálózattudomány segíthet biztonságosabbá, fenntarthatóbbá, élhetőbbé tenni a városainkat, a lakók közösségi érzését is fokozhatja, amire szintén elég nagy szükségünk lenne. Ennek a felhasználásnak egy szép példája, hogy a Telekom csapatával és Balogh Máté zeneszerzővel közösen létrehoztátok Budapest dallamát. Mik voltak ennek a projektnek a főbb lépései?

J. M.: A projekt keretében a városlakók mobilitási adatait (hogy hol élnek, hova járnak dolgozni, hol töltik a szabadidejüket) – a vonatkozó adatvédelmi szabályok betartása mellett – igyekeztünk láthatóvá és hallhatóvá tenni. Az egyik első kihívást az jelentette, hogyan lesz az adatból hang. Ahhoz, hogy erre választ kapjunk, először vissza kell mennünk oda, mit jelent egy idősor. Az idősor egy olyan függvény, amelynek egyik tengelyén az idő van, a másikon meg szerepelhet például a hőmérséklet napi alakulása (a nap folyamán órás bontásban hány °C-t mértünk) vagy egy részvény árfolyama (mennyit voltak hajlandóak fizetni egy a részvényért az elmúlt évek során, napi bontásban). 

 

Ugyanilyen idősort létre lehet hozni annak alapján is, hogy egy-egy GPS-koordinátával meghatározott helyen hány telefon aktív a nap különböző óráiban a 4G-5G hálózaton. A többféle mobilaktivitási-adatpontot (hogy ki telefonál, ki küld SMS-t, ki milyen appokat használ) a Telekom több millió felhasználóra vonatkozóan rögzíti és gyűjti – végül az ez alapján készült, összesített, órás és kerületi szintű anonim adathalmazt használhattam.  

M. D./WMN: Ezekből az adatokból látni lehet, hogy mely napszakban és mely földrajzi területeken emelkedik a mobiltelefonok aktivitása? 

J. M.: Igen, az ilyen adatokból nagyon jól kirajzolódnak egyrészt a főbb közlekedési csomópontok, például a metróvonal, ahol sok ember megfordul, és miközben utazik, használja a telefonját. Ha pedig igazán közelről megnézzük, látszanak lyukak is, mondjuk, a liftek környékén, ahol gyakran elmegy a térerő. Az is nyomon követhető, hogy hétvégéken később kelnek az emberek, mint hétköznap, vagy a belváros zsúfoltabb, pörgősebb, mint a külváros.

Ezek persze olyan dolgok, amiket intuitíve is várnánk, de több százezer ember adatain keresztül látni mindezt mégiscsak más – így lesz a véleményből számszerűsített tény.

De hogyan is lesz aztán ebből hang? Pár éve elkezdtem amatőr szinten DJ-zni, és zenélés közben eszembe jutott, hogy valójában az ilyenkor lejátszott zenék, dallamok is az idősor nevű matematikai állatfajba tartoznak, hiszen zenei hangok sorozatából állnak. Innen már csak pár matekozós lépés, hogy a mobilitási adatok óránkénti vagy napi bontását mint idősort, átkonvertáljuk egy másik idősorrá, az egymást követő hangokká. Ezen a ponton jó sok különböző változat következett, mire létrejött egy olyan hangsor, ami az emberi fül számára is befogadható. De ez még itt nem annyira dallam, inkább csak olyan, mint egy régi telefonos csengőhang.   

zene város mesterséges intelligencia hálózatkutatás adatvizualizáció Janosov Milán

M. D./WMN: Jól gondolom, hogy itt jön képbe a mesterséges intelligencia? 

J. M.: A generatív AI-szolgáltatások, mint a ChatGPT vagy a Midjourney az utóbbi időben nagyon felfutottak. Zenében is vannak ilyen programok, bár nem olyan felkapottak, és talán még nem annyira egyszerű használni őket, de a logika itt is hasonló: rengeteg adatot, ez esetben klasszikus zenei darabot tanítottak ezeknek az AI-modelleknek. A megtanult minták alapján tudják, hogy egyes hangsorok után tipikusan milyen hangsorok szoktak következni.

Ezek abszolút statisztikai együttállások, ilyenformán az AI-nak nincs zenei ízlése, nem tudja, hogy ez egy jól hangzó zene, csak azt, hogy ezek éppen statisztikailag harmonizáló adatpontok (sőt, az AI nem is „tud”, de egy másik kérdés).

Így pedig képes olyan hangsort generálni, ami számunkra várhatóan kellemes lesz. Összegezve: kap egy tanuló-adatmintát, abban vezérmotívumokat keres, e köré írja a dallamot, és ezt akár több száz verzióban is elkészíti. Ebből választottuk ki azt, ami elég jó volt ahhoz, hogy Budapest dallama legyen. 

Ez alapján Balogh Máté zeneszerző komponált egy rendkívüli komolyzenei darabot vonósnégyesre, a 3D-adatvizualizációt pedig egy örmény alkotó, Hayk Zakoyan készítette. A másfél perces videón látni lehet, ahogy a gömb végül Budapest-formába rendeződik, közben az oszlopok magasságai a mobilos intenzitást és a nappalok-éjszakák váltakozásait jelzik, a színek pedig nagyjából a zene intenzitását követik. 

M. D./WMN: Felemelő érzés ilyen formában is látni, ahogy belőlünk, emberekből, akik itt élünk és dolgozunk Budapesten, összeáll valami nagyobb egész: a város színe és ritmusa. Említetted a DJ-skedést, és volt olyan kutatásod is, amelyben azt vizsgáltad, min múlik, hogy valakiből sztár DJ legyen. Mik voltak a tanulságok? 

J. M.: A brit DJ Mag minden évben közönségszavazást indít arról, ki a világ 100 legnépszerűbb DJ-e. Nem is tegnap kezdték, így elérhetők 20–25 évre visszamenően ezek a top 100-as rangsorok, amik alapján azon kezdtem el gondolkozni, hogy előre lehet-e jelezni, ki fog legközelebb a lista élére állni. Sikertelen projektekről ritkán mesélünk, ám itt az első ötlet mégis kudarcba fulladt. Ezt követte a hálózatos rész, ami viszont tudományos szemmel váratlanul gyümölcsöző lett: a top 100-ba kerülők körülbelül fele korábban már dolgozott valakivel, aki bent volt a top 100-ban, és tipikusan olyannal, aki az élbolyban volt. Őket elneveztük mentoráltaknak és mentoroknak. Utóbbiak közé sorolhatók egy-egy zenei stílus klasszikusai, például David Guetta, Martin Garrix vagy Paul van Dyk.

Kiderült, hogy ezek a kiemelkedő egyéniségek egyfajta kapuőrfunkciót látnak el a zenei közösségen belül: az a feltörekvő művész, aki valamelyikükkel közösen adhat ki dalt, átlagosan háromszor jobb helyezést ér el a top 100-as listán. Nagyobb eséllyel tud bekerülni a rangsorba, akár a 20–22. helyig is eljut, viszont szinte sosem előzi meg a mentorát. 

Ha tehát valaki a legnagyobb sztárok közé akar tartozni, akkor jobban jár, ha nem mentorálják, ám ez azt is jelenti, hogy sokkal nagyobb kockázatot vállal, hiszen lehet, hogy sosem jön el számára az áttörés. 

M. D./WMN: Egyébként is nagyon izgalmas kérdés, hogy mi van előbb: a kapcsolati háló vagy a siker? 

J. M.: Erre is, arra is látunk példát. David Guetta esetében a hálózatos pozíció volt meg először, és utána jött a szakmai siker, George Lucas filmrendezőnél meg pont fordítva, először ért el sikereket, és utána kezdtek el sokan kapcsolódni hozzá. A PhD-kutatásom során több tízezer filmrendező, zenész, író és tudós vizsgálatával azt az eredményt kaptam, hogy jóformán teljesen véletlenszerűen dől el, hányadik munkánk lesz a legsikeresebb. Viszont minél többször próbálkozunk, annál nagyobb esélyünk van arra, hogy valami maradandót alkossunk. 

M. D./WMN: Visszakanyarodva a zenéhez: hamarosan eljöhet az a pont, amikor a streamingszolgáltatások már jobban fogják ismerni az ízlésünket, mint mi magunk. Szerinted ez milyen előnyökkel és veszélyekkel jár?

J. M.: Az előny nyilván az, hogy nem kell sok időt a megfelelő zene kiválasztásával töltenünk. Viszont az emberi faktort, a kreativitást kiveheti a technológia a zenéből. Kicsit olyan ez, mint a dob és dobgép. Utóbbi sosem hibázik, nem üt mellé egy milliszekundumot sem. Viszont lehet, hogy pont emiatt nem érezzük annyira természetesnek, emberinek, a sajátunknak. Ettől még lehet, hogy egy gép által összerakott DJ-szettre tömegek el tudnak majd bulizni, hiába hiányzik belőle az egyediség. 

zene város mesterséges intelligencia hálózatkutatás adatvizualizáció Janosov Milán

M. D./WMN: Közben azon gondolkodom, hogyan hat majd az idegrendszerünkre, a mentális egészségünkre, ha állandóan számunkra kellemes ingerekkel leszünk körülvéve. Beszűkülünk-e, fokozódik-e a negatív ingerekkel szembeni sebezhetőségünk? 

J. M.: Pont nemrég hallottam a Spotify mérnöki podcastjában, hogy ők is látják az algoritmus torzítását, azt, hogy ebből a szempontból is buborékba leszünk zárva. Dolgoznak rajta, hogy ez ne így legyen, csak hát

kérdéses, mennyire lehet hatékony az a megoldás, ami ugyanabból a rendszerből érkezik, mint a probléma. Elképzelhető, hogy befoltozzák, de a folt mentén várhatóan látszani fog a varrás. 

M. D./WMN: A Trónok harcától kezdve az amerikai színészek házassági viszonyain át a 2022-es focivébéig, kifejezetten szórakoztató témákról is készítesz hálózatos térképeket. Úgy tűnik, egy jóféle játékosság jellemzi a munkádat – ezt belülről is ilyen megélni? 

J. M.: Teljesen! Van egy technológiai része, amikor adatot gyűjtünk meg összerakjuk, de van egy felfedezés része is, annak az izgalma, amikor kezd kirajzolódni egy térkép. Ezek persze tipikusan olyan térképek, hogy amikor már készen vannak, utólag szinte magától értetődőnek tűnnek. Erről eszembe jut az egyik első hálózatkutató, Duncan J. Watts könyve, aminek az a címe, hogy Everything is obvious: Once you know the answer (Minden nyilvánvaló: Ha már tudod a választ). Egy-egy ilyen térkép láttán mondhatjuk tehát, hogy ó, hiszen erre én is gondoltam, de általában több más, ugyanannyira racionális hipotézis közül lesz valamelyik a befutó.   

 

M. D./WMN: Kutyaetológusok szoktak néha azzal viccelődni, hogy ők tudományosan írják le és bizonyítják azt, amit a gazdák már régóta tudnak. 

J. M.: Ám a gazdáknak is tud újat mondani a hálózattudomány – épp pár hónapja jelent meg az ELTE Etológia Tanszékének egyik kutatása, amiben én is közreműködtem, és amiben kutyák agyának aktivitási mintáit vizsgáltuk hálózatosan, és készítettük el az állatok funkcionális agytérképét, úgy tudom, világelsőként. 

M. D./WMN: Ha már társtudományok, mennyiben segíti az adattudósi munkádat, hogy eredetileg fizikusként végeztél?

J. M.: Nagyon sokban. A fizika alapvetően arról szól, hogy matematikai modellekkel írunk le természeti jelenségeket, és ezen belül fizikusok olyan változatos dolgokkal foglalkoznak, mint a folyadékok működése, a gravitáció, a fény, a villamosságtan, az új anyagok kifejlesztése vagy a repüléstechnológia. A fizikában az egyik fő motívum, ami engem is megfogott, hogy egy általános logikai rendszer segítségével tudunk problémákat megoldani. Valójában az adattudományban is ugyanez történik: az agykutatástól a Trónok harcán át a városfejlesztésig, számokkal, adatokkal válaszolunk meg kérdéseket. A különbség az, hogy

míg a fizikában laborban dolgoznak a kutatók, végzik a méréseket, és gyártják az adatsorokat, addig itt az adatok nem egyetlen mérésből jönnek, hanem például már fent vannak a neten, vagy egy-egy applikáció rendszerezve gyűjti őket a pillanatok alatt elérhető szervereken – mondhatni, tálcán kínálják őket a különböző alkalmazások.   

M. D./WMN: Nemrég írtam a matematikai szorongásról, és azt olvastam, hogy egyes kutatások szerint minden ötödik felnőtt fél, idegenkedik a számoktól. Te találkozol ilyen reakciókkal, amikor a munkádról beszélsz? 

J. M.: Általában ez az első reakció, ha elárulom, hogy fizikus vagyok. Ezért kimondottan ez is a célom ezekkel a projektekkel, mint a Vaják vagy a focivébé, hogy kihozzam az adattudományt az elefántcsonttoronyból, kicsit eloszlassam a hálózatokat körülvevő misztikus ködöt, és megmutassam, lehet ez szórakoztató is (onnan pedig már csak egy lépés, hogy hasznos). Mert lehet, hogy valakinek rossz élményei voltak matekórán, vagy ódzkodik a számoktól, de az már jobban érdekelheti, hogy előre lehet-e jelezni a Trónok harca cselekményét a korábbi évadok alapján. 

zene város mesterséges intelligencia hálózatkutatás adatvizualizáció Janosov Milán

M. D./WMN: Mit értesz hálózattudatosság, adatműveltség alatt, és szerinted miért érdemes ezeken a területeken a hétköznapi életünkben is fejlődnünk?

J. M.: Szerintem onnan érdemes megfogni, hogy ráérezzünk: bárhol, ahol kütyüzés zajlik, legyen az laptop, telefon, okosóra, bármi, ott adatok mozognak, és adatokat rögzítenek, amik kapcsolódnak hozzánk.

Legalább tudjunk arról, hogy van valaki, aki nézi, mit helyeztünk a bevásárló-kosarunkba, vagy milyen a pulzusunk az okosóránk szerint.

Ha van felugró ablak arról, hogy ezt szeretnénk-e, akkor tudatosan döntsünk. Az is egy út lehet, ha eleve kevesebbet osztunk meg magunkról, kevesebb kütyüt használunk, vagy máshogy használjuk őket, mint eddig. A lényeg, hogy szem előtt tartsuk, hogy ezek az adatok rólunk szólnak, rengeteg mindenre jók lehetnek már most is, vagy akár tíz év múlva, mert ezek az adatok akkor is ott lesznek.

Képek: Chripkó Lili/WMN

Milanovich Domi