Nástroje a metody pro čištění dat
Článek nabízí ucelený přehled hlavních technik a dostupných nástrojů, které se dnes používají při čištění a přípravě dat s ohledem na jejich velikost, technických dovedností uživatelů i potřeby projektu.
Bez klavíru a notového zápisu by pravděpodobně nevznikla vrcholná díla řady hudebních skladatelů. Dnes může autor skládat hudbu v softwaru nabízejícím řadu funkci, které mu jeho práci zjednoduší, případně rozšíří jeho možnosti při manipulaci s hudebním dílem. V minulosti se studovaly notové zápisy, libreta a další tištěné materiály, dnes máme k dispozici digitalizované sbírky a databáze. Přečtěte si, jaké další možnosti nabízejí digitální technologie v oblasti hudební vědy.
Už v roce 1957 se dvojici počítačových vědců podařilo pomocí počítače nazvaného ILLIAC I autonomně vygenerovat skladbu s názvem lliac Suite for String Quartet. Lejaren Hiller a Leonard Isaacson z Illinoiské univerzity využili principů kompozičních pravidel i umělé inteligence. Dá se říct, že svým počinem odstartovali vývoj autonomních generativních modelů. Zásadní místo v této problematice však zaujímá systém Experiments in Musical Intelligence skladatele David Copa. Jeho systém se nejen učí z již existujících skladeb, ale navíc umí i napodobit předkládaný styl kompozice. Jeho další projekt z roku 1990 Emily Howell už dokonce umí komponovat vlastním stylem. V současnosti se autonomnímu generování hudby věnuje řada projektů, které pracují s modelem umělé neuronové sítě. Právě strojové učení a umělá inteligence jsou metody, které nabízejí zcela nové možnosti při zpracování většího množství hudebních dat.
Společnost OpenAI vytvořila pomocí nástroje MuseNet hlubokou neuronovou síť, která je naučená na hudbě od Johanna Sebastiana Bacha, respektive jeho kompozici. Systém se naučil, jak Bach skládal hudbu, jak vede jeho melodie a jak jsou dlouhé jeho tóny. Následně systém vygeneruje nový obsah a nové skladby, které by teoreticky měly znít, jako kdyby je komponoval Bach. Jedná se tedy o specifickou neuronovou síť, která napodobuje styl skladatele. Poslechněte si ukázku a posuďte sami, zda se jí to povedlo.
Sonifikace je technika, díky které můžeme převádět data do zvukových výstupů. Stejně jako v případě vizualizace dat, kde se data převádějí třeba do grafů a diagramů, sonifikace využívá zvuk k reprezentaci komplexních datových souborů.
MusicLM je specifický systém, který generuje hudbu z textových popisků. Systém se učí z informací z hudebních nahrávek. Na základě zadaného promptu vygeneruje třeba soundtrack strategické hry. Jak zní melodické techno nebo jazz v podání MusicLM si můžete vyzkoušet tady.
Sonic Visualiser je specifický program pro hudební analýzu a pro rozbor informací získaných z hudebních nahrávek. Uživatelé mohou podrobně prozkoumávat různé aspekty zvukových nahrávek – umožňuje například provádět detailní analýzy frekvencí a tempa ve zvukových stopách.
Multidisciplinární tým výzkumníků z Masarykovy univerzity, Vysokého učení technického a Národního muzea společně pracuje na projektu Paměť zvuku. Na příkladech klavírních skladeb Bedřicha Smetany a Antonína Dvořáka zkoumají využití strojového učení a umělé inteligence. Cílem projektu je vytvořit analytický nástroj vhodný pro hudebně-interpretační praxi, který navíc umožní také analýzu expresivity interpretačního výkonu. Dalším výstupem projektu bude například metodika k muzikologickému využití softwaru, software a specializovaná databáze.
Projekt zkoumá využití strojového učení a umělé inteligence pro zachycení vývoje interpretace české hudby na příkladech klavírních skladeb B. Smetany a A. Dvořáka. Více o projektu.
Článek nabízí ucelený přehled hlavních technik a dostupných nástrojů, které se dnes používají při čištění a přípravě dat s ohledem na jejich velikost, technických dovedností uživatelů i potřeby projektu.
Otevřená věda klade důraz na zpřístupňování výzkumných dat i v humanitních oborech. Co ale v tomto kontextu data znamenají? A proč nejsou neutrální? Přečtěte si článek, který přibližuje filozofické i praktické aspekty pojmu data v humanitních vědách a poukazuje na význam humanitní perspektivy pro porozumění datové kultuře.