Nástroje a metody pro čištění dat
Článek nabízí ucelený přehled hlavních technik a dostupných nástrojů, které se dnes používají při čištění a přípravě dat s ohledem na jejich velikost, technických dovedností uživatelů i potřeby projektu.
Již druhý rok měli účastníci online konference Digitální data perspektivou humanitního vědce možnost poslechnout si příspěvky od odborníků a výzkumníků z řad oborů humanitních věd. Konference, jež proběhla v úterý 23. 11. 2021, i tentokrát nabídla prostor pro sdílení poznatků a zkušeností. Byly představeny způsoby práce s digitálními daty, nové technologie jako 3D tisk i možnosti zpřístupnění digitálních materiálů. Kromě akademiků a studentů z Masarykovy univerzity jsme mohli virtuálně přivítat i návštěvníky z dalších institucí a organizací. Přinášíme shrnutí jednotlivých příspěvků včetně odkazů k jejich záznamům.
Ludmila Kaňáková představila projekt Projectiles, který je výstupem pětiletého výzkumu kamenných šipek ve střední Evropě. Byl představen jak kontext sběru, tak i motivace data sdílet. Popsán byl i proces integrace do infrastruktury Digitalia MUNI ARTS a spolupráce s týmem projektu LINDAT/CLARIAH-CZ na tvorbě nové platformy projectiles.phil.muni.cz.
Příspěvek autorů (Ivona Solčániová, Roman Brück, Karolína Stehlíková, Ivan Málek) názorně představil probíhající projekt Theatre 3D, který kombinuje znalosti z oboru divadelní historie a 3D tisku. Cílem projektu je vytvoření setu vytištěných 3D modelů divadelních budov a souvisejících artefaktů. Byl popsány jednotlivé procesní fáze projektu, od sběru podkladů, vytvoření 3D modelu a samotného tisku.
Zdenko Vozár ve své přednášce představil společný projekt Národní knihovny ČR, Moravské zemské knihovny a Knihovny Akademie věd ČR, jež usiluje a zpřístupnění dat i metadat z digitální knihovny všem zájemcům z akademické obce i široké veřejnosti. Toho zpřístupnění by bylo možné díky budovanému exportnímu modulu, který by v budoucnosti bylo možné nasadit i na další digitální knihovny. Představen bylo také rozhraní pro export textů z Webarchivu ČR.
Na poslední přednášce promluvil Michal Lorenz o infrastruktuře pro digitální platformy Digitalia MUNI ARTS, jež vznikla v rámci národní velké výzkumné infrastruktury LINDAT/CLARIAH-CZ. Představena byly jak kurátorská, tak technická řešení, význam infrastruktury pro akademickou obec i širokou veřejnost a plány vývoje.
V odpolední části konference bylo představeno celkem pět posterů. Účastníci mohli nad postery s přednášejícími debatovat v samostatných virtuálních místnostech.
Databáze Všeobecné zrcadlo digitální Asie zpřístupňuje zdroje z oblasti asijských studií a sadu nástrojů relevantních pro výzkum v oblasti Asie. Pro lepší vyhledávání lze využít i hashtagů.
Poster představuje proces kvantitativní analýzy alchymických textů, od ustanovení textového korpusu, jenž žánrově spadá do tzv. florilégií, až po digitální zpracování.
Projekt Beckett Digital Library umožňuje intertextuální reference Beckettovy hry Pas moi a vykresluje tak lepší obrázek o jeho tvůrčím procesu. Autorská práva neumožňují zpřístupnit celý poster, jak ho bylo možné vidět v diskuzi. Pokud vás toto téma zajímá víc, obraťte se prosím přímo na autora.
Poster představil disertační projekt zaměřený na koncept identity ‚influencer‘ na Instagramu a výzvy spojené se sběrem dat a vývoje metodologie.
HUME Lab je vědecká infrastruktura na Masarykově univerzitě, podporující experimentální výzkum v sociálních a humanitních vědách a poskytující badatelům prostor a nástroje pro jejich projekty.
Děkujeme všem přednášejícím i účastníkům a budeme se těšit na další podobná setkání.
Článek nabízí ucelený přehled hlavních technik a dostupných nástrojů, které se dnes používají při čištění a přípravě dat s ohledem na jejich velikost, technických dovedností uživatelů i potřeby projektu.
Otevřená věda klade důraz na zpřístupňování výzkumných dat i v humanitních oborech. Co ale v tomto kontextu data znamenají? A proč nejsou neutrální? Přečtěte si článek, který přibližuje filozofické i praktické aspekty pojmu data v humanitních vědách a poukazuje na význam humanitní perspektivy pro porozumění datové kultuře.