Nástroje a metody pro čištění dat
Článek nabízí ucelený přehled hlavních technik a dostupných nástrojů, které se dnes používají při čištění a přípravě dat s ohledem na jejich velikost, technických dovedností uživatelů i potřeby projektu.
Množství dat, které každý den generujeme a shromažďujeme, je obrovské. Jak se v takovém množství zorientovat a umět v něm číst? Jedním z řešení může být jejich vizualizace – nástroj, který se používá k přetváření hodnot a symbolů do srozumitelnějších grafů či 3D modelů.
Vizualizace dat je proces převodu dat do vizuální podoby, která je pro nás lépe pochopitelná a zapamatovatelná. Díky vizualizaci vidíme v datech např. vzorce, můžeme sledovat trendy a změny v čase. Protože nám vizuální zobrazení poskytuje komplexnější pohled, jsou pro nás složité datové vztahy srozumitelnější. Vizualizace může mít různé podoby, od grafů a infografik, které jsou vhodné pro rychlé pochopení základních trendů v datech, až po interaktivní 3D počítačové modely.
Vědecká vizualizace je založená na modelování, renderování a 3D modelech. Vědeckou vizualizací se rozumí proces reprezentace dat v podobě grafických modelů. Vědecká vizualizace nám umožňuje vidět vztahy a souvislosti, které jsou pro lidské oko jinak skryté (3D model molekuly, animace vývoje hvězdy). Pro pochopení složitých, neuchopitelných nebo abstraktních objektů, které existují pouze v naší mysli, jsou tak vizuální modely mimořádně užitečné.
Vizualizace informací je postup, kdy se počítačovému programu poskytne soubor instrukcí pro zpracování velkého množství dat, která jsou ze své podstaty abstraktní, s cílem převést informace do vizuální podoby – grafů, nákresů, map nebo diagramů. V grafu pak můžeme sledovat výsledky volebního průzkumu, vývoj cen nemovitostí v čase nebo podíl jednotlivých náboženství v České republice.
Jedná se o vizualizaci geoprostorových dat pomocí interaktivní vizualizace. Geografické vizualizace se uplatňují ve všech možných oborech, podívejte se např. na projekt Filmové Brno, který je zaměřený na dějiny filmové distribuce v Brně.
Vizualizací lze dobře využívat i v oblasti humanitních věd – jedním z příkladů je archeologie. Díky digitálním technologiím jsou archeologické vizualizace trojrozměrné, virtuální a interaktivní. Už v roce 1997 bychom našli po celém světě desítky počítačových rekonstrukcí archeologických lokalit. Projekty jako např. digitální rekonstrukce římského chrámu si získaly velký mediální ohlas, na jehož základě zavedl vědec Paul Reilly do archeologie novou formu oboru, kterou pojmenoval „virtuální archeologie“.
Nahlédněte do archeologického 3D virtuálního muzea středověké keramiky, které vzniklo v projektu Vrcholně středověká keramika jako součást movitého kulturního dědictví.
V archeologii bývají 3D rekonstrukční modely navíc často doplněny informacemi, které vysvětlují kontext znázorňované situace – může jít o text, mapu nebo graf. Digitální modely tak mají velký potenciál oslovit širší veřejnost a předat množství informací vizuálně atraktivním způsobem.
Cílem projektu Archeologické 3D virtuální muzeum. Nové technologie dokumentace a prezentace neolitického sídelního areálu. bylo využít technologie 3D skenování k vytvoření virtuálního muzea, které bude prezentovat obraz neolitické kultury na příkladu sídliště v Bylanech u Kutné Hory.
Jedním z důvodů, proč vizualizaci využít je efektivní předávání informací. Náš mozek vizuální informace zpracovává rychleji a uchovává je déle než text nebo čísla. I přes velké množství dat vložených do grafu nebo interaktivní vizualizace bude sdělení pro čtenáře srozumitelné a dokáží se v něm rychle zorientovat. Proto je vizualizace důležitým nástrojem nejen ve vědě, ale také např. ve výuce a vzdělávání.
Dalším důvodem je její argumentační síla. Vizualizace dat může pomoci zvýšit přesvědčivost našich argumentů. Některé výzkumy poukazují na to, že grafy dodávají našemu sdělení důvěryhodnost a na čtenáře mají větší dopad než samotný text nebo čísla. Síly vizualizace lze však také zneužít. Vizuální zobrazení může být záměrně manipulativní a nepřesné – ne vždy ukazuje všechna dostupná data. Manipulovat lze zvolenou formou grafu, barvou nebo podsekáváním osy.
V kurzu se seznámíte se základními koncepty vizualizace dat a vizuálního vnímání nebo jaký typ grafu zvolit a jak ho správně vytvořit v nástrojích typu MS Excel nebo RAWGraphs.
Článek nabízí ucelený přehled hlavních technik a dostupných nástrojů, které se dnes používají při čištění a přípravě dat s ohledem na jejich velikost, technických dovedností uživatelů i potřeby projektu.
Otevřená věda klade důraz na zpřístupňování výzkumných dat i v humanitních oborech. Co ale v tomto kontextu data znamenají? A proč nejsou neutrální? Přečtěte si článek, který přibližuje filozofické i praktické aspekty pojmu data v humanitních vědách a poukazuje na význam humanitní perspektivy pro porozumění datové kultuře.