Textová analýza
V minulých letech se vědci při zkoumání nejen literárních textů spoléhali na takzvané blízké čtení (close reading), což znamenalo čtení a analýzu jednotlivých textů. Touto metodou bylo možné zpracovat desítky, nebo maximálně stovky textů. Díky digitalizačním projektům, ale také textům, které produkují sociální média je dnes dostupné obrovské množství textových dat, které není možné zpracovávat klasickou metodou "close reading".
Díky nástrojům pro počítačové zpracování textových dat je ale možné velké množství dat analyzovat novými způsoby. Text mining - neboli vytěžování textových dat - a kvantitativní textová analýza umožňuje vědcům vypořádat se s tímto obrovským množstvím dat a najít v nich vzorce, které by nebyly pro lidské čtenáře viditelné. Metoda kvantitativní textové analýzy, která je někdy označována jako distant reading - „vzdálené čtení“, nenahrazuje tradiční analýzu („blízké čtení“), ale může ji doplnit.
Koncept Distant reading není nijak nový. Již v roce 2000 ho představil literární vědec Franco Moretti.
Nástroje pro textovou analýzu
- Mallet Mallet je nástrojem pro Topic modeling, tedy modelování témat v textu.
- Voaynt Tools Voyant Tools je webové prostředí pro čtení a analýzu textu. Jedná se o vědecký projekt, který má usnadnit čtení a interpretační postupy studentům a vědcům digitálních humanitních oborů i široké veřejnosti.
- Sketch Engine Sketch Engine (SkE) je software, který vyhledává slovní profily (word sketches), sdružuje je na základě gramatických relací a vytváří z korpusu tezaury.
- KonText Rozhraní KonText je webová aplikace, která slouží k přístupu ke korpusům ČNK a práci s nimi.
- Google nGram viewer Nástroj společnosti Google pro zkoumání klíčových slov ve více než 5 milionech knih v Googlebooks do roku 2008.