Můj osobní psycho deník: Nástroje a metody datové analytiky

1. část

Seznam televizí na Heureka.cz

Pomocí rozšíření na Chromu XPathHelper jsem označila seznam televizí na heurece.

Pak už jsem importovala data do Google Sheets a postupně vytvořila tabulku s názvy televizí, cenovým rozpětím a hodnocením televizí.

Import jsem provedla pomocí kódu:

=IMPORTXML("https://televize.heureka.cz/";"//div[@class='p']//h2/a|//div[@class='p last']//h2/a")

Stejnou cestou jsem vytvořila i cenové rozpětí:

=IMPORTXML("https://televize.heureka.cz";"//div[@class='p']//p[@class='price']|//div[@class='p last']//p[@class='price']")

a i hodnocení: =IMPORTXML("https://televize.heureka.cz/";"//div[@class='p'][*]//p[@class='rw'] | //div[@class='p last'][*]//p[@class='rw']")

Výsledná tabulka

2. část

Analýza textu

Vyzkoušela jsem nástroj Geneea Text Analysis. Vložila jsem pro zajímavost krátký článek z Novinky.cz. Domnívám se, že se jedná o užitečný nástroj a to především v případě, když potřebujeme najít v textu klíčová slova.

3. část

RegexOne

Prošla jsem si tutorial na regexone.com.

Můj osobní psycho deník

pondělí 7. října 2019

Nástroje a metody datové analytiky - 2. úkol