pondělí 7. října 2019

Nástroje a metody datové analytiky - 2. úkol


1. část

Seznam televizí na Heureka.cz


Pomocí rozšíření na Chromu XPathHelper jsem označila seznam televizí na heurece.



Pak už jsem importovala data do Google Sheets a postupně vytvořila tabulku s názvy televizí, cenovým rozpětím a hodnocením televizí.

Import jsem provedla pomocí kódu: 
=IMPORTXML("https://televize.heureka.cz/";"//div[@class='p']//h2/a|//div[@class='p last']//h2/a")

Stejnou cestou jsem vytvořila i cenové rozpětí:
 =IMPORTXML("https://televize.heureka.cz";"//div[@class='p']//p[@class='price']|//div[@class='p last']//p[@class='price']")

a i hodnocení: =IMPORTXML("https://televize.heureka.cz/";"//div[@class='p'][*]//p[@class='rw'] | //div[@class='p last'][*]//p[@class='rw']")


Výsledná tabulka


2. část

Analýza textu


Vyzkoušela jsem nástroj Geneea Text Analysis. Vložila jsem pro zajímavost krátký článek z Novinky.cz. Domnívám se, že se jedná o užitečný nástroj a to především v případě, když potřebujeme najít v textu klíčová slova. 



3. část

RegexOne


Prošla jsem si tutorial na regexone.com.




Žádné komentáře:

Okomentovat