Články autora: Tamás Szőke

Záverečný webinár

Záverečný webinár

Uncategorized | Tamás Szőke | 1. júla 2020

Záznam zo záverečného webináru projektu.

Zhlukovanie dokumentov podľa silných stránok SWOT

python | Tamás Szőke | 28. júna 2020

SWOT analýza je dôležitým vstupom pre tvorbu rozvojových stratégií PHSR. Tento notebook je o skúmaní podobnosti silných stránok obcí. Výsledkom sú zhluky obcí, ktoré majú podobné silné stránky.

Počítanie n-gramov vo swot analýzach

python | Tamás Szőke | 24. júna 2020

Príklad frekvenčnej analýzy n-gramov vo SWOT analýzach (s aj bez POS tagov). V oblasti výpočtovej lingvistiky a pravdepodobnosti je n-gram súvislou sekvenciou n položiek z danej vzorky textu. Položkami môžu byť fonémy, slabiky, písmená, slová alebo bázové páry podľa aplikácie. V našom prípade sú to bo a tri gramy slov.

Lematizácia SWOT

python | Tamás Szőke | 24. júna 2020

Výsledkom dolovania SWOT tabuliek sú textové reťazce nachádzajúce sa v príslušných kvadrantoch SWOT analýzy. Jednotlivé slová (tokeny) tvoriace tieto textové reťazce sa v nich nachádzajú v rôznych gramatických tvaroch. Ak ich chceme ďalej analyzovať tak potrebujeme najprv získať základné alebo “slovníkové” tvary slov. Tento proces sa volá lematizácia.

Prvá diplomová práca z našich dát

Prvá diplomová práca z našich dát

Uncategorized | Tamás Szőke | 22. júna 2020

Na Národohospodárskej fakulte EU v Bratislave bola úspešne obhájená prvá diplomová práca, ktorá vznikla využitím našich dát. Autorom práce „Strategické plánovanie rozvoja obce“ je Ing. Alexandra Urbanová a pozrieť si ju môžete v knižnici EUBA. Abstrakt URBANOVÁ, Alexandra: Strategické plánovanie rozvoja obcí. – Ekonomická univerzita v Bratislave. Národohospodárska fakulta; Katedra verejnej správy a regionálneho rozvoja. […]

Extrakcia vízie rozvoja územia

python | Tamás Szőke | 17. júna 2020

V nasledujúcopm príklade použijeme predpripravené dáta a pomocou regulérnych výrazov vyextrahujeme víziu rozvoja z jednotlivých dokumentov PHSR.

Dolovanie SWOT

python | Tamás Szőke | 17. júna 2020

SWOT analýza by sa v dokumentoch mala objaviť ako tabuľka o rozmere 4×4. V realite sú to ale tabuľky s variabilným počtom stĺpcov a riadkov a s variabilnou pozíciou elementov SWOT. V niektorých prípadoch je SWOT v dokumentoch uvedený ako súvislý text a absentuje tabuľková forma.

Prítomnosť SWOT analýzy v dokumentoch PHSR

python | Tamás Szőke | 17. júna 2020

Jedným z kľúčových obsahových prvkov dokumentov PHSR je SWOT analýza, ktorá slúži na definovanie východísk pre návrhovú časť PHSR.

Príklad extrakcie formuláru U1

python | Tamás Szőke | 17. júna 2020

Formulár U1 – Zámer spracovania PHSR. Obsahuje informácie o pláne na vypracovanie PHSR. Táto tabuľka sa tvorí pred samotným spracovaním PHSR a popisuje predpokladaný spôsob spracovania dokumentu, rámcový harmonogram a predpokladané náklady.

Príprava tabuliek na extrakciu dát

python | Tamás Szőke | 17. júna 2020

V predchádzajúcich skriptoch sme súbory korpusu PHSR homogenizovali na formát pdf a následne sme z nich vyextrahovali tabuľky do samsotatných excelovských súborov. Samostatné súbory sú užitočné pre manuálne overenie výsledkov následných algoritmov ale nie sú optimálne pre automatizované spracovanie. Preto isch skonsolidujeme do jedného objektu.