Články autora: Tamás Szőke

Extrakcia surových tabuliek

python | Tamás Szőke | 17. júna 2020

Dokumenty PHSR obsahujú množstvo tabuliek a formulárov s dôležitým obsahom avšak s výraznou variabilitou. Testovali sme viacej nástrojov a knižníc až sme nakoniec narazili na camelot. Tento zošit obsahuje príklad použitia camelotu na extrakciu tabuliek z pdf súborov.

Prítomnosť vzorových tabuliek

python | Tamás Szőke | 17. júna 2020

Ďalšou úrovňou overenia konformity bolo overenie prítomnosti formulárov v súlade s metodikou platnou pre PO 2014-2020. Na rozdiel od základných obsahových častí PHSR, ktoré sú priamo uvedené v zákone, formuláre vyplývajúce z metodiky nie sú záväzné.

Prítomnosť povinných kapitol

python | Tamás Szőke | 17. júna 2020

Zákon o regionálnom rozvoji stanovuje povinné obsahové časti pre dokumenty PHSR. Pomocou regulérnych výrazov sme sa snažili identifikovať prítomnosť povinných častí v dokumentoch PHSR za PO 2014-2020.

Konverzia do plaintext

python | Tamás Szőke | 17. júna 2020

V týchto notebookoch nájdete postup, ako sme súbory z formátu pdf konvertovali do čistého textu. Python ponúka množstvo balíkov pre zvládnutie tejto úlohy. Niektoré z nich sme uviedli v Konvenciách pre predspracovanie textových dát PHSR.  

Konverzia do pdf

python | Tamás Szőke | 17. júna 2020

V tomto notebooku nájdete postup, ako sme konvertovali súbory z rôznych formátov (doc, odcx, xls, rtf, odt…) do formátu pdf.

Základná štatistika datasetu OS

python | Tamás Szőke | 17. júna 2020

Základný korpus OS pozostáva z niekoľkých tabuliek a pár tisícov súborov. Aj bez ďalšieho čistenia a triedenia poskytujú surové údaje dôležité poznatky o stave plánovania regionálneho rozvoja na Slovensku.    

Sťahovanie našich dát

python | Tamás Szőke | 2. septembra 2019

Tu je malá PYTHON pomôcka v prostredí Google Colab pre tých, ktorí si chcú stiahnuť naše dáta prostredníctvom API a uložiť si ich na Google Drive.  

Nové data API

Nové data API

O projekte | Tamás Szőke | 26. novembra 2018

Tím Otvorených stratégií dokončil zbieranie rozvojových dokumentov a vytvoril z nich knižnicu všetkých verejne dostupných stratégií obcí, ktoré si môžete pohodlne vyhľadať a stiahnuť aj vy na tejto linke: https://app.otvorenestrategie.sk/repozitar/prehlad Projekt by sa však nenazýval „Otvorené stratégie“, ak by sme skončili iba v tomto kroku. Údaje sme štrukturovali a aktualizovali dáta o dokumentoch a ich […]

Pohľad do našej databázy

Pohľad do našej databázy

O projekte | Tamás Szőke | 10. septembra 2018

Dokončili sme úvodný zber záznamov, začíname s validáciou a čistením dát. Pozrite sa do databázy PHSR a získajte rýchly prehľad o niektorých parametroch prostredníctvom nášho interaktívneho reportu. Na úvodnej konferencii sa môžete tešiť na viac podrobností. 

Pozývame na úvodnú konferenciu

Pozývame na úvodnú konferenciu

O projekte | Tamás Szőke | 7. septembra 2018

Už dňa 25/9/2018 sa v Banskej Bystrici uskutoční úvodná konferencia nášho projektu. V súčasnosti sme dokončili aktivitu 1:zber všetkých PHSR obcí a miest, a zverejnili sme ich na webstránke projektu: https://app.otvorenestrategie.sk/repozitar/prehlad Následne budeme dáta spracovávať a hľadať väzby medzi strategickými prioritami obcí aj hierarchickými úrovňami samosprávy, ktoré budú dostupné v štrukturovanej forme a vizualizované na […]