Kategória: python

Prítomnosť povinných kapitol

python | Tamás Szőke | 17. júna 2020

Zákon o regionálnom rozvoji stanovuje povinné obsahové časti pre dokumenty PHSR. Pomocou regulérnych výrazov sme sa snažili identifikovať prítomnosť povinných častí v dokumentoch PHSR za PO 2014-2020.

Konverzia do plaintext

python | Tamás Szőke | 17. júna 2020

V týchto notebookoch nájdete postup, ako sme súbory z formátu pdf konvertovali do čistého textu. Python ponúka množstvo balíkov pre zvládnutie tejto úlohy. Niektoré z nich sme uviedli v Konvenciách pre predspracovanie textových dát PHSR.  

Konverzia do pdf

python | Tamás Szőke | 17. júna 2020

V tomto notebooku nájdete postup, ako sme konvertovali súbory z rôznych formátov (doc, odcx, xls, rtf, odt…) do formátu pdf.

Základná štatistika datasetu OS

python | Tamás Szőke | 17. júna 2020

Základný korpus OS pozostáva z niekoľkých tabuliek a pár tisícov súborov. Aj bez ďalšieho čistenia a triedenia poskytujú surové údaje dôležité poznatky o stave plánovania regionálneho rozvoja na Slovensku.    

Sťahovanie našich dát

python | Tamás Szőke | 2. septembra 2019

Tu je malá PYTHON pomôcka v prostredí Google Colab pre tých, ktorí si chcú stiahnuť naše dáta prostredníctvom API a uložiť si ich na Google Drive.