Aiuto il time out!
I server sdmx vanno in time out come tutti gli altri… Ricordatevi allora che tutti i file sdmx sono scaricabili comunque da http://dati.istat.it/.
Per ogni tabella che visualizzate potete scaricare i file sdmx corrispondenti, come nella figura che segue:
Ricordatevi che vi servono tutti e due i file proposti.
Dovete quindi scaricare sia il file SDMX (“Esportazione in SDMX”) che il file dei metadati (“Esportazione in DSD”).
Il file DSD che contiene i metadati ci serve per avere le label al loro posto. Alla fine dovreste trovare due files sul vostro disco:
- DataGeneric.xml
- DataStructureDefinition.xml
Metter tutto assieme con rsdmx.
Per fortuna rsdmx legge anche i files dal disco rigido. Con le istruzioni che seguono leggiamo sia i dati che i metadati:
require(rsdmx)
occ.data <- readSDMX("DataGeneric.xml", isURL = F)
occ.dsd <- readSDMX("DataStructureDefinition.xml", isURL = F)
poi mettiamo tutto assieme:
occ.ful <- setDSD(occ.data, occ.dsd)
e alla fine otteniamo il dataframe che ci serve:
occ <- as.data.frame(occ.ful, labels = TRUE)
Come non sovraccaricare i server SDMX.
per fortuna esistono metodi per non sovraccaricare i servers SDMX e non scaricare tutte le volte tutti i dati. Alla prossima puntata.