Aiuto il time out!

I server sdmx vanno in time out come tutti gli altri… Ricordatevi allora che tutti i file sdmx sono scaricabili comunque da http://dati.istat.it/.

Per ogni tabella che visualizzate potete scaricare i file sdmx corrispondenti, come nella figura che segue:

schermata dello scaricamento file da dati.istat.it

Ricordatevi che vi servono tutti e due i file proposti.

Dovete quindi scaricare sia il file SDMX (“Esportazione in SDMX”) che il file dei metadati (“Esportazione in DSD”).

Il file DSD che contiene i metadati ci serve per avere le label al loro posto. Alla fine dovreste trovare due files sul vostro disco:

  • DataGeneric.xml
  • DataStructureDefinition.xml

Metter tutto assieme con rsdmx.

Per fortuna rsdmx legge anche i files dal disco rigido. Con le istruzioni che seguono leggiamo sia i dati che i metadati:

require(rsdmx)
occ.data <- readSDMX("DataGeneric.xml", isURL = F)
occ.dsd <- readSDMX("DataStructureDefinition.xml", isURL = F)

poi mettiamo tutto assieme:

occ.ful <- setDSD(occ.data, occ.dsd)

e alla fine otteniamo il dataframe che ci serve:

occ <- as.data.frame(occ.ful, labels = TRUE)

Come non sovraccaricare i server SDMX.

per fortuna esistono metodi per non sovraccaricare i servers SDMX e non scaricare tutte le volte tutti i dati. Alla prossima puntata.