Poigrajmo se s podatki
1. Strojno učenje in podatki
1.4. Gostovanje, združevanje, distribucija podatkov
Zaradi velikosti in morebitne zapletenosti podatkov za učenje v sistemih umetne inteligence ter iz njih izhajajočih modelov so bile vzpostavljene različne pobude, ki omogočajo njihovo gostovanje in distribucijo.
Odprte podatkovne nize in modele je mogoče gostiti v specializiranih skladiščih (npr. vir slikovnih podatkov https://idr.openmicroscopy.org/ ) ali v splošnih nacionalnih ali mednarodnih skladiščih (npr. Zenodo https://zenodo.org/). Takšni repozitoriji običajno zagotavljajo potrebno infrastrukturo za upravljanje avtorstva, licenciranja, verzioniranja in arhiviranja njihove vsebine.
Pri kompleksnih nalogah, kjer različne skupine vzporedno delajo na anotiranju različnih podatkovnih vzorcev, nekatere pobude delujejo kot katalogi za ustrezne podatkovne vire. Tako je na primer v primeru pobude HTR United (https://htr-united.github.io), ki zbira metapodatke anotiranih dokumentov za prepoznavanje (rokopisnega) besedila.