Kratki opisi idej za različne predmete
Klasifikacija živali (biologija)
Podatki: živalske vrste z njihovimi značilnostmi (imajo plavuti, so kosmate, število nog...) in ali gre za sesalce, plazilce, ptiče in tako naprej (skladno z delitvijo, ki se uporablja pri biologiji). Obstajajo znani podatki na to temo, lahko pa jih zamenjamo z bolj slovenskimi.
Analiza: z algoritmom za gradnjo klasifikacijskih dreves lahko zgradimo drevo s pravili, ki jih otroci spoznavajo pri NIT.
Gručenje držav (geografija)
Podatki: družbenoekonomske značilnosti vseh držav v določenem letu (podatki Svetovne banke).
Analiza: opazujemo posamične podatke na zemljevidu. Povezave med njimi lahko gledamo v, npr. razsevnem diagramu. Sestavimo lahko gruče držav in opazujemo njihove značilnosti.
Slovenski priimki (geografija, slovenščina)
Podatki: za 200 najpogostejših priimkov poznamo (primerno anonimizirane) lokacije teh priimkov v Sloveniji.
Analiza: opazujemo "priimkovne značilnosti Slovenije", kot na primer v katerih regijah so pogosti posamični priimki, katere občine imajo enake priimke (kar kaže na njihovo zgodovinsko povezanost). Morda se da pogovoriti tudi o pomenu/izvoru priimkov.
Podnebni pasovi (geografija)
Podatki: meritve vremenskih postaj, na primer v evropskih prestolnicah. (Obstaja tudi nekaj gigabajtov velika baza dnevnih meritev vremenskih postaj po vsem svetu; za Slovenijo je na voljo od prve postaje na Kredarici naprej!).
Analiza: z gručenjem dobimo podnebne pasove. Lastnosti posameznega lahko naprej opazujemo s primernimi vizualizacijami.
Podobnosti narečnih skupin (slovenščina)
Podatki: korpus slovenskih narečij, v katerem različni govorci opisujejo stare hiše v svojem okolju. Pripovedi so "prevedene" v pogovorni zapis, na voljo pa so tudi podatki z dialektološkim zapisom.
Analiza: tipične besede ali glasovi posamičnih narečij. Gručenje narečij.
Razlikovanje med publicističnimi in leposlovnimi besedili (slovenščina)
Podatki: korpus 150 publicističnih in leposlovnih besedil.
Analiza: gradnja klasifikacijskega modela, opazovanje besed, ki nakazujejo publicistiko oz. leposlovje. Delotok je možno prilagoditi tako, da opazujemo različne vidike besedila, na primer število besed, glagolov, samostalnikov itd.
Stilske razlike med Monetom in Manetom (umetnost)
Podatki: zbirka 107 slik obeh slikarjev
Analiza: zgradimo model, ki zna razlikovati med slikami. Potem lahko opazujemo, pri katerih slikah se zmoti (Monet, ki je videti bolj kot Manet, in obratno) ali pa, pri katerih slikah je model najbolj odločno prepričan, da gre za tega ali onega slikarja (tipične slike)
Podatki o velikosti evropskih mest (zgodovina)
Podatki: število prebivalcev 2262 evropskih mest od leta 700 v korakih po 100 oz. 50 let.
Analiza: na zemljevidu lahko opazujemo velikosti po letih in opazimo, kako postanejo v določenem obdobju pomembna mesta južne Španije, kako Evropo zdesetka kuga, kdaj nastopi industrijska revolucija v Angliji in kdaj v Rusiji, kaj se skozi zgodovino dogaja z Istanbulom. Možno je narediti tudi gručenje, ki nam da skupine mest s podobno usodo skozi zgodovino.
Prepoznavanje drevesnih vrst (biologija)
Podatki: učenci poslikajo drevesne liste na sprehodu in poimenujejo datoteke z drevesnimi vrstami
Analiza: naredimo model, ki loči med vrstami, ali pa gručimo slike. Potem lahko učenci opišejo, po čem so si podobni listi v posameznih gručah. Z vidika biologije to sicer ni neko globoko spoznanje, morajo pa znati opisati liste, kar najbrž tudi sodi v predmet.
Priporočilni sistemi (matematika)
Podatki: zberemo podatke učencev o najljubših knjigah, filmih ali kaj podobnega
Analiza: gručenje, asociativna pravila, večrazrežnostno lestvičenje.
(Pod matematiko to spada pod temo "obdelava podatkov", za katero sicer najbrž navadno zmanjka časa)
Analiza zaporedij DNK (biologija)
Podatki: genska sekvenca različnih sevov Sars-Cov-2
Analiza: analiza zaporedij, gručenje in dendrogrami