63765 Podatkovno rudarjenje

63765 Podatkovno rudarjenje

  • Vrsta programa: interdisciplinarni univerzitetni študijski program Upravna informatika 1. stopnja
  • 6 ECTS
  • Tip predmeta: izbirni
  • Število ur predavanj: 45
  • Seminarske vaje: 30
  • Samostojno delo: 105
  • Nosilec: dr. Janez Demšar

 

 

1. Cilji in kompetence

Cilj predmeta je študente izuriti v metodah odkrivanja zakonitosti iz podatkov. Študent, ki uspešno opravi ta predmet bi moral biti zmožen v zbranih podatkih poiskati vzorce in hipoteze, ki bi bile praktično uporabne za lastnika podatkov oz. naročnika študije.

2. Vsebina predmeta

Poglavja predavanj obsegajo:

  • Uvod; motivacijski primeri
  • Kratka ponovitev izbranih metod strojnega učenja in statistike
  • Vizualizacija podatkov; dobri in slabi primeri iz prakse
  • Kombiniranje vizualizacije, strojnega učenja in statistike v podatkovnem rudarjenju
  • Diskretizacija zveznih atributov, obravnavanje neznanih vrednosti in delo s šumnimi podatki s kombinacijo avtomatskih metod in ekspertnega znanja
  • Metode za izbiranje atributov, odkrivanje interakcij in sestavljanje atributov
  • Pogosti scenariji v odkrivanju zakonitosti
    • napovedovanje izjem
    • delo z neuravnoteženimi razredi
    • cenovno občutljivo učenje
    • priporočilni sistemi
    • napovedovanje prebegov in podobni problemi
  • Uporaba znanih orodij

3. Temeljna literatura in viri

  • F. Witten, E. Frank: Data Mining: Practical Machine Learning Tools and Techniques, Morgan Kaufmann, 2005.
  • S. Few: Now You See It: Simple Visualization Techniques for Quantitative Analysis, Analytics Press, 2009.
  • E. R. Tufte: The Visual Display of Quantitative Information, 2nd Edition, Cheshire, CT: Graphics Press, 2001.

4. Predvideni študijski rezultati

Znanje in razumevanje:

  • Poznavanje metod podatkovnega rudarjenja, zmožnost njihove rabe in ovrednotenja njihovih rezultatov.

Uporaba:

  • Uporaba pri rudarjenju resničnih podatkov.

Refleksija:

  • Spoznavanje in razumevanje uglašenosti med teorijo in njeno aplikacijo na konkretnih primerih s področja modeliranja podatkov.

Prenosljive spretnosti - niso vezane le na enpredmet:

  • Predmet je osnova za predmet Odločitveni sistemi.

5. Metode poučevanja in učenja

Predavanja in vaje, domače naloge, seminarska naloga, praktično delo na umetno generiranih in resničnih podatkih.

6. Načini ocenjevanja

Način (pisni izpit, ustno izpraševanje, naloge, projekt):

  • Sprotno preverjanje (domače naloge, kolokviji in projektno delo) (50 %)
  • Končno preverjanje (pisni in ustni izpit) (50 %)

Ocene: 6-10 pozitivno, 1-5 negativno
(v skladu s Statutom UL)