1076 Podatkovno rudarjenje

1076 Podatkovno rudarjenje

  • Vrsta programa: interdisciplinarni univerzitetni študijski program Upravna informatika 1. stopnja
  • 2. letnik
  • 6 ECTS
  • Tip predmeta: izbirni
  • Število ur predavanj: 45
  • Seminar: 10
  • Vaje: 20
  • Samostojno delo: 105
  • Nosilec: dr. Janez Demšar

1. Cilji in kompetence

  • Cilj predmeta je študente izuriti v metodah odkrivanja zakonitosti iz podatkov. Študent, ki uspešno opravi ta predmet bi moral biti zmožen v zbranih podatkih poiskati vzorce in hipoteze, ki bi bile praktično uporabne za lastnika podatkov oz. naročnika študije.

2. Vsebina predmeta

Poglavja predavanj obsegajo

  • Uvod; motivacijski primeri
  • Kratka ponovitev izbranih metod strojnega učenja in statistike
  • Vizualizacija podatkov; dobri in slabi primeri iz prakse
  • Kombiniranje vizualizacije, strojnega učenja in statistike v podatkovnem rudarjenju
  • Diskretizacija zveznih atributov, obravnavanje neznanih vrednosti in delo s šumnimi podatki s kombinacijo avtomatskih metod in ekspertnega znanja
  • Metode za izbiranje atributov, odkrivanje interakcij in sestavljanje atributov
  • Pogosti scenariji v odkrivanju zakonitosti
    • napovedovanje izjem
    • delo z neuravnoteženimi razredi
    • cenovno občutljivo učenje
    • priporočilni sistemi
    • napovedovanje prebegov in podobni problemi
  • Uporaba znanih orodij

3. Temeljna literatura in viri

  • F. Witten, E. Frank: Data Mining: Practical Machine Learning Tools and Techniques, Morgan Kaufmann, 2005.
  • S. Few: Now You See It: Simple Visualization Techniques for Quantitative Analysis, Analytics Press, 2009.
  • E. R. Tufte: The Visual Display of Quantitative Information, 2nd Edition, Cheshire, CT: Graphics Press, 2001.

4. Predvideni študijski rezultati

Znanje in razumevanje:

  • Poznavanje metod podatkovnega rudarjenja, zmožnost njihove rabe in ovrednotenja njihovih rezultatov.

Uporaba:

  • Uporaba pri rudarjenju resničnih podatkov.

Refleksija:

  • Spoznavanje in razumevanje uglašenosti med teorijo in njeno aplikacijo na konkretnih primerih s področja modeliranja podatkov.

Prenosljive spretnosti - niso vezane le na en predmet:

  • Predmet je osnova za predmet Odločitveni sistemi.

5. Metode poučevanja in učenja

  • Predavanja in vaje, domače naloge, seminarska naloga, praktično delo na umetno generiranih in resničnih podatkih.

6. Načini ocenjevanja

Način (pisni izpit, ustno izpraševanje, naloge, projekt):

  • Sprotno preverjanje (domače naloge, kolokviji in projektno delo) (50 %)
  • Končno preverjanje (pisni in ustni izpit) (50 %)