Poslovno-tehniška fakulteta

Odkrivanje zakonitosti v podatkih

Predmet se izvaja v programu:
Študijski program druge stopnje Gospodarski inženiring

Cilji in kompetence

Odkrivanje zakonitosti v podatkih je proces odkrivanja vzorcev in modelov, opisanih s pravili ali drugimi človeku razumljivimi formalizmi za predstavitev znanja. Najpomembnejši del tega procesa predstavlja podatkovno rudarjenje, ki vključuje uporabo metod, tehnik in orodij za avtomatsko konstrukcijo vzorcev in modelov iz podatkov.

Cilji predmeta so:

  • predstaviti osnove podatkovnega rudarjenja, postopke odkrivanja zakonitosti v podatkih ter metodologijo CRISP-DM,
  • predstaviti izbrane metode in tehnike podatkovnega rudarjenja,
  • predstaviti metodologijo ocenjevanja rezultatov.

Študenti bodo obvladali osnove predprocesiranja podatkov, rudarjenja podatkov in odkrivanja zakonitosti v podatkih ter bodo usposobljeni za praktično uporabo izbranih orodij podatkovnega rudarjenja in metod za evalvacijo rezultatov.

Pogoji za vključitev v delo oz.
za opravljanje študijskih obveznosti

Za uspešno osvajanje snovi je potrebno predhodno znanje, ki ga študentje pridobijo pri predmetih: Tehniška matematika in Osnove računalništva. Potrebna so tudi osnovna znanja matematike, računalništva in informatike.

Vsebina

  • Uvod v rudarjenje podatkov
  • Podatkovno rudarjenje po standardih CRISP-DM metodologije
  • Tehnike rudarjenja podatkov
  • Hevristike, ocenjevanje kvalitete naučenih vzorcev ter metodologija evalvacije rezultatov
  • Praktična uporaba izbranih orodij rudarjenja podatkov

Predvideni študijski rezultati

Znanje in razumevanje:

Obvladana uporaba izbranih metod in tehnik podatkovnega rudarjenja, usposobljenost za predprocesiranje podatkov, praktično uporabo izbranih orodij podatkovnega rudarjenja, usposobljenost za uporabo in interpretacijo metod za evalvacijo rezultatov.

Temeljna literatura in viri

Izbrana poglavja iz naslednjih knjig:

  • D. Mladenić, N. Lavrač, M. Bohanec, S. Moyle (eds.) Data Mining and Decision Support: Integration and Collaboration. Kluwer 2003. ISBN 1-4020-7388-7.
  • J.H. Witten, E. Frank, M.A. Hall: Data Mining: Data Mining: Practical Machine Learning Tools and Techniques (Third Edition), Morgan Kaufmann, 2011. ISBN 978-0-12-374856-0.
  • T. Mitchell: Machine Learning. McGraw Hill, 1997. ISBN 0070428077.
  • M. Berthold, D.J. Hand (eds.), Intelligent Data Analysis: An Introduction, Springer, 2003. ISBN 978-3-540-43060-5.
  • S. Džeroski, N. Lavrač (eds.) Relational Data Mining. Springer 2001. ISBN 3-540-42289-7.

Načini ocenjevanja

  • S pisnim izpitom se ocenjuje osnovna znanja podatkovnega rudarjenja in odkrivanja zakonitosti v podatkih in znanje postopka odkrivanja zakonitosti v podatkih po standardih CRISP-DM metodologije.
  • S seminarsko ali projektno nalogo in ustnim zagovorom se ocenjuje praktična znanja za uporabo orodij podatkovnega rudarjenja in metod za evalvacijo rezultatov.

Reference nosilca

Prof. dr. Nada Lavrač je redna profesorica za področje računalništvo.

Univerzitetna koda predmeta: 2GI018

Letnik: 2

Nosilec predmeta:

Predavatelj:

Asistent:

ECTS: 6

Obseg:

  • Predavanja: 30 ur
  • Samostojno delo: 120 ur

Vrsta predmeta: izbirni predmet

Jeziki: slovenski

Metode poučevanja in učenja:
predavanja, seminar, vaje, samostojno delo