Odkrivanje zakonitosti v podatkih

Cilji in kompetence

Odkrivanje zakonitosti v podatkih je proces odkrivanja vzorcev in modelov, opisanih s pravili ali drugimi človeku razumljivimi formalizmi za predstavitev znanja. Najpomembnejši del tega procesa predstavlja podatkovno rudarjenje, ki vključuje uporabo metod, tehnik in orodij za avtomatsko konstrukcijo vzorcev in modelov iz podatkov.

Cilji predmeta so (a) predstaviti osnove podatkovnega rudarjenja, (b) predstaviti postopke odkrivanja zakonitosti v podatkih ter metodologijo CRISP-DM, (c) predstaviti metodologijo ocenjevanja rezultatov, (d) predstaviti izbrane metode in tehnike podatkovnega rudarjenja, (e) usposobiti študente za praktično uporabo izbranih orodij rudarjenja podatkov.

Študenti bodo obvladali osnove predprocesiranja podatkov, rudarjenja podatkov in odkrivanja zakonitosti v podatkih ter bodo usposobljeni za praktično uporabo izbranih orodij podatkovnega rudarjenja in metod za evalvacijo rezultatov.

Pogoji za vključitev v delo oz. za opravljanje študijskih obveznosti

Za uspešno osvajanje snovi so potrebna osnovna znanja matematike, računalništva in informatike.

Vsebina

  1. Uvod v rudarjenje podatkov
  2. Podatkovno rudarjenje po CRISP-DM metodologiji
  3. Tehnike rudarjenja podatkov:
    - Hevristike za konstrukcijo modelov in vzorcev
    - Kvaliteta naučenih modelov in odkritih vzorcev
    - Metodologija evalvacije rezultatov
  4. Praktična uporaba izbranih orodij rudarjenja podatkov

Predvideni študijski rezultati

Znanje in razumevanje:

Obvladana uporaba izbranih metod in tehnik podatkovnega rudarjenja, usposobljenost za predprocesiranje podatkov, praktično uporabo izbranih orodij podatkovnega rudarjenja, usposobljenost za uporabo in interpretacijo metod za evalvacijo rezultatov.

Temeljna literatura in viri

Izbrana poglavja iz naslednjih knjig:
• D. Mladenić, N. Lavrač, M. Bohanec, S. Moyle (eds.) Data Mining and Decision Support: Integration and Collaboration. Kluwer 2003. ISBN 1-4020-7388-7 E-gradivo
• J.H. Witten, E. Frank, M.A. Hall: Data Mining: Practical Machine Learning Tools and Techniques (Third Edition), Morgan Kaufmann, 2011. ISBN 978-0-12-374856-0 E-gradivo
• M. Berthold (ed.), Bisociative Knowledge Discovery, Springer, 2012. ISBN 978-3-642-31829-0 E-gradivo
• J. Fuernkranz, D. Gamberger, N. Lavrač: Foundations of Rule Learning. Springer, 2012. ISBN 978-3-540-75196-0 E-gradivo

Načini ocenjevanja

Ocenjevanje kompetenc:
• S pisnim izpitom se ocenjuje osnovna znanja podatkovnega rudarjenja in odkrivanja zakonitosti v podatkih in znanje postopka odkrivanja zakonitosti v podatkih po standardih CRISP-DM metodologije.
• S seminarsko ali projektno nalogo in ustnim zagovorom se ocenjuje praktična znanja za uporabo orodij podatkovnega rudarjenja in metod za evalvacijo rezultatov.

50/50

Reference nosilca

Prof. dr. Nada Lavrač, redna profesorica za področje računalništva
Področja dejavnosti: tehnologije znanja, strojno učenje, rudarjenje tabelaričnih, relacijskih in tekstovnih podatkov, upravljanje znanja, marketing in upravljanje virtualnih podjetij, aplikacije strojnega učenja in rudarjenja podatkov na področjih biomedicine, zdravstvenega varstva in znanostih o življenju
Zaposlitev / kariera: Od leta 1978 zaposlena na Institutu “Jožef Stefan”; ustanoviteljica in vodja Odseka za tehnologije znanja; od 2002 znanstvena svetnica IJS; od 2007 redna profesorica na Univerzi v Novi Gorici in Mednarodni podiplomski šoli Jožefa Stefana; 1996-1998 podpredsednica ECCAI (European Coordination Committee for AI); od 1999 članica sveta AIME (Artificial Intelligence in Medicine); od 2000 vodja Sekcije za rudarjenje podatkov Slovenskega statističnega društva; članica Društva za umetno inteligenco SLAIS.
Dosežki: avtorica vrste znanstvenih člankov, štirih znanstvenih monografij, urednica vrste knjig in zbornikov, soavtorica dveh izjemnih znanstvenih dosežkov (po sklepu Sveta ARRS za leto 2011 in za leto 2012), koordinatorka dveh EU projektov, slovenska nosilka več kot deset EU projektov v skupni vrednosti 3 Mio EUR. Nagrade: 2013 Zoisovo priznanje za pomembne znanstvene dosežke pri inteligentni analizi podatkov, 2007 ECCAI Fellow nagrada za pionirsko raziskovalno delo znanstvene dosežke na področju umetne inteligence v Evropi; 1998 nagrada Ambasadorka RS v znanosti; 1986 nagrada Sklada Borisa Kidriča za raziskave sinteze znanja s kvalitativnim modeliranjem (I. Bratko, I. Mozetič, N. Lavrač, M. Horvat, B. Čerček, A.Grad, P. Rode)

Izbrane objave

• Gamberger D., Lavrač, N.: Expert-Guided Subgroup Discovery: Methodology and Application, Journal of Artificial Intelligence Research 17 (2002), 501-527.
• Lavrač N., Džeroski, S.: Inductive Logic Programming: Techniques and Applications. Ellis Horwood, 1994.
• Lavrač N., Kavšek, B., Flach P. A., Todorovski, L.: Subgroup discovery with CN2-SD. Journal of Machine Learning Research, 5 (2004), 153-188.
• Železny F., Lavrač N.: Propositionalization-based relational subgroup discovery with RSD. Machine Learning 62 :1-2 (2006), 33-63.
• Fuernkranz J., Gamberger D., Lavrač N.: Foundations of Rule Learning. Springer 2012.