Umetna inteligenca za analizo podatkov

Cilji in kompetence

Analiza podatkov s pomočjo umetne inteligence je proces odkrivanja vzorcev in modelov, opisanih s pravili ali drugimi človeku razumljivimi formalizmi za predstavitev znanja. Najpomembnejši del tega procesa predstavlja podatkovno rudarjenje, ki vključuje uporabo metod, tehnik in orodij za avtomatsko konstrukcijo vzorcev in modelov iz podatkov.

Cilji predmeta so (a) predstaviti osnove podatkovnega rudarjenja, (b) predstaviti postopke odkrivanja zakonitosti v podatkih ter metodologijo CRISP-DM, (c) predstaviti metodologijo ocenjevanja rezultatov, (d) predstaviti izbrane metode in tehnike podatkovnega rudarjenja na primerih, relevantnih za gospodarski inženiring, (e) usposobiti študente za praktično uporabo izbranih orodij rudarjenja podatkov.

Študenti bodo obvladali osnove predprocesiranja podatkov, rudarjenja podatkov in odkrivanja zakonitosti v podatkih ter bodo usposobljeni za praktično uporabo izbranih orodij podatkovnega rudarjenja in metod za evalvacijo rezultatov.

Pogoji za vključitev v delo oz. za opravljanje študijskih obveznosti

Za uspešno osvajanje snovi so potrebna osnovna znanja matematike, računalništva in informatike.

Vsebina

  1. Uvod
  2. Umetna inteligenca (UI) v poslovnem okolju
  3. Analiza podatkov po CRISP-DM metodologiji
  4. Tehnike umetne inteligence za analizo podatkov:
    - Analiza tabelaričnih podatkov
    - Hevristike za konstrukcijo modelov in vzorcev
    - Kvaliteta naučenih modelov in odkritih vzorcev
    - Metodologija evalvacije rezultatov
    - Analiza tekstovnih podatkov
  5. Primeri uporabe UI v poslovnem področju, ekologiji, industriji, itd.
  6. Praktična uporaba izbranih orodij analize podatkov

Predvideni študijski rezultati

Znanje in razumevanje:

Obvladana uporaba izbranih metod in tehnik umetne inteligence za analizo podatkov, usposobljenost za predprocesiranje podatkov, praktično uporabo izbranih orodij podatkovnega rudarjenja, usposobljenost za uporabo in interpretacijo metod za evalvacijo rezultatov.

Temeljna literatura in viri

Izbrana poglavja iz naslednjih knjig:

  • D. Mladenić, N. Lavrač, M. Bohanec, S. Moyle (eds.) Data Mining and Decision Support: Integration and Collaboration. Kluwer 2003. ISBN 1-4020-7388-7 Katalog E-gradivo
  • J.H. Witten, E. Frank, M.A. Hall: Data Mining: Practical Machine Learning Tools and Techniques (Third Edition), Morgan Kaufmann, 2011. ISBN 978-0-12-374856-0 Katalog E-gradivo
  • M. Berthold (ed.), Bisociative Knowledge Discovery, Springer, 2012. ISBN 978-3-642-31829-0 Katalog E-gradivo
  • J. Fuernkranz, D. Gamberger, N. Lavrač: Foundations of Rule Learning. Springer, 2012. ISBN 978-3-540-75196-0 Katalog E-gradivo

Načini ocenjevanja

Ocenjevanje kompetenc:
• S pisnim izpitom se ocenjuje osnovna znanja umetne inteligence za analizo podatkov in postopka odkrivanja zakonitosti v podatkih po standardih CRISP-DM metodologije.
• S seminarsko ali projektno nalogo in ustnim zagovorom se ocenjuje praktična znanja za uporabo izbranih orodij za analizo podatkov in metod za evalvacijo rezultatov.
50/50

Reference nosilca

Prof. dr. Nada Lavrač, redna profesorica za področje računalništva
Področja dejavnosti: tehnologije znanja, umetna inteligenca, strojno učenje, rudarjenje tabelaričnih, relacijskih in tekstovnih podatkov, analiza tekstovnih podatkov, upravljanje znanja, marketing in upravljanje virtualnih podjetij, aplikacije strojnega učenja in rudarjenja podatkov na področjih biomedicine, zdravstvenega varstva, znanostih o življenju, marketinga in medijskih podatkov
Zaposlitev / kariera: Od leta 1978 zaposlena na Institutu “Jožef Stefan”; ustanoviteljica in v letih 2014-2020 vodja Odseka za tehnologije znanja; od 2002 znanstvena svetnica IJS; od 2007 redna profesorica na Univerzi v Novi Gorici in Mednarodni podiplomski šoli Jožefa Stefana; 1996-1998 podpredsednica ECCAI (European Coordination Committee for AI); članica Društva za umetno inteligenco SLAIS, 2022-2024 članica odbora ELLIS
Dosežki: avtorica vrste znanstvenih člankov, petih znanstvenih monografij, urednica vrste knjig in zbornikov, soavtorica dveh izjemnih znanstvenih dosežkov (po sklepu Sveta ARRS za leto 2011 in za leto 2012), koordinatorka dveh EU projektov, slovenska nosilka več kot deset EU projektov v skupni vrednosti 4 Mio EUR. Nagrade: 2022 Zoisova nagrada za vrhunske znanstvene dosežke na področju strojnega učenja, 2020 ELLIS Fellow imenovanje za znanstvene dosežke na področju strojnega učenja, 2013 Zoisovo priznanje za pomembne znanstvene dosežke pri inteligentni analizi podatkov, 2007 ECCAI/EURAI Fellow imenovanje za pionirsko raziskovalno delo znanstvene dosežke na področju umetne inteligence v Evropi; 1998 nagrada Ambasadorka RS v znanosti; 1986 nagrada Sklada Borisa Kidriča za raziskave sinteze znanja s kvalitativnim modeliranjem (I. Bratko, I. Mozetič, N. Lavrač, M. Horvat, B. Čerček, A.Grad, P. Rode)

Prof. dr. Aneta Ivanovska (prej Trajanov), izredna profesorica za področje računalništva in informatike na Univerzi v novi Gorici in direktorica študijskega programa Gospodarski inženiring 2. stopnje, je strokovnjakinja na področju umetne inteligence. Doktorirala je na področju strojnega učenja leta 2010 na Mednarodni Podiplomski Šoli Jožefa Stefana. Od leta 2005 do 2022 je delala kot raziskovalka na Odseku za Tehnologije Znanja na Inštitutu Jožef Stefan. Podoktorski študij je opravila na Inštitutu Ruđer Bošković v Zagrebu v letu 2015-2016. Njena glavna raziskovana področja so strojno učenje in odkrivanje znanja iz okoljskih podatkov, sistemi za podporo pri odločanju, induktivno logično programiranje in odkrivanje enačb. Sodelovala je v številnih Evropskih in nacionalnih projektih na področju agro-ekologije, kjer je uporabljala različne metode strojnega učenja za analizo (agro)ekoloških podatkov. Od novembra 2022 dela kot vodja oddelka za umetno inteligenco v podjetju MarineXchange, ki se ukvarja z razvojem programske opreme v potniški križarkarski industriji.

Izbrane objave

• Lavrač N., Džeroski, S.: Inductive Logic Programming: Techniques and Applications. Ellis Horwood, 1994.
• Lavrač N., Kavšek, B., Flach P. A., Todorovski, L.: Subgroup discovery with CN2-SD. Journal of Machine Learning Research, 5 (2004), 153-188.
• Železny F., Lavrač N.: Propositionalization-based relational subgroup discovery with RSD. Machine Learning 62 :1-2 (2006), 33-63.
• Fuernkranz J., Gamberger D., Lavrač N.: Foundations of Rule Learning. Springer 2012.
• Lavrač N., Podpečan V., Robnik-Šikonja M. Representation Learning: Propositionalization and Embeddings. Springer 2021.
• Sandén, Taru, Wawra, Anna, Berthold, Helene, Miloczki, Julia, Schweinzer, Agnes, Gschmeidler, Brigitte, Spiegel, Heide, Debeljak, Marko, Trajanov, Aneta. TeaTime4Schools : using data mining techniques to model litter decomposition in austrian urban school soils. Frontiers in ecology and evolution. 2021, vol. 9, str. 703794-1-703794-9, ilustr. ISSN 2296-701X. DOI: 10.3389/fevo.2021.703794. [COBISS.SI-ID 68232707]
• Iannetta, Pietro, Debeljak, Marko, Trajanov, Aneta, et al. A multifunctional solution for wicked problems : value-chain wide facilitation of legumes cultivated at bioregional scales is necessary to address the climate-biodiversity-nutrition nexus. Frontiers in sustainable food systems. 2021, vol. 5, str. 692137-1-692137-8. ISSN 2571-581X. DOI: 10.3389/fsufs.2021.692137. [COBISS.SI-ID 72049155]
• Wall, David P., Delgado, Antonio, O'sullivan, Lilian, Creamer, Rachel, Trajanov, Aneta, Kuzmanovski, Vladimir, Henricksen, Christian B., Debeljak, Marko. A decision support model for assessing the water regulation and purification potential of agricultural soils across Europe. Frontiers in sustainable food systems. 2020, vol. 4, str. 115-1-115-11. ISSN 2571-581X. DOI: 10.3389/fsufs.2020.00115. [COBISS.SI-ID 21854979]
• Sandén, Taru, Trajanov, Aneta, Spiegel, Heide, Kuzmanovski, Vladimir, Saby, Nicolas, Picaud, Calypso, Henriksen, Christian B. H., Debeljak, Marko. Development of an agricultural primary productivity decision support model : a case study in France. Frontiers in environmental science. 2019, vol. 7, str. 58-1-58-13. ISSN 2296-665X. DOI: 10.3389/fenvs.2019.00058. [COBISS.SI-ID 32342311],
• Leeuwen, Jeroen P. Van, Debeljak, Marko, Kuzmanovski, Vladimir, Trajanov, Aneta, et al. Modeling of soil functions for assessing soil quality : soil biodiversity and habitat provisioning. Frontiers in environmental science. 2019, vol. 7, str. 113-1-113-13. ISSN 2296-665X. DOI: 10.3389/fenvs.2019.00113. [COBISS.SI-ID 32581927]