Izbrana poglavja iz biostatistike in bioinformatike

Cilji in kompetence

Cilj predmeta je, da študenti pridobijo naslednja znanja in kompetence:
• Razumevanje in uporaba uni-in multivariantnih analiz na primerih različnih bioloških podatkov;
• Sposobnost vizualizacije uni-in multivariantnih podatkovnih setov ter ocenjevanje univariantne statistične značilnosti;
• Kritično ocenjevanje in analiza svojih podatkov ter statističnih analiz podatkov iz literature;
• Osnovno razumevanje in analiza podatkov NGS (Next Generation Sequencing).

Pogoji za vključitev v delo oz. za opravljanje študijskih obveznosti

Formalnih pogojev za vključitev ni. Zaželjeno pa je poznavanje osnov sistema linux in kodiranja.

Vsebina

• Spoznavanje jezika R in uporaba Rstudio, ukazna vrstica;
• Vizualizacija podatkov z uporabo R, sintaksa in logika ggplot2, učinkovita vizualizacija podatkov;
• Nomenklatura in definicija različnih tipov spremenljivk, razporeditev in merila disperzije;
• Uvod v parametrične in ne-parametrične metode;
• Razlike med opisnimi spremenljivkami (hi-kvadrat test), moč učinka (effect size);
• Uvod v linearno regresijo;
• Uvod v multivariantne statistične analize: PCA;
• Uvod v bioinformatiko, oblike datotek (.fastq, .fasta, .gff, .sam, .bam etc) in uporaba najpogostejših podatkovnih baz;
• Združevanje podatkov NGS, mapiranje sekvenc, uporaba genomskih urejevalnikov, predvidevanje sekundarne strukture proteinov z porabo AlphaFold2.

Predvideni študijski rezultati

Glavni študijski rezultat predmeta je študente usposobiti za samostojno analizo raziskovalnih podatkov z orodji biostatistike in bioinformatike. Pridobljeno znanje jim bo v pomoč pri načrtovanju in izvedbi eksperimentov ter pri kritični evalvaciji eksperimentalnih podatkov.

Temeljna literatura in viri

  • Whitlock, M. C. The analysis of biological data / M. C. Whitlock and D. Schluter. - Greenwood Village, Colorado : Roberts and Company Publishers, 2009. - ISBN 978-0-9815194-0-1 Katalog E-gradivo
  • Statistical tools for high-throughput data analysis
  • Drugi viri na spletu

Načini ocenjevanja

Ocenjevanje bo sestavljeno iz različnih nalog statistične analize javnih podatkovnih baz.
Sledil bo ustni del, ki bo namenjen diskusiji uporabe analiz in dobljenih rezultatov pisnega dela.
Pisni del (80 %)
Ustni del (20 %)

Reference nosilca

Alfonso Esposito je izredni profesor, habilitiran za področje genomike na univerzi Enna "Kore". V zadnjih 7 letih je bil odgovoren za bioinformatiko in biostatistiko na Univerzi v Trentu in na ICGEB, sodeloval pa je tudi usposabljanju magistrskih in doktorskih študentov. Imel je več že predavanj in seminarjev o uporabi bioinformatike v mikrobni genomiki in metagenomiki.

Bibliografija:
• Renato Pedron, Alfonso Esposito, William Cozza, Massimo Paolazzi, Mario Cristofolini, Nicola Segata, Olivier Jousson. Microbiome characterization of alpine water springs for human consumption reveals site- and usage-specific microbial signatures (2022) Frontiers in Microbiology, IF 4.07, DOI: 10.3389/fmicb.2022.946460.
• Cristina Bez, Alfonso Esposito, Hang Dinh Thuy, Minh Nguyen Hong, Giampiero Valè, Danilo Licastro, Iris Bertani, Silvano Piazza and Vittorio Venturi. The rice foot rot pathogen Dickeya zeae alters the in-field plant microbiome (2021) Environmental microbiology, IF: 5.49, doi: 10.1111/1462-2920.15726.
• Alfonso Esposito, Luigimaria Borruso, Jayne Rattray, Lorenzo Brusetti, Engy Ahmed. Taxonomic and functional insights into rock varnish microbiome using shotgun metagenomics (2019) FEMS Microbiology Ecology, 95:12, IF 4.09, DOI: 10.1093/femsec/fiz180
• Alfonso Esposito, Arianna Pompilio, Clotilde Bettua, Valentina Crocetta, Elisabetta Giacobazzi, Ersilia Fiscarelli, Olivier Jousson, Giovanni Di Bonaventura. Evolution of Stenotrophomonas maltophilia in Cystic Fibrosis Lung over Chronic Infection: A Genomic and Phenotypic Population Study (2017) Frontiers in Microbiology, IF 4.07, DOI: 10.3389/fmicb.2017.01590