Progetto per l'esame di Biologia Computazionale[145375] dell'Università di Trento a.a. 2024/2025.
Docenti: Dassi Erik e Asnicar Francesco
L'obbiettivo del progetto è identificare e caratterizzare vari geni differenzialmente espressi per la tipologia di tumore specifico. Tutte le analisi necessarie sono state svolte utilizzando il dataset del progetto TCGA.
Il le analisi del progetto sono state realizzate mediante un R Notebook, in modo da rendere il codice pulito e leggibile. Il file R per le analisi è il seguente: ESCA.Rmd.
All'interno del file sono spiegate le varie a analisi, sia dal punto di vista tecnico, sia dal punto di vista dei risultati ottenuti.
└── BioComp2025-ESCA/
├── ESCA.Rmd
├── graph
├── data
├── BioComp2025-ESCA.Rproj
├── LICENSE
└── README.mdI grafici sono contenuti nella cartella graph e sono numerati per l'analisi fatta. Per una ricerca veloce cercate il numero del grafico all'interno del file ESCA.Rmd, questo vi porterà all'analisi corrispondente.
I dati elaborati si trovano nella cartella data.
Non tutti i dati sono numerati per esperimento, consiglio di cercare direttamente il nome del file e vi troverete dove è stato generato.
TCGA-ESCA è il progetto del The Cancer Genome Atlas (TCGA) dedicato al carcinoma esofageo. Questo tumore può essere suddiviso in due sottotipi principali:
- Esophagus Squamous Cell Carcinoma (ESCC): originato dalle cellule squamose che rivestono l'esofago.
- Esophagus Adenocarcinoma (EAC): si sviluppa dalle ghiandole mucose, spesso associato a esofago di Barrett.
All'interno del progetto sono presenti dati per un numero di pazienti pari a 185.
I dati si distribuiscono in:
- ~90 ESCC
- ~95 EAC
I campioni provengono da diversi centri oncologici negli Stati Uniti. Sono stati raccolti vari tessuti tra cui: tumori primari, tessuti normali adiacenti e in alcuni casi metastasi.
TCGA ha eseguito una profilazione multi-omica dei campioni. Le principali analisi includono:
-
Genomica
- Whole exome sequencing (WES): per identificare mutazioni somatiche.
- Copy number alterations (CNA): utilizzando SNP arrays.
- Mutazioni frequenti:
- ESCC: TP53, NFE2L2, KEAP1, PIK3CA
- EAC: TP53, CDKN2A, ERBB2, KRAS
-
Epigenomica
- Methylation arrays: per l'analisi dello stato epigenetico.
-
Trascrittomica
- RNA-Seq: per valutare l’espressione genica.
- Splicing alternativo
- Analisi di espressione differenziale tra tessuti tumorali e normali.
-
Proteomica
- Reverse Phase Protein Array (RPPA): per la quantificazione di proteine e fosfoproteine.
ESCC:
- Chemio-radioterapia (es. cisplatino + 5-FU)
- Chirurgia in casi selezionati
EAC:
- Chirurgia (esofagectomia)
- Chemoterapia (es. FOLFOX, paclitaxel)
- Targeted therapy per mutazioni specifiche (es. HER2 amplificato)
In casi avanzati, si stanno testando:
- Inibitori di checkpoint immunitari (es. anti-PD1/PD-L1)
- Terapie mirate su ERBB2, MET, ecc.
I metadati clinici raccolti da TCGA includono:
| Categoria | Dettagli |
|---|---|
| Età | 33-90 anni, mediana ~60-65 |
| Sesso | Prevalenza maschile |
| Stadio Tumorale | I-IV, con staging TNM incluso |
| Grado Istologico | Ben differenziato, moderato, poco differenziato |
| Follow-up | Informazioni su sopravvivenza globale (OS), sopravvivenza libera da malattia (DFS) |
| Recidive | Data di recidiva e localizzazione |
| Trattamenti | Tipo di trattamento (chemioterapia, radioterapia, chirurgia), date e durata |
- cBioPortal
- GDC Data Portal
- UCSC Xena Browser
- Cancer Genomics Cloud
- recount3 e Bioconductor: accesso agli RNA-Seq pre-processati.
- Eva Jovanovska
- Lara Baggio
- Sofia Paiusco
- Pietro Rocchio
This project is licensed under the MIT License - see the LICENSE file for details.