Seminari inaugural del cicle
Susie Bayarri: la reina del Bayes

Geòrgia Escaramís

30 d’octubre de 2025

Cronograma del cicle 2025–2026
27/11/2025
A potential transition from a concentrated to a generalized HIV epidemic: the case of Madagascar
David Alonso Giménez — CEAB (CSIC)
18/12/2025
Mètodes d’emparellament (Matching) per controlar la confusió en estudis observacionals
Jordi Real — Digital Health Validation Center (H. Sant Pau)
29/01/2026
Beyond Illness-Death: Capturing Real-World Disease Progression with Multistate Models
Guadalupe Gómez Melis — Universitat Politècnica de Catalunya
26/02/2026
Avaluació de la capacitat diagnòstica de proves mèdiques quantitatives
Sara Pérez — Universitat de Barcelona
26/03/2026
A Genomic SEM Approach to Shared Heritability in Immune-Related Diseases
Xavier Farré — GCAT lab, IGTP
30/04/2026
Anàlisi quantitatiu de xarxes sexuals egocèntriques en ITS
Miquel Saña Miralles — CEEISCAT
28/05/2026
Bayesian approach to Distributed Lag Non-Linear Models
Pau Satorra Herbera — Unitat de Bioestadística IGTP
18/06/2026
A Pooled Post Hoc Analysis of Individual Participant Data From 2 Randomized Trials
Cristian Tebé Cordomí — Unitat de Bioestadística IGTP

M. J. “Susie” Bayarri (1956 – 2014)

Catedràtica de la Universitat de València

Presidenta d’ISBA (1998)

Pionera en estadística bayesiana

Àrees clau:

  • Validació de models computacionals
  • Selecció i comparació de models
  • Inferència jeràrquica i robustesa bayesiana

“Susie va ser una de les figures més influents en el desenvolupament del pensament bayesià al món. Una líder científica amb energia, humor i una generositat inesgotable.”
Jim Berger, Duke University

Pensament freqüentista versus bayesià

El cor del pensament bayesià

El teorema de Bayes ens permet actualitzar les creences quan observem nova informació:

\[ p(\theta \mid X) = \frac{p(X \mid \theta)\,p(\theta)}{p(X)} \]

  • \(p(\theta)\) → el que sabíem abans (prior)
  • \(p(X \mid \theta)\) → el que observem (versemblança)
  • \(p(\theta \mid X)\) → el que sabem després (posterior)

En resum: creences → evidència → noves creences.

Quan és útil el pensament bayesià?

  • Observacions agrupades: alumnes dins d’escoles, pacients dins d’hospitals
  • Factors repetits: mesures al llarg del temps o en diferents regions
  • Contextos amb variabilitat dins i entre grups

En aquests casos, els models jeràrquics (o multinivell) descriuen nivells d’informació connectats i el pensament bayesià els gestiona de manera coherent.

El pensament bayesià “entén” la jerarquia de la realitat.

El model jeràrquic bayesià


        θ
   (nivell global)
        │ p(α|θ)
        ▼
   α₁, α₂, …, αⱼ
 (nivell de grup)
        │ p(X|α)
        ▼
   X₁ⱼ, X₂ⱼ, …, Xₙⱼ
 (dades observades)

\(\theta\) → creences prèvies globals
\(\alpha_j\) → paràmetres de grup condicionats
\(X_{ij}\) → observacions condicionades

Això condueix a la posterior jeràrquica:

\[ p(\theta,\alpha \mid X)\propto p(X\mid \alpha)\,p(\alpha\mid \theta)\,p(\theta) \]

El pensament bayesià uneix dades, processos i creences dins una mateixa estructura coherent.

El repte de la inferència bayesiana

En molts models reals, la posterior no té forma tancada,i calcular-la de manera exacta és inabastable.

MCMC (Markov Chain Monte Carlo) va obrir la porta a la inferència aproximada: mostrejar la posterior mitjançant simulació iterativa, a canvi d’un gran cost computacional.

El 2009, un canvi de paradigma:
INLA (Integrated Nested Laplace Approximation) permet aproximar les marginals posteriors de manera ràpida i precisa — per a models amb processos latents gaussians. 🔗 Projecte INLA

Contribucions més influents de Susie Bayarri

  • Contrast i diagnòstic de models bayesians
    Bayarri & Berger (2000), JASA
    → Definició formal dels p-values predictius i eines per comprovar l’ajust dels models.

  • Priors objectius i “reference priors”
    Berger & Bayarri (1999), Annals of Statistics
    → Fonament teòric dels priors no informatius i de l’anàlisi bayesiana objectiva.

  • Calibració de models de simulació
    Kennedy, Bayarri, Berger et al. (2001–2009)
    → Pionera en la integració de dades observades i models computacionals complexos.

  • Selecció i comparació de models bayesians
    Bayarri & Berger (2012), Annals of Statistics
    → Nous criteris i aproximacions per a la tria de models i el control de l’evidència.

Una contribució constant: fer la inferència bayesiana més rigorosa, interpretable i útil.

Model jeràrquic espaci-temporal conjunt (multivariant)
per les ITS a Catalunya

🧩 Case study

Antecedents i Objectiu

La incidència de les infeccions de transmissió sexual (ITS) a Catalunya augmenta de manera ininterrompuda des del 2016 i planteja un repte creixent per a la salut pública.

  • Catalunya concentra les taxes més elevades del país; +32,4 % d’increment anual mitjà.
  • 2023: Clamídia 196,3, Gonorrea 166,5, Sífilis 31,8 casos per cada 100.000 habitants.
  • Heterogeneïtat territorial: coexisteixen patrons compartits i desviacions específiques per malaltia.
  • Es requereix vigilància robusta i anàlisi conjunta per orientar la prevenció.

** Objectiu: model conjunt espai–temps, robust i interpretable → separar el component comú, captar l’específic, mesurar tendències per infecció i incloure factors de risc.

Mètodes: dades

  • ITS notificables (Àrea Bàsica de Salut, ABS, 2016–2023):
    • Clamídia (Ct)
    • Gonorrea (Ng)
    • Sífilis infecciosa (Sy)
  • Format lattice per ABS

  • SIR = O/E:
    • O: casos observats per ABS–any–infecció
    • E: casos esperats per estandardització indirecta (edat/sexes)
  • Determinants contextuals (covariables):
    • Índex socioeconòmic territorial (tercils T1–T3; ↑ tercil = menor vulnerabilitat)
    • Densitat poblacional (1 = urbà, 2 = mixt, 3 = rural)

Mètodes: model

Model conjunt bayesià Espai (S) – Temps (T)

\[ O_{i,t}^{(d)} \sim \text{Poisson}\!\left(E_{i,t}^{(d)} \, \theta_{i,t}^{(d)}\right) \]

\[ \log(\theta_{i,t}^{(d)}) = \alpha^{(d)} + \beta^{(d)} t + T_t^{(d)} + S_i^{(0)} + S_i^{(d)} + X_i \gamma \]

\[ S_i^{(0)} \sim \text{ICAR}(W, \tau_0), \quad S_i^{(d)} \sim \text{ICAR}(W, \tau_d), \quad T_t^{(d)} \sim \text{RW1}(\tau_t) \]

Notació. \(i\): ABS; \(t\): any; \(d\): infecció (Ct, Ng o Sy); \(\theta_{i,t}^{(d)}\): risc relatiu; \(\tau\): precisió amb priors de penalització per complexitat PC.

Component espacial

ICAR compartit \(S_i^{(0)}\) + ICAR específic per infecció \(S_i^{(d)}\)

\[ s_i \mid s_{N(i)}, \tau \sim \mathcal{N}\!\left(\bar{s}_{N(i)}, \frac{1}{\tau n_i}\right) \]

Model adaptat de: Gómez-Rubio, V., Palmi-Perales, F., López-Abente, G., Ramis-Prieto, R., Fernández-Navarro, P. (2019). Bayesian joint spatio-temporal analysis of multiple diseases. SORT, 43(1):61–74.

Mètodes: model

Model conjunt bayesià Espai (S) – Temps (T)

\[ O_{i,t}^{(d)} \sim \text{Poisson}\!\left(E_{i,t}^{(d)} \, \theta_{i,t}^{(d)}\right) \]

\[ \log(\theta_{i,t}^{(d)}) = \alpha^{(d)} + \beta^{(d)} t + T_t^{(d)} + S_i^{(0)} + S_i^{(d)} + X_i \gamma \]

\[ S_i^{(0)} \sim \text{ICAR}(W, \tau_0), \quad S_i^{(d)} \sim \text{ICAR}(W, \tau_d), \quad T_t^{(d)} \sim \text{RW1}(\tau_t) \]

Notació. \(i\): ABS; \(t\): any; \(d\): infecció (Ct, Ng o Sy); \(\theta_{i,t}^{(d)}\): risc relatiu; \(\tau\): precisió amb priors de penalització per complexitat PC.

Component temporal

Pendent \(\beta^{(d)}\) + desviació suau \(T_t^{(d)} \sim \mathrm{RW1}(\tau_t)\)

Factors contextuals

Efectes associats a covariables \(X_i \gamma\) (p. ex. socioeconòmiques, accessibilitat, etc.)

Inferència

Integrated Nested Laplace Approximation (INLA)

Model adaptat de: Gómez-Rubio, V., Palmi-Perales, F., López-Abente, G., Ramis-Prieto, R., Fernández-Navarro, P. (2019). Bayesian joint spatio-temporal analysis of multiple diseases. SORT, 43(1):61–74.

Resultats: estimacions dels paràmetres del model (I)

Riscos relatius (RR): mitjana, mediana i Interval de Credibilitat (IC95%)

Paràmetre Mitjana Mediana IC95% inf IC95% sup
α (Interceptes per infecció)
αCt 0.348 0.348 0.348 0.370
αNg 0.215 0.215 0.203 0.226
αSy 0.352 0.352 0.331 0.374
β (Canvi anual per infecció)
βCt 1.310 1.309 1.038 1.162
βNg 1.279 1.279 1.089 1.353
βSy 1.027 1.027 0.914 1.155
γ (Factors contextuals, efecte comú)
Dens. Pobl. mitjana vs urb. 0.838 0.838 0.719 0.905
Dens. Pobl. rural vs urb. 0.739 0.739 0.651 0.836
Índex Socioec. T2 vs T1(major vuln.) 0.916 0.916 0.854 0.951
Índex Socioec. T3 vs T1 (major vuln.) 0.892 0.892 0.825 0.953

Resultats: estimacions dels paràmetres del model (II)

Variàncies (\(\sigma^2 = \tau^{-1}\)): mitjana, mediana i IC95%

Bloc Mitjana Mediana IC95% inf IC95% sup
Espacial
Comú 0.138 0.138 0.117 0.165
Específic Ct 0.030 0.030 0.021 0.045
Específic Ng 0.010 0.011 0.004 0.022
Específic Sy 0.074 0.075 0.056 0.102
Temporal
Específic Ct 0.077 0.074 0.045 0.126
Específic Ng 0.036 0.036 0.024 0.062
Específic Sy 0.018 0.020 0.007 0.041

Resultats: distribució temporal i geogràfica

Dinàmica temporal

Mapa de risc comú a totes les ITS

Resultats: patrons espacials diferencials per ITS

Clamídia

Gonorrea

Sífilis infecciosa

Conclusions

  • Patrons comuns i específics: el model distingeix el que és compartit entre ITS i el que és diferencial per infecció i territori.

  • Major robustesa: davant la variabilitat de taxes directes (zones petites o amb pocs casos), el model aporta estimacions més estables i fiables.

  • Evidència útil en salut pública: orienta la prevenció i el control d’una manera més focalitzada.

  • Extensible: pot aplicar-se a altres contextos territorials.