DOI: 10.1051/gse:2000131
Genet. Sel. Evol. 32 (2000) 467-482
Computation of identity by descent probabilities conditional on
DNA markers via a Monte Carlo Markov Chain method
Miguel Pérez-Encisoa,b,c - Luis Varonaa
- Max F. Rothschildb
aArea de Producció Animal, Centre UdL-IRTA, 25198 Lleida, Spain
bDepartment of Animal Science, Iowa State University, Ames,
50011-3150 Iowa, USA
cPresent address: Station d'amélioration génétique des animaux,
Institut national de la recherche agronomique,
31326 Castanet Tolosan Cedex, France
(Received 11 January 2000; accepted 05 June 2000)
Abstract:
The accurate estimation of the probability of identity by descent (IBD) at loci
or genome positions of interest is paramount to the genetic study of quantitative
and disease resistance traits. We present a Monte Carlo Markov Chain method to
compute IBD probabilities between individuals conditional on DNA markers and on
pedigree information. The IBDs can be obtained in a completely general pedigree
at any genome position of interest, and all marker and pedigree information
available is used. The method can be split into two steps at each iteration. First,
phases are sampled using current genotypic configurations of relatives and second,
crossover events are simulated conditional on phases. Internal track is kept of all
founder origins and crossovers such that the IBD probabilities averaged over
replicates are rapidly obtained. We illustrate the method with some examples.
First, we show that all pedigree information should be used to obtain line origin
probabilities in F2 crosses. Second, the distribution of genetic relationships
between half and full sibs is analysed in both simulated data and in real data
from an F2 cross in pigs.
Keywords:
DNA markers / identity by descent probability / Monte Carlo Markov Chain
Résumé:
Calcul de probabilités d'identité par descendance sachant les
marqueurs moléculaires d'ADN via une méthode MCMC.
L'estimation précise des probabilités d'identité par descendance (IBD) est
fondamentale pour l'analyse génétique de caractères quantitatifs et de
susceptibilités aux maladies. On présente une méthode de Chaîne de
Markov Monte Carlo (MCMC) pour obtenir les probabilités IBD entre individus
sachant les marqueurs d'ADN et le pedigree. Les IBDs peuvent être calculés
pour un pedigree général sur une position quelconque du génome. Toute
l'information des marqueurs et du pedigree est utilisée. La méthode consiste
en deux étapes :
1) les phases sont échantillonnées en utilisant les configurations génotypiques
des individus apparentés ;
2) les crossing-overs sont simulés sachant les phases. On trace l'origine des
fondateurs et des positions des crossing-overs. Donc les probabilités IBD sont
calculées immédiatement. On présente quelques applications. D'abord, on montre
que toute l'information doit être prise en compte pour calculer les
probabilités sur croisements F2. Ensuite, on étudie la distribution de
coefficients de parenté entre frères avec données réelles et simulées.
Mots clé :
chaîne de Markov Monte Carlo / marqueurs moléculaires / probabilité
d'identité par descendance
Correspondence and reprints: Miguel Pérez-Enciso
e-mail: mperez@toulouse.inra.fr
Copyright INRA, EDP Sciences