Quelle est la définition d’une région de faible complexité pour l’enrichissement ciblé ?

Nous utilisons actuellement un modèle exclusif pour prévoir si une sonde sera ou non difficile à détecter avec le séquençage Illumina. Dans ce modèle, les entrées incluent la teneur en GC, la complexité générale (mesurée en tant que nombre de kmers distincts contenus dans une séquence de sonde), la complexité locale (mesurée en tant que nombre de kmers distincts dans une région limitée d’une séquence) et la présence d’homopolymères.

En général, les sondes dont la teneur en GC est > 85 %, les homopolymères de plus de 20 nt ou les répétitions en tandem de dinucléotides ou trinucléotides de plus de 30 nt sont difficiles à séquencer.

Cet article a-t-il été utile ?

Non

Vous avez d’autres questions ? Nous contacter

Powered by Translations.com GlobalLink OneLink Software