Přibližně polovina autistických dětí
Nový přístup pro sekvenování DNA (dlouhá čtení) odhaluje architekturu vzácných varianty v genomech autistických dětí 

Přibližně polovina autistických dětí, u nichž standardní genetické testy nevysvětlily příčinu jejich obtíží, ji možná nosí v místech genomu, která dosavadní metody prostě přečíst nedokázaly. Nová studie publikovaná v lednu 2026 v časopise Nature Communications ukazuje, že sekvenování celého genomu dlouhými čteními (LR-WGS) dokáže v těchto případech odpovědi najít, a to tam, kde se opakovaně selhávalo. 

Autismus a hledání genetických příčin: proč je to tak obtížné 

Poruchy autistického spektra (PAS) jsou skupinou neurovývojových onemocnění s velmi pestrým klinickým obrazem. Patří sem potíže s komunikací a sociální interakcí, ale i opakující se vzorce chování. Celková prevalence se globálně odhaduje přibližně na 1%1 %, přičemž chlapci jsou postiženi asi čtyřikrát častěji než dívky. 

Genetika autismu je složitá. Genetické faktory se podílejí na vzniku PAS z více než 60%60 %, avšak genetická příčina zůstává u velké části pacientů neobjasněna i po rozsáhlém testování. Dosavadní studie využívající standardní sekvenování krátkými čteními (Illumina a podobné platformy) dokázaly identifikovat příčinu jen u přibližně 20%20 % případů, a to zejména díky odhalení tzv. de novo mutací (vzniklých nově, nikoliv zděděných od rodičů) a změn v počtu kopií genů. 

Proč ale zbývá tolik nevyřešených případů? Klíčová část genomu zůstávala nedostupná. Jde hlavně o oblasti bohaté na opakující se sekvence, tzv. repetitivní oblasti, kam krátká čtení (typicky 150 bází) jednoduše spolehlivě nedosáhnou. Jsou to právě tato místa, kde se skrývají varianty ovlivňující nejen geny samotné, ale i jejich regulaci. 

Proč standardní WGS na některé varianty nestačí 

Abychom pochopili, v čem tkví přínos LR-WGS, je třeba si nejprve přiblížit, jak sekvenování obecně funguje. 

Představte si, že chcete přečíst rozsáhlou knihu, ale máte k dispozici pouze útržky o délce dvou nebo tří řádků. Většinu textu z útržků složíte dohromady bez problémů. Jenže v knize jsou pasáže, kde se stále dokola opakuje totéž slovo. Krátké útržky z takových míst jsou navzájem k nerozeznání a neumíte je v textu správně zařadit. Nevíte, zda se dané slovo opakovalo desetkrát, nebo stokrát. Přesně tohle je problém sekvenování krátkými čteními (SR-WGS). Čtení o délce 150 bází jsou vynikající pro rychlé a levné pokrytí většiny genomu, avšak repetitivní oblasti nebo strukturní varianty DNA jednoduše nemůže tato technologie zachytit.  

Sekvenování dlouhými čteními (LR-WGS) využívajíá technologie jako PacBio HiFi nebo Oxford Nanopore (ONT), které dokážou přečíst najednou úseky dlouhé typicky 15 000 až 30 000 bází, tedy 100 až 200× více. Takto dlouhé čtení bez problémů překryje i rozsáhlé repetitivní pasáže a přináší přesný obraz toho, co se v nich skutečně odehrává. Navíc LR-WGS umožňuje tzv. fázování genomu (phasing), tedy odlišení toho, která varianta pochází od matky a která od otce. U standardního WGS se obě kopie chromozomů promíchají dohromady, což komplikuje identifikaci recesivně zděděných variant, tedy mutací, které způsobí onemocnění teprve tehdy, jsou-li přítomny na obou chromozomech zároveň. 

Jak studie probíhala 

Yang Sui a kol. z Katedry genomových věd Washingtonské univerzity (University of Washington) analyzovali genomy 189 jedinců z 51 rodin s autismem, jejichž genetická příčina nebyla odhalena přes opakované standardní vyšetření, konkrétně panelové testy, celoexomové sekvenování (WES) nebo celogenomové sekvenování krátkými čteními. Kohortu tvořilo 46 rodin z databází SSC (Simons Simplex Collection) a SAGE s idiopatickým autismem a pět rodin s dívkami vykazujícími klinické rysy Rettova syndromu, u nichž opakované testy nenalezly mutaci v genu MECP2. Důležité je, že 41 z 51 probandů byly dívky, a to záměrně, protože u dívek s autismem je pravděpodobnost nálezu závažné varianty obecně vyšší. 

De novo assembly: sestavení genomu od základů 

Klíčovým metodologickým krokem byl přístup označovaný jako de novo assembly, tedy sestavení genomu doslova od nuly, bez závislosti na referenční sekvenci. Právě tady spočívá jeden z nejdůležitějších přínosů LR-WGS a to, co tuto studii metodologicky odlišuje od většiny předchozích analýz. 

Každý z 189 genomů byl osekvenován pomocí PacBio HiFi s průměrným pokrytím 36násobku genomu a střední délkou čtení 19 000 bází. Pro 87 dětí byly pomocí nástroje hifiasm zkonstruovány fázované genomové sestavy (haplotype-resolved assemblies). Výsledkem nebylo jen přečtení sekvence genomu, ale sestavení téměř kompletních genomových haplotypů, jedné kopie od matky a druhé od otce. Průměrná délka ucelených úseků (contig N50) dosáhla 43 megabází, přičemž přesnost sestavy (QV = 56) byla srovnatelná s referenčními genomovými sestavami z pangenomových projektů HPRC a HGSVC. 

Proč na de novo assembly tolik záleží? Standardní přístup zarovnává čtení na jeden vzorový lidský referenční genom. To má zásadní nevýhodu: pokud se varianta pacienta od referenčního genomu liší natolik, že ji algoritmy nedokážou spolehlivě zarovnat, jednoduše zmizí. Tento jev se označuje jako referenční bias. U de novo assembly k tomu nedochází, protože se sestavenou sekvencí pacienta se porovnávají jiné sestavené sekvence, nikoliv jediný referenční vzor. Tím se výrazně zvyšuje schopnost odhalit neobvyklé nebo komplexní přestavby genomu. 

De novo assembly dále umožnila zcela nově zrekonstruovat strukturu pohlavních chromozomů. Chromozom X byl sestaven průměrně z 95% délky, chromozom Y ze 70%. Jsou to oblasti, které SR-WGS rutinně vylučuje kvůli opakujícím se sekvencím a problémům s ploiditou. Fázování přitom umožnilo jednoznačně přiřadit každý z chromozomů X k matce nebo otci bez nutnosti jakékoliv referenční sekvence. Kombinace de novo assembly a LR-WGS dat navíc umožnila automaticky zachytit methylaci DNA v místech CpG z ONT čtení bez nutnosti dalšího chemického zpracování vzorku. Studie tak u několika dívek detekovala výrazné zkosení inaktivace chromozomu X, včetně jednoho případu, kde se přednostně inaktivoval mateřský chromozom X, což je potenciálně konzistentní s přítomností poškozené kopie na straně matky. 

 

Filtrování pomocí pangenomu 

Po sestavení genomů autoři identifikovali strukturní varianty (SV) nástrojem PAV a validovali je pomocí dalších metod. Na každém diploidním genomu bylo nalezeno průměrně 27 576 SV. Aby bylo možné soustředit se na vzácné a potenciálně patogenní varianty, bylo nutné ty běžné vyloučit. K tomu posloužila kontrolní databáze 569 genomů osekvenovaných dlouhými čteními z projektů HPRC, HGSVC a 1000 Genomes. Po filtrování zbylo přibližně 202 vzácných SV na jedince, tedy přibližně 0,7%0,7 % původního počtu. 

Srovnání s přístupem používajícím pouze SR-WGS kontroly je výmluvné. Pokud by se k filtrování využíval jen standardní soubor gnomAD (63 000 genomů krátkých čtení), zůstalo by po filtraci přes 14 000 vzácných SV na jedince, tedy sedmdesátkrát více, a identifikace skutečně patogenních variant by tak byla prakticky nemožná. Díky LR-WGS kontrolám se povedlo vyloučit 97 až 99%99 % všech SV jako běžné polymorfismy. 

Co přinesly výsledky 

Tři patogenní varianty odhaleny tam, kde předchozí testy selhaly 

Celkem byly u 51 probandů identifikovány tři varianty klasifikované jako patogenní. U dívky s idiopatickým autismem byla nalezena de novo nesmyslná mutace (stop-gain G1124*) v genu SYNGAP1, který kóduje protein nezbytný pro správnou funkci synapsí a kognitivní vývoj. Tato varianta prošla třemi předchozími SR-WGS analýzami bez záchytu, protože leží v oblasti bohaté na GC páry, kde se krátká čtení shlukují a kvalita volání variant je nízká. Při zpětné kontrole Illumina dat se varianta ukázala jako přítomná, jenže celý úsek byl během standardního zpracování dat odfiltrován jako technicky nespolehlivý. 

U dívky s příznaky Rettova syndromu byla nalezena de novo delece 874 párů bází zasahující poslední exon genu MECP2. Tato varianta prošla dvěma panelovými testy a jedním celoexomovým sekvenováním bez záchytu. LR-WGS ji identifikoval jednoznačně a nález byl potvrzen třemi nezávislými sekvenačními platformami. Třetí patogenní varianta byla de novo missense záměna (D370N) v genu TBL1XR1, jehož protein přímo interaguje s MECP2. Varianta sama o sobě byla identifikována i SR-WGS, avšak její plný klinický kontext byl pochopen teprve ve spojení s LR daty. 

Devět kandidátních variant v regulačních oblastech genomu 

Vedle tří patogenních variant bylo identifikováno devět dalších kandidátních variant u 17,6%17,6 % probandů, které jsou podezřelé z příčinné role a čekají na funkční potvrzení. Sedm z devíti šlo o strukturní varianty a žádná z nich by standardními SR-WGS metodami nalezena nebyla. 

Zajímavé je, kde tyto varianty leží. Nenacházejí se v kódujících oblastech genů, tedy ne tam, kde jsou instrukce pro stavbu bílkovin, ale v regulačních oblastech, konkrétně v promotorech, enhancerech a 3' nepřekládaných oblastech (UTR). Jde o sekvence, které řídí, kdy, kde a jak moc se geny zapínají. Jejich mutaci lze přirovnat k poruše světelného vypínače: gen je přítomen, ale nemůže se správně aktivovat. 

Jako příklad lze uvést 71bázovou de novo tandemovou inzerci v intronu genu CNTN3 (kontaktin 3, gen důležitý pro vývoj nervového systému), která narušuje vazebné místo pro transkripční faktor HNRNPK a nachází se v místě bohatém na CT repetice, kde všechny testované SR nástroje selhaly. Dalším příkladem je 135bázová bialelická delece v 3' UTR genu CLN8 (rizikový gen pro PAS), přítomna na obou chromozomech v důsledku dědičnosti od obou heterozygotních rodičů. Právě tento typ varianty dokáže LR-WGS díky fázování genomu identifikovat. Konečně de novo záměna v promotoru genu DDX3X, klíčového pro vývoj neuronů, nebyla dosud nalezena v žádné kontrolní populaci. 

Co studie říká o budoucnosti diagnostiky vrozených příčin autismu 

Celkový diagnostický záchyt studie byl 5,9%5,9 % (tři patogenní varianty z 51 probandů). Autoři sami konstatují, že byl nižší, než očekávali, zvláště s ohledem na záměrné zaměření na dívky s autismem, u nichž je pravděpodobnost nálezu velké varianty obecně vyšší. Limitem je i rozsah kohorty: 51 rodin je pro statisticky průkazné závěry o celkové zátěži strukturními variantami stále příliš málo. Studie nenalezla statisticky významný rozdíl v počtu vzácných SV mezi postiženými jedinci a zdravými sourozenci a výsledky na chromozomu X a u homozygotních variant naznačují určité trendy, avšak bez dosažení statistické významnosti. Dalším omezením je, že část kandidátních variant v regulačních oblastech nebyla funkčně potvrzena. Expresní data z lymfocytů neodhalila změny genové exprese, zřejmě proto, že regulační vliv těchto variant se projeví specificky v mozkové tkáni, nikoliv v krvi. 

Přesto studie přináší jasná poselství. LR-WGS přináší informace, které SR-WGS systematicky přehlíží, přičemž většina kandidátních variant by bez dlouhých čtení nalezena nebyla, ať kvůli repetitivnímu kontextu, nebo proto, že zasahovalia do  regulačních oblastíi. De novo assembly pak posouvá diagnostiku za hranici standardního zarovnávání na referenci: schopnost sestavit téměř kompletní genom každého jedince a porovnat ho s pangenomovými kontrolami eliminuje referenční bias a umožňuje detekovat varianty v dosud nepřístupných oblastech genomu. Sedm z devíti kandidátních variant bylo bialelických, homozygotních, zděděných na obou chromozomech současně. Výskyt těchto variant naznačuje, že u části autistických pacientů hraje roli dědičnost po obou rodičích zároveň, tedy oligogenní nebo recesivní model, který standardní analýzy přehlíží. 

Cesta k rutinnímu klinickému nasazení je stále před námi. Cena LR-WGS postupně klesá, ale stále výrazně převyšuje náklady na standardní sekvenování. Bioinformatické postupy, zejména filtrování a interpretace SV v regulačních oblastech, jsou komplexní a jejich standardizace je teprve v počátcích. A ačkoliv je pangenomová kontrolní databáze rostoucím zdrojem, pro záchyt ultra-vzácných variant bude v budoucnu potřeba ještě výrazně větší soubor. Přesto jsou výsledky inspirativní. Tři rodiny se po letech opakovaných negativních testů díky LR-WGS dočkaly odpovědi, devět dalších má konkrétního kandidáta hodného dalšího výzkumu a stovky, možná tisíce podobných rodin nás teprve čekají. 

Zdroj: 
DOI: 10.1038/s41467-026-68378-4 

 

Vezměte osud a Vaše zdraví
do vlastních rukou