Dlouhodobá vyrovnávací selekce přispívá k adaptaci u Arabidopsis a jeho příbuzných

Sdílené polymorfismy jsou hojné mezi A. thaliana a C. rubella

V populaci 80 exemplářů A. thaliana , bylo nalezeno 4 902 039 SNP (z 119 146 348 míst), mezi nimiž mělo 2 044 731 minoritní frekvenci alel (MAF) > 0,05. V populaci 80 exemplářů A. thaliana bylo nalezeno 4 902 039 SNP (z 119 146 348 míst). V populaci C. rubella jsme voláním SNP z 22 přístupů C. rubella (Additional file 1: Table S1, včetně 21 publikovaných přístupů a jednoho přístupu sekvenovaného v této studii ) proti referenčnímu genomu C. rubella , identifikovali 2 149 643 SNP (z 134 834 574 míst), z nichž 1 240 547 mělo MAF > 0,05. Pro identifikaci sdílených polymorfismů mezi oběma druhy, definovaných jako stejný pár alel na určitém ortologickém místě, jsme nejprve zkonstruovali soubor ortologických genových párů mezi oběma druhy. Abychom zaručili zachování ortologických genů, zahrnuli jsme kromě referenčních genomů A. thaliana a C. rubella také Arabidopsis lyrata , příbuzný A. thaliana. Získali jsme 16 047 párů ortologických genů a odstranili 33, které měly tandemové duplikace v některém ze tří referenčních genomů, a nakonec jsme pro další analýzu získali celkem 16 014 párů ortologických genů mezi A. thaliana a C. rubella.

Genová oblast 16 014 ortologických genů u A. thaliana zahrnovala 39 275 210 bp a podobně u C. rubella zahrnovala 40 936 262 bp. Tyto oblasti obsahovaly 3 889 495 fixních rozdílů a tento vysoký poměr (~ 10 %) odpovídá dlouhé době divergence (~ 8 MYA) obou druhů . V těchto oblastech jsme našli 1 122 845 bialelických míst (426 123 s MAF > 0,05) u A. thaliana a 452 116 bialelických míst (279 780 s MAF > 0,05) u C. rubella. Mezi těmito polymorfními místy bylo 19 732 ortologických míst polymorfních u obou druhů, z nichž 8535 sdílelo stejný alelový pár (shared SNP ) (Additional file 1: Table S2).

Ve srovnání se sekvencemi nekódujících oblastí jsou sekvence kódujících oblastí více konzervované a poskytují robustní zarovnání mezi oběma vysoce odlišnými druhy; proto jsme se nejprve zaměřili na shSNP v kódujících oblastech. MAF > 0,05 byla požadována u obou druhů, aby byla zaručena spolehlivost SNP a zohledněn očekávaný přebytek alel se středními frekvencemi pro místa pod dlouhodobou vyrovnávací selekcí. V kódujících oblastech 1007 genů jsme nalezli 1503 shSNP.

Na 1503 shSNP byla použita další filtrace, aby se zabránilo chybám při genotypování a mapování. Filtrování bylo aplikováno pouze na data SNP C. rubella, protože jsme stáhli matici SNP pro A. thaliana. Abychom se vyhnuli falešným SNP vzniklým duplikacemi v genomu, posoudili jsme mapovatelnost každé 50bp oblasti v C. rubella a pro další analýzu jsme ponechali pouze místa, která se nacházela v jednoznačně mapovatelných oblastech. Takto zůstalo pouze 580 míst. Nakonec jsme po odstranění nekvalitních míst označených nástrojem pro volání SNP získali 546 spolehlivých společných kódujících SNP ve 433 genech. Podrobnosti o procesu filtrování naleznete v části „Metody“ a pohled na tento proces je znázorněn na obr. 2.

Obr. 2. 2
obrázek2

Postup filtrování SNP pro identifikaci kandidátních míst TSP

Demografická historie obou druhů

Detekce skutečných signálů TSP z hojných společných polymorfismů závisí na úplném pochopení demografické historie obou druhů. Společné frekvenční spektrum lokalit (joint SFS) bylo široce používáno ke studiu demografické historie různých organismů . Proto jsme nejprve extrahovali čtyřnásobně degenerovaná místa ze zarovnání referenčních genomů A. thaliana a C. rubella na 16 014 ortologů. Nakonec jsme získali 2 011 573 míst pro demografickou analýzu (podrobnosti viz „Metody“).

Simulace koalescence byly poté provedeny pomocí fastsimcoal2 v rámci základního modelu bez toku genů (M1, obr. 3) a modelu zahrnujícího dávný tok genů mezi oběma rody (M2, obr. 3). Uvažovali jsme pouze starobylý tok genů mezi oběma druhy, protože u druhů patřících do různých rodů a s různým počtem chromozomů (pět vs. osm) je velmi nepravděpodobná nedávná introgrese. Kromě toho je v obou rodech A. thaliana jediným druhem s pěti a nikoli osmi chromozomy ; proto jsme omezili starobylý tok genů před oddělením A. thaliana od zbytku rodu Arabidopsis. V každém modelu jsme stanovili dobu divergence obou rodů na 8 MYA , což odpovídá době před 8 miliony generací, a předpokládali jsme rychlost spontánních mutací 7 × 10-9 na bp za generaci . Uvažovali jsme různé velikosti populací obou druhů na základě událostí přechodu od jejich příslušných předchůdců; A. thaliana prodělala redukci populace poté, co se oddělila od zbytku rodu Arabidopsis přibližně 6 MYA, a C. rubella zažila velmi nedávné úzké hrdlo spojené se speciací z C. grandiflora . Použili jsme koalescenční simulace s použitím metody složené věrohodnosti implementované ve fastsimcoal2 k přizpůsobení obou modelů společnému SFS obou druhů vypočtenému z extrahovaných 2 011 573 mezidruhových čtyřnásobně degenerovaných míst. Oba modely jsme porovnali pomocí Akaikeho informačního kritéria (AIC) a Akaikeho váhy důkazů (w), stejně jako v práci Excoffier et al. . Model bez dávného genového toku (M1) seděl o něco lépe (Max EstLhood: -682010 vs -682028), měl nižší AIC a vyšší váhu důkazů než druhý model (obr. 3, Additional file 2: Table S3). Obě blízké pravděpodobnosti navíc naznačují, že vliv ancestrálního toku genů by měl být v dlouhém časovém měřítku vymazán a ke kvalitě modelu přispívá jen málo.

Obr. 3
obrázek3

Odhady demografických parametrů pro dva modely divergence obou druhů

Podle modelu M1 je současné N e A. thaliana činila ~ 519 000 s 95% intervalem spolehlivosti (CI) 486 368-527 574 z velké populace předků (~ 2 230 000, 95% CI = 1 085 330-4 876 051) před oddělením od zbytku rodu Arabidopsis v době ~ 5,84 MYA (95% CI = 5,27-6,70). C. rubella se vyvinula ~ 0,40 MYA (95% CI = 321 998-500 317) z ancestrální populace s velkým N e ~ 4 037 000 (95% CI = 2 076 868-5 165 614) a současným N e ~ 129 000 (95% CI = 126 383-157 779). Oba rody se oddělily od ancestrální populace s N e = ~ 4 930 000 (95% CI = 4 560 931-4 969 696). V rámci modelu M2 s genovým tokem byly získány podobné odhady parametrů, s výjimkou většího ancestrálního N e pro rod Arabidopsis (~ 3 270 000, 95% CI = 797 016-4 342 346) a menšího N e pro rod Capsella (~ 1 972 000, 95% CI = 2 126 346-6 248 003). Byl odhadnut silnější tok genů z rodu Capsella do rodu Arabidopsis než v opačném směru (míra migrace na generaci; 1 × 10-8, 95% CI = 4,0 × 10-15-1,1 × 10-6 vs 7 × 10-14, 95% CI = 5,7 × 10-15-6,1 × 10-5), i když v obou případech slabý (podrobnosti viz doplňkový soubor 2: tabulka S3).

Transspecies polymorphisms between the two species must be under balancing selection

Trans-species polymorphisms can be neutral and its probability can be approximated given specific demographic parameters. Podobně jako ve studii TSP u lidí a šimpanzů , při neutrální evoluci byly sdílené polymorfismy v našem systému identické podle původu pouze tehdy, pokud: (1) alespoň dvě linie A. thaliana a dvě linie C. rubella se nespojily před rozdělením A. thaliana-C. rubella a (2) linie nesoucí stejnou alelu se spojily před liniemi nesoucími různé alely. Tato pravděpodobnost je dána především podmínkou (1) a lze ji aproximovat následujícím způsobem založeným na teorii koalescence :

$$ P={e}^{-\frac{T}{2{N}_A}\ast }{e}^{-\frac{T}{2{N}_C}}, $$

kde T označuje dobu divergence obou rodů a N A/N C označuje velikosti populací A. thaliana/C. rubella. Podle našich odhadů v rámci modelu M1, zohledňujících změny velikosti populací, je tato pravděpodobnost totožnosti na základě původu řádově 10-9. Vzhledem k tomu, že máme < 39 275 210 srovnaných míst mezi oběma druhy v genové oblasti, očekáváme, že celkový počet neutrálních TSP bude < 1 pouze genetickým driftem.

V našem modelu jsme předpokládali náhodné páření; oba druhy jsou však samosprašné a v rámci druhu pravděpodobně existuje populační struktura. Nicméně nedávné demografické události by měly mít relativně malý vliv, protože požadujeme hluboké koalescenční události náhodou u obou druhů ve stejné oblasti genomu . Jak ukazuje předchozí studie , i hluboká populační struktura v rámci moderních lidí by měla mít na pravděpodobnost minimální vliv. V této studii mají oba druhy historii převážně outcrosingu. A. thaliana přešla z outcrosingu na selfing pouze před jedním milionem let a C. rubella přešla mnohem později . I jako u samosprašných druhů dosahuje míra outcrosingu místních populací až 14,5 % . Proto je nepravděpodobné, že by populační struktury, pokud existují, přetrvávaly v dlouhém časovém měřítku, a jejich vliv na pravděpodobnost tak lze ignorovat.

Identifikace mezidruhových polymorfismů pod vyrovnávacím výběrem

TSP lze odlišit od neutrálních mutací, protože oblasti pod dlouhodobým vyrovnávacím výběrem se shlukují podle alel, nikoli podle druhů . Proto jsme se dále zaměřili na 433 kandidátních genů se spolehlivě sdílenými SNP v kódující oblasti a zkoumali jsme haplotypy pokrývající každý sdílený bialelický SNP s MAF > 0,05 v genových oblastech.

Pro odhad délky každého segmentu nesoucího signál TSP jsme použili vzorec odvozený dříve, který do značné míry závisí na rychlosti rekombinace. Z hlediska koalescence není takový segment rozdělen rekombinací, dokud všechny linie ze stejné alelické třídy nekoalescují ke svému poslednímu společnému předkovi v ancestrální populaci . Přijmeme-li pro oba druhy rychlost rekombinace 3,6 cM/Mb, byla délka segmentu teoreticky extrémně krátká, tj. jen několik párů bází. Vzhledem k tomu, že oba druhy vznikly nedávno z příslušných outcrossingových předků a efektivní míra rekombinace mohla být v minulosti mnohem vyšší, může být očekávaná délka ještě kratší. Tento odhad naznačuje, že za neutrálních okolností v našem systému je velmi obtížné objevit jakýkoli úsek bez přerušení rekombinací. Pokud však existuje vyrovnávací selekce, může selekce potlačit rekombinaci v okolní oblasti . Proto by délka segmentu měla být delší než teoretický odhad v rámci neutrálního modelu. Prohledali jsme tedy genovou oblast s použitím velikosti okna 100 bp a velikosti kroku 1 bp.

Ve 433 kandidátních genech jsme detekovali 975 sdílených bi-alelních SNP (včetně exonických i intronických SNP s MAF > 0,05). Podobně jako v předchozích studiích , jsme dále mezi kvalifikovanými okny (zarovnanými minimálně na 95 % délky; podrobnosti viz „Metody“) hledali okna pokrývající alespoň dva z 975 SNP, které jsou v silné vazebné nerovnováze (r 2 > 0,5) u obou druhů, abychom identifikovali alelické stromy. Tato omezení mohou výrazně snížit počet falešně pozitivních výsledků a poskytnout alelické stromy, pokud existují, s vysokým rozlišením. Nakonec jsme identifikovali okna z pěti genů, AT1G35220, AT2G16570, AT4G29360, AT5G38460 a AT5G44000, zahrnující deset míst, jako kandidátské TSP v rámci dlouhodobé vyrovnávací selekce (doplňkový soubor 3: obrázek S1). Žádný z pěti ortologických genů, které jsme zde nalezli, nekoreluje s variací počtu kopií (CNV) a všechny mají pouze jednu shodu, když jsme je porovnali s referencemi obou druhů, v tomto pořadí (podrobnosti viz „Metody“).

Pro ověření identifikovaných oblastí jsme nejprve určili všechny haplotypy v identifikovaných oblastech z každé populace a resekvenovali reprezentativní vzorky pro každý haplotyp (primery viz Doplňkový soubor 1: tabulka S4). Podle očekávání byla všechna kandidátní místa TSP v pěti genech ověřena a sekvence obou druhů v kandidátních oblastech se shlukovaly spíše podle alel než podle druhů (obr. 4). V genu AT1G35220 byla dvě kandidátní místa TSP v úplné vazebné nerovnováze v intronické oblasti; tato oblast může být cílem vyrovnávací selekce nebo může být spojena s nezjištěným kódujícím místem TSP.

Obr. 4
obrázek4

Všechny kandidátské oblasti v pěti genech vytvářejí spíše alelický než druhový strom

Ačkoli haplotypy každé oblasti se shlukují podle alel, spíše než druh, sdílení haplotypů mezi oběma druhy bylo zjištěno jen zřídka, s výjimkou AT2G16570 (Col-0 sdílel svůj haplotyp s několika druhy C. rubella; obr. 4). To není překvapivé vzhledem k dlouhé době divergence; rozsáhlé sdílení haplotypů se obvykle objevuje v mnohem menším časovém měřítku a je vyvoláno událostmi, jako je nedávná introgrese mezi blízce příbuznými druhy.

Studie neutrální simulace ověřují pět kandidátních genů

Abychom zjistili, zda by pozorovaná okna mohla být generována náhodně v rámci neutrální evoluce, což by vedlo k falešně pozitivním výsledkům, provedli jsme další simulace založené na odhadnutých demografických parametrech pomocí fastsimcoal2 (Additional file 4: Text S1). Kromě neutrálních rekurentních mutací může genový tok vést také ke sdílení SNP. V souladu s tím jsme provedli simulace podle modelu M1 (bez toku genů) i M2 (s dávným tokem genů), ačkoli naše demografická analýza ukázala, že M1 o něco lépe odpovídá datům. V obou simulacích jsme zohlednili heterogenitu v mutačních rychlostech pro různé třídy mutací, zejména vyšší mutační rychlost v místech CpG, která může vést k falešně pozitivním výsledkům (doplňkový soubor 1: tabulka S5, doplňkový soubor 4: text S1). Pomocí fastsimcoal2 jsme v rámci každého modelu vygenerovali 1 000 000 neutrálních úseků o délce 100 bp a hledali jsme ty, které mají dva nebo více společných SNP a shlukují se podle alel, jak jsme hledali TSP.

Pro oba modely žádný z 1 000 000 běhů nedal vzniknout oknu, které by splňovalo naše kritéria (Additional file 1: Table S6). Navzdory existenci neutrálních sdílených SNP žádné simulované okno nevytvořilo alelický strom, protože všechna okna se sdílenými SNP byla doprovázena mnohem větším množstvím fixních rozdílů mezi oběma druhy, což znamená vyšší úroveň divergence než diverzity. Tento výsledek naznačuje, že tyto simulované neutrální sdílené SNP jsou spíše rekurentní mutace než TSP, a co je důležitější, pět genů, které jsme našli, neodpovídá neutrální evoluci, a tím se ukázalo, že jsou skutečnými TSP pod vyvažující selekcí. Konečná místa a geny TSP jsou uvedeny v tabulce 1. Navíc spolu s výše uvedenou demografickou studií naše výsledky naznačují, že i kdyby došlo k dávnému toku genů, při neutrální evoluci by se TSP v tomto systému ztratily driftem.

Tabulka 1 Informace o kandidátních genech a místech TSP

Vlastnosti genů při vyvažující selekci

Dále jsme vypočítali nukleotidovou diverzitu (π) pro všechny oblasti TSP v pěti genech u každého druhu a k určení úrovně diverzity pozadí jsme použili simulované neutrální sekvence při M1. Všechny oblasti v pěti genech vykazovaly významně vyšší hodnoty π než úrovně pozadí jak u C. rubella, tak u A. thaliana (Wilcoxon-Mann-Whitney test, FDR-korekce P < 0,05, tabulka 2, doplňkový soubor 3: obrázek S2A), kromě AT5G38460 u A. thaliana. Kromě toho alely těchto genů vykazovaly trend ke středním frekvencím (Wilcoxon-Mann-Whitney test, P = 0,0752/0,03474 pro A. thaliana/C. rubella; Additional file 3: Figure S2B). Střední frekvence je však známkou vyrovnávací selekce, nikoli však definitivním důkazem, protože se očekává, že rozložení frekvencí alel na místech spojených s vyrovnávacím polymorfismem bude vykazovat posun směrem k rovnovážné frekvenci, která může být při jakékoli frekvenci alel .

Tabulka 2 Genetické vlastnosti míst TSP

Jeden z pěti genů podléhajících dlouhodobé vyrovnávací selekci v této studii, AT1G35220, má neznámou funkci, ale vykazuje fosforylaci bílkovin při ošetření etylenem . AT2G16570 je mimo jiné klíčovým enzymem v dráze biosyntézy purinových nukleotidů a je důležitý pro buněčné dělení, biogenezi chloroplastů a klíčení semen ; AT4G29360 je protein O-glykosylhydrolázy rodiny 17, který se podílí na obranných reakcích ; AT5G38460 je glykosyltransferáza a katalyzuje přenos glykosylové skupiny z jedné sloučeniny (donoru) na druhou (akceptor) a podílí se na různých funkcích, včetně biotického stresu ; AT5G44000 je glutathion S-transferáza, která se obvykle podílí na odpovědi na abiotický a biotický stres . Tyto geny se zřejmě potenciálně podílejí na reakci na biotický nebo abiotický stres (AT4G29360, AT5G38460 a AT5G44000) nebo na základních biochemických funkcích (AT2G16570).

Podle očekávání byly geny podléhající vyrovnávací selekci funkčně důležité a všechny homology těchto pěti genů existovaly již u posledního společného předka zelených rostlin. Jak je uvedeno v tabulce S7 (Additional file 1: Table S7), homology (buď ortology, nebo paralogy) lze nalézt i u nejbazálnějšího druhu zelených rostlin, Chlamydomonas reinhardtii, pro všech pět genů, s výjimkou AT4G29360, který lze vysledovat až u Physcomitrella patens.

V této studii však nevynikly lokusy, u kterých je všeobecně přijímáno, že jsou pod vyvažující selekcí, jako je S-locus nebo R geny. To se dalo očekávat, protože tyto lokusy jsou příliš variabilní na to, aby je bylo možné identifikovat na základě krátkých čtení. Například R geny jsou příliš dynamické na to, aby se daly nazvat SNP ; S-locus neexistuje v nejnovější anotaci genomu Arabidopsis a u C. rubella se od přechodu od outcrosingu k selfingu a rozpadu self-incompatibility udržuje pouze jeden S-locus haplotyp . Navíc S-locus již není pod vyrovnávací selekcí, protože oba druhy jsou nyní samosprašné. Naproti tomu geny, které jsme zde identifikovali, ačkoli jsou staré, nebyly dosud komplexně studovány a mohou poskytnout vhled do typů genů pod vyvažujícím výběrem.

Vyvažující výběr přispěl k adaptaci na divergentní stanoviště

Abychom zjistili, zda alelické varianty pod dlouhodobým vyvažujícím výběrem souvisejí s ekologickou diverzifikací, zkoumali jsme divergenci s ohledem na 48 ekologických faktorů (Additional file 5: Table S8A). Vzhledem k nedostatku informací o GPS a malé velikosti vzorku C. rubella byla tato analýza možná pouze u vzorků A. thaliana. Populační struktura obvykle silně koreluje s ekologickou diverzifikací, a proto může naše výsledky zkreslovat. Nejprve jsme zkontrolovali, zda některé místo TSP koreluje s populační strukturou ve vzorcích A. thaliana, ačkoli tato struktura nemá vliv na pravděpodobnost pozorování druhového stromu A. thaliana a C. rubella. Pomocí programu ADMIXTURE jsme zjistili, že 80 vzorků A. thaliana lze rozdělit do dvou skupin (Additional file 3: Figure S3; Additional file 6: Table S9) a pouze alelické klasifikace dvou míst z genu AT5G38460 významně korelují s populační strukturou (chí-kvadrát test, FDR-corrected P < 0,05,; Additional file 1: Table S10). Proto jsme gen AT5G38460 z následných ekologických analýz vyloučili.

Pro důkladné pochopení ekologické divergence jsme použili 1135 nedávno publikovaných genomů A. thaliana . Nejprve jsme použili proces „ztenčení“, abychom zaručili, že každý vzorek je vysoce reprezentativní pro své přirozené prostředí, čímž jsme ponechali 584 vzorků (viz „Metody“). Za druhé jsme pro každý gen rozdělili 584 vzorků A. thaliana do dvou skupin na základě rozfázovaných haplotypů pro dvě místa TSP (Additional file 5: Table S8B, C, některé vzorky byly odstraněny, protože je nebylo možné rozfázovat). Poté jsme vyhodnotili divergenci mezi oběma skupinami vzorků s ohledem na 48 ekologických faktorů pro každý ze čtyř genů. Je zajímavé, že všechny tyto čtyři geny byly spojeny s divergencí některých specifických ekologických parametrů. Zejména AT1G35220 a AT4G29360 vykazovaly významnou divergenci s ohledem na většinu ekologických faktorů souvisejících s teplotou (Additional file 5: Table S8 A, Wilcoxon-Mann-Whitney test, FDR-corrected P < 0,05).

Poté jsme modelovali ekologické niky pro všechny čtyři geny. Je zřejmé, že dvě skupiny vzorků pro každý gen, jak ukazuje Warrenova statistika I, která měří podobnost nik , vykazovaly významně nižší pozorovanou identitu nik než 100 náhodných permutací (jednovýběrový t-test, FDR-korigováno P < 0,01; obr. 5a, Additional file 5: Table S8 D). Jinými slovy, obě alelické skupiny vzorků vykazují významnou nikovou divergenci. Kromě toho byly vzorky jednotlivých alelických typů pro každý gen rozptýleny, místo aby byly izolovány do malé lokální oblasti (Additional file 3: Figure S4). Tyto výsledky naznačují, že všechny tyto lokusy korelují s adaptací.

Obr. 5
obr. 5

Ekologická a expresní divergence. a Významná ekologická divergence mezi oběma typy vzorků pro každý ze čtyř genů, jak ukazuje pozorované skóre I (I O) a simulované skóre I (I S). b Expresní divergence genu AT5G44000. c Vlevo: Modelování niky s vysokou pravděpodobností (≥ 0,5) obou typů vzorků pro AT5G44000. Vpravo: Výsledky významnosti při různých permutačních strategiích (pro niky s pravděpodobností ≥ 0,5; I O = 0,673, 100 permutací)

Zkoumali jsme také diferenciaci exprese pro čtyři geny mezi dvěma odpovídajícími skupinami na základě rozfázovaných haplotypů na dvou místech TSP výběrem 84 publikovaných transkriptomů získaných z listových tkání A. thaliana (pro každý přírůstek byl sekvenován jeden vzorek a úroveň exprese byla měřena jako počet fragmentů na kilobázi exonu na milion mapovaných fragmentů ) jako v naší předchozí studii . Jeden gen, AT5G44000, vykazoval významný rozdíl v expresi (Wilcoxon-Mann-Whitney test, FDR-korekce P < 0,05, obr. 5b) mezi oběma skupinami haplotypů.

Provedli jsme proto hloubkové modelování niky AT5G44000 (obr. 5c) a zkoumali diverzifikaci obou skupin vzorků (503 vs 75). Nejprve jsme porovnali identitu niky mezi oběma skupinami haplotypů AT5G44000 omezením naší analýzy na niky s vysokou pravděpodobností (≥ 0,5) a získali jsme podobné výsledky (obr. 5c, Additional file 5: Table S8 D). Abychom zjistili, zda nevyvážená velikost vzorku může ovlivnit výsledky, použili jsme další permutační strategii omezením analýzy na stejnou velikost vzorku (75) pro oba soubory v každém opakování (s pravděpodobností > 0,5). Jak je uvedeno na obr. 5c, když byla permutace provedena pro skutečné skupiny vzorků (simulace 1), pozorovaná hodnota I (0,673) nevykazovala významný rozdíl (jednovýběrový t-test, P = 0,166), což naznačuje, že pozorovaná hodnota byla spolehlivá bez ohledu na rozdíl ve velikosti vzorku. Když byly obě skutečné skupiny smíchány a byly vybrány dvě náhodné skupiny skutečné velikosti (simulace 2) nebo dvě náhodné skupiny stejné velikosti (75) (simulace 3), rozdíl mezi pozorovanou hodnotou a permutacemi byl opět významný (jednovýběrový t-test, P = 1,9 × 10-75 pro simulaci 2 a P = 2,6 × 10-75 pro simulaci 3). Tyto výsledky naznačují, že dvě funkčně diferencované skupiny haplotypů AT5G44000 se adaptovaly na odlišná ekologická prostředí.

.

Napsat komentář