Gyakran Ismételt Kérdések: BLAT

Témák

  • BLAT vs. BLAST
  • A BLAT egyáltalán nem talál szekvenciát vagy nem minden elvárt egyezést
  • A BLAT vagy az In-Silico PCR több egyezést talál, mint például chr_alt vagy chr_fix, annak ellenére, hogy csak egyet várnak
  • BLAT használati korlátozások
  • BLAT forrás és dokumentáció letöltése
  • Web alapú BLAT paraméterek ismétlése parancsban-soros verzióban
  • A -ooc flag használata
  • A webalapú BLAT százalékos azonosság és pontszám számítások ismétlése
  • A webalapú BLAT “szerencsésnek érzem magam” keresési eredmények ismétlése
  • A BLAT használata rövid szekvenciákhoz maximális érzékenységgel
  • BLAT ALL genomok
  • BLAT ALL genomok: A webalapú BLAT eredmények közelítése gfServer/gfClient használatával
  • Standalone vagy gfServer/gfClient eredményeinek kezdőpozíciója eggyel eltér

Return to FAQ Table of Contents

BLAT vs. BLAST

Mi a különbség a BLAT és a BLAST között?

A BLAT egy olyan igazító eszköz, mint a BLAST, de más a felépítése. DNS-en a BLAT úgy működik, hogy egy teljes genom indexét tartja a memóriában. Így a BLAT céladatbázisa nem a GenBank szekvenciák halmaza, hanem a teljes genom összeállításából származó index. Alapértelmezés szerint az index az összes nem átfedő 11-merből áll, kivéve az ismétlődésekben erősen érintetteket, és kevesebb mint egy gigabájt RAM-ot használ. Ez a kisebb méret azt jelenti, hogy a BLAT sokkal könnyebben tükrözhető, mint a BLAST. A DNS BLAT-ot úgy tervezték, hogy gyorsan megtalálja a legalább 40 bázis hosszúságú, 95%-os vagy annál nagyobb hasonlóságú szekvenciákat. Eltévesztheti az eltérőbb vagy rövidebb szekvenciaillesztéseket. (Az önálló Blat alapértelmezett beállításai és várható viselkedése némileg eltér a BLAT grafikus változatának beállításaitól.)

A fehérjék esetében a BLAT 11 méteres helyett 4 méteres szekvenciákat használ, és a lekérdezéssel 80%-os vagy annál nagyobb hasonlóságú, 20+ aminosav hosszúságú fehérjeszekvenciákat talál. A fehérjeindex valamivel több mint 2 gigabájt RAM-ot igényel. A gyakorlatban — a szekvenciák evolúciós időbeli eltérési aránya miatt — a DNS BLAT jól működik az emberen és a főemlősökön belül, míg a fehérje BLAT továbbra is jó egyezéseket talál a földi gerinceseken és még korábbi szervezeteken belül a konzervált fehérjékre. Az emberen belül a protein Blat sokkal jobb képet ad a géncsaládokról (paralógokról), mint a DNS Blat. A BLAST és a psi-BLAST az NCBI-nél azonban sokkal távolabbi egyezéseket is talál.

A BLAT-nak gyakorlati szempontból több előnye is van a BLAST-tal szemben:

  • gyorsaság (nincs sorban állás, válasz másodpercekben) a kisebb homológia mélység árán
  • egyidejű lekérdezések hosszú listájának fasta formátumban történő benyújtásának lehetősége
  • öt kényelmes kimeneti rendezési lehetőség
  • közvetlen kapcsolat az UCSC böngészőjébe
  • . az illesztési blokkok részletei természetes genomi sorrendben
  • lehetőség az illesztés későbbi elindítására egy egyéni pálya részeként

ABLAT-ot általában arra használják, hogy megkeressék egy szekvencia helyét a genomban vagy meghatározzák egy mRNS exonszerkezetét, de a szakértő felhasználók nagy kötegelt feladatokat is futtathatnak, és belső paraméterérzékenységi változtatásokat végezhetnek a Blat parancssori telepítésével a saját Linux szerverükön.

A BLAT nem talál egy szekvenciát, vagy nem minden várt egyezés

Nem találok egy szekvenciát a BLAT-tal, bár biztos vagyok benne, hogy a genomban van. Valamit rosszul csinálok?

Először is ellenőrizze, hogy a genom megfelelő verzióját használja-e. Például a humán genomnak jelenleg két változata van széles körben használatban (hg19 és hg38), és lehet, hogy az Ön szekvenciája csak az egyikben található meg. Sok publikált cikk nem adja meg az assembly verziót, így lehet, hogy mindkettővel próbálkozni kell.

A cDNS-szekvenciában egy splice-helyen átmenő nagyon rövid szekvenciákat nem lehet megtalálni, mivel nem szerepelnek a genomban. A qPCR-primerek tipikus példák erre. Ezekben az esetekben próbálkozzon az In-Silico PCR használatával, és válasszon ki célpontként egy génkészletet. Általában az In-Silico PCR eszköz érzékenyebb, és a primerpárok esetében előnyben kell részesíteni.

Egy másik problémás eset az ismétlődésekben vagy transzpozonokban található szekvenciák keresése.A BLAT kihagyja a lekérdezés leginkább ismétlődő részeit, és korlátozza a talált találatok számát, ami az ilyen ismétlődő szekvenciák hiányzó találataihoz vezet.A BLAT online verziója elrejti a lekérdezésből az 1024-nél többször a genomban előforduló 11mert, és kromoszómaszálanként 16 találatra korlátozza az eredményeket. Ez azt jelenti, hogy kromoszómánként legfeljebb 32 helyet kapunk vissza. Ez a sebesség növelése érdekében történik, de kihagyott találatokat eredményezhet, ha ismétlődő szekvenciákat keresünk.

Gyakran előfordul, hogy ismétlődő szekvenciák esetén a többi találatot az önláncos nyomvonal segítségével találjuk meg, de csak akkor, ha a többi találat elég hosszú és specifikus. A “Short match” (rövid egyezés) sáv használatával ellenőrizheti, hogy egy adott helyen van-e szekvencia, ha a szekvencia hossza kevesebb, mint 30 bp.Ezt a minimális hosszkorlátozást megkerülheti, ha több flankáló szekvenciát ad hozzá a lekérdezéshez, hogy a lekérdezés elég egyedivé váljon. Ha ez nem lehetséges, az egyetlen alternatíva a BLAT futtatható fájljainak és egy genom .2bit fájljának letöltése a saját gépére, és a BLAT használata a parancssorban. További információért lásd: BLAT forrás és dokumentáció letöltése. Ha a BLAT parancssori verzióját használja, a repMatch opciót nagy értékre állíthatja, hogy megpróbálja javítani az ismétlődő régiókban az egyezések megtalálását, és ne használja az alapértelmezett 11.ooc repeat masking fájlok egyikét.

A BLAT vagy az In-Silico PCR több egyezést talál, mint például chr_alt vagy chr_fix, annak ellenére, hogy csak egy várható

Kettő vagy több egyezést látok a genomban, holott csak egynek kellene lennie. Mik ezek az extra egyezések?

Ez általában az újabb genom-összeállításoknál fordul elő, mint például a hg38, amikor olyan szekvenciát keresünk, amely “alternatív” vagy “fix” szekvenciával rendelkezik. Az ilyen assemblies minőségének javítása érdekében a kurátorok néhány fontos lókuszból, pl. az MHC régiókból, több változatot adtak hozzá. Fix szekvenciákat is hozzáadnak, hogy a hibákat a referencia megváltoztatása nélkül oldják meg. További információért lásd a patches blogbejegyzésünket.

Ha blat vagy isPCR egy olyan szekvenciát, amely megfelel egy olyan kromoszómahelynek, amely fix vagy alt szekvenciával is rendelkezik, akkor egy egyezést fog látni a referencia kromoszómán (pl. “chr1”) és egy másik egyezést a patch szekvencián (pl. chr1_KN196472v1_fix). A legtöbb esetben nyugodtan figyelmen kívül lehet hagyni a patch-találatot, mivel egy emberi genom nem tartalmazza egyszerre a referencia- és az alternatív szekvenciát. A patch-szekvenciák speciális fajtáiról további információt a témával kapcsolatos GYIK-bejegyzésünkben talál.

BLAT használati korlátozások

A Blat-szerverük figyelmeztetést küldött, amelyben arról tájékoztatnak, hogy túlléptem a szerverhasználati korlátozásokat. Tudna nekem tájékoztatást adni az UCSC Blat szerverhasználati paramétereiről?

A Blat szervereink nagy igénybevétele miatt korlátozzuk a szolgáltatást azon felhasználók számára, akik programozottan lekérdezik a BLAT eszközt vagy nagy kötegelt lekérdezéseket végeznek. A BLAT programvezérelt használata legfeljebb 15 másodpercenként egy találatra és naponta legfeljebb 5000 találatra korlátozódik. Kérjük, hogy a kötegelt lekérdezéseket legfeljebb 25 szekvenciára korlátozza.

A nagy mennyiségű BLAT igényt támasztó felhasználók számára javasoljuk a BLAT eszköz letöltését helyi használatra. További információért lásd: A BLAT forrás és dokumentáció letöltése.

A BLAT forrás és dokumentáció letöltése

A BLAT forrás letölthető? A dokumentáció elérhető?

A BLAT forrás és a futtatható fájlok szabadon hozzáférhetőek tudományos, nonprofit és személyes használatra. A kereskedelmi licencekkel kapcsolatos információk a Kent Informatics weboldalán találhatók.

A BLAT forrása letölthető http://hgdownload.soe.ucsc.edu/admin/ (a /kent/src/blat címen található a legfrissebb jksrci*.zip forrásfán belül). A BLAT futtatható fájlokat a http://hgdownload.soe.ucsc.edu/admin/exe/ menüpontban találja, és válassza ki a gép típusát.

A BLAT program specifikációiról szóló dokumentáció itt érhető el. Vegye figyelembe, hogy a parancssori BLAT nem ad vissza egyezéseket a lekérdezési szekvencia U nukleotidjaira.

A webes Blat paramétereinek másolása a parancssori változatban

Egy saját Blat szervert állítok fel, és ugyanazokat a paraméterértékeket szeretném használni, amelyeket az UCSC webes Blat szervere használ.

A hgBLAT/gfServer és az önálló, parancssori Blat között szinte mindig kis különbségekre számítunk. A legjobb egyezéseket a pslReps és pslCDnaFilter segédprogramok segítségével találhatjuk meg. A webes Blatot megengedő módon, legalább 20-as cut-off pontszámmal hangoltuk, ami a legtöbb illesztést megjeleníti. Javasoljuk annak eldöntését, hogy az adott kísérlet vagy elemzés szempontjából melyik szűrési paramétereknek van a legtöbb értelme. Gyakran ezek a beállítások eltérőek és szigorúbbak lesznek, mint a webalapú Blat beállításai. Ezt szem előtt tartva, használja a következő beállításokat, hogy megközelítse a webes Blat keresési eredményeit:

Megjegyzés: Vannak esetek, amikor a gfServer/gfClient megközelítés jobban megközelíti a webes eredményeket, mint az önálló Blat. A folyamat áttekintéséhez lásd az alábbi példát.

standalone Blat:

  • Blat keresés:
    blat -stepSize=5 -repMatch=2253 -minScore=20 -minIdentity=0 database.2bit query.fa output.psl
  • Megjegyzés: A webes eredmények reprodukálásához a PSL kimenetet kell használni. A BLAT az alternatív kimeneti formátumokat (pl. blast8) kissé eltérően kezeli, és ez kisebb eltéréseket eredményezhet az eredményekben; különösen rövid igazítások esetén. Továbbá a lekérdezési szekvencia minden U nukleotidját T nukleotiddá kell konvertálni, vagy a “-q=rna” flag-et kell használni a web-BLAT-nak való megfeleléshez.

faToTwoBit:

  • Lágy maszkolást használ a Fasta formátum 2 bites formátumra való konvertálásához a BLAT bemenethez.

gfServer (így vannak beállítva az UCSC webes BLAT szerverei):

  • BLAT szerver (PCR-re képes):
    gfServer start blatMachine portX -stepSize=5 -log=untrans.log database.2bit
  • lefordított BLAT szerver:
    gfServer start blatMachine portY -trans -mask -log=trans.log database.2bit

A DNS/DNS és DNS/RNS egyezések engedélyezéséhez csak a host, port és twoBit fájlokra van szükség. Ugyanazt a portot használja a lefordítatlan Blat (gfClient) és a PCR (webPcr) is. A lefordított Blat (fehérje-keresések vagy lefordított keresések a fehérjetérben) engedélyezéséhez külön Blat-kiszolgálóra lesz szükség külön porton.

gfClient:

  • Set -minScore=0 és -minIdentity=0. Ez néhány alacsony pontszámú, általában hamis találatot eredményez, de az interaktív használathoz elég könnyű figyelmen kívül hagyni őket (mivel az eredmények pontszám szerint vannak rendezve), és néha az alacsony pontszámú találatok jól jönnek.

Jegyzetek a repMatch-ről:

  • A gfServer dna találatok alapértelmezett beállítása: repMatch = 1024 * (tileSize/stepSize).
  • A Blat dna találatok alapértelmezett beállítása: repMatch = 1024 (ha tileSize=11).
  • A webalapú eredményekkel egyenértékű parancssori eredmények eléréséhez a repMatch értéket meg kell adni a BLAT használatakor.

A webalapú Blat által megjelenített pontszám és százalékos azonossági egyezések megismétlésére vonatkozó további információkért lásd ezt a BLAT GYIK-et.

A BLAT, a gfServer és a gfClient számára elérhető paraméterekkel kapcsolatos további információkért lásd a BLAT specifikációit.

A -ooc flag használata

Mire szolgál a -ooc flag?

A BLAT bármely -ooc opciójának használata, például a -ooc=11.ooc, felgyorsítja az ismétlődő maszkoló szekvenciához hasonló kereséseket. A 11.ooc fájl a genomszekvenciában túlreprezentáltnak ítélt szekvenciákat tartalmazza. A keresési sebesség javítása érdekében ezeket a szekvenciákat nem használjuk fel a genomhoz való igazítás során. Ésszerű méretű szekvenciák esetén ez nem okoz problémát, és jelentősen csökkenti a feldolgozási időt.

A 11.ooc fájl használatának mellőzésével az igazítási idő megnő, de az érzékenység is kissé nő. Ez akkor lehet fontos, ha rövidebb szekvenciákat vagy rossz minőségű szekvenciákat igazítunk. Például, ha egy adott szekvencia elsősorban a 11.ooc fájlban található szekvenciákból áll, akkor a -ooc jelző használata esetén soha nem lesz megfelelően beültetve az igazításhoz.

Összefoglalva, ha nem talál bizonyos szekvenciákat, és megengedheti magának a többlet feldolgozási időt, érdemes a BLAT-ot a 11.ooc fájl nélkül futtatni, ha az adott helyzet indokolja a használatát.

A webalapú Blat százalékos azonosság- és pontszám-számításainak megismétlése

A saját parancssori Blat-kiszolgálóm használatával hogyan tudom megismételni a webalapú Blat által előállított százalékos azonosság- és pontszám-számításokat?

A parancssori Blatnak nincs olyan opciója, amely megadja a százalékos azonosságot és a pontszámot. Létrehoztunk azonban olyan szkripteket, amelyek tartalmazzák a számításokat:

  • Tekintse meg a perl-szkriptet a forrásfából: pslScore.pl
  • A megfelelő C program megtekintése: pslScore.c és a kapcsolódó pslScore és pslCalcMilliBad könyvtári függvényeket a psl.c

forráskód licencelésével és letöltésével kapcsolatos információkért lásd a forráskód beszerzésével kapcsolatos GYIK-ünket.

A webes Blat “Szerencsésnek érzem magam” keresési eredményeinek megismétlése

Hogyan generálhatom ugyanazokat a keresési eredményeket, mint a webes Blat “Szerencsésnek érzem magam” opciója a parancssori Blat használatával?

A “Szerencsésnek érzem magam” Blat keresés kódja a lekérdezési oldalon kiválasztott rendezési kimeneti opció alapján rendezi az eredményeket. Ezután az első lekérdezett szekvencia legmagasabb pontszámú igazítását adja vissza.

Ha az eredményeket a “query, start” vagy a “chrom, start” szerint rendezi, az “I’m feeling lucky” eredmény előállítása egyszerű: rendezze a kimeneti fájlt ezen oszlopok szerint, majdválassza ki a legfelső eredményt.

A pontszámot tartalmazó rendezési lehetőségek bármelyikének megismétléséhez először ki kell számolnia a pontszámot minden egyes eredményhez a PSL kimeneti fájlban, majd az eredményeket pontszám vagy más kombináció (pl. “query, score” és “chrom, score”) szerint kell rendezni. A pontszám kiszámításával kapcsolatos információkért lásd a Web-alapú Blat százalékos identitás- és pontszám-számítások replikálása című részt.

Alternatívaként megpróbálhatja szűrni a Blat PSL kimenetét a Genome Browser forráskódjában elérhetőpslReps vagy pslCDnaFilter programmal. A forráskód beszerzésével kapcsolatos információkért lásd a forráskód licencelésével és letöltésével kapcsolatos GYIK-et.

A BLAT használata rövid szekvenciákhoz maximális érzékenységgel

Hogyan konfiguráljam a BLAT-ot rövid szekvenciákhoz maximális érzékenységgel?

Itt van néhány iránymutatás az önálló Blat és a gfServer/gfClient konfigurálásához ezekre a feltételekre:

  • A legrövidebb lekérdezési méret megtalálásának képlete, amely garantálja a találatot (ha az egyező csempék nincsenek túlhasználtként megjelölve) a következő: Például, ha a stepSize 5-re és a tileSize 11-re van beállítva, akkor a 2 * 5 + 11 – 1 = 20 bp méretű lekérdezés találatokat fog találni, ha a lekérdezés pontosan megfelel a célnak.
    A stepSize paraméter 1 és tileSize között változhat.
    A tileSize paraméter 6 és 15 között változhat. Fehérje esetén a tartomány lejjebb kezdődik.
    MinMatch=1 esetén (pl., fehérje), a minimális garantált találat hossza: 1 * stepSize + tileSize – 1
    Megjegyzés: Van egy “minimális szerencsés méret” is a találatokhoz. Ez a lehető legkisebb találat, amelyet a BLAT találni tud. Ez a minimális szerencsés méret a következő képlettel számítható ki: stepSize + tileSize. Ha például 11 tileSize-t és 5 stepSize-t használunk, akkor a 16 bázisnál kisebb találatokat nem fogjuk jelenteni.
  • Próbálja ki a -fine használatát.
  • Használjon nagy értéket a repMatch számára (pl. -repMatch = 1000000), hogy csökkentse annak esélyét, hogy egy csempe túlhasználtnak legyen jelölve.
  • Ne használjon .ooc fájlt.
  • Ne használjon -fastMap.
  • Ne használjon maszkoló parancssori opciókat.

A fenti változtatások érzékenyebbé teszik a BLAT-ot, de lassítják a sebességet és növelik a memóriahasználatot. Szükség lehet arra, hogy egyszerre egy kromoszómát dolgozzunk fel a memóriaigény csökkentése érdekében.

Egy megjegyzés a kimenet szűrésével kapcsolatban: a -minScore paraméter értékének a lekérdezés méretének felénél nagyobbra emelése nincs további hatással. Ezért a Genome Browser forráskódjában elérhető pslReps vagy pslCDnaFilter programot használja a kívánt méret, pontszám, lefedettség vagy minőség szűrésére. A forráskód beszerzésével kapcsolatos információkért lásd a forráskód licenceléséről és letöltéséről szóló GYIK-ünket.

Blat ALL genomes

Hogyan blat lekérdezéseket az összes organizmus alapértelmezett genom-összeállításaira?

ABLAT-ot úgy tervezték, hogy gyorsan megtalálja a szekvencia hasonlóságot a lekérdezett és a célszekvenciák között. Általában a BLAT-ot egyetlen célgenomban lévő szekvencia-homológia helyeinek megtalálására vagy egy mRNS exonszerkezetének meghatározására használják. A BLAT azt is lehetővé teszi a felhasználók számára, hogy összehasonlítsák a lekérdezett szekvenciát a UCSC Genome Browserben található organizmusok összes alapértelmezett összeállításával. A Search ALL funkció hasznos lehet, ha egy nem egyértelmű lekérdezési szekvenciával rendelkezik, és megpróbálja meghatározni, hogy melyik szervezethez tartozhat.

A Genom legördülő lista feletti “Search ALL” jelölőnégyzet kiválasztása lehetővé teszi, hogy az összes szervezetünk alapértelmezett összeállításának genomjaiban keressen. Emellett minden csatolt csomópont Blat szerverén is kereshet, ami azt jelenti, hogy a felhasználó által létrehozott összeszerelési csomópontokban is kereshet. A találati oldalon megjelenik az összes organizmusunk rendezett listája és homológiájuk a lekérdezett szekvenciával. Az eredmények úgy vannak rendezve, hogy a legjobb illesztési pontszámmal rendelkező organizmus áll a lista tetején, jelezve, hogy az adott organizmus mely régió(i)nak van a legnagyobb homológiája a lekérdezett szekvenciával.A teljes illesztésnek, beleértve a hibás illesztéseket és hézagokat is, legalább 20 pontot kell elérnie ahhoz, hogy megjelenjen a Blat kimenetén. Az Assembly listában található linkre kattintva egy új oldalra jut, amely a szekvencia-homológia különböző helyeit és pontszámait jeleníti meg a kívánt assemblyben.

Blat ALL genom: Nincs találat

A Blat ALL eredményei találatokat tartalmazó összeállításokat jelenítenek meg, de azokra kattintva nem találatokat jelez

A Blat ALL eredményoldalán a “Találatok” oszlop nem igazításokat, hanem csempe találatokat jelez. A csempe találatok a célpontban talált 11 bázisú kmer egyezések, amelyek nem feltétlenül jelentenek sikeres igazításokat. Amikor az “Assembly” linkre kattintunk, az adott genom teljes Blat-illesztése következik be, és a 20 bp-nál kisebb eredményt jelentő illesztési pontszámok nem talált találatként jelennek meg.

Amikor egy szekvenciát elküldünk a Blat ALL segédprogramnak, a szekvencia összehasonlításra kerül a szerveren lévő indexszel. Az indexet a célgenomból építettük fel, 11bp alapértelmezett stepSize értékkel. ezek a 11-merek a következőképpen “csempézik” a szekvenciát:

TGGACAACATG GCAAGAATCAG TCTCTACAGAA

Az index felépítése után az igazítás első lépése a lekérdezési (keresési) szekvencia beolvasása, az összes 11-mer kivonása, és ezek keresése az éppen a memóriában lévő genomi 11-mer indexben. Az ott talált egyezések jelentik a kezdeti “találatokat”, amelyeket a Blat ALL eredményoldalán lát. A következő lépés az, hogy megkeressük azokat a találatokat, amelyek átfedik egymást vagy bizonyos távolságon belülre esnek egymástól, és megkíséreljük a szekvenciák összehangolását a találati helyek között a célban és a lekérdezésben.

Ha például két 11 bázisú csempe találat tökéletesen illeszkedik, az 22-es pontszámot eredményez. Ez meghaladja a minimálisan szükséges 20-as pontszámot (lásd Blat ALL genomes), és igazításként kerülne jelentésre. Vannak azonban büntetések a hézagok és a hibás illeszkedések, valamint az esetleges átfedések miatt (lásd a BLAT specifikációjában a lépésméretet), amelyek mind 20 alá csökkenthetik a pontszámot. Ebben az esetben a Blat ALL 2 “találatot” jelentene, de az összeszerelésre kattintva nem lenne találat. Ez leggyakrabban akkor fordul elő, ha a Blat ALL csak néhány (1-3) találatot jelentett.

A webalapú Blat-eredmények közelítése a gfServer/gfClient használatával

A gfServer/gfClient használata gyakran jobb közelítést vagy akár replikációt biztosít a webalapú Blat-eredményekhez, amelyeket egyébként az önálló Blat használatával nem lehet megtalálni. Ez a megközelítésutánozza a Genome Browser webalapú Blat által használt blat szervert. A következő példa azt mutatja be, hogyan kell beállítani egy hg19 gfServer-t, majd egy lekérdezést végrehajtani. Először töltse le az operációs rendszernek megfelelő segédprogramot, és adjon neki futtatási engedélyeket:

#For linuxrsync -a rsync://hgdownload.soe.ucsc.edu/genome/admin/exe/linux.x86_64/blat/ ./#For MacOSrsync -a rsync://hgdownload.soe.ucsc.edu/genome/admin/exe/macOSX.x86_64/blat/ ./chmod +x gfServer gfClient blat

Majd töltse le a megfelelő .2bit genomot (ebben a példában a hg19-et), és futtassa a gfServerprogramot a webes Blat paramétereivel, megadva a helyi gépet és az 1234-es portot:

wget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.2bit./gfServer start 127.0.0.1 1234 -stepSize=5 hg19.2bit

Néhány pillanat múlva a gfServer inicializálódik, és készen áll a lekérdezések fogadására. A webes Blat közelítéséhez a gfClientet fogjuk használni a következő paraméterekkel, a bemeneti és kimeneti fájlokat kijelölve:

./gfClient -minScore=20 -minIdentity=0 127.0.0.1 1234 . input.fa out.psl

A out.psl kimeneti fájlnak a webes Blathoz nagyon hasonló eredményeket kell adnia.

A standalone vagy gfServer/gfClient eredmények kezdőpozíciója eggyel eltér

A standalone Blat eredményeim vagy a gfServer/gfClient Blat eredmények kezdőpozíciója eggyel kevesebb, mint amit a webes Blat eredményeken látok

Ez annak köszönhető, hogy a Genome Browserben hogyan tároljuk a belső koordinátákat. Az alapértelmezettBlat Output típusú hiperlink a belső koordináta adatszerkezetünkben mutatja az eredményeket. Ezeknek a belső koordinátáknak nulla alapú kezdete és egy alapú vége van. További információért lásd a következő GYIK bejegyzést.

Ha a Kimenet típusát psl-re változtatjuk a webBlaton, akkor a nulla alapú, félig nyitott koordináták eredményei ugyanúgy megjelennek, mint az önálló Blat és a gfServer/gfClient eljárásokban.

Szólj hozzá!