Burrows-Wheeler Aligner (BWA) er et effektivt program, der bringer relativt korte nukleotidsekvenser mod en lang referencesekvens såsom det humane genom.
Softwaren implementerer to algoritmer, BWA-kort og BWA-SW. De tidligere værker for forespørgsel sekvenser kortere end 200 bp og sidstnævnte for længere sekvenser op til omkring 100kbp.
Begge algoritmer gør gapped alignment. De er som regel mere præcise og hurtigere på forespørgsler med lave fejlprocenter. Se BWA manualsiden for flere oplysninger.
Er BWA tilpasse 454 læser?
& Nbsp; Ja og nej. Den BWA-SW del af BWA fungerer godt på 454 læser om 200 bp eller længere. Den opnår tilsvarende tilpasning nøjagtighed til SSAHA2 mens meget hurtigere. BWA-SW arbejder også for kortere læser, men følsomheden er lavere. Hertil kommer, at BWA-SW ikke støtte parret-end tilpasning.
Hvad er maksimal query sekvens længde på linie?
& Nbsp; Det anbefales kun at bruge BWA-kort på læser kortere end 200 bp. Selvom BWA-kort arbejder i op til et par kbp forespørgsel principielt dens ydeevne er forringet. For lange læser, BWA-SW er bedre.
& Nbsp; Den BWA-SW komponent kan justere en BAC-sekvens (ca. 150kbp) mod det humane genom. Hastigheden i form af på linie baser per tidsenhed kan sammenlignes med hastigheden af 1kbp read tilpasning. I princippet bør BWA-SW kunne tilpasse et par Mbp query sekvens på et tilsvarende hastighed, men jeg har ikke prøvet.
Hvad er tolerance over sekventeringsfejl?
& Nbsp; Bwa-kort er primært designet til sekventering fejlrater på under 2%. Selvom brugerne kan bede den om at tolerere flere fejl ved tuning kommandolinjeparametre, er dens ydeevne hurtigt nedbrydes. Bemærk, at for Illumina læser, kan BWA-kort mulighed for at trimme ringe kvalitet baser fra 3'-enden før tilpasning og dermed er i stand til at tilpasse flere læser med høj fejlprocent i halen, hvilket er typisk for Illumina data.
& Nbsp; BWA-SW tåler flere fejl givet længere tilpasning. Simulation tyder på, at BWA-SW kan fungere godt givet 2% fejl for en 100bp tilpasning, 3% fejl for en 200 bp, 5% for 500bp og 10% for justering 1000 bp eller længere.
Er BWA finde kimære læser?
& Nbsp; Ja, BWA-SW komponent er i stand til at finde kimære. BWA normalt rapporterer en justering for hver læst men kan udsende to eller flere linjeføringer, hvis læse / contig er en kimære.
Er BWA opkald SNPs ligesom MAQ?
& Nbsp; Nej, BWA kun gør tilpasning. Ikke desto mindre, det output linjeføringer i SAM-format, som understøttes af flere generiske SNP, der ringer, såsom samtools og GATK.
Jeg ser man læse i et par har høj kortlægning kvalitet, men den anden læsning har nul. Er det rigtigt?
& Nbsp; Det er korrekt. Kortlægning kvalitet er tildelt til individuel læsning, ikke for en læse par. Det er muligt, at man læse kan kortlægges entydigt, men dens makker falder i en tandom gentagelse og dermed dens nøjagtige position ikke kan bestemmes.
Jeg ser en læse skiller sig ud i slutningen af et kromosom, og er registreret som unmapped (flag 0x4). Hvad sker der her?
& Nbsp; Internt BWA sammenkæder alle reference- sekvenser i én lang sekvens. En læst kan kortlægges til krydset af to tilstødende referencesekvenserne. I dette tilfælde vil BWA flag læses som unmapped, men du vil se position, cigar og alle tags. En bedre løsning ville være at vælge en alternativ placering eller trimme tilpasningen ud til enden, men det er ganske kompliceret i programmering og er ikke implementeret i øjeblikket.
Er BWA arbejde referencesekvenserne længere end 4GB i alt?
& Nbsp; Nej, det er ikke muligt og vil ikke blive støttet i den nærmeste fremtid på grund af den tekniske kompleksitet involveret.
Errata strong>
Endelsen vifte interval på en tom streng bør [0, n-1], hvor n er længden af databasen streng, ikke [1, n-1] som er angivet i Li og Durbin (2009 og 2010). Tilsvarende skal vi definere O (a, -1) = 0 og revidere pseudokoden i figur 3 fra Li og Durbin (2009). BWA implementering er faktisk korrekt. Den fejl opstår kun på papiret. Vi beklager den forvirring og takke Nils Homer og Abel Antonio Carrion Collado for påpeget dette
Hvad er nyt i denne udgivelse:.
- Bugfix:. duplikeret alternative hits i XA tag
- Bugfix: ved trimning aktiveret, BWA-ALN trimmer 1BP mindre .
- Deaktiveret justeringen farve-plads. 0.6.x fungerer ikke med fast læser på nuværende tidspunkt.
- Bugfix:. Segmenteringsfejl grund af overdreven tvetydige baser
- Bugfix:. Forkert mate position i SE-tilstand
- Bugfix: sjælden segmenteringsfejl i PE-tilstand
- Når makro _NO_SSE2 er i brug, falde tilbage til standard Smith-Waterman
- i stedet for SSE2-SW.
- Eventuelt mark split hits med lavere alignment score som sekundær.
- Bugfix:. Uendelig løkke forårsaget af tvetydige baser
- Eventuelt output søgesekvensen.
Kommentarer ikke fundet