NCBI C ++ Toolkit tilbyder gratis, bærbare, offentlige domæne biblioteker uden begrænsninger bruge. Det virker på Unix, MS Windows og Mac OS-platforme:
ย ท Netværk og kommunikationssystem (IPC) bibliotek med iostream adaptere
ย ท multithreading Bibliotek
ย ท CGI og Fast-CGI bibliotek
ย ท HTML Generation Bibliotek
ย ท SQL Database Access Bibliotek
ย ท C ++ wrapper bibliotek til BerkeleyDB
ย ท C ++ iostream Adaptor / Wrapper Bibliotek
ย ท GZIP og BZ2 C ++ Wrapper Bibliotek med iostream adaptere
ย ท ASN.1 og XML serialisering bibliotek med C ++ Code Generator Tool (datatool)
ย ท Dato og tid Bibliotek
ย ท File System Funktionsbibliotek
ย ท Kommando-linje Argument, konfiguration og miljø Processing Library
ย ท Sequence justeringsalgoritmer Library
ย ท BLAST Engine Bibliotek
ย ท Biologisk Sekvenser kan hentes og behandles Bibliotek
ย ท Bærbar FLTK og OpenGL baseret GUI og grafiske biblioteker
Udover ovenstående, er der en hel masse mere brugbare biblioteker, både generelle formål og biotek-relaterede, der konstant udvikles, vedligeholdes og anvendes i det virkelige liv produktion af hundredvis af web og selvstændige programmer og deres programmører (også tælles i hundreder).
Hvis du er en C ++ udvikler vil du finde den bærbare karakter bibliotekerne meget nyttige i opbygningen cross-platform applikationer, selvom du ikke har meget interesse i bioinformatik. Biblioteker som dem for CGI / spol CGI, HTML, Netværk, SQL Database Access, ASN.1 og XML serialisering er helt generelle formål og kan bruges i en lang række applikationer uden for Bioinformatik problemområdet.
C ++ Toolkit gennemgår aktiv udvikling med bibliotekerne bliver bygget hver aften. Kildekoden er frit tilgængelig via FTP og CVS. Dokumentationen for C ++ Toolkit er tilgængelig online på NCBI Bookshelf format og også bog som kan downloades i Acrobat er PDF-format
Hvad er nyt i denne udgivelse:.
< p>- HØJDEPUNKTER:
- Tilføjet LDS2 (Local Data Storage v.2), som er baseret på sqlite3, har nye funktioner og bedre ydelse. Også implementeret LDS2 data loader til at bruge LDS2 fra Object Manager.
- XmlWrapp-dette praktisk XML håndtering API har været det meste færdig (og endda poleret).
- Gennemført tunneling og godkendelse af HTTP-forbindelser og tunneling af Secure Sockets via HTTP proxies.
- CFormatGuess nu tillader at skelne mellem GTF, GFF3 og GFF2. Det er en muligvis bryde forandring. For flere detaljer se nedenfor.
- Gennemførte store dele af CFeatTree, klassen til at organisere funktioner defineret på en biologisk sekvens i et hierarki, der afspejler deres forældre-barn relationer (baseret på funktionen undertyper).
- CORELIB:
- Gennemført locale-uafhængig konvertering af strengen at fordoble og tilbage; ændrede centrale biblioteker til at bruge det.
- NSTR :: Begrund () - til formatering af stykker i tekst .
- CNcbiApplication - gøre FindProgramExecutablePath statisk, og mere robust; tilføje en statisk højere niveau GetAppName metode. Kig efter de globale konfigurationsfiler i flere tilfælde.
- CMetaRegistry :: FindRegistry -. Ny metode udsætte logik at bestemme, hvilken fil (hvis nogen) til at indlæse
- CEnvironmentCleaner -. Ny klasse til at skille sig uønsket miljøvariabler
- CFileIO - tilbage til original adfærd:. Ikke lukke filen håndtaget, hvis det er tildelt via SetFileHandle ()
- SERIAL:
- serialisering af AnyContent dataobjekter - fast at genkende og korrekt proces attributter i deres værdier .
- Korrigeret læsning af XML-data til at tildele et element standard værdi, når den har intet indhold.
- Tilføjet understøttelse af sekvenser af elementer, hvor elementet har en standardværdi.
- DATATOOL:
- Korrigeret kodegenerering af:
- CHOICE dataobjekter;
- binære datatyper med attributter.
- Korrigeret konvertering af dobbelt typen værdier for at bevare mere betydende cifre.
- CONNECT:
- Tilføjet KeepAlive socket option (fSOCK_KeepAlive).
- Tilføjet NCBI forbindelsestesten (CConnTest).
- Hjælpeprogrammer:
- g_FindDataFile -. Ny funktion til lokalisering datafiler i (konfigurerbare) standard placeringer
- CChecksumStreamWriter -. Ny klasse til at beregne checksum af data skrevet til en strøm
- g_GZip_ScanForChunks () - ny API, at forespørge komprimerede stream positioner. Tilføjet implementering for at få positioner i separate gzip-filer i sammenkædede gzip-fil.
- Tilføjet kompression / dekompression stream manipulatorer (inkluderer / util / komprimere / stream_util.hpp).
- CFormatGuess (util / format_guess. {H / c} pp) opdateret, med en muligvis bryde forandring. Formålet med dette er at tillade CFormatGuess at skelne mellem GTF, GFF3 og GFF2. I øjeblikket er det klumper alle disse formater i en en "eGtf 'værdi. Den gamle 'eGtf' værdi (3) er ved at blive erstattet med »eGtf_POISONED", og vil ikke blive returneret igen. Den nye værdi for "eGtf« (21), vil betyde en fil, der skal læses med CGtfReader (objtools / læsere / gtf_reader.hpp). Den nye værdi "eGff3« (22) er efter filer beregnet til at blive læst med CGff3Reader (objtools / læsere / gff3_reader.hpp), og »eGff2« (24) er efter filer beregnet til at blive læst med CGff2Reader (inkluderer / objtools / læsere /gff2_reader.hpp)
- BIO-objekter:
- CBioseq :: GetNonLocalId - Ny metode til at hjælpe sted sekvenser importeret fra FASTA filer med range specifikationer i mere sammenhæng; indpakket CBioseq_Handle :: GetNonLocalIdOrNull (ligeledes nyt).
- CSeq_id :: IdentifyAccession - Gennemføre eller forbedre anerkendelse for flere præfikser (GA, HH, HI, HO-HU, JA-JO, EAAA-EZZZ, og IAA-IZZ, hvoraf nogle svarer til den nye mulighed for DDBJ TPA WGS data) og mixed-i TPA protein tiltrædelser (hovedsagelig fra EMBL, men nogle fra GenBank også).
- Skelne WGS master-tiltrædelser af en ny flag bit. Slap af over-streng FBF anerkendelse logik.
- CSeq_id :: IsValidLocalID, CSeq_id :: ParseIDs -. Ny funktionalitet til at arbejde med almindelig tekst sekvens identifikatorer, indregnes ud af CFastaReader og generaliseret noget
- SSeqIdRange - Ny type (komplet med parser og on-the-fly & quot; iterator & quot;) til arbejde med Seq-id intervaller, som er til stede i nogle FASTA defline source modifikatorer .
- BIO-TOOLS:
- CFastaOstream - Eventuelt acceptere brugerdefinerede titler til enlige sekvenser. Tag negativ-strengede intervaller med førende 'C'er.
- CFastaReader - Støtte negativ-strengede intervaller og Paillet kompakte defline stil hul syntaks (?? & Quot; & gt; N & quot; hvor N er et nummer, eller & quot; & gt; unk100 & quot;)
- COBALT:
- Tilføjet kommando-line option -num_domain_hits, der begrænser antallet af konserverede domæner pr sekvens anvendes til beregning alignment begrænsninger.
- Fylogenetiske træer:
- Tilføjet højere niveau interface til beregning fylogenetisk træ fra sekvensalignments (fx BLAST og kobolt resultater). Klasse CPhyTreeCalc beregner fylogenetisk træ, og CPhyTreeFormater udskriver træet i Newick og Nexus format.
- BIO-objektbiblioteker:
- Gennemførte CheckNumRows () og andre metoder til sparsomme alignments.
- For at reducere hukommelsesforbrug: tilføjet læst-kroge til at reducere hukommelse, der bruges af linjeføringer efter deserialization; Na-streng nu bruger en byte hukommelse hvor det er muligt; Score.value valg er nu indlejret i CScore.
- Udnyt tiltrædelse i CSeq_id :: GetLabel ().
- BIO-OBJECT MANAGER:
- Tilføjet getter metoder til boolean felter i CTableFieldHandle.
- Tilføjet GetBestGeneForFeat () baseret på CFeatTree.
- Gennemført GetBestOverlappingFeat () på CFeatTree.
- Tilføjet hurtigt cscope :: GetTaxid ().
- Gennemført bulk-lastning for acc / ver, gi, label, og taxid.
- Tilføjet huller nul-længde kontrollere, CSeqMap og CSeqVector.
- Gennemført GetLength () og GetCoverage () for obligations- placeringer.
- Forbedringer:
- Tilføjet hjælper metode til at fylde CFeatTree på stedet.
- drønede op kortlægning af simple CSeq_loc_mix steder i CFeat_CI.
- Skærpet sortering af funktioner i CFeat_CI at undgå uklarheder.
- CSeq_feat_Handle getters nu arbejder med Seq-bord funktioner også.
- Seq-table funktioner understøtter nu flere niveauer brugerfelter.
- Non Seq-feat Seq-tabeller er nu anerkendt, selvom beliggende i Split luns.
- drønede op CBioseq_Handle :: AddId ().
- Optimeret cscope :: AttachXxx ().
- Support split af navngivne anmærkning.
- CSeqVector og CSeqVector_CI s CanGetRange () nu return false stedet for at smide en undtagelse.
- Tillad at angive, hvordan til at håndtere eksisterende håndtag i ResetHistory ().
- Optimeret re-forældre, hvis der tilføjet flere funktioner til CFeatTree.
- Tilføjet mulighed for at fejlsøge cscope oprettelse / sletning.
- Mange ændringer i C ++ oprydning funktionalitet at efterligne oprydning funktionalitet, som allerede findes i C. Der er stadig mere arbejde at gøre med BasicCleanup, men der er gjort betydelige fremskridt. Lidt arbejde er blevet gjort for ExtendedCleanup som af endnu.
- CSeq_loc_Mapper kan nu initialiseres med en GC-forsamling.
- Fejlrettelser:
- Fast kortlægning af mix steder på minus streng i CFeat_CI.
- Mange rettelser i den måde CFeatTree links funktioner.
- Flere tråd-sikkerhedsmæssige rettelser.
- Fast typo forhindrer tilføje flugter og grafer til CSeq_annot_EditHandle.
- værn mod undtagelser, når sortering funktioner i CFeat_CI.
- GENBANK DATA LOADER:
- Registreret HPRD eksterne anmærkninger.
- Tilføjet valgfri exclude_wgs_master param i pubseqos / pubseqos2 læsere.
- Gennemført bulk-lastning for acc / ver, gi, label, og taxid.
- Tilføjet CGBDataLoader :: CloseCache ().
- Forbedring:
- Brug isætning anmodninger i cscope :: GetBioseqHandles ().
- Separate læser Statistikkerne efter lastede klatter.
- Tilføjet tidsstempel til GenBank debug beskeder.
- Brug IConnValidator til åbning PubSeqOS forbindelser.
- Tilføjet split-version luns anmodninger og luns undernøgler i GenBank cache at undgå at bruge forkerte bidder når blob split tilstand ændres i ID.
- Tilføjet sekundære mindre forvirrende param navne for åben timeout.
- Du må ikke formere prøve igen optælling af antallet af forbindelser.
- Objekt MANAGER Test og demoapplikationer:
- id2_fetch_simple -. Tilføjet -ID muligheder for vilkårlige Seq-id'er
- test_bulkinfo -. Ny test ansøgning
- FASTA:
- C ++ funktion tabel funktionalitet er blevet gjort mere funktionel som en del af BankIt projektet.
- asn2flat nytte
- Kæmpe række ændringer Fladfil formateringsplugin at bringe den meget tættere på at frigive klar tilstand (muligvis frigive klar på dette punkt, selv om nogle relativt mindre problemer tilbage).
- XMLWRAPP:
- Fast segmentering fejl i tilfælde af at tage en henvisning til XPath udtryk kører resultater.
- Tilføjet hjælpere at få offentlig ID, systemet id og DTD navn for eksterne og interne delmængder.
- Tilføjet metoder til opslag node attributter.
- Fast udførelse af XPath udtryk:. Det nu starter fra given knude
- Fast søge attributter (herunder standard), når et namespace til rådighed.
- Tilføjet mulighed for at køre XPath udtryk uden behov for at registrere navnerum eksplicit.
- Tilføjet evne til at levere containere til opsamling af fejl og advarsler ved fortolkning dokumenter.
- Tilføjet evne til at modificere værdier og namespaces for node standardindstillinger attributter.
- Tilføjet mulighed for at teste, om en attribut er standard.
- Tilføjet mulighed for at indsætte eller fjerne attributter under hensyn til deres navnerum.
- Tilføjet mulighed for at fratage XML erklæring, når et dokument gemmes.
- WindowMasker:
- Tilføjet en ny input format, & quot; seqids & quot ;; med dette input format, indgangen er en fil, der indeholder en sekvens id på hver linje, og algoritmen bruger Bio-Object Manager til at se op sekvenserne.
- Tilføjet en ny klasse CWinMaskConfig, til opbevaring af alle de WindowMasker konfigurationsparametre. Klassen kan bruges til at tilføje de nødvendige kommandolinjeargumenter til CArgDescriptions, og derefter få de konfigurationsparametre fra kommandolinje-argumenter.
- BUILD RAMMER (UNIX):
- Fortolk kommandolinje-specifikationer APP_PROJ eller LIB_PROJ som cue at rydde ud andre * _PROJ indstillingerne ikke også leveres der. (Kræver GNU Make;. Bygger med Sun gøre fortsat arbejde som før)
- Supply flere mål i undermapper:. * _F (Ved hjælp af lokale flade makefiler produceret på efterspørgslen, ignorerer afhængighed af andre dele af træet), * _fd (indpakning øverste niveau Makefile.flat), clean_sources og purge_sources
- Indstil, og dens bekvemmelighed scripts (compilere / unix / * sh.):
- Bemærkelsesværdige nye flag, uden hold-3psw -. Ikke at bruge med nogen 3.-parts software
- Tilføjet en check på GLEW.
- Forbedret kontrol af Boost og OpenGL.
- Support angivelse run stier på Darwin (Mac) systemer med moderne toolchains.
- BLAST:
- Til Darwin (Mac OS X), bygge kun til Intel-processorer, selv i ellers universel bygger på grund af en PowerPC toolchain begrænsning.
- Tilføjet support for at hente NCBI Taxonomy ID'er for hvilke WindowMasker support er tilgængelig.
- Tillad specifikationen af en forespørgsel sekvens sammen med flere sekvensalignment fil i psiblast.
- Tilføjet database hårdt maskering support.
- Tilføjet database soft-maskering for oversatte søgninger.
- Tilføjet understøttelse af btop (BLAST tilbagesporingstabel operationer) og forespørgsel og emne længde i tabelform rapport.
- Kommando-line applikationer - tillade psiblast at søge flere forespørgsler, tilføjede valgfri -input_type for makeblastdb
- Tillad brug af bedste hit og XML i blast2sequences mode.
- Forbedret formatering ydeevne til fjernransagninger.
- makembindex kan nu opbygge maskerede MegaBLAST indeks direkte fra en BLAST nucleotid database ved hjælp af maskering lagret i BLAST database. Dette opnås ved ny kommandolinje option -db_mask at makembindex. Muligheden accepterer heltal id filtrering algoritme understøttes af BLAST database. Den mulighed kan kun anvendes i forbindelse med -iformat blastdb.
- For at hjælpe en bruger med at finde ud af de numeriske id'er for filtrering algoritmer, der understøttes af en BLAST-database, er de flag -show_filters indført. Anvendelse af flag med -iformat blastdb og BLAST database som input får makembindex til output en liste over tilgængelige filtrering algoritmer og afslutte.
- Programmer NetCache:
- NetCache er omarbejdet til at omfatte følgende funktioner:
- bedre styring af diskplads
- lock-mindre arbejde med klatter, der versionering i stedet
- multi-port lytte og pr-klient indstillinger differentiering.
- NetCache og ICache API'er:
- Brug Uint8 overalt for blob størrelse.
- Tillad delvis blob hentning.
- Indført beskyttelse blob password; tomme adgangskoder behandles som ingen adgangskode.
- Worker node API'er:
- Ny parameter for terminering arbejdstageren node, hvis dens hukommelsesforbrug overskrider den angivne grænse (parameter & quot; total_memory_limit & quot;) .
- Ny parameter for terminering arbejdstageren node, hvis dens køretid overstiger den angivne grænse (parameter & quot; total_time_limit & quot;) .
- GRID ANVENDELSE:
- netscheduled
- Rettet en fejl, der forårsagede noget svar på køen sletning kommando.
- remote_app
- Ny konfiguration parameter (& quot; tmp_dir & quot;). At styre, hvordan midlertidige mappe navn genereres - at reducere dens længde
- Log blob skrive fejl.
- netcache_control
- Tillad delvis blob hentning.
- Ny kommando -Fjern at slette klatter af deres id'er.
- Ny parameter -auth at angive strengen godkendelse til at bruge.
- Nye kommandoer -reconf og -reinit til brug NetCache administratorer.
- netschedule_control
- Aktiveret kompatibilitetstilstand at gøre netschedule_control arbejde med ældre arbejdstager noder.
- cgi2rcgi.cgi
- Opret ikke et tomt NetCache klat som pladsholder for de fremskridt besked.
- Log Grid fejl, der rapporteres til brugeren.
- Tillad mellemrum i jobbet ID parameter.
- Support output af de oplysninger, jobstatus i JSON format.
- Tillad brugerdefinerede HTML-skabeloner, der skal defineres for netfejl og andre arrangementer.
- tilføjet nogen-cache HTTP-headers for at undgå caching af mellemresultater.
- ncfetch.cgi
- Ny parameter for at få adgang kodeordsbeskyttede klatter.
- Fortolke ekstra parameter & quot; filnavn & quot; som et filnavn til den downloadede fil.
.
Hvad er nyt i version Dec 31, 2008:
- Denne udgivelse tilføjer en metode til at beregne kolonne-specifikke pseudocounts i PSI-BLAST.
- Det refactors den netydelser bibliotek.
- Det tilføjer unit test rammer og fejl logning for alle File API klasser.
- Det løser pthread support på IRIX. Det øger støtte til XML serialisering.
- Den fastsætter støtte til Sybase.
- Det tilføjer understøttelse af mindre opslagstabeller for små forespørgsler.
- Det tilføjer en API til at hente GenBank frontlæsser statistikker.
- Det har forskellige andre forbedringer, speedups og fejlrettelser.
Kommentarer ikke fundet