NCBI C ++ Toolkit gir gratis bærbare offentlig tilgjengelige biblioteker med ingen restriksjoner bruke. Det fungerer på Unix, MS Windows og Mac OS plattformer:
ย ท Nettverk og kommunikasjon mellom prosesser (IPC) bibliotek med iostream adaptere
ย ท multithreading Library
ย ท CGI og Fast-CGI Library
ย ท HTML Generation Library
ย ท SQL Database Access Library
ย ท C ++ wrapper bibliotek for Berkeley DB
ย ท C ++ iostream Adaptor / Wrapper Bibliotek
ย ท GZIP og BZ2 C ++ wrapper Bibliotek med iostream adaptere
ย ท ASN.1 og XML serialisering Bibliotek med C ++ Code Generator Tool (datatool)
ย ท Dato og klokkeslett Bibliotek
ย ท File System Funksjon Bibliotek
ย ท Command-Line Argument, konfigurasjon og Miljø Processing Library
ย ท Sequence Alignment Algoritmer Bibliotek
ย ท BLAST Engine Library
ย ท Biologisk Sekvenser henting og Processing Library
ย ท Portable FLTK og OpenGL basert GUI og grafiske biblioteker
Foruten de ovennevnte, er det en hel masse mer nyttige biblioteker, både generelle formål og bioteknologi-relaterte som stadig utvikles, vedlikeholdes og brukes i real-life produksjon av hundrevis av Web og frittstående applikasjoner og deres programmerere (også telles i hundrevis).
Hvis du er en C ++ utvikler vil du finne den bærbare natur bibliotekene svært nyttige i å bygge på tvers av plattformer, selv om du ikke har mye interesse i bioinformatikk. Bibliotekene som de for CGI / Fast-CGI, HTML, Nettverk, SQL Database Access, ASN.1 og XML serialisering er ganske generelle formål og kan brukes i en rekke applikasjoner utenfor Bioinformatikk problem domene.
C ++ Toolkit gjennomgår aktiv utvikling med bibliotekene bygges hver kveld. Kildekoden er fritt tilgjengelig via FTP og CVS. Dokumentasjonen for C ++ Toolkit er tilgjengelig på nettet i NCBI bokhylle format og også som nedlastbar bok i Acrobat PDF-format
Hva er nytt i denne utgaven:.
< p>- HØYDEPUNKTER:
- Lagd LDS2 (Local datalagring v.2) som er basert på SQLite3, har nye funksjoner og bedre ytelse. Også implementert LDS2 data loader å bruke LDS2 fra Object Manager.
- XmlWrapp -dette praktisk XML håndtering API har vært stort sett ferdig (og til og med polert).
- Gjennomført tunneling og autorisasjon av HTTP-tilkoblinger og tunnelering av sikre stikkontakter, via HTTP proxyer.
- CFormatGuess tillater nå skille mellom GTF, GFF3, og GFF2. Det er en muligens bryte endring. For mer informasjon se nedenfor.
- gjennomført store deler av CFeatTree, klassen for å organisere funksjoner definert på en biologisk sekvens i et hierarki som reflekterer deres foreldre-barn-relasjoner (basert på funksjons subtyper).
- CORELIB:
- Gjennomført locale uavhengig konvertering av strengen til å doble og tilbake; endrede kjerne biblioteker for å bruke den.
- NStr :: Justify () - for formatering av tekstavsnitt .
- CNcbiApplication - gjør FindProgramExecutablePath statisk, og mer robust; legge til en statisk høyere nivå GetAppName metoden. Se etter globale konfigurasjonsfiler i flere tilfeller.
- CMetaRegistry :: FindRegistry -. Ny metode utsette logikken bestemme hvilken fil (hvis noen) å laste
- CEnvironmentCleaner -. Ny klasse å forkaste uønsket miljøvariabler
- CFileIO - tilbake til opprinnelig oppførsel. Ikke lukke filen håndtaket hvis det er tildelt via SetFileHandle ()
- SERIE:
- serialisering av AnyContent dataobjekter - fast å gjenkjenne og ordentlig prosess attributter i sine verdier .
- Korrigert lesing av XML-data til å tildele et element standardverdi når det har ikke noe innhold.
- Lagt til støtte for sekvenser av elementer, hvor elementet har en standardverdi.
- DATATOOL:
- Korrigert kodegenerering av:
- CHOICE dataobjekter;
- binære datatyper med attributter.
- Korrigert konvertering av doble typen verdier for å bevare mer signifikante siffer.
- CONNECT:
- Lagt Keepalive socket alternativet (fSOCK_KeepAlive).
- Lagd NCBI tilkoblingstesten (CConnTest).
- Utilites:
- g_FindDataFile -. Ny funksjon for å finne datafiler i (konfigurerbar) standardplasseringene
- CChecksumStreamWriter -. Ny klasse for å beregne sjekksummen av data skrevet til en bekk
- g_GZip_ScanForChunks () - nytt API, for å spørre komprimerte stream stillinger. Lagt implementering for å få posisjoner i separate gzip-filer inni sammensatt gzip fil.
- Lagt kompresjon / dekompresjon stream manipulatorer (include / util / komprimere / stream_util.hpp).
- CFormatGuess (util / format_guess. {T / c} pp) oppdatert, med en muligens bryte endring. Hensikten med dette er å tillate CFormatGuess å skille mellom GTF, GFF3, og GFF2. Foreløpig er det klumper alle disse formatene til en 'eGtf' verdi. Den gamle 'eGtf' verdi (3) blir erstattet med 'eGtf_POISONED', og vil ikke bli returnert igjen. Den nye verdien for 'eGtf' (21) vil bety en fil som skal leses med CGtfReader (objtools / lesere / gtf_reader.hpp). Den nye verdien 'eGff3' (22) er for filer ment å leses med CGff3Reader (objtools / lesere / gff3_reader.hpp), og 'eGff2' (24) er for filer ment å leses med CGff2Reader (inkluderer / objtools / lesere /gff2_reader.hpp)
- BIO-GJENSTANDER:
- CBioseq :: GetNonLocalId - Ny metode for å hjelpe sted sekvenser importert fra fasta filer med rekkevidde spesifikasjoner i mer sammenheng; innpakket av CBioseq_Handle :: GetNonLocalIdOrNull (likeledes ny).
- CSeq_id :: IdentifyAccession - Implementere eller forbedre anerkjennelse for flere prefikser (GA, HH, HI, HO-HU, JA-JO, EAAA-EZZZ, og IAA-Izz, noen som tilsvarer den nye muligheten for DDBJ TPA WGS data) og blandet-i TPA protein tiltredelser (for det meste fra EMBL, men noen fra GenBank også).
- Skille WGS mester tiltredelser av en ny flagg bit. Slappe av over-streng PDB anerkjennelse logikk.
- CSeq_id :: IsValidLocalID, CSeq_id :: ParseIDs -. Ny funksjonalitet for å arbeide med ren tekst sekvens identifikatorer, priset ut av CFastaReader og generalisert noe
- SSeqIdRange - Ny type (komplett med parser og on-the-fly & quot; iterator & quot;) for å arbeide med Seq-id-serier, som er til stede i noen FASTA defline kilde modifikatorer .
- BIO-TOOLS:
- CFastaOstream - Alternativt godta egendefinerte titler for enkeltsekvenser. Tag negativt kjedede områder med ledende 'c-tallet.
- CFastaReader - Støtte negativt kjedede serier og Sequin kompakte defline-stil gap syntaks (?? & Quot; & gt; N & quot; hvor N er et nummer, eller & quot; & gt; unk100 & quot;)
- KOBOLT:
- Lagt kommandolinjealternativet -num_domain_hits som begrenser antall konserverte domener per sekvens som brukes i databehandling justerings begrensninger.
- Fylogenetiske trær:
- Lagt høyere nivå grensesnitt for databehandling fylogenetisk tre fra sekvenssammenstillinger (for eksempel BLAST og kobolt resultater). Klasse CPhyTreeCalc beregner fylogenetisk tre, og CPhyTreeFormater skriver treet i Newick og Nexus format.
- BIO-objektbiblioteker:
- Gjennomførte CheckNumRows () og andre metoder for sparsom justeringer.
- For å redusere minne fotavtrykk: lagt lest-kroker for å redusere minne som brukes av justeringer etter deserialization; Na-strand bruker nå en byte minne der det er mulig; Score.value valg er nå innebygd i CScore.
- Utnytt tiltredelse i CSeq_id :: GetLabel ().
- BIO-OBJEKT MANAGER:
- Lagd getter metoder for boolean felt i CTableFieldHandle.
- Lagd GetBestGeneForFeat () basert på CFeatTree.
- Gjennomført GetBestOverlappingFeat () på CFeatTree.
- Lagt rask CScope :: GetTaxid ().
- Gjennomført bulk lasting for acc / ver, GI, etikett, og taxid.
- Lagd null-lengde hull sjekk til CSeqMap og CSeqVector.
- Gjennomført GetLength () og GetCoverage () for obligasjonsplasseringer.
- Forbedringer:
- Lagt helper metode for å fylle CFeatTree på stedet.
- Sped opp kartlegging av enkle CSeq_loc_mix steder i CFeat_CI.
- Strengere sortering av funksjoner i CFeat_CI å unngå uklarheter.
- CSeq_feat_Handle getters nå jobber med Seq-tabellen funksjoner også.
- Seq-table funksjoner nå støtter multi-level brukerfelt.
- Ikke Seq-feat Seq-tabeller er nå anerkjent selv om ligger i delt blings.
- Sped opp CBioseq_Handle :: AddId ().
- Optimalisert CScope :: AttachXxx ().
- Support splitt av oppkalt merknader.
- CSeqVector og CSeqVector_CI sin CanGetRange () nå return false stedet for å kaste et unntak.
- Tillat å spesifisere hvordan man skal håndtere med eksisterende håndtak i ResetHistory ().
- Optimalisert re-foreldre hvis flere funksjoner er lagt til CFeatTree.
- Lagt til mulighet for å feilsøke CScope oppretting / sletting.
- Mange endringer i C ++ opprydding funksjonalitet for å imitere opprydding funksjonalitet som allerede finnes i C. Det er fortsatt mye arbeid som må gjøres med BasicCleanup, men betydelig fremgang har blitt gjort. Lite arbeid har blitt gjort for ExtendedCleanup som foreløpig.
- CSeq_loc_Mapper kan nå bli initialisert med en GC-forsamling.
- Bugfiks:
- Fast kartlegging av mix steder på minus strand i CFeat_CI.
- Mange feilrettinger i måten CFeatTree lenker funksjoner.
- Flere tråd-sikkerhetsrettinger.
- Fast skrivefeil hindrer legge justerer og grafer til CSeq_annot_EditHandle.
- Safeguard mot unntak når sortering funksjoner i CFeat_CI.
- GENBANK DATA LOADER:
- Registrert HPRD eksterne merknader.
- Lagt valgfri exclude_wgs_master param i pubseqos / pubseqos2 lesere.
- Gjennomført bulk lasting for acc / ver, GI, etikett, og taxid.
- Lagd CGBDataLoader :: CloseCache ().
- Forbedring:
- Bruk bulklasteforespørsler i CScope :: GetBioseqHandles ().
- Separate leserstatistikken etter type lastet blobs.
- Lagt tidsstempel til GenBank debug beskjeder.
- Bruk IConnValidator for åpning PubSeqOS tilkoblinger.
- Lagt split-versjon til chunk forespørsler og klump nøklene i GenBank cache for å unngå å bruke feil biter når blob split tilstand er endret i ID.
- Lagd sekundære mindre forvirrende param navn for åpen timeout.
- Ikke multiplisere prøve telling av antall tilkoblinger.
- OBJECT MANAGER TEST OG DEMO SØKNADER:
- id2_fetch_simple -. Lagt -id alternativer for vilkår Seq-id-er
- test_bulkinfo -. Ny testapplikasjon
- FASTA:
- C ++ funksjonen bord har blitt gjort mer funksjonell slik som for en del av BankIt prosjektet.
- asn2flat verktøyet
- Huge rekke endringer i Flat formaterings å bringe den mye nærmere å slippe klar tilstand (muligens frigjøre klar på dette punktet, selv om noen relativt små spørsmål gjenstår).
- XMLWRAPP:
- Fast segmentering feil ved å ta en referanse til XPath uttrykk kjører resultater.
- Lagt hjelpere for å få offentlig ID, system-ID og DTD navn for eksterne og interne undergrupper.
- Lagd metoder til oppslag node attributter.
- Fast gjennomføring av XPath uttrykk:. Det nå starter fra den gitte noden
- Fast søker attributter (inkludert standard) når et navnerom er gitt.
- Lagt evne til å kjøre XPath uttrykk uten nødvendighet for å registrere navnerom eksplisitt.
- Lagt evne til å gi beholdere for innsamling av feil og advarsler under analyse dokumenter.
- Lagt evne til å endre verdier og navnerom av nodestandard attributter.
- Lagt evne til å teste om et attributt er standard.
- Lagt evne til å sette inn eller ta attributter mens du tar hensyn til deres navnerom.
- Lagt evne til å strippe XML-deklarasjonen når et dokument er lagret.
- WindowMasker:
- Lagt til en ny input format, & quot; seqids & quot ;; med denne input format, er input en fil som inneholder en sekvens id på hver linje, og algoritmen bruker Bio-Object Manager til å slå opp sekvensene.
- Lagt til en ny klasse CWinMaskConfig, for lagring av alle konfigurasjonsparametere de WindowMasker. Klassen kan brukes til å legge de nødvendige kommandolinjeargumenter til CArgDescriptions, og deretter få konfigurasjonsparametrene fra kommandolinjeargumenter.
- BUILD RAMMER (UNIX):
- Tolk kommandolinje spesifikasjonene til APP_PROJ eller LIB_PROJ som en kø for å tømme ut andre * _PROJ innstillinger ikke også tilbys der. (Krever GNU Make;. Bygger med Sun gjør fortsette å jobbe som før)
- Forsynings flere mål i underkataloger:. * _F (Ved hjelp av lokale flate Make-filer produsert på bestilling, ignorerer avhenger av andre deler av treet), * _fd (innpakning toppnivå Makefile.flat), clean_sources og purge_sources
- Konfigurer og dens bekvemmelighet skript (kompilatorer / unix / * sh.):
- Verdt å merke seg ny flagg --without-3psw -. Til å ikke bruke med noen tredje-parts programvare
- Lagt til en sjekk for Glew.
- Forbedret sjekker for Boost og OpenGL.
- Support spesifisere kjøre stier på Darwin (Mac) systemer med moderne toolchains.
- BLAST:
- På Darwin (Mac OS X), bygge bare for Intel-prosessorer selv i ellers universell bygger på grunn av en PowerPC-verktøyene begrensning.
- Lagt til støtte for å hente NCBI Taksonomi IDer som WindowMasker støtte er tilgjengelig.
- Tillat spesifisering av en spørring sekvens sammen med multippel sekvens justering fil i psiblast.
- Lagt database hardt masker støtte.
- Lagt database soft-maskering for oversatte søk.
- Lagt til støtte for btop (BLAST traceback operasjoner) og spørring og under lengde i tabellrapporten.
- Command-line-applikasjoner - tillate psiblast å søke i flere spørsmål, lagt valgfri -input_type for makeblastdb
- Tillat bruk av beste hit og XML i blast2sequences modus.
- Forbedret formatering ytelse for eksterne søk.
- makembindex kan nå bygge maskert MegaBLAST indeksen direkte fra en BLAST nukleotid databasen ved hjelp av maskerings informasjon som er lagret i BLAST databasen. Dette oppnås ved ny kommandolinjealternativet -db_mask å makembindex. Alternativet godtar heltall id av filtrering algoritmen støttes av BLAST databasen. Alternativet kan bare brukes i forbindelse med -iformat blastdb.
- For å hjelpe en bruker i å finne ut tall ids av filtreringsalgoritmer som støttes av en BLAST database, er flagg -show_filters innført. Påføring av flagg med -iformat blastdb og BLAST databasen som en inngang trigger makembindex å sende ut en liste over tilgjengelige filtrering algoritmer og avslutte.
- APPLIKASJONER NetCache:
- NetCache er omarbeidet til å omfatte følgende funksjoner:
- bedre styring av diskplass;
- lock-mindre arbeid med blobs, er versjons brukt i stedet;
- multi-port lytting og pr-klient innstillinger differensierende.
- NetCache og ICache APIer:
- Bruk uint8 overalt for blob størrelse.
- Tillat delvis blob henting.
- Introdusert blob passordbeskyttelse; tomme passord blir behandlet som noe passord.
- Worker node APIer:
- Ny parameter for å heve arbeideren node hvis sin minneforbruket overstiger den angitte grensen (parameter & quot; total_memory_limit & quot;) .
- Ny parameter for å heve arbeideren node hvis sin kjøre tiden overskrider den angitte grensen (parameter & quot; total_time_limit & quot;) .
- grid applikasjoner:
- netscheduled
- Fikset en bug som forårsaket ingen svar til køen sletting kommandoen.
- remote_app
- Ny konfigurasjonsparameter (& quot; TMP_DIR & quot;). Å kontrollere hvordan midlertidig katalognavn genereres - å redusere dens lengde
- Logg blob skrivefeil.
- netcache_control
- Tillat delvis blob henting.
- Ny kommando -Fjern å slette blobs av sine IDer.
- Ny parameter -auth å angi autentiseringsstreng som skal brukes.
- Nye kommandoer -reconf og -reinit for bruk av NetCache administratorer.
- netschedule_control
- Aktivert kompatibilitetsmodus for å gjøre netschedule_control arbeid med eldre arbeidstaker noder.
- cgi2rcgi.cgi
- Ikke opprette en tom NetCache blob som plassholder for meldingen fremgang.
- Logg Grid feil som er rapportert til brukeren.
- Tillat mellomrom i jobb-ID-parameteren.
- Support utgang av informasjonen i JSON-format jobbstatus.
- Tillat definerte HTML-maler for å bli definert for GRID feil og andre hendelser.
- Lagt no-cache HTTP-hoder for å unngå bufring av mellomresultater.
- ncfetch.cgi
- Ny parameter for å få tilgang til passordbeskyttede blobs.
- Tolk ekstra parameter & quot; filnavn & quot; som et filnavn for den nedlastede filen.
.
Hva er nytt i versjon 31 desember 2008:
- Denne utgivelsen gir en metode for å beregne kolonne spesifikke pseudocounts i PSI-BLAST.
- Det refactors den nettjenester biblioteket.
- Den legger rammeverk for enhetstest og feillogging for alle File API klasser.
- Det fikser pthread støtte på IRIX. Det forbedrer støtte for XML serialisering.
- Det fikser støtte for Sybase.
- Det legger til støtte for mindre oppslagstabeller for små spørringer.
- Det legges til et API for å hente GenBank laster statistikk.
- Det har ymse andre forbedringer, speedups, og feilrettinger.
Kommentarer ikke funnet