MetagenomeDB er en Python bibliotek designet for enkelt å lagre, hente og kommentere metagenomic sekvenser. & Nbsp; MetagenomeDB fungere som en abstraksjon lag på toppen av en MongoDB database. Det gir en API for å opprette og endre og koble to typer objekter, nemlig sekvenser og samlinger:
& Nbsp; * sekvenser (Sequence klasse) kan være leser, contigs, PCR kloner, etc.
& Nbsp; * samlinger (Collection klasse) representerer sett av sekvenser; for eksempel leser som resulterer fra sekvensering av en prøve, contigs satt sammen av et sett av lyder, PCR bibliotek
Ethvert objekt kan annotert ved hjelp av en ordbok-lignende syntaks:
# Først, importerer vi biblioteket
import MetagenomeDB som mdb
# Så skaper vi en ny sekvens objekt med to
# (Obligatorisk) egenskaper, "navn" og "sekvens"
s = mdb.Sequence ({"name": "My sekvens", "sekvens": "ATGC"})
# Objektet kan nå bli kommentert
print s ["lengde"]
s ["type"] = "lese"
# En gang endret, objektet må være forpliktet
# Til databasen for modifikasjoner å forbli
s.commit ()
Objekter av typesekvensen eller Samling kan kobles til hverandre for å representere ulike metagenomic datasett. Eksempler omfatter, men er ikke begrenset til:
& Nbsp; * samling av lyder som følge av en sekvense kjøre (forholdet mellom multiple Sequence objekter og ett Collection)
& Nbsp; * sett contigs følge av montering av et sett med lyder (forholdet mellom to samling gjenstander)
& Nbsp; * lesninger som er en del av en contig (forholdet mellom multiple Sequence objekter og ett Sequence)
& Nbsp; * sekvens som er lik den annen sekvens (forholdet mellom to objekter Sequence)
& Nbsp; * samling som er en del av en større samling (forholdet mellom to samling gjenstander)
Resultatet er et nettverk av sekvenser og samling, som kan utforskes ved hjelp av dedikerte metoder; IEG, Collection.list_sequences (), Sequence.list_collections (), Sequence.list_related_sequences (). Hver og en av disse fremgangsmåter tillater avanserte filtre ved hjelp av MongoDB søkene syntaks:
# Liste alle samlinger av typen 'collection_of_reads'
# Sekvensen 's' tilhøre
samlinger = s.list_collections ({"type": "collection_of_reads"})
# Liste alle sekvenser som også hører til disse samlingene
# Med en lengde på minst 50 bp
for c Samlinger:
& Nbsp; utskrifts c.list_sequences ({"lengde": {"$ gt": 50}})
MetagenomeDB gir også et sett med kommandolinjeverktøy for å importere Nukleotidsekvensene, proteinsekvenser, BLAST og FASTA justering algoritmer utgang, og ACE montering filer. . Andre verktøy er å legge til eller fjerne flere objekter, eller for å kommentere dem
Krav
- Python
Kommentarer ikke funnet