Emdros er en Open-Source tekst databasemotor for lagring og gjenfinning av analysert eller kommentert tekst.
Emdros har en kraftig spørre-språk for å stille relevante spørsmål av dataene.
Emdros har bred anvendelse i felt som omhandler analysert eller kommentert tekst. Bruksområdene inkluderer lingvistikk, publisering, tekstbehandling, og eventuelle andre felt som omhandler kommenterte tekst.
Emdros gir en konseptuell modell av tekst som kan være ganske befriende å bruke når det har blitt forstått.
Meta-data kan også lagres, så lenge det ikke er noen tekstlig element som det kan være forbundet.
Emdros er bra både for korpuslingvistikk (store mengder tekst) og for feltlingvistikk (mindre mengder data).
Fast korpus, for eksempel bibelske tekster, er gode kandidater for å gjøre Emdros nyttig. Emdros blir nå brukt for store databaser av den hebraiske bibelen.
Ordbøker er også et mål mulighet. Emdros støtter strukturering av tekstdokumenter ned til minste detalj, mens ikke å miste det store bildet.
Emdros uttrykker en bestemt modell av tekst kalt EMdF modell. Den primære fordelen over XML datamodell er at objekttyper (for eksempel sider og kapitler) trenger ikke være hierarkisk strukturert eller innebygd, men kan overlappe. I tillegg må objekter (for eksempel en klausul eller en setning) ikke være sammenhengende, men kan ha hull.
Emdros kan sende sine resultater i XML. XML bærer sin egen frittstående DTD og validerer med en validering parser.
Emdros arkitektur
Emdros passer inn i en programvarearkitektur som følger:
+ --------------- +
| Client | Bruker skrevet
+ --------------- +
|
+ --------------- +
| MQL | Emdros
+ --------------- +
|
+ --------------- +
| EMdF | Emdros
+ --------------- +
|
+ --------------- +
| DB | PostgreSQL eller MySQL
+ --------------- +
På toppen er det en klient som du som bruker må skrive. Denne klienten vil dra nytte av Emdros tjenester for å sørge for behovene til din particlar database domene.
Så kommer de to Emdros-lag: Den MQL lag og EMdF lag. Den MQL laget gir et grensesnitt til MQL språk. Den MQL lag automatisk tar fordel av EMdF lag, som kan oversettes til MQL spørringer i SQL kall til den underliggende databasen.
Den underliggende database tar seg av lagring av data, og hente det som anvist av EMdF lag.
Dataene domene som Emdros håndterer er at av tekst. Emdros gir en viss abstraksjon av tekst som gjør den ideell for lagring og gjenfinning av annotert tekst, for eksempel språklige analyser av en tekst.
Disse analysene kan være, for eksempel, syntaktiske analyser, morfologiske analyser, eller diskurs analyser, eller alle disse. Fonologiske analyser støttes også i en viss grad.
Emdros er spesielt nyttig i områder hvor forskningsspørsmål trenger å bli spurt av databaser over kommentert tekst. Dette vil inkludere ordbok-making, bibelsk språkforskning (gresk eller hebraisk), andre språkforskning og forskning på annotert tekst generelt.
Emdros har en bestemt modell av tekst kalt EMdF modell. Brukere har attestert, og vår erfaring viser at EMdF modellen kan være ganske befriende når du arbeider med tekst som programmerer eller program designer. Dermed alle programmer som omhandler kommenterte teksten vil trolig dra nytte av Emdros og EMdF modell
Egenskaper :.
- Språklige analyser er det primære målet domene. Dette omfatter alle nivåer av analyse, som morfologi, syntaks, og diskursanalyse, og selv fonologi til en viss grad.
- Publishing er også et felt hvor Emdros kan være nyttig. Emdros støtter bryte en tekst ned i sider, kapitler, avsnitt, osv.
- Tekst behandling kan ha nytte av Emdros hvis problemet innebærer kommentere teksten.
Hva er nytt i denne versjonen:
- Eksperimentell støtte for fulltekstsøk ble lagt
- De RenderObjects og RenderXML funksjoner ble forbedret.
- Generelle hastighet forbedringer ble oppnådd.
- Støtte ble lagt til for å bygge på nyere Linux-distribusjoner, samt støtte for å bygge med qmake.
Hva er nytt i versjon 3.2.0:
- Oppgradert til SQLite 3.6.17 og PCRE 8.01.
- TIGERXML importøren er nå mer skånsom mot inngangen.
- Emdros Query Tool kan nå produksjonen i XML-format, og kan skape PNGs fra kommandolinjen.
Hva er nytt i versjon 3.1.0:
- Feilrettinger:
- Den langvarige feil, # 1217003 på SourceForge.Net sin Emdros bug tracker, har blitt fikset. I utgangspunktet er det var en feil utforming på den måten objekt referanser ble behandlet i topografisk MQL. Dette kan noen ganger føre til villedende og / eller ufullstendige resultater.
- Bug # 2021303 har blitt fikset. Det sies at i Emdros Query Tool, sette & quot; option = stille & quot; i konfigurasjonsfilen ville innebære at man måtte endre størrelsen på vinduet for å få noen effekt vises i det hele tatt.
- funksjonsforbedringer:
- Emdros Query Tool er nå i stand til å redde sin produksjon til HTML. Når utgangen inneholder trær, de er lagret som PNG.
- Lagt libharvest, som er et bibliotek for & quot; høsting & quot; Emdros stedene.
- Lagt til en JSON parser, som brukes i libharvest.
- Emdros Query Tool nå viser ingen verktøytips, som brukerne ønsket slått av.
- Objekt referanse bruksområder kan nå referere sin egen blokk. For eksempel er dette nå mulig: [Word som w1 // Legg merke til hvordan dette refererer til samme objekt for begge funksjonene. phrase_dependent_part_of_speech = w1.part_of_speech]
- På Linux-desktop, er et meny lagt for Emdros Query Tool, den Emdros chunking Tool, og Emdros Import Tool.
- Emdros Query Tool og Emdros chunking Tool er både betydelig raskere ved å vise resultater.
- Emdros Query Tool er nå i stand til å vise horisontale trær i sin produksjon.
- Emdros Query Tool er nå i stand til å sende ut resultatene som en KWIC konkordans (KWIC = nøkkelord i Context).
- MatchedObject :: getFeatureAsString () returnerer nå en liste over enum etiketter i stedet for en liste med heltall når funksjonen er en liste over enums.
- Hastigheten på GET gjenstander som har monader IN har blitt forbedret.
- TigerXML importøren er nå i stand til å importere * .ltcx filer fra Linguistic treet Constructor.
- Bygg endringer:
- gcc 4.3 er nå støttet.
- PostgreSQL versjon 8.3 er nå den eneste støttet versjon, på alle plattformer.
- Emdros kan nå være rpm-bygget på 64-bit Fedora 10.
- Emdros kan nå bli bygget på x86 Solaris.
- turtall får nå fordelingen identifikator (f.eks fc9) i RPM navn automatisk.
- Python SWIG DLL på Win32 heter nå _Emdros.pyd fremfor _Emdros.dll.
- På Mac OS X, både 10.4 og 10.5 støttes av de samme binærfiler.
- wxWidgets 2.4 støttes ikke lenger; bare 2,6 og 2,8 er.
- På Mac OS X og Linux / Unix, ikke-Unicode bygger på Emdros støttes ikke lenger.
- er SWIG CSharp nå i stand til å bruke GMC for Net bindinger.
Kommentarer ikke funnet