DataCleaner

Skjermbilde programvare:
DataCleaner
Prog.varedetaljer:
Versjon: 4.0.9
Last opp dato: 11 Apr 16
Utvikler: -
Lisens: Gratis
Popularitet: 17

Rating: nan/5 (Total Votes: 0)

DataCleaner er en åpen kildekode og helt gratis løsning for organisasjoner og bedrifter som ønsker å øke og måle kvaliteten på sine data.

Med DataCleaner, vil brukerne kunne profilere, sammenligne, validere data mot forretningsregler, og overvåke progresjon av disse målingene over tid.

Blant funksjonene kan vi nevne data overvåking, data profilering og DQ analyse, data rensing og berikelse, oppdage og fusjonere duplikater, kundedatakvalitet, samt superrask ETLightweight (Extract-Transform-Load).

Hvis du vil vite mer om DataCleaner funksjoner og muligheter, samt hvordan å jobbe med det, henvises det til http://eobjects.dk/docs

What er nytt i denne versjonen:

  • Forbedringer og nye funksjoner:
  • Vi har gjort det mulig å lage og slippe tabeller via skrivebordet UI av DataCleaner. Merk at begrepet & quot; tabellen & quot; her faktisk dekker mer enn bare relasjonsdatabasetabeller. Det inkluderer også Ark i MS Excel datalagre, Samlinger i MongoDB, Dokumenttyper i CouchDB og ElasticSearch og så videre ... I utgangspunktet alle Datastore typer som støtter skrive-operasjoner, bortsett fra single-table datalagre som CSV datalagre, støtter denne funksjonaliteten! Funksjonaliteten er eksponert via:
  • & quot; Opprett tabellen & quot; aktivert via høyreklikkmenyen av skjemaer i treet på venstre side av programmet.
  • & quot; Opprett tabellen & quot; aktivert også via table-selection innganger i komponenter som setter inn i tabellen, tabell oppslag og oppdatering bordet.
  • & quot; drop table & quot; aktivert via høyreklikkmenyen av tabeller i treet på venstre side av programmet.
  • Vi har lagt til (valgfritt) evnen til å spesifisere ditt Salesforce.com webtjeneste Endpoint URL. Dette gjør at du kan bruke DataCleaner å koble til sandkasse miljøer Salesforce.com samt til dine egne endepunkter.
  • ElasticSearch støtten er forbedret, slik at tilpassede kartlegginger samt gjenbruk av ElasticSearch Datastore definisjoner nå også for søking og indeksering.
  • Prøvetaking av poster og valg av mulige duplikater i Duplicate deteksjon funksjonen er forbedret, noe som fører til raskere konfigurasjon fordi de beslutninger som fattes i løpet av treningsøkten er mer representative.
  • Duplicate påvisning modell filformat er oppdatert som har fjernet behovet for en egen "referanse 'fil for å redde siste trening beslutninger. Kompatibilitet med det gamle formatet er beholdt, men bruker det nye formatet legger mange fordeler for brukeropplevelsen.
  • Bugfikses:
  • En tråd sult problemet ble løst i DataCleaner monitor. Virkningen av dette problemet var stor, men det skjedde bare i sjeldne og svært tilpassede tilfeller. Hvis tilpassede lytteren objekter på DataCleaner monitor ville kaste en feil, ville det resultere i en ressurs aldri blir frigjort og tar opp en tråd fra Quartz-planlegging basseng på serveren. Hvis dette skulle skje mange ganger serveren kunne til slutt gå ut av tråder i denne puljen.
  • Den vertikale menyen på resultatet skjermen er nå å gjøre en skikkelig jobb med å vise etikettene av de komponentene som har resultater. Dette gjør det lettere å gjenkjenne hvilke menyelement poeng til hva resultatet element.

Hva er nytt i versjon 3.5.5:

  • 'Synonym lookup' forvandling har nå et alternativ å slå opp hvert tegn på inngangen. Dette er nyttig hvis du gjør utskifting av synonymer innenfor verdiene av en lang tekstfeltet.
  • Blokkerings gjennomføring av DataCleaner arbeidsplasser gjennom skjer webtjeneste for dette kan noen ganger mislykkes med en feil forårsaket av blokkering tråden. Dette problemet er løst.
  • En forbedring ble gjort i måten arbeidsplasser og sekvensen av komponenter er lukket / ryddet opp etter henrettelsen.
  • JNLP / Java WebStart versjon av DataCleaner ble avslørt av en feil i Java runtime forårsaker visse JAR-filer for ikke å bli gjenkjent av WebStart launcher, under visse omstendigheter. Dette problemet er løst ved å gjøre små endringer til disse JAR-filer.
  • For noen døde linker i dokumentasjonen ble fikset.

Hva er nytt i versjon 3.5.4:

  • Det er nå mulig å skjule utgangs kolonner av transformasjoner . Hiding vil ikke påvirke behandlingen flyt i det hele tatt, men bare skjule dem fra brukergrensesnittet, og dermed potensielt gjør opplevelsen mer ren, når vi samhandler med andre komponenter.
  • En ny webtjeneste er lagt til overvåking web-applikasjon, som gir en vei for å hente fra status for gjennomføring av en bestemt jobb.
  • En feil ble fikset, slik at HTML-rapporten til å mislykkes for enkelte analysetyper når ingen poster hadde blitt behandlet.
  • Og 6 andre mindre feilen har blitt adressert.

Hva er nytt i versjon 3.5.1:

  • Capture endret poster:
  • Et nytt filter ble lagt for å muliggjøre trinnvis behandling av poster som ikke har blitt behandlet før, f.eks for profilering eller kopiering bare endret poster. De nye filtre heter Capture endret poster, med henvisning til begrepet Endre datafangst.
  • I kø kjøring av jobber:
  • DataCleaner skjermen vil nå kø utførelsen av den samme jobben, hvis det utløses flere ganger. Dette sikrer at du ikke tilfeldigvis kjøre den samme jobben samtidig som kan føre til alle slags problemer, avhengig av hva jobben gjør.
  • Mindre feilrettinger:
  • Flere feilrettinger ble gjennomført.

Hva er nytt i versjon 3.5:

  • Flere veivisere er nå tilgjengelig for å registrere datalagre; inkludert fil-opplasting til server for CSV-filer, database tilkobling oppføring, guidet registrering av Salesforce.com legitimasjon og mer.
  • De jobben bygnings veivisere har også blitt utvidet med flere forbedrede funksjoner; Valg av verdifordeling og mønster finne felt i rask analyse veiviseren, en helt ny veiviser for oppretting EasyDQ basert kunde rensing arbeidsplasser og en ny jobb veiviser for avfyring Pentaho Data Integration jobber (les mer under).
  • Du kan nå ad-hoc spørring noen datalageret direkte i nettbrukergrensesnittet. Dette gjør det enkelt å få raske eller sporadiske innsikt i dataene uten å sette opp jobber eller andre administrerte tilnærminger til behandling av data.
  • Når jobber eller datalagre er opprettet, blir brukeren ledet til å ta affære med den nybygde objektet. For eksempel kan du raskt kjøre en jobb rett etter det er bygget, eller spørre en datalager etter at den er registrert.
  • Administratorer kan nå direkte laste opp jobber til depotet, som er spesielt nyttig hvis du ønsker å hånd redigere XML-innholdet av jobbfilene.
  • Mye av den tekniske cruft er nå gjemt bort i favør av å vise enkle dialoger. For eksempel når en jobb er utløst et stort lasteindikatoren vises, og når du er ferdig resultatet vil bli vist. Den avanserte logging skjermen som tidligere var det fortsatt kan vises når du klikker en kobling for ytterligere detaljer.

Hva er nytt i versjon 3.1.2:

  • Vi har lagt til en web-tjeneste i overvåkings søknad om å få en (liste over) metriske verdier. Dette gjør overvåkingen enda mer anvendelig som en sentral infrastrukturkomponent, som en måte å overvåke data (kvalitet) og utsette resultatene til tredjeparts applikasjoner.
  • "Table lookup" komponent har blitt forbedret ved å legge delta semantikk som en konfigurerbar eiendom. Bruke bli semantikk du kan justere hvis du ønsker oppslags å jobbe semantisk som en LEFT BLI eller en INNER JOIN.
  • De EasyDQ komponenter har blitt oppgradert, og legger til flere konfigurasjonsmuligheter og et rikere deduplisering resultat grensesnitt.
  • Ytelsesforbedringer har vært et spesielt fokus på denne utgivelsen. Forbedringer har blitt gjort i motoren på DataCleaner å ytterligere utnytte en streaming behandling tilnærming i visse hjørne saker som ikke var dekket tidligere.

Hva er nytt i versjon 3.1.1:

  • Dato og tidsrelatert analysemuligheter har blitt utvidet , og legger til distribusjons analysatorer for ukenummer, måneder og år. Alle analyse knyttet til dato og klokkeslett er nå gruppert i en undermeny kalt & quot; Dato og tid & quot; etter & quot; Analyser & quot;.
  • En valgfri & quot; beskrivende statistikk & quot; alternativet er lagt til nummer analysator og dato / tid analysator. Dette alternativet legger ytterligere beregninger til resultatene av disse analysatorer, for eksempel Median, Skjevhet, prosentiler og kurtose. Disse verdiene er valgfritt fordi deres minne fotavtrykk er noe større enn de eksisterende beregninger.
  • Linjene i tidslinje diagrammer av overvåkingen webapplikasjon nå har små prikker i dem. Dette er spesielt nyttig for diagrammer med noen (eller bare en) observasjoner i dem -. Å peke ut nøyaktig hvor observasjon poeng er
  • Spørringen parser da påkalle ad-hoc-spørringer har også blitt vesentlig forbedret. Nå spørringer kan inneholde tydelig klausuler, * -wildcards, subqueries og er feiltolerant mot tekst-case problemer.
  • To nye transformatorer har blitt lagt for å generere UUID og for å generere tidsstempler.

Hva er nytt i versjon 3.1:

  • Metric formler - utdypet Data Quality KPIer:
  • Det er nå mulig å bygge mye mer forseggjort Data Quality KPIer i DataCleaner overvåking web-applikasjon. Brukergrensesnittet gjør det mulig å bygge komplekse formler i et regneark-lignende formel stil; med variabler som samles inn av DataCleaner jobber.
  • Metric formler kan kombinere en rekke beregninger, konstanter og operasjoner, så lenge det kan uttrykkes i en matematisk ligning.
  • For eksempel - måle frekvensen av like poster i prosent av det totale platetelling. Eller måle mengden av produktkoder som er i samsvar med et sett av flere strengmønstre.
  • Ad-hoc spørring - av alle datalager:
  • Med DataCleaner 3.1 kan du nå utføre ad-hoc-spørringer til noen datalageret! Spørringer kan uttrykkes i vanlig SQL og vil bli brukt til databaser og filer, NoSQL databaser og mer, noe som gir en virkelig nyttig spørring mekanisme for å strekke seg inn i oppdagelsen og data profilering erfaring.
  • Spørringen alternativet er også tilgjengelig gjennom en web-tjeneste for å holde orden på brukere med ADMIN rolle. Spørringen er gitt som en HTTP parameter eller POST kroppen, og resultatet er gitt som en XHTML bordet.
  • Verdi matcher - en ny analyse alternativ:
  • Ofte ganger du har en fast idé om hvilke verdier bør være tillatt og forventet for et bestemt felt. I DataCleaner det har alltid vært Verdi Distribution analyse alternativ som vil hjelpe deg å hevde dine forutsetninger. I DataCleaner 3,1 skjønt, har du en mer presis tilbud - Verdi matcher. Denne analysen alternativet kan du angi et sett av forventede verdier, og deretter utføre en verdifordeling som analyse, spesielt for å validere og identifisere uventede verdier.
  • Kopiere, slette og forvaltning av arbeidsplasser:
  • Ledelse av arbeidsplasser og resultater i DataCleaner skjermen programmet har blitt kraftig forbedret. Du kan nå klikke en jobb i Planlegging side av skjermen, og finn ledelse alternativer tilgjengelige for operasjoner som døpe, kopiering, sletting og mer. Hver operasjon respekterer sammenhengen til andre gjenstander i skjermen, som analyseresultater, tidsplaner og mer. Dette betyr at forvaltningen av overvåkingen depotet har blitt mye enklere og moden.
  • Administrer datakvalitet historie:
  • Noen ganger du står overfor situasjoner der du faktisk ønsker å gjøre overvåking med historiske data! Det kan være at du har historiske dumper eller sikkerhetskopier av databaser, som du ønsker å vise og fortelle historien om. Nå kan du gjøre analysen av denne historiske data, laste det opp til DataCleaner skjermen, og ved hjelp av en ny web-tjeneste, satt en historisk data for den aktuelle analyseresultatet. Dette betyr at tidslinjer vil den skal plotte resultatene ved hjelp av sin tiltenkte dato, men med de resultatene du har samlet kanskje på et senere tidspunkt.
  • Gruppert scheduler støtte (kun EE):
  • Planleggeren av DataCleaner monitoren er eksternaliserte, slik at den kan erstattes ved hjelp av enkel konfigurasjon. I Enterprise Edition (EE) av DataCleaner, tilbyr vi et klynge planlegger, gir muligheten til å laste balanse og distribuere henrettelser over en klynge av maskiner.
  • Single-signon (SSO) ved hjelp av CAS (EE only):
  • I Enterprise Edition (EE) av DataCleaner vi nå tilby en enkelt-signon alternativet for skjermen programmet. Nå DataCleaner kan være en integrert del av IT-infrastrukturen, også sikkerhet-messig.
  • ... Og mye mer:
  • Det ovenstående er bare en oppsummering. Mer enn tretti problemene er løst i denne utgaven. Vi har løst flere forespørsler som kommer fra fora og samfunnet, og vi oppfordrer alle til å bruke dette mediet som et redskap for forandring. Vi er veldig glad for å gjøre utviklingen av DataCleaner bli sterkt påvirket av strømmene i samfunnet.

Hva er nytt i versjon 3.0.3:

  • Legger en tjeneste for døpe jobber i overvåkings repository .
  • Du får tilgang til dette som en RESTful webtjeneste eller interaktivt i brukergrensesnittet.
  • En webtjeneste ble lagt til for å endre den historiske datoen for en analyse resultat i overvåkingen depotet.
  • Internett-programmet har blitt gjort kompatibel med eldre JSF beholdere.
  • Caching av konfigurasjon i Web-programmet ble kraftig forbedret, noe som fører til raskere siden laste og jobb initialisering ganger.

Hva er nytt i versjon 3.0.2:

  • Når utløser en jobb i overvåking webapplikasjon, panelet automatisk oppdateres hvert sekund for å få den nyeste topp henrettelsen.
  • Fil-basert datalagre (som CSV eller Excel-regneark) med absolutte stier er nå riktig løst i overvåkingen web-applikasjon.
  • & quot; Velg fra nøkkel / verdi over & quot; transformator støtter nå nestede velger uttrykk som & quot; Address.Street & quot; eller & quot; ORDERLINES [0] .product.name & quot;.
  • Tabellen oppslag mekanismen er optimalisert for ytelse, ved hjelp av preparerte uttalelser når du kjører mot JDBC databaser.
  • Administratorer kan nå laste ned filbaserte datalagre direkte fra & quot; datalagre & quot; siden.
  • Unntak håndtering i overvåkings webapplikasjon har blitt forbedret litt, slik at feilmeldingene mer presis og intuitiv.

Hva er nytt i versjon 3.0.1:

  • Den primære feilretting i denne utgaven var i ferd med å gjenopprette kartlegging av søyler og spesifikke enumerable kategoriseringer. For eksempel i den nye Fullstendighet analysator, fant vi at etter omlasting en lagret jobb, kartleggingen var ikke alltid riktig.
  • Videre noen interne forbedringer har blitt gjort, noe som gjør det enklere å distribuere DataCleaner monitor web-applikasjon i miljøer med Spring Framework.
  • Sist men ikke minst, visualiseringsinnstillingene i desktop-programmet har blitt forbedret ved automatisk å ta en titt på den jobben som visualiseres og veksling vises gjenstander basert på skjermstørrelsen og mengden av detaljer som trengs for å vise det pent.

Hva er nytt i versjon 3.0:

  • Visning av tidslinjen og trender i datakvalitet beregninger
  • Sentralisert oppbevaringssted for administrasjon og inneholder arbeidsplasser, resultater, tidslinjer osv.
  • Planlegging og revisjon av DataCleaner arbeidsplasser
  • Gir webtjenester for å påkalle DataCleaner transformasjoner
  • Sikkerhet og multi-leieforholdet
  • Varsler og meldinger når datakvalitet beregninger er ute av deres forventede komfort soner.
  • Det er en ny Fullstendighet analysator som er svært nyttig for enkelt å identifisere poster som har ufullstendige felt.
  • Du kan nå eksportere DataCleaner resultatene til pen HTML rapporter som du kan gi til sjefen din, eller sende til XML-parser!
  • Den nye overvåkingen miljøet er også tett integrert med desktop søknad. Dermed har desktop søknad nå muligheten til å publisere arbeidsplasser og resultater til skjermen depotet, og skal brukes som en interaktiv redaktør for innhold som allerede i depotet.
  • Ny dato orientert transformasjoner er nå tilgjengelig: Dato range filter, noe som gjør at du kan delsett datasett basert på datoperioder, og format dato, noe som gjør det mulig å formatere en date med en dato maske
  • .
  • Regex Parser (som var tidligere bare tilgjengelig gjennom ExtensionSwap) har nå blitt inkludert i DataCleaner. Dette gjør det svært praktisk å analysere og standard rik tekst-felt ved hjelp av regulære uttrykk.
  • Det er en ny tekst sak transformator tilgjengelig. Med denne transformasjonen kan du enkelt konvertere mellom store / små bokstaver og riktig kapitalisering av setninger og ord.
  • To nye søk / erstatt transformasjoner har blitt lagt til. Vanlig søk / erstatt og Regex søk / erstatt
  • Brukeropplevelsen av desktop-programmet har blitt forbedret. Vi har lagt til flere i-program hjelpemeldinger, gjort fargene ser lysere og klarere og forbedret font håndtering.

Hva er nytt i versjon 2.5.2:

  • Apache CouchDB support:
  • Vi har lagt til støtte for NoSQL database Apache CouchDB. DataCleaner støtter både lese fra, analysere og skrive dine CouchDB tilfeller.
  • Oppdater tabellen forfatteren:
  • Etter våre tidligere forsøk på å bringe ETLightweight-stil funksjoner i DataCleaner, vi har lagt til en forfatter som oppdaterer poster i en tabell. Du kan bruke dette for eksempel for å sette inn eller oppdatere poster basert på bestemte vilkår.
  • I likhet med Sett inn tabell forfatter, den nye DataCleaner Update bord forfatter er ikke begrenset til SQL-baserte databaser, men noen datalager type som støtter skriving (for tiden relasjonsdatabaser, CSV-filer, Excel regneark, MongoDB databaser og MongoDB databaser), men semantikk er de samme som med en tradisjonell UPDATE TABLE-setningen i SQL.
  • Drill på detaljer informasjon som er lagret i resultatfilene:
  • Når du bruker resultatet trekk ved DataCleaner 2,5 Lagre noen brukere opplevde at deres drill til detaljert informasjon gikk tapt. I DataCleaner 2.5.2 vi nå også vedvare denne informasjonen, noe som gjør DQ arkiver mye mer verdifull når undersøker historiske data hendelser.
  • Forbedret EasyDQ feilhåndtering:
  • De EasyDQ komponentene har blitt forbedret når det gjelder feilbehandling. Hvis en kortvarig nettverksproblem oppstår eller en annen lignende sak fører til noen poster til å mislykkes, vil EasyDQ komponenter nå grasiøst gjenopprette og aller viktigst -. Batch arbeidet vil råde selv på tross av feil
  • Tabell kartlegging for NoSQL datalagre:
  • Siden CouchDB og MongoDB er ikke tabell basert, men har en mer dynamisk struktur vi gi to tilnærminger til å jobbe med dem: Standard, som er å la DataCleaner autodetect en tabell struktur, og den avanserte som lar deg spesifisere manuelt din ønsket tabellstruktur. Tidligere avanserte alternativet var kun tilgjengelig gjennom XML konfigurasjon, men nå brukergrensesnittet inneholder nødvendige dialoger for å gjøre dette direkte i programmet.

Hva er nytt i versjon 2.4.1:

  • funksjonsforbedringer:
  • Batch lasting funksjonene vi kraftig forbedret når du skriver data til databasetabeller. Forvent å se mange størrelsesordener forbedringer her.
  • Skriving til data er mer bekvemt gjort tilgjengelig ved å legge til alternativer til vinduet menyen.
  • Du kan nå enkelt endre navn på komponenter i en jobb ved å dobbeltklikke sine faner.
  • Den Javascript transformatoren har nå syntaks farge, slik at Javascripts er lettere å inspisere og modifisere.
  • Bugfikses:
  • Når du leser fra og skriver til det samme datalager (f.eks. Den DataCleaner klargjøringsområdet) vi har sørget for at tabellen cache av at datalageret er uthvilt. Tidligere noen scenarier tillater deg å se en ut-av-dato visning av bordene.
  • En potensiell vranglås når du starter opp programmet ble løst. Dette fastlåste situasjonen var en konsekvens av et problem i JVM, men vi jobbet rundt det ved å synkronisere alle anrop til bestemte API i Java.

Hva er nytt i versjon 2.4: (. Aka deduplisering eller Fuzzy matching av records)

  • Duplicate deteksjon , som er gratis å bruke for opp til 500.000 verdier.
  • Adressedatavalidering og rensing. Dette gjør at du kan sjekke om adresser finnes, hvis de er riktig formatert og selv til å foreslå endringer i tilfelle du har feil.
  • Navn datavalidering og rensing. Med navnetjenesten, betyr EasyDQ ikke bare formatere navn konsekvent, men også kontrollerer for feilstavelser og tolker navnet deler.
  • E-post og telefon validering og rensing. Disse tjenestene gir kontroll av e-post og telefondata, noe som gjør at e-postdomener eksisterer, at landkoder er riktige, og mye mer.

Hva er nytt i versjon 2.3:

  • International data support:
  • Hvis du arbeider med internasjonale data, så du kan ha forskjellige tegnsett i dataene, for eksempel kinesisk eller hebraisk. Vi har lagt tegnsettet distribusjon analysator, som er en profilering alternativ som lar deg finne ut hvilke tegnsett som brukes i dataene.
  • Arbeide med data som inneholder forskjellige tegnsett kan være problematisk. Ved hjelp av den nye translitterere transformatoren kan du nå translitterere strenger fra forskjellige skriftsystemer til latinske tegn.
  • Det er også en ny webcast demonstrasjon, med fokus på de internasjonale datafunksjonene DataCleaner 2,3 i dokumentasjonsdelen.
  • Gruppering av analyseresultater av en sekundær kolonne:
  • Mønster analysator er nå i stand til å gruppere mønstre basert på en sekundær kolonne. Dette er nyttig for analyser som:
  • Få mønstre av telefonnumre, gruppert etter land.
  • Kom mønstre av epost brukernavn basert på e-postdomenet.
  • Noe lignende har vært gjort for verdien Distribution analysator; Dette gjør det mulig for analyser som:
  • Er alle bynavn tydelig når gruppert etter postnummer?
  • Hva er fordelingen av kjønn innenfor bestemte kundetyper?
  • Forbedret diagrammer:
  • mønsteret finder resultatene kan nå vises i et diagram. Dette gjør fordelingen synlig og viser hvor mye av en & quot; long tail & quot; mønstre finnes.
  • Utgangen av verdien fordeling analysatoren har blitt forbedret i et par områder:
  • lesbarhet av kartet har blitt forbedret.
  • Den viser det totale antallet rader og den distinkte tellingen over disse radene: antall ulike verdier som finnes i radene. Det hjelper på å finne ut hvor ofte like verdier eksisterer.
  • Hvis det er tomme strenger, bruker vi nøkkelordet for det, slik at det er lettere å gjenkjenne dem.
  • Output:
  • Ved siden av de allerede eksisterende formater (CSV-filer og H2 datalagre) vi lagt skrive utgang til Excel-regneark.
  • Etter å ha skrevet til en datalager, er det nå mulig å forhåndsvise utgang, slik at du kan sjekke om produksjonen er i henhold til dine forventninger.
  • Det er nå også mulig å legge den ut som en ny datalager, slik at den kan brukes som innspill til en ny jobb.
  • Andre forbedringer:
  • Dokumentasjon er generelt bedre. Spesielt har logging og kommandolinje-grensesnitt beskrivelser blitt lagt til.
  • Utvidelsen mekanismen har blitt forbedret ved modularizing flere stykker av søknaden og introdusere Google Guice som et allment tilgjengelig avhengighet injeksjon rammeverk for forlengelse utviklere.
  • Og selvfølgelig vi gjorde mer enn tjue små forbedringer og feilrettinger.

Hva er nytt i versjon 2.2:

  • Den viktigste driveren for denne utgivelsen har vært en historie om utvidelses . Mens slippe programmet vi simultaniously lanserer en ny DataCleaner nettsted som har et viktig nytt område: The ExtensionSwap. Ideen om ExtensionSwap er å tillate deling av utvidelser til DataCleaner og installasjon ved å klikke på en knapp i nettleseren!
  • DataCleaner forlengelse API har blitt forbedret mye i denne utgivelsen, noe som gjør det mulig å lage dine egne transformatorer, analysatorer og filtre. Hvis du føler at utvidelsene kan være av interesse for andre brukere, kan du dele den på ExtensionSwap og vi gir en kanal for at du enkelt kan distribuere det til tusenvis av brukere. Extension API og ExtensionSwap er nærmere forklart i vår nye webcast demonstrasjon for utviklere og andre Teknologikyndige med interesse.
  • Vi er også slippe et sett med innledende utvidelser på ExtensionSwap: De HIquality Kontakter for DataCleaner utvidelse som gir avansert navn, telefon og e-post rensing, basert på menneskelige slutninger naturlig språk prosessering DQ webtjenester. Vi er også skipsfart en prøve utvidelse som vil tjene som et eksempel for utviklere som ønsker å prøve ut forlengelsen utvikling selv. I de kommende månedene vil vi sørge for å legge enda flere utvidelser som stammer fra vår interne portefølje av verktøy som vi bruker på menneskelige slutning kunnskaps samle lag.
  • I tillegg til utvidelses vi fokuserer også på embeddability. Vi ønsker å være i stand til å legge ned DataCleaner lett inn i andre programmer for å gjøre profilering og dataanalyse mulig hvor som helst! Vi har opprettet en ny bootstrapping API som tillater programmer å pakke DataCleaner og bootstrap den med en dynamisk konfigurasjon eller kjør den i en & quot; enkelt datalageret modus & quot ;, der søknaden er innstilt mot bare inspisere en enkelt datalager (vanligvis definert av søknaden som bygger DataCleaner). Vi har allerede noen virkelig interessante tilfeller av embedding DataCleaner i verk -. Både i andre åpen kildekode-programmer, så vel som kommersielle programmer
  • Vi har lagt til støtte for å analysere SAS datasett. Dette er noe vi er ganske stolte av som vi er, så vidt vi vet, den første store open source program for å gi slik funksjonalitet, til slutt befriende mye av SAS brukere. SAS interoperabilitet delen ble opprettet som et eget prosjekt, SassyReader, så vi forventer å se adopsjon i DataCleaner er gratis åpen kildekode samfunn snart også!
  • Vi har også lagt til støtte for en annen type Datastore: Fast bredde filer. Fast bredde filer er tekstfiler der hver kolonne har en fast bredde. Det er ingen separator eller anførselstegn, som CSV-filer, i stedet hver linje er like lange, og hver linje skal symbolbaserte henhold til et sett av verdi lengder.
  • Et alternativ til & quot; mislykkes på inkonsekvenser & quot; ble lagt til CSV-fil og fast bredde fil datalagre. Disse flaggene legge til et format integritetssjekk når du bruker disse tekstfil basert datalagre.
  • En feil ble fikset, som forårsaket CSV separator innstillingene ikke å bli tatt vare på i brukergrensesnittet, når du redigerer en CSV datalager.
  • japanske og andre tegn som ikke støttes i brukergrensesnittet. This & quot; bug & quot; var et spørsmål om å undersøke tilgjengelige skrifter på systemet og velge en skrifttype som kan gjengi de spesielle tegn. På de fleste moderne systemer vil det være i stand fonter tilgjengelig, men på noen Unix / Linux grener det kan fortsatt være begrensninger.
  • dokumentasjonsdelen har blitt oppdatert! Helt siden den første 2,0 utgivelsen dokumentasjonen har vært langt bak, men vi har endelig klart å få det oppdatert. Det er fortsatt brikker mangler i docs, men det bør definitivt være nyttig for grunnleggende bruk samt en referanse for de fleste emner.
  • Application oppstartstiden ble forbedret med parallelizing konfigurasjonen lasting og ved å utsette igangsettelsen av de deler av konfigurasjon som ikke er nødvendig for den første vindusutstillingen.
  • Den fonetiske likheten finder analysator er fjernet fra hovedfordeling, noe som var ganske eksperimentell og fungerer mest som et bevis på konseptet og en forrett til fellesskapet for å lage mer avanserte matchende analysatorer. Du kan nå finne og installere den fonetiske likheten finder på ExtensionSwap.
  • Avbrutt eller errornous jobb håndtering ble forbedret og brukergrensesnittet reagerer mer korrekt ved å deaktivere knapper og fremdriftsindikatorer, hvis en jobb er stanset.
  • Fast noen mindre UI problemstillinger knyttet til bord dimensjonering og bruk av rullefelt.

Hva er nytt i versjon 2.1.1:

  • Ekstrautstyr:
  • Lagt til en søk / filtrering tekstfeltet på listen datalagre. Dermed kan du raskt finne datalageret hvis du har registrert flere datalagre enn tilgjengelig på skjermen.
  • Referansedata for landkoder ble satt til standard distribusjon, takk går til Graham Rhind for å gi disse.
  • Lagt til en vannrett rullefelt til dataene forhåndsvisning vinduer for det er mer enn 10 kolonner.
  • Mulighet for å legge til en utvidelse pakke med ny funksjonalitet i dialogboksen Alternativer under kjøring. Mer fokus på utvidelser vil følge i kommende utgivelser.
  • Vi har utsatt en tidlig forhåndsvisning av vår kommandolinjegrensesnitt (CLI) ved at du kan påberope applikasjonen med & quot; -Bruk & quot; parameter som vil vise CLI alternativer.
  • Lagt rekke formateringsalternativer til & quot; Konverter til Number & quot; transformator.
  • Bugfikses:
  • Fast en ut-av-minne problem når spørring tabeller med mye kolonner (150 +).
  • Fikset et problem som forårsaker & quot; Limit analyse & quot; sjekk boksen for å ikke bli kontrollert på riktig måte når en jobb ble gjenåpnet etter lagring.
  • Ikke egentlig en feilretting som det var aldri en offisiell funksjon, men nå støtter vi gjenopprette brukerinnstillinger (den userpreferences.dat fil) fra tidligere versjoner av DataCleaner.

Hva er nytt i versjon 2.1:

  • Det var mye arbeid utført på brukergrensesnittet ( se media side):
  • Vi bestemte oss for å fjerne venstre vinduet inneholder miljø konfigurasjonsmuligheter.
  • I stedet alle disse alternativene er nå flyttet til jobben bygningen vinduet slik at brukeren bare har til å fokusere på et enkelt vindu for alle interaksjoner som trengs for å bygge en jobb.
  • Dialogboksen velkommen / pålogging har også blitt fjernet til fordel for en mer diskret panel som kan trekkes inn eller skjult fra hovedvinduet.
  • Data utvalg og ledelse regnes som den første aktiviteten i programmet, og det er derfor det er også det første skrittet for å håndtere i hovedvinduet.











Skjermbilder

datacleaner-315902_1_315902.png
datacleaner-315902_2_315902.png
datacleaner-315902_3_315902.png

Lignende programvare

nflgame
nflgame

20 Feb 15

Amalgam
Amalgam

11 May 15

Yoyo-migrations
Yoyo-migrations

14 Apr 15

Aqua Data Studio
Aqua Data Studio

17 Feb 15

Annen programvare fra utvikleren -

StressLinux
StressLinux

19 Jun 16

Total.js
Total.js

10 Dec 15

GolfS
GolfS

29 Oct 15

IT Asset Tool
IT Asset Tool

2 Apr 18

Kommentarer til DataCleaner

Kommentarer ikke funnet
Legg til kommentar
Slå på bilder!