Apache Parkett er en "søyle" data lagringsformat som ble spesielt opprettet for Apache Hadoop familie av prosjekter.
parkett anbefales å brukes med store data, hovedsakelig fordi den bruker et komplekst datakompresjonssystem, avhengig av en rekke optimalisert rekord shredding og re-montering algoritmer.
Dette gjør at data kan brytes ned, organisert i en nestet format, og settes sammen igjen når spørres.
Parkett formatet kan også brukes utenfor Hadoop økosystem, blir spesielt designet for å være så agnostiker som mulig, arbeider med alle typer databehandling rammeverk og datalagring modell.
< strong> Hva er nytt i denne versjonen:
- Gi nytt navn pakker og maven koordinater til org.apache
- Legg koding statistikk å ColumnMetaData
- Streaming sparsommelighet API
- Nye logiske typer
Hva er nytt i versjon 2.3.0:
- Gi nytt navn pakker og maven koordinater til org.apache
- Legg koding statistikk å ColumnMetaData
- Streaming sparsommelighet API
- Nye logiske typer
Begrensninger
- Prosjektet er fortsatt under utvikling i Apache Inkubator depotet og kan endre seg drastisk fra versjon til versjon.
Kommentarer ikke funnet