Sadržaj:
Definicija - Što znači Apache Avro?
Apache Avro je okvir za serializaciju podataka i poziv poziva na daljinu koji je razvijen u okviru projekta Apache Hadoop gdje pruža i oblik serializacije za dobivanje trajnih podataka i žičan format za pružanje komunikacije između Hadoop čvorova, kao i povezivanje klijentskog programa s Hadoop-om usluge.
Avro koristi JSON format za definiranje protokola i vrsta podataka, kao i serializira podatke u kompaktni binarni format.
Tehopedija objašnjava Apača Avro
Apache Avro je veliki okvir za serijsku obradu podataka koji proizvodi podatke u kompaktnom binarnom formatu koji ne zahtijeva generiranje koda ili proxy objekte.
Koristi se kao komponenta za serijsku obradu podataka za Apache Hadoop. Avro radi na konceptu shema. Kad se čitaju Avrovi podaci, shema koja je korištena tijekom pisanja tih određenih podataka uvijek je prisutna.
To omogućava svakom skupu podataka bez režijskih vrijednosti, što čini seriju brzom i relativno malom. Budući da se podaci i njihova shema potpuno opisuju, to ga čini jednostavnim za upotrebu s dinamičkim jezicima skripta.
Kad su podaci Avro pohranjeni u određenoj datoteci, shema se također pohranjuje s njima da bi ih kasnije drugi program obradio. Dakle, ako program koji čita podatke očekuje drugu shemu, onda se to lako može riješiti jer su obje sheme prisutne.
Avro pruža:
Kompaktan i brz format binarnih podataka
Bogate strukture podataka
Datoteka spremnika za pohranu trajnih podataka
Poziv na daljinski postupak (RPC)
Integracija s dinamičnim jezicima
Stvaranje koda nije uvjet za čitanje ili pisanje datoteka podataka ili za upotrebu ili primjenu RPC protokola.