Sadržaj:
Streaming obrada podataka je područje u nastajanju. To znači da obrađuje podatke gotovo trenutno (s vrlo malim kašnjenjem) kada se generiraju. Do sada se većina obrada podataka temeljila na serijskim sustavima, gdje su obrada, analiza i odlučivanje bili odgođeni proces. Sada, kako se nove tehnologije i platforme razvijaju, organizacije se postupno preusmjeravaju na stream-based pristup, a ne na stare batch-based sustave. Apache Flink je projekt otvorenog koda za streaming obradu podataka. To pomaže organizacijama da rade analize u stvarnom vremenu i donose pravovremene odluke.
Webinar: Stajanje na rubu: strujanje analitike u akciji Registrirajte se ovdje |
Što je Apache Flink?
Apache Flink može se definirati kao platforma otvorenog koda koja je sposobna za obradu distribuiranih tokova i batch podataka. Jezgra Apache Flink je mehanizam za strujanje podataka koji podržava komunikaciju, distribuciju i toleranciju grešaka za obradu distribuiranih podataka. Apache Flink jedina je hibridna platforma koja podržava i serijsku i strujnu obradu. Podržava različite slučajeve upotrebe koji se temelje na obradi u stvarnom vremenu, projektima strojnog učenja, grupnoj obradi, analizi grafova i drugima.
Flink se sastoji od sljedećih komponenti za stvaranje stvarnih aplikacija, kao i za podršku strojnom učenju i obradi grafikona: