Dom baze podataka Što je apache lucene? - definicija iz tehopedije

Što je apache lucene? - definicija iz tehopedije

Sadržaj:

Anonim

Definicija - Što znači Apache Lucene?

Apache Lucene projekt je otvorenog koda za visoku izvedbu i potpuno opremljenu biblioteku teksta za tražilice koji je u cijelosti napisan Java.

Može pretraživati ​​tekst u dokumentima, pa je to tehnologija koja je pogodna za bilo koju aplikaciju koja zahtijeva ovu značajku, posebno ako je riječ o više platformi.

Prvi put ga je razvio Doug Cutting 1999. godine i službeno je postao dio Jakarte obitelji Apache fondacije otvorenog koda Java projekata u rujnu 2001. godine. Nadograđen je na vrhunski Apache projekt u veljači 2005. godine.

Tehopedija objašnjava Apache Lucene

Apache Lucene je pretraživač visoke performanse s konceptom "dokumenta koji sadrži polja teksta" u svojoj temeljnoj logičkoj arhitekturi. To nudi veliku fleksibilnost i omogućuje da lucenski API postane neovisan od bilo kojeg formata datoteke.


Bilo koji tekst formata kao što su MS Word, HTML, XML, PDF i OpenDocument može se indeksirati sve dok se tekstualne informacije mogu izdvojiti, što znači da sa slikama ne može ništa.


Lucene je pogodan za bilo koju aplikaciju koja treba cjelovitu indeksiranje teksta i mogućnost pretraživanja, ali nadaleko je prepoznata kao izvrstan alat za primjenu internetskih pretraživača i za lokalno pretraživanje na jednom mjestu.


Značajke uključuju:

  • Skalabilno i visoko performansno indeksiranje - može obraditi preko 150 Gb na sat na modernom hardveru i zahtijeva samo 1 Mb po hrpi zahtjeva za memorijom.
  • Snažni, precizni i učinkoviti algoritmi pretraživanja - nude mnoge vrste snažnih upita poput fraze, zamjenskih znakova, blizine i raspona upita. Također je izvršeno pretraživanje i razvrstavanje po bilo kojem polju.
  • Cross platforma - čista Java provedba i dostupna je i na drugim programskim jezicima.
Što je apache lucene? - definicija iz tehopedije