Sadržaj:
- Definicija - Što znači transformacija Burrows-Wheeler (BWT)?
- Techopedia objašnjava Burrow-Wheeler transformaciju (BWT)
Definicija - Što znači transformacija Burrows-Wheeler (BWT)?
Transformacija Burrows-Wheeler (BWT) algoritam je koji uzima blokove podataka, kao što su žice i preuređuje ih u nizove sličnih znakova. Nakon transformacije, izlazni blok sadrži iste točne podatkovne elemente prije nego što je započeo, ali razlikuje se u redoslijedu. Priroda algoritma obično postavlja slične znakove jedan pored drugog, što rezultirajući redoslijed podataka olakšava komprimiranje. Stoga se koristi u mnogim algoritmima kompresije.
Techopedia objašnjava Burrow-Wheeler transformaciju (BWT)
Algoritam transformacije Burrows-Wheeler relativno je novi algoritam koji su 1994. godine izumili Michael Burrows i David Wheeler, a zasnovan je na neobjavljenoj transformaciji koju je otkrio Wheeler 1983. godine, a objavljenoj u svom radu "Algoritam kompresije podataka bez gubitaka po blokovima".
Najosnovnije, BWT uzima niz podataka kao što je niz, dodaje EOF znak i zatim razvrstava sve rotacije tog niza u leksikografski red. Sljedeći pseudo kod ili koraci ilustriraju algoritam:
- Napravite tablicu koja sadrži retke koji predstavljaju sve moguće rotacije niza u jednom koraku.
- Poredajte sve redove po abecednom redu.
- Ispišite posljednji stupac tablice.
Na primjer: riječ „banana“; dodavanje EOF znaka pretvara ga u "banana $", a zatim primjenjujemo algoritam:
1. Napravite tablicu s retcima koji predstavljaju sve moguće rotacije:
banana $
Anana $ b
Nana $ ba
ana $ zabrana
na $ bana
od $ Banan
$ banane
2. Redove sortirajte abecedno / leksikografski na temelju prvog stupca:
$ banane
od $ Banan
ana $ zabrana
Anana $ b
banana $
Nana $ ba
na $ bana
3.Vratite posljednji stupac kao BWT izlaz: annb $ aa
Rezultirajući niz je lakše komprimirati, jer se ponavljani znakovi skupljaju jedan pored drugog. Ali trebaju biti dodatni podaci pohranjeni s transformiranim podacima kako bi se moglo izvršiti obrnuta transformacija. Iako su dobiveni transformirani podaci veći od izvornog oblika, ali se njegova karakteristika stisljivosti povećava višestruko, što u biti čini "besplatnom" metodom poboljšanja učinkovitosti metoda kompresije.
