Ako funguje komprimácia

Tento problém síce nesúvisí priamo s webovými stránkami, avšak myslím si, že môže byť pre niekoho zaujímavé pochopiť, ako približne funguje komprimácia. Ponúkam zjednodušený príklad.

Čo to je komprimácia

Určite to poznáte. Prípona .zip, .rar, .gz, .file. Dokonca aj .jpg a aj .mp3 sú komprimované formáty.

Komprimácia je spôsob, počas ktorého sa určité časti dát nahrádzajú zjednodušeným znakom. Toto šalamúnske vysvetlenie si uvedieme na príklade:

Predstavme si, že máme Bibliu a otvoríme v nej Evanjelium podľa Lukáša. Vyhľadáme si v celom Evanjeliu slovo „Ježiš“. Nájde nám ho 92 krát. Keby sme teda ručne prepisovali Evanjelium na pergamen, ako to robili mnísi pred tisíc rokmi, museli by sme 92 krát napísať slovo Ježiš. Čo sa však stane, ak by sme slovo Ježiš nahradili znakom, napríklad „@“? No ušetrili by sme pri každom výskyte slova Ježiš 4 znaky a namiesto 460 znakov by sme použili len 92 krát znak @. Takýmto spôsobom sme urobili vlastne komprimáciu textu. Výsledkom tohto procesu je výsledný text, ktorý je skrátený o niekoľko znakov.

Vyhľadajme teraz slovo „Mária“, nájdeme ho v danom text 11 krát. Nahraďme ho znakom „&“ a opäť ušetríme nejaké znaky a skrátime výsledný text.

No a takto nejako funguje aj komprimácia dát v počítači. Rozdiel je len ten, že počítač vie tieto operácie robiť expresne a obojsmerne, teda nie je žiaden problém pracovať s komprimovanými súbormi.

Existujú dve formy komprimácie – stratová a bezstratová komprimácia:

Stratová – výsledný súbor nie je zhodný s originálom, ale podobná sa na neho. To znamená, že ak máme obrázok, ktorý je celý čierny a v strede je maličká zelená čiarka, tak táto čiarka pri komprimácií zanikne. Dôjde tak k zníženiu kvality výsledného súboru. Vo zvukových súboroch sú zas vynechávané príliš vysoké a príliš nízke tóny, ktoré ľudské ucho aj tak nepočuje. Najznámejším reprezentantom sú súbory .jpg pre obrázky a .mp3 pre zvuky.
Bezstratová – výsledný súbor je zhodný s originálom, nedochádza k zníženiu kvality výsledného súboru. Veľkosť výsledného súboru, je, samozrejme, vyššia ako pri stratovej komprimácií.

V reálnom živote

V reálnom živote je to trošku zložitejšie, počítač totiž neskúma text po slovách, ani po písmenách, ale po bitoch. Teda komprimujú sa nie texty, ale bity. Keď počítač zaregistruje nejaký reťazec opakujúcich sa núl a jednotiek, napríklad 10110110, nahradí ho znakom. To je spôsob, akým sa dajú komprimovať aj ostatné súbory, ako napríklad obrázky, či zvuk. Samozrejme, existujú nejaké komprimačné algoritmy, ktorými sa počítače musia riadiť, v opačnom prípade by nebolo možné, aby Váš počítač previedol spätne súbor komprimovaný na mojom počítači.

Komprimačné programy a parametre

Na samotnú komprimáciu sa používajú tzv. komprimačné programy. Najznámejším je asi WinRar, ktorý sa dá zadovážiť aj zadarmo. Tento program dokáže komprimovať súbor, alebo odkomprimovať (extrahovať) existujúci komprimát. Komprimovaný súbor voláme zjednodušene „Archív“. Komprimovať možno aj viacero súborov naraz, alebo dokonca aj celé zložky.

Z parametrov je dôležitá najmä prípona súboru. Najčastejšie sa používa .zip a .rar. To sú také bežne používané archívy. Ak komprimujeme dáta z optického disku CD, DVD, BD a pod. väčšinou sa skomprimujú do súboru .iso. Obrázky väčšinou komprimujeme do formátu .jpg a zvuk zasa do .mp3

Kvalita konvertovaného súboru sa dá nastaviť v komprimačnom programe. Nastavuje sa pritom pomer medzi rýchlosťou a kvalitou. Vysoká kvalita komprimácie má za následok síce menšiu veľkosť výsledného súboru, ale trvá dlhšie. Rýchla komprimácia trvá síce krátko, ale výsledný archív nie je tak dokonale skomprimovaný a teda má väčšiu veľkosť v bitoch.

Na záver ponúkam porovnanie toho, ako vyzerá stratovo skomprimovaný high-resolution obrázok, ktorý je skonvertovaný na najvyššiu a najnižšiu kvalitu:
Nekvalitný: 18kB (najviac skomprimovaný)
Kvalitný: 108 kB (najmenej skomprimovaný)

Najnovšie články

HTML tagy, ktoré musíš poznať #3

V minulých dvoch článkoch (tu a tu) sme sa naučili základnú koncepciu značkovacieho jazyka HTML, ukázali sme si použitie vlastnosti (atribútov) jednotlivých HTML tagov a

Zanikne PHP?

Áno, do piatich rokov PHPčko zanikne. Zo všetkých ľudí sa stanú vegáni. Všetci do jedného budeme jazdiť na ekologických elektro vozidlách… V skutočnosti však  PHPčko

Nové projekty

Vodnefiltre

A je to tu! Najzložitejší e-shop môjho doterajšieho života bol úspešne spustený a je v plnej prevádzke a funkčný, dokonca už prijal aj niekoľko objednávok.

Ikry

Ďalší e-shopík, tentokrát som ale riešil len redesign existujúceho e-shopu, nakoľko funkcionalita už bola vytvorená. Ide o CBD e-shop s celkom širokým sortimentom.

Sarka

Vintage obchod s oblečením. Veraže sme sa dosť natrápili, ale napokon to všetko dobre dopadlo 🙂

Táto webstránka používa súbory cookies