Bacula.pl

- rozwiązanie kopii zapasowych dla wymagających
Kategorie: WSZYSTKIE Newsy Artykuły Blog

Współczynnik kompresji dla napędów taśm magnetycznych

3 luty 2013, autor: Marcin Haba (gani),

news

Jednym z parametrów, podawanych w specyfikacji napędu taśm magnetycznych, jest współczynnik kompresji. W tym wpisie chciałbym szerzej wyjaśnić, co kryje się pod terminem tegoż współczynnika oraz to, jaki wpływ ma on na działanie napędu taśmowego w codziennej pracy z programem wykonującym kopie zapasowe.

Współczesne napędy taśm magnetycznych charakteryzują się zdolnością kompresji danych zapisywanych na nośnik taśmowy. Kompresja taka nazywa się kompresją sprzętową. W odróżnieniu od kompresji programowej, kompresja sprzętowa nie zużywa zasobów CPU. Uniezależnienie to wynika z tego, że napęd taśm magnetycznych z funkcjonalnością kompresji wyposażony jest moduł elektroniczny, który realizuje kompresję zapisywanych danych. Kompresowanie danych przez napęd taśmowy odbywa się “w locie”, bez dodatkowego narzutu czasowego samej kompresji.

Współczynnik kompresji sprzętowej

Producenci napędów taśmowych w specyfikacjach swoich produktów podają “siłę” kompresji poprzez współczynnik kompresji. Wyrażony jest on w postaci proporcji ilości danych poddawanych kompresji do ilości danych po kompresji. Jeśli więc współczynnik kompresji napędu taśmowego wynosi 2:1 (dwa do jednego), w teorii oznacza to, że przy zapisie np. 2GB danych poprzez taki napęd wynikowo ilość skompresowanych danych zapisanych na nośnik powinna wynieść 1GB. To tyle z teorii.

W praktyce współczynnik kompresji zazwyczaj nie przekłada się ściśle na ilość skompresowanych danych zapisanych na nośnik, ponieważ producenci napędów taśm podają współczynnik kompresji zakładając idealne warunki kompresji. Mam tu na myśli typy danych poddawanych kompresji. Jak ogólnie wiadomo, niektóre typy danych są lepiej kompresowane, a inne nieco gorzej lub prawie wcale. Przykładem danych dobrze kompresowalnych mogą być np. pliki tekstowe czy też inne formaty plików, które nie są kompresowane programowo. Natomiast danymi słabo kompresowalnymi są np. różne rodzaje plików multimedialnych (MP3, AVI itp.) lub inne typy plików wcześniej poddane kompresji programowej.

Ile danych zmieści się na mojej taśmie magnetycznej?

To pytanie wymaga wyjaśnienia różnicy pomiędzy dwoma typami pojemności taśm magnetycznych, które podawane są na opakowaniach taśm. Pierwszą z nich - zazwyczaj pisaną dużą czcionką - jest pojemność taśmy przy użyciu kompresji sprzętowej. Drugą pojemnością - często podawaną małą czcionką - jest pojemność rzeczywista. Ta ostatnia nazywana jest natywną pojemnością taśmy. Tym sposobem na taśmach magnetycznych znaleźć można dwie pojemności taśmy. Oto przykład dla taśmy typu LTO-2:

400GB/200GB

Obydwie pojemności mają ścisłą zależność z współczynnikiem kompresji. Jeśli podzieli się pojemność skompresowanych danych (w powyższym przykładzie będzie to 400GB) przez pojemność natywną (w powyższym przykładzie to 200GB) to otrzyma się współczynnik kompresji dla tego typu taśm (400/200 czyli 2:1).

W tym miejscu chciałbym uściślić fakt podawania na taśmach magnetycznych pojemności dla kompresowanych danych i pojemności rzeczywistej taśmy. Taśmy magnetyczne same w sobie nie posiadają możliwości kompresji. Taką właściwość posiada napęd taśm, a nie taśma. Taśma magnetyczna nie rozróżnia tego, czy zapisywane są na nią dane skompresowane czy też dane nieskompresowane.

Prędkość zapisu danych napędu taśm z włączoną kompresją sprzętową

Na koniec kilka zdań o wpływie kompresji sprzętowej na prędkość zapisu na nośnik taśmowy. Na początku wspomniałem o tym, że kompresja realizowana przez napęd taśm wykonywana jest “w locie”, bez narzutu czasowego. Ten fakt ma wpływ na to, że (pozornie) napęd taśmowy również może charakteryzować się dwoma prędkościami zapisu - prędkość zapisu przy użyciu kompresji sprzętowej oraz prędkość zapisu bez użycia kompresji. Jeśli, przy współczynniku kompresji 2:1, prędkość zapisu bez użycia kompresji wynosi 40MB/s, to przy zapisie z kompresją wyniesie ona 80MB/s. W rzeczywistości w tym przykładzie większość napędów taśmowych będzie zapisywać dane z prędkością 40MB/s. Dzieje się tak za sprawą tego, że napędy taśm projektowane do zapisu ze stałą prędkością potrafią zapisywać dane na taśmach wyłącznie z jedną stałą prędkością. Napęd taśm w omawianym przykładzie w ciągu sekundy zapisze 40MB. Jeśli dane będą skompresowane, to z punktu widzenia aplikacji kopii zapasowych (oraz jej użytkownika) może wyglądać to tak, że zapisuje on dane z prędkością 80MB/s, gdyż aplikacja w ciągu sekundy podaje 80MB. Te same 80MB po (idealnym) skompresowaniu “w locie” danych dla współczynnika kompresjjsi 2:1 będzie miało rozmiar 40MB i ta ilość danych trafi na taśmę. Podsumowując, przy zastosowaniu kompresji sprzętowej napęd taśm może przyjmować więcej danych, które ulegają kompresji i zostają zapisane ze stałą prędkością rzeczywistą na taśmę magnetyczną.

W rozpatrywanym powyżej przykładzie z zapisem 80MB danych na taśmę magnetyczną przy współczynniku kompresji 2:1 założyłem idealne warunki kompresji (bardzo dobrze  kompresowalne dane). W rzeczywistości zależność pomiędzy prędkością przyjmowania danych przez napęd, a współczynnikiem kompresji jest dokładnie taka sama jak w omawianym w niniejszym wpisie przypadku zależności współczynnika kompresji a pojemności taśmy - czyli im bardziej kompresowalne dane, tym lepsze osiągi zapisu danych.

Kończąc wpis i zarazem podsumowując zagadnienie współczynnika kompresji chciałbym uczulić Cię, drogi czytelniku, na różnicę pomiędzy teoretycznym współczynnikiem kompresji, jaki podają producenci, a rzeczywistymi osiągami napędu taśm w warunkach zapisu różnego typu danych.

Ta strona używa plików cookies (niezbędnych do prawidłowego działania oraz analitycznych). Odmów Wybierz ciasteczka Zezwól na wszystkie (więcej informacji)