-
Data: 2022-10-15 10:59:16
Temat: Re: Kopia dysku
Od: Mateusz Viste <m...@x...invalid> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]2022-10-15 o 00:31 GMT, Marcin Debowski napisał:
> > A kiedy będziesz potrzebował któregoś z tych obrazów dd, to albo
> > wyciągasz go BORGiem na serwerze (a dalej tradycyjnie, na dyskietce
> > czy co tam używasz), albo montujesz BORGa FUSE-em i eksportujesz
> > zasób NFSem lub inną Sambą.
>
> A ta kompresja to jest na poziomie bloków jakiegoś wewnętrznego
> systemu plików, skoro, jak napisałeś gdzieindziej, zmiana w dużym
> pliku nie oznacza jego nowej, pełnej kopii?
Nie tyle w wewnętrznym "systemie plików", co w sposobie, w jaki BORG
trzyma dane (tj. formacie swojej bazy danych). Przy czym sama kompresja
tak naprawdę niewiele daje. Dużo bardziej interesująca jest
deduplikacja. Kiedy masz dwa pliki, których zawartość pokrywa się np. w
90%, to BORG potrafi to wykryć i zapisuje 90% ich zawartości tylko raz.
Masz natomiast rację w tym, że jest to podejście blokowe, poniekąd
podobne zresztą do tego, które znamy z torrentów. Deduplikacja działa
tak, że BORG każdy plik dzieli na bloki. Dla każdego bloku oblicza hash
i taką parę HASH=BLOK sobie zapisuje w swojej bazie. Jeśli widzi, że
hash o takiej wartości już wcześniej wystąpił, to nie zapisuje go
kolejny raz, tylko trzyma odnośnik do niego. Co istotne: nieważne, czy
blok pochodzi z tego samego pliku, czy z dwóch różnych, czy nawet z
różnych źródeł lub różnych okresów backupu: BORG trzyma go tylko raz.
Czyli jeśli mam gigabajtowy plik wideo, który sobie skopiuję na dysk
pod inną nazwą, potem wyślę na laptop żony, i dodatkowo zapiszę na
domowym NASie, to po backupach tych trzech komputerów w bazie BORGa
plik nadal będzie zapisany tylko raz, a nie 4x jak to miałoby miejsce
przy konwencjonalnym podejściu.
Do tego deduplikacja zachodzi już na kliencie, czyli zamiast wysyłać
całość danych do serwera backupowego, klient BORGa wysyła mu listę
znalezionych plików, i dla każdego pliku listę bloków (hashy), z
których się składa. Serwer wówczas pyta tylko o te bloki, których
jeszcze nie zna, dzięki czemu wysyłamy relatywnie mało danych (dużo
mniej, niż wysłałby rsync).
BORG daje też fajny podgląd na to, jak skuteczny jest każdy z etapów.
Tutaj przykład obecnego stanu mojego repo:
----------------------------------------------------
--------------
Original size Compressed size Deduplicated size
All archives: 2.32 TB 1.87 TB 110.30 GB
Unique chunks Total chunks
Chunk index: 575'596 12'846'752
----------------------------------------------------
--------------
Takie repo można zamontować (read-only) borgfs-em, wówczas użytkownik
widzi normalną strukturę katalogów, a borgfs zajmuje się w tle
odpowiednim mapowaniem danych.
Mateusz
Następne wpisy z tego wątku
- 16.10.22 11:15 Marcin Debowski
- 20.10.22 09:28 Adam
- 20.10.22 12:10 heby
Najnowsze wątki z tej grupy
- Podłączenie DMA 8257 do 8085
- pozew za naprawę sprzętu na youtube
- gasik
- Zbieranie danych przez www
- reverse engineering i dodawanie elementów do istniejących zamkniętych produktów- legalne?
- Problem z odczytem karty CF
- 74F vs 74HCT
- Newag ciąg dalszy
- Digikey, SN74CBT3253CD, FST3253, ktoś ma?
- Szukam: czujnik ruchu z możliwością zaączenia na stałe
- kabelek - kynar ?
- Podnieść masę o 0.6V
- Moduł BT BLE 5.0
- Pomiar amplitudy w zegarku mechanicznym
- ale zawziętość i cierpliwość
Najnowsze wątki
- 2025-01-08 Warszawa => Programista Full Stack .Net <=
- 2025-01-08 Podłączenie DMA 8257 do 8085
- 2025-01-08 Warszawa => System Architect (background deweloperski w Java) <=
- 2025-01-08 Warszawa => Solution Architect (Java background) <=
- 2025-01-08 Wrocław => Application Security Engineer <=
- 2025-01-08 Warszawa => International Freight Forwarder <=
- 2025-01-08 Mińsk Mazowiecki => Area Sales Manager OZE <=
- 2025-01-08 Lublin => Inżynier Serwisu Sprzętu Medycznego <=
- 2025-01-08 Bieruń => Spedytor Międzynarodowy (handel ładunkami/prowadzenie flo
- 2025-01-08 Gliwice => Business Development Manager - Network and Network Security
- 2025-01-08 Warszawa => Spedytor Międzynarodowy <=
- 2025-01-07 Aero2
- 2025-01-06 odbiornik GPS z kablem USB
- 2025-01-07 Oszczędzanie nie jest łatwe
- 2025-01-07 Warszawa => Java Developer <=