RÄD

Backup vs RAID

Backup vs RAID
Säkerhetskopior är en viktig del av vårt digitala liv. Varje dator från gigantiska databaser till en enda persondator eller mobil enhet behöver säkerhetskopieras. En plats där de mest relevanta användardata kan lagras under lång tid och också lagras på ett sådant sätt att de kan återställas i nödtiden. Vi kan göra en åtskillnad mellan uppgifterna i vårt nuvarande system, låt oss kalla det live data, och den backade upp data. Det senare lagras bort från det nuvarande systemet som använder live-data.

RAID, handlar om levande data, det är en mekanism med vilken ett löpande system kombinerar flera skivor till en enda lagringsenhet. Data sprids sedan över alla skivor på ett sådant sätt att de kan överleva misslyckandet hos minst en (eller flera) av de fysiska skivorna. Den enklaste typen av RAID-array är RAID1 eller spegling. Det är här du kopierar (eller speglar) samma data över två eller flera skivor så att om en av skivorna misslyckas kan data fortfarande överleva och fortfarande användas aktivt. Det finns också andra RAID-konfigurationer, och vi kommer att diskutera dem när vi går vidare.

Om RAID

RAID, eller Redundant Array of Inexpensive Disks, är en mekanism för att lagra data över diskar. Det finns ett brett "utbud" av RAID-inställningar som du kan gå med, men de två grundläggande mekanismerna som alla är baserade på är följande:

1. Spegling:

Spegling innebär att dina datablock kopieras, speglas, över flera diskar. Om du speglar dina data över tre skivor kan du överleva upp till två skivor som misslyckas vid varje given tidpunkt, de misslyckade skivorna kan sedan ersättas med nya utan mycket krångel. På samma sätt om du kopierar data över n + 1 skivor, du tål upp till n skivor misslyckas. Nackdelen med detta är att du bara får lagringskapaciteten lika med den minsta disken i din RAID-array.

2. Paritet:

Ett andra tillvägagångssätt är att dela upp dina data i två delar, med de två användarblocksblocken kan du skapa ett tredje "paritetsblock". De tre blocken har alla samma storlek och är spridda över olika enheter. Minst tre enheter är nödvändiga för att denna konfiguration ska fungera. Om någon av disken misslyckas kan du återskapa blocken som är lagrade på den disken med de andra två blocken. Till exempel, om det andra användarblocket går förlorat kan det första blocket och paritetsblocket användas för att beräkna det andra användarblocket. Om du är intresserad av hur detta fungerar, kolla in den här underbara förklaringen.

Denna metod kan förbättras ytterligare för att ha 2 eller till och med 3 paritetsblock. Men mer än 3 paritetsblock ses inte så ofta i branschen. Om du har ett paritetsblock kan du överleva ett diskfel. Två paritetsblock innebär att du kan motstå att två skivor misslyckas och så vidare.

Det är mer effektivt när det gäller lagringsutnyttjande än spegling. Om du har ett paritetsblock behöver du bara 50% mer fysisk lagring per faktisk användardata som du lagrar. Det betyder att lagra 1 GB data du behöver 1.5 GB lagringsutrymme (plus att det finns en liten kostnad för metadata). Detta är mycket effektivare än till och med det mest effektiva speglingsschemat där du behöver minst 2 GB lagringsutrymme för att spegla 1 GB data mellan två diskar.

Nackdelen är att slumpmässiga skrivoperationer kommer att sakta ner tack vare den extra biten av beräkning och skrivoperation associerad med paritetsblocket. Tillförlitligheten är inte lika bra som en n + 1 speglade diskar där du kan förbereda dig för valfritt antal diskar som misslyckas.

RAID-konfigurationer kan vara så komplexa eller så enkla som du vill att de ska vara, du kan kombinera paritets- och speglingsstrategier och ändra dem efter företagets önskemål. Det finns dedikerade RAID-styrenheter som du ansluter dina fysiska diskar till, och operativsystemet ser sedan en enda logisk disk som visas av styrenheten. LSI är en sådan leverantör av RAID-kontroller. Du kan också utföra RAID i programvaran OpenZFS är förmodligen den bästa satsningen du har på det avseendet.

En sista typ av RAID, som får ett hedervärt omnämnande är RAID 0. Tekniskt sett är det inte ett RAID-system, för det finns ingen redundans involverad här. Tanken bakom RAID 0 är att helt enkelt sprida dina data över flera lagringsenheter utan några motståndskraft mot diskfel. Fördelen är att du får prestandaförbättringar genom att göra detta. Om du skriver 1 GB data till en enda disk är processen långsam. Skivan kan bara göra ett begränsat antal skrivoperationer per sekund och ditt operativsystem måste vänta tills det är klart innan operationen skickas till sin väg. Om du sprider samma 1 GB data över två sådana skivor, kan du skriva (och läsa) från dem båda samtidigt och få en hel del prestandaförbättring.

Back Ups

Begreppet säkerhetskopior är diskutabelt viktigare än RAID. En säkerhetskopia, i samband med lagringshantering, är en känd bra kopia av data från en viss tidpunkt, från vilken du kan återställa filer tillbaka till ditt huvudsystem vid behov. När det gäller implementering finns det många molnhostade lösningar och många offline-lösningar som också kan användas.

Tarsnap och Backblaze är mina favorithanterade säkerhetskopieringstjänster för både privata och företagsanvändningsfall. Du kan också inkludera Google Drive, iCloud eller Dropbox i denna definition av a säkerhetskopiering lösning men de riktas mer mot konsumentmarknaden än företaget. Den underliggande principen är dock fortfarande densamma. När du loggar in på en ny iPhone eller iPad synkroniseras alla data, dina kontakter, foton, mediebibliotek etc från ditt iCloud-konto sömlöst och när du fortsätter att använda enheten blir de nyare data tyst backade in i molnet och du don ' Jag behöver inte oroa dig för det.

Din säkerhetskopieringslösning kan vara så enkel som att kopiera data till en extern hårddisk eller att använda rsync (eller zfs send, om du använder OpenZFS) för att regelbundet generera en kopia av all relevant information. Detta kan inkludera din dokumentmapp, din databas, ditt källförråd eller till och med hela ditt rotfilsystem splatras i en platt zip eller en tarball. De viktiga kriterierna som en bra reservlösning ska uppfylla är följande:

  1. Säkerhetskopior bör förekomma ofta - Om du säkerhetskopierar data varje månad istället för varje vecka riskerar du att förlora upp till en månads värde av data när katastrofen inträffar.
  2. Dina säkerhetskopior ska gå tillbaka i tiden - Säkerhetskopieringen är begränsad. Ibland måste du kasta bort äldre säkerhetskopior. Ju mer lagringsutrymme du har, desto bättre kan dina säkerhetskopior vara. Antag att du säkerhetskopierar dina data varje vecka, men kastar säkerhetskopior som är äldre än 2 veckor. Om en fil av misstag raderas och detta går obemärkt förbi i två veckor, har du inget sätt att ta tillbaka den.
  3. Dina filer borde faktiskt vara återställbara - Om du aldrig har försökt återställa dina data från säkerhetskopian har du ingen säkerhetskopia. Du borde inte behöva lära dig att återställa data vid den kritiska tidpunkten när du drabbades av dataförlust. Planera framåt och vet hur du återställer systemet från den senaste kända säkerhetskopian.
  4. Din säkerhetskopia ska separeras från det löpande systemet - När katastrofen inträffar och alla dina filer på produktionsservern krypteras, raderas eller skadas måste du se till att detsamma inte händer med din säkerhetskopia. Ett bra sätt att säkerställa detta är att se till att din reservenhet inte är "ansluten" till din produktionsmiljö, dvs.koppla ur USB-hårddisken, koppla bort ditt NFS-filsystem när du är klar med säkerhetskopiering. Åtminstone, ge inte produktionssystemet privilegiet att skriva över eller ändra dina säkerhetskopieringsdata. Gör det skrivskyddat.

Nu när vi vet lite om både RAID och backup, låt oss markera några skillnader mellan dem.

Filer och block

RAID handlar alltid om datablock, inte hur filsystemet presenterar dessa data för användaren. Både mjukvara och hårdvara RAID hanterar data som informationsblock, storleken på block kan variera från 128 KiB till 1 MiB.

Säkerhetskopior är å andra sidan mycket mer flexibla. De utförs vanligtvis på filsystemnivå, även om det inte finns någon hård och snabb regel för att detta ska vara fallet. De är också mer detaljerade. Du kan återställa en enda fil från din säkerhetskopia, om din lösning är tillräckligt flexibel. RAID-matriser är inte säkerhetskopior, de är bara ett sätt att sprida data över flera diskar. Om en fil raderas frigörs alla speglade block och paritetsblock. Slutet av berättelsen.

Använd fall

Säkerhetskopior är för alla. Tillvägagångssättet och omfattningen kan variera från personligt bruk till företag, men alla med ett digitalt liv behöver säkerhetskopiering. RAID är mer en affärs- / företagsspecifik funktion. Du ser RAID-matriser i servrar, lagringsenheter som NAS och SAN, moln hypervisorer, etc. Nästan alla ställen som lagrar kritisk data använder någon form av RAID. Även servrarna som kör dina molnhostade säkerhetskopior använder förmodligen RAID-matriser. Dessa är inte uteslutande tekniker.

Detta betyder inte att du inte kan använda RAID för ditt personliga fall, det har bara mer nytta i företagen. En del av anledningen bakom detta är att i företaget bultas diskar med IO-operationer 24/7. I produktionsmiljön, som lagring av en databas- eller videostreamingtjänst eller en molnhypervisor, kommer lagringsenheten på din server under konstant obehaglig belastning, data läses hela tiden från och skrivs till dessa enheter och ofta av flera applikationer samtidigt. Under dessa förhållanden är det mycket mer troligt att dina enheter misslyckas. Att ha en RAID-konfiguration betyder att om en enhet misslyckas får du lite eller ingen stilleståndstid. De flesta servrar kan fortsätta att fungera även efter ett diskfel så att du inte förlorar ny information och förfrågningar som kommer in varje sekund.

En genomsnittlig stationär dator kan knappast återskapa samma stressiga tillstånd, även om disken dör, om du använder en säkerhetskopieringslösning som Backblaze, kan du hämta de flesta av dina förlorade data och att förlora några timmars arbete är förmodligen det värsta som kan hända. Även detta blir en sällsynthet tack vare molnhostade lösningar som Adobe Creative Cloud, Office 365, etc.

RAID är inte en ersättning för Backup

Om det finns en enda take-away du vill ha från den här artikeln, borde det vara den här. RAID är INTE en ersättning för Backup. Säkerhetskopiera alltid dina data! Det finns många människor där ute som tror att om du har RAID, betyder det att data är säkra över flera diskar och det finns därför ingen anledning att säkerhetskopiera. Ingenting är längre ifrån sanningen. RAID är tänkt att hantera en enskild specifik fråga - skivorna misslyckas eller ger tillbaka felaktiga data. Att ha RAID skyddar dig inte från en miljon andra hot som följande:

  1. Användarfel och oavsiktlig radering
  2. Program- eller OS-buggar som orsakar utbredd dataskada
  3. Ransomware eller annan skadlig kod som krypterar, tar bort eller skadar dina data
  4. Fel på RAID-kontroller själva

Data i din RAID-array är live. Om operativsystemet, en applikation (eller en användare) går haywire och tar bort några filer här och där kommer filen att raderas över hela din RAID-array. Att ha en separat kopia av dina data, en säkerhetskopia, är det enda sättet du någonsin kan skydda dig mot denna typ av scenario.

Slutsats

Om du är orolig för dina data bör din första oro vara backup-lösning. De flesta stationära användare, utom kanske kraftanvändare, borde investera mer i en tillförlitlig säkerhetskopia istället för att fitta med RAID1, RAID5 eller RAIDZ. Om du vill bygga din egen säkerhetskopieringsserver måste du tänka på en anständig säkerhetskopieringspolicy och en pålitlig lagringsbackend. Den här artikeln kanske ett bra ställe att börja. Du kan använda rsync eller zfs skicka för att ta periodkopia av dina data till denna backend.

Om du är i företaget och överväger en RAID-lösning för att lagra all din live-data. Överväg att använda OpenZFS, det erbjuder en mycket flexibel lösning, allt från n-disk spegling till RAIDZ1 med ett paritetsblock till RAIDZ2 och RAIDZ3 med 2 och 3 paritetsblock. Du måste överväga mycket om din ansöknings krav innan du fattar ett beslut. Det finns avvägningar mellan dina läs- och skrivföreställningar, motståndskraft och lagringseffektivitet. Jag skulle dock rekommendera att du bara tänker på RAID efter att du har bestämt dig för en reservlösning.

Topp 5 spelinspelningskort
Vi har alla sett och älskat streaming av spel på YouTube. PewDiePie, Jakesepticye och Markiplier är bara några av de bästa spelarna som har tjänat mil...
Hur man utvecklar ett spel på Linux
För ett decennium sedan skulle inte många Linux-användare förutsäga att deras favoritoperativsystem en dag skulle vara en populär spelplattform för ko...
Portar med öppen källkod för kommersiella spelmotorer
Gratis, öppen källkod och plattformsmekaniska rekreationer kan användas för att spela gamla såväl som några av de ganska senaste speltitlarna. I den h...