Att underhålla din webbplats innebär att ha en dedikerad säkerhetskopieringsstrategi. Även om säkerhetskopior är viktiga, är de inte det enda sättet att bevara din webbplats. Den naturliga förlängningen av en säkerhetskopiering är att arkivera en webbplats – men de är kompletterande processer.

Det finns flera flexibla sätt att arkivera en webbplats. Den goda nyheten är alla är användarvänliga och lättillgängliga. Du behöver bara välja rätt lösning för dina behov och krav.

I det här inlägget tar vi en titt på hur du arkiverar en webbplats. Vi kommer också att utforska olika arkiveringstyper som du kan stöta på, lista några av de mest framträdande webbplatsarkiveringsverktygen och diskutera några tips för att arkivera din webbplats.

En introduktion till webbplatsarkivering

Arkivering av en webbplats innebär att innehåll, data och media bevaras för framtida referens. Med hjälp av en dedikerad tjänst som Wayback Machine (och vi kommer till andra lösningar senare) kan du se äldre versioner av en webbplats.

Hur Kinstas webbplats såg ut 2015 - vi har kommit långt!

Hur Kinstas webbplats såg ut 2015 – vi har kommit långt!

teknisk nivå tar sökrobotar ögonblicksbilder av en webbplats, vilket utgör själva arkivet. Du kan komma åt det med en enkel kalender och se varje iteration i ett tidslinjeformat om du vill.

Wayback Machines kalenderarkiv för Kinstas webbplats.

Wayback Machines kalenderarkiv för Kinstas webbplats.

För att förstå varför lösningar som Wayback Machine finns måste vi gå tillbaka till början av 2000-talet. Dot-com-bubblan var på väg att spricka, många företag gick under. Några populära webbplatser stängdes eller övergavs med få minnen kvar.

Precis som andra medieformat innan internet, såsom musik och tv, hade dessa webbplatser historiskt och nostalgiskt värde. Att spara dem innebar att ge framtida internetanvändare en glimt av hur långt vi kommit från tidigare teknik.

The Internet Archive lanserade Wayback Machine för att hjälpa till att bevara webbplatser. Om en webbplats har arkiverats där kan du se hur en webbplats har utvecklats genom åren.

Många sökrobotar krävs för att arkivera en webbplats, inklusive stora enskilda genomsökningar som kan ta år att göra. Det grovarbete som behövs för att utföra genomsökningsexpeditioner och spara de resulterande ögonblicksbilderna är enormt.

Wayback Machines första 100 TB-server togs till exempel i drift år 2004. I slutet av 2020 hade Wayback Machine lagrat över 70 petabyte (PB) av data. Det är över 70 000 terabyte (TB).

Men inte alla är bekväma med det arbete Internet Archive gör. Det har förekommit flera diskussioner och juridiska utmaningar baserade på huruvida ett arkiv av en webbplats bryter mot upphovsrättslagar.

Ändå, med tanke på den stora tillväxten i antalet arkiv som lagras, finns det en tydlig önskan att bevara webbplatser.

Redo att arkivera din webbplats? 👀 Goda nyheter: det är en någorlunda användarvänlig process. 😄 Den viktigaste delen är att välja rätt lösning för webbplatsens behov och krav. Se alla alternativ här ⬇️Click to Tweet

Varför du borde arkivera en webbplats

Det finns gott om skäl för att vilja arkivera en webbplats, annat än bara nostalgiska skäl. För en verklig analogi, titta på GitHub.

GitHubs infrastruktur är ungefär som ett internetarkiv.

GitHubs infrastruktur är ungefär som ett internetarkiv.

Github lagrar arkiv av projekt, tillsammans med varje sparning som gjorts. För att jämföra detta med internetarkivering representerar GitHub-arkiven hela arkivet, och sparningarna är ögonblicksbilderna.

På samma sätt som Gits arkiv är värdefulla, så är internetarkiven också det. Du kan till exempel titta på tidigare iterationer på din webbplats – till och med från många år sedan – för att påverka dina nuvarande designval.

Du kan också vara juridiskt skyldig att arkivera din webbplats, särskilt om du är i den finansiella eller juridiska branschen.

Slutligen, om du oturligt nog blir inblandad i tvister kring din webbplats kommer dina arkiv att vara värdefulla bevis. Om du kan presentera tydliga och kompletta webbplatsarkiv kan du lösa tvister redan innan domstolarna blir inblandade.

Skillnaden mellan säkerhetskopior och arkivering

Innan vi pratar om de olika typerna av webbarkivering som finns tillgängliga är det värt att komma tillbaka till ett ämne vi berörde tidigare. På papper kan en säkerhetskopiering och ett arkiv av en webbplats se likadana ut. De utför dock olika jobb som kompletterar varandra. Kortfattat:

Det är värt att notera att arkivering inte är gjort för att helt ignorera databevarande ansträngningar. En av fördelarna är faktiskt att låta användarna navigera på din webbplats som om den vore levande. Trots det, med tanke på att webbplatser som Wayback Machine finns som ett virtuellt minne, krävs det högre prioritet att hålla de visuella elementen intakta än att bevara backend-funktionaliteten.

Kort sagt, du behöver använda både säkerhetskopior och arkiv för din webbplats – den förra som dagligt skydd om det värsta händer och den senare som ett extra sätt att dokumentera utvecklingen av din webbplats.

De olika typerna av webbarkivering som du kommer att stöta på

Webbarkivering finns i flera olika sorter. Det finns några olika typer du kommer att stöta på. Här går vi igenom dem allihop:

För enkla webbplatser med statiska data och en organiserad arkiveringsstrategi bör det räcka med arkivering på klientsidan. De flesta andra webbplatser kommer dock att ha mer fördel av arkiv på serversidan – transaktionsbaserad arkivering är inte nödvändigt för de flesta webbplatser.

Slutligen – och vi kommer att diskutera detta mer detaljerat under hela inlägget – bör du också överväga var och hur dina arkiv förvaras. Ett lokalt arkiv är till exempel inte ett dåligt val, men det kan försvinna om du får fel på din dator. Å andra sidan har du mindre kontroll över vad som arkiveras om du väljer en tredjepartslösning.

Som du kan förvänta dig är svaret här att använda ett mångfacetterat tillvägagångssätt för att arkivera en webbplats. Vi föreslår att du behandlar arkiv som säkerhetskopior: håll tre olika kopior på separata platser och synkronisera dem på något sätt.

Du kanske vill göra ett av arkiven levande också, så att du kan dra nytta av alla serverfunktioner på din webbplats. Resultatet är en webbplats med en robust säkerhetskopierings- och arkivstrategi som fortfarande är användbar för andra.

En nybörjarguide till Internetarkiveringsverktyg och webbplatser

Det finns en uppsjö av lösningar tillgängliga för att arkivera en webbplats. Vi går i genom några av de mer populära, och ger dig vår åsikt om hur de kan passa dig.

1. Wayback Machine

Wayback Machine.

Wayback Machine.

Låt oss först diskutera Wayback Machine. Det var det första i sitt slag, så det satte standarden för andra arkiveringsverktyg.

Därför kommer det nog vara första målet om du vill arkivera en webbplats. Det har många sätt att skapa och ladda upp arkiv, och till och med en dedikerad API för att koppla in dess funktionalitet. Det är värt att notera att det är en arkivlösning på serversidan också.

Med det sagt, på grund av hur det genomsöker och arkiverar webbplatser kanske inte Wayback Machine kan bevara all funktionalitet på din webbplats. Ändå anses det som branschstandard för webbarkiverare, och det är helt gratis att använda. Vi visar dig hur du arkiverar en webbplats mer detaljerat med Wayback Machine senare i den här artikeln.

2. Archive.today

Archive.todays webbplats.

Archive.todays webbplats.

Nästa verktyg är Archive.today. Det liknar Wayback Machine på många sätt – till och med webbplatsens nästan retroliknande design. Dess dataservrar är baserade i Europa, men det har ett annat tillvägagångssätt för arkivering än Wayback Machine.

Till att börja med är Archive.Today är inte baserat på sökrobotar som går igenom webben. Istället skickar du in dina webbadresser och samtycker till att inkluderas i arkivet. Dessutom är dess funktionslista mer grundläggande än andra lösningar. Det finns till exempel inte någon robust raderingspolicy och arkiveringsprocessen utesluter vissa media- och filtyper.

Ändå är det gratis och lämpligt om du vill ha en gratis plats att lagra arkiv på. Webbplatsen har även sökfunktionalitet för att hitta tidigare arkiverade webbplatser.

3. Heritrix

Heritrix webbplats

Heritrix webbplats

Vi har hittills nämnt Internet Archive och Wayback Machine nästan omväxlande i det här inlägget. Wayback Machine är dock bara en tjänst, och Internet Archive erbjuder få andra arkiveringsprodukter förutom det. Heritrix är ett gratis verktyg med öppen källkod som kom till genom ett samarbete mellan Internet Archive och Nordic Libraries.

Det är i princip en sökrobot snarare än ett fullfjädrat arkiveringsverktyg. Du kan dock packa ihop alla genomsökta resultat. Även om så inte har varit fallet tidigare, använder Wayback Machine nu Heritrix för att genomsöka webbplatser att inkludera på sin egen webbplats. Dessutom använder ett stort antal bibliotek och institutioner Heritrix för att bygga sina arkiv.

Trots dess imponerande funktioner kan det vara lite klurigt att installera Heritrix. Det finns inget användarvänligt gränssnitt för att installera det, så du behöver kunskap om Git, GitHub och kommandoraden.

Som med andra liknande lösningar är Heritrix helt gratis att använda, så det passar bra som en kostnadseffektiv självarkiverande lösning.

4. Web Archiving Integration Layer (WAIL)

Web Archiving Integration Layers (WAIL) webbplats.

Web Archiving Integration Layers (WAIL) webbplats.

Om du vill att Heritrix ska arkivera en webbplats men känner dig avskräckt av den tekniska kunskap som krävs för att helt enkelt installera programmet finns det en annan lösning för dig. Web Archiving Integration Layer (WAIL) är en gratis och öppen källkods plattformsoberoende datorapp som ger dig ett funktionellt grafiskt användargränssnitt (GUI) att använda tillsammans med en installerare.

Den goda nyheten är att Heritrix är WAIL:s genomsökningsmotor. Det innebär att du kan utnyttja Heritrix kraft utan att behöva fiffla med GitHub och kommandoraden. Dessutom använder WAIL OpenWayback-motorn för att ”spela upp” webbarkiv.

Här får du alltså ett fullfjädrat webbarkiveringsverktyg redo att använda på din maskin. Vi visar dig också exakt hur WAIL fungerar senare i artikeln.

5. Stillio

Stillios webbplats.

Stillios webbplats.

Vårt näst sista arkiveringsverktyg stoltserar med en automatiserad lösning som tar ögonblicksbilder med bestämda intervaller. Stillio är en premiumtjänst som ser ut och känns annorlunda än andra arkiveringslösningar.

Webbplatsen ser smart ut och ger dig otaliga alternativ för att skapa ett arkiv som uppfyller exakt dina krav. Du kan till exempel lägga till taggar och egna titlar i dina webbadresser.

Dessutom kan du välja att lagra arkiv till Dropbox, Google Drive och andra tredjepartstjänster.

Stillio har dock en stor nackdel: det stöder inte backend-arkivering. Du är begränsad till skärmdumpar av din webbplats snarare än ett fullständigt arkiv av data. För många användningsområden räcker det inte.

Stillio kan dock vara användbart i vissa fall, till exempel fungerar det som ett varumärkeshanterings- och spårningsverktyg. Till exempel kan du ta skärmdumpar av konkurrenters webbplatser eller sökmotorresultat. Det är också bra för innehållsverifiering.

Stillios priser börjar vid $29 per månad och stiger genom fyra nivåer upp till $299 per månad. Det är mycket att begära, särskilt när det finns gratis alternativ med mer kraftfulla funktioner. Men om det passar dig perfekt är det värt att ta en titt!

6. Pagefreezer

Pagefreezers webbplats.

Pagefreezers webbplats.

Vår sista lösning är ett annat automatiserat verktyg. Pagefreezer erbjuder flera av samma fördelar som Stillio, men det arkiverar också socialt medieinnehåll, textmeddelanden, fulla webbplatser och samarbetsplattformar på företagsnivå.

På ytan verkar Pagefreezer vara en mer robust lösning än Stillio och tycks ha större värde i diverse användningsfall.

Till exempel, där du är juridiskt skyldig att arkivera en webbplats helt är Pagefreezer helt rätt. Det låter dig automatisera antalet ögonblicksbilder och granska dem med hjälp av en webbplatsarkivsläsare och ett jämförelseverktyg.

Sammantaget är Pagefreezer en bra lösning på företagsnivå för arbetsplatsarkivering. Företag som använder Yammer eller Salesforces Chatter kommer att dras till denna typ av lösning, liksom Workplace-användare.

Vad innebär filändelsen Web Archive (WARC)?

Om du undersöker hur du arkiverar en webbplats, kommer du att stöta på formatet Web Archive (WARC). Det är en paketerad kombination av ditt webbplatsarkivs olika filer så att det är bärbart och fristående.

Internet Archive skapade WARC för att bevara webbdata på lång sikt. International Internet Preservation Consortium (IIPC) har publicerat den fullständiga specifikationen av filformatet. Det kommer att lagra bilder, metadata, och praktiskt taget allt din webbplats behöver för att köras på en fristående basis.

Även om det ursprungligen bara var ett praktiskt filformat är WARC nu en internationell ISO-standard för digitala arkiv. Därmed har det antagits av myndigheter och andra officiella organ. Faktum är att det finns flera användningsfall där en WARC-fil är avgörande:

WARC används av många olika lösningar för arkivering och sökrobotar, såsom StormCrawler och Apache Nutch. Du kan också justera inställningarna för ett kommandoradsverktyg som Wget för att hämta och packa förfrågningar som WARC-filer. Vi kommer att diskutera detta mer detaljerat inom kort.

Det finns gott om andra verktyg som kan mata ut WARC-filer också. Till exempel kan webbplatssparnings-verktyget wallabag göra detta.

Som ett alternativ finns grab-site, en webbaserad app för att hjälpa till med genomsökning av arkiv som WARC-filer.

Att öppna en WARC-fil är olika beroende på vilket verktyg du använder. Oavsett vilken lösning du föredrar, kom ihåg att några av dessa verktyg inte har uppdaterats på ett tag.

Därför behöver du se till att din valda lösning fungerar med ditt nuvarande system och att det kommer att vara tillgängligt att använda även i framtiden. Du kommer att rädda dig själv från massor av huvudvärk om du undviker ett verktyg som kan sluta få uppdateringar eller helt sluta fungera medan du är mitt uppe i ett arkiveringsprojekt.

Tips för att hantera dina offlinearkiv

Låt oss ägna några minuter åt att hjälpa dig organisera dina befintliga arkiv innan vi går in på hur du arkiverar en webbplats. Vi har berört ämnet tidigare, men att ha en solid strategi på plats kommer att göra dina arkiv mer hanterbara. Webbplatsens användare kommer också att få större användning av ett välorganiserat arkiv.

Det finns tre viktiga element som du måste tänka på:

Medan du kan utöka din arkivadministration ytterligare, kommer dessa tre tips att låta dig börja på rätt sätt.

5 sätt att arkivera en webbplats

Nedan kommer vi att föreslå fem olika sätt att arkivera en webbplats. Vi har rangordnat lösningarna utifrån deras relativa svårighet. Men om du ser en lösning som du tror kommer att fungera för dina nuvarande behov så är det bara att sätta igång med den.

1. Spara en enskild sida till din lokala dator

Låt oss först diskutera den enklaste lösningen. Den funkar bra om du behöver arkivera en enda sida, och ännu bättre är att funktionaliteten praktiskt taget redan finns i alla webbläsare.

Kämpar du med stilleståndstid och WordPress-problem? Kinsta är en prestationsoptimerad hosting-lösning utformad för att spara tid. Kolla in våra funktioner

För att sätta igång, öppna din favoritwebbläsare och gå till den webbplats du vill arkivera. När sidan har laddats, navigera till webbläsarens meny och hitta alternativet Spara sida som.

Firefox applikationsmeny innehåller den funktionalitet du behöver för att spara en enda webbsida.

Firefox applikationsmeny innehåller den funktionalitet du behöver för att spara en enda webbsida.

Klicka sedan på alternativet för att spara sidan och webbläsaren visar dig en dialogruta.

Här väljer du ett namn på din sida (men standardinställningen duger gott och väl). Se också till att du sparar hela sidan snarare än bara dess HTML. Detta kommer att bevara webbplatsen med största möjliga funktionalitet.

2. Använd DevKinsta för att arkivera din WordPresswebbplats

DevKinsta kan också hjälpa dig att arkivera en webbplats.

DevKinsta kan också hjälpa dig att arkivera en webbplats.

Vi tycker att DevKinsta är ett viktigt verktyg för att skapa och distribuera WordPresswebbplatser. Men det har fler ess i rockärmen: det hjälper dig att arkivera dina Kinstahostade webbplatser också.

Vi har gått igenom hela processen med att dra en extern MyKinsta-kopia till DevKinsta i en av våra kunskapsbasartiklar. För att sammanfatta:

Vid denna tidpunkt kan du öppna din webbplats i DevKinsta och använda den som om den var levande.

3. Använd ett onlinearkiv (såsom Wayback Machine)

Ingen handledning skulle vara komplett utan att visa dig hur Wayback Machine fungerar. Lyckligtvis är processen enkel. Med det sagt, observera att den här metoden bara låter dig arkivera enskilda sidor (även om prenumerationstjänsten Archive-It låter dig arkivera hela webbplatser).

För detta tillvägagångssätt, gå till Wayback Machines webbplats och kolla in formuläret Spara sida nu:

Formuläret Spara sida nu på Wayback Machines webbplats.

Formuläret Spara sida nu på Wayback Machines webbplats.

Om du vill arkivera en sida lägger du bara till webbadressen du vill spara i det här formuläret och klickar sedan på Spara sida. Beroende på hur stor eller komplex sidan är kan du behöva vänta några minuter medan sökroboten och motorn gör sin grej. Det kan se ut som om sidan har kraschat. Vi möttes av Dödens Vita Skärm (WSoD) ett tag i våra tester.

Men när sidan har arkiverats kommer Wayback Machine att omdirigera dig till den nya, dedikerade sidan.

En Kinstasida arkiverad på Wayback Machine.

En Kinstasida arkiverad på Wayback Machine.

Observera att du också kan använda ett bokmärknings- och webbläsartillägg för att arkivera en webbplats. Faktum är att de flesta aktuella webbläsare har dessa alternativ inbyggda, inklusive Google Chrome, Firefox och Safari.

4. Installera Web Archiving Integration Layer (WAIL)

Det första steget med detta tillvägagångssätt är att ladda ner WAIL och installera det. Lyckligtvis finns det en dedikerad installatör för verktyget (men eftersom programmet är skrivet i Python används PyInstaller-modulen).

Installationsprocessen är lätt som en plätt. Oavsett vilket operativsystem (OS) du har kan du göra följande:

När WAIL är öppet ser du dess minimala gränssnitt:

WAIL:s gränssnitt ger dig tre alternativ.

WAIL:s gränssnitt ger dig tre alternativ.

Du presenteras nu tre alternativ att välja mellan: visa ett arkiv, kontrollera dess status eller arkivera en webbplats. Knapparna är lite förvirrande, eftersom det kan kännas mer naturligt att läsa från vänster till höger. Men vid den första lanseringen har du ingenting i dina arkiv.

Istället anger du webbadressen till den webbplats du vill arkivera och klickar på Arkivera nu! WAIL kommer börja genomsöka webbplatsen. Du kan kontrollera statusen för genomsökningen på fliken Avancerat > Heritrix:

WAIL visar aktuell status för genomsökningsjobbet

WAIL visar aktuell status för genomsökningsjobbet

När det är klart kommer det att visa dig ett framgångsmeddelande. Då kan du klicka på knappen Visa arkiv på fliken Grundläggande. Detta kommer att öppna din arkiverade webbplats i en webbläsare, redo att visas.

5. Använd Wget om du är bekväm med kommandoraden

För vår sista metod för att arkivera en webbplats behöver du några saker innan du börjar:

Du kommer förmodligen att ha de två första redan.

På macOS kan du installera Wget via Homebrew med kommandot brew install wget. Observera att du också måste installera Homebrew, men det tar bara några sekunder. På Linux är Wget förinstallerat på de flesta av de större distributionerna.

Om du är en Windows-användare kan det vara svårare att installera Wget på din dator. Även om det finns handledningar tillgängliga över hela webben, fungerar det inte alltid konsekvent mellan maskiner. I stället rekommenderar vi att du går till Wgets officiella webbplats och kollar in några av de tillgängliga Windows-binärerna, eftersom kan fungera bättre för dig.

Oavsett är det enkelt att använda Wget när du har installerat det. Navigera först till en katalog i ett nytt terminalfönster. Här skapar vi katalogen också, men det här steget är valfritt:

cd documents && mkdir archive && cd archive

Observera att Wget kommer att dra alla nedladdningar till vad arbetskatalogen än är. I det här fallet har vi angett en mapp för våra filer.

Därefter behöver du genomsöka en webbplats och dra filerna. Varje åtgärd anropas med kommandot wget, och du bör använda följande format:

wget "https://kinsta.com/" --warc-file="kins"

Att trycka på Enter-tangenten startar nedladdningen av kinsta.com till en index.html-fil och skapar en WARC fil som heter kins-00000.warc.gz.

En webbplats arkiveras som en WARC-fil.

En webbplats arkiveras som en WARC-fil.

Wget är kraftfullt, och det finns många kommandon och alternativ som du kan använda. Du kan till exempel använda --mirror-kommandot för att skapa en WARC-fil som innehåller webbplatsens fullständiga spegel. Du kan också använda kommandot --no-warc-compression för att skriva okomprimerade filer, men det här kommer självklart att ta upp mer utrymme per nedladdning. Att använda den inbyggda kompressorn är det optimala tillvägagångssättet.

Att arkivera din webbplats är lite som att göra en tidskapsel⏳...och lyckligtvis är det enkelt att komma igång med hjälp av den här guiden. ✅Click to Tweet

Sammanfattning

Webbarkivering har vuxit från ett behov av att dokumentera internets snabbt föränderliga form. Det har nu flera användningsområden – till exempel när det gäller juridiska filer och krav. Oavsett vilka behov du har kan du komplettera din övergripande strategi för säkerhetskopiering med ett välstrukturerat och organiserat arkiv .

Lyckligtvis finns det gott om lösningar tillgängliga som kan hjälpa dig. De flesta webbläsare erbjuder möjligheten att spara en webbsida på din dator, men lösningar som DevKinsta är också bra verktyg för jobbet. Men dedikerade arkiveringsverktyg som Wayback Machine, Heritrix, WAIL och Wget är allihop särskilt robusta lösningar och erbjuder standardiserade filformat.

Har den här artikeln lett till att du vill arkivera en egen webbplats? Dela dina tankar och åsikter i kommentarerna nedan!


Spara tid, kostnad och maximera webbplatsens prestanda med:

  • Omedelbar hjälp från WordPress -hostingexperter, 24/7.
  • Cloudflare Enterprise-integration.
  • Global publik räckvidd med 28 datacenter över hela världen.
  • Optimering med vår inbyggda Application Performance Monitoring.

Allt detta och mer, i en plan utan långsiktiga kontrakt, assisterad migration och en 30-dagars pengarna-tillbaka-garanti. Kolla in våra paket, eller prata med säljteamet för att hitta den plan som fungerar för dig.