{"id":1258,"date":"2020-04-13T18:52:00","date_gmt":"2020-04-13T16:52:00","guid":{"rendered":"https:\/\/archivesquarantainearchief.be\/?p=1258"},"modified":"2020-04-21T20:44:16","modified_gmt":"2020-04-21T18:44:16","slug":"sites-web-blog-et-reseaux-sociaux-quelques-solutions-pour-archiver-le-web","status":"publish","type":"post","link":"http:\/\/archivesquarantainearchief.be\/nl\/2020\/04\/13\/sites-web-blog-et-reseaux-sociaux-quelques-solutions-pour-archiver-le-web\/","title":{"rendered":"Websites, blogs en sociale media: enkele oplossingen voor de archivering van het Web"},"content":{"rendered":"<p>We kunnen het niet voldoende herhalen : internet vormt vandaag een goudmijn aan informatie en getuigenissen. De huidige crisis vormt hierop geen uitzondering. Maar hoe pakken we de bewaring van deze informatie aan ? Welke Touls kunnen ons helpen voor de offline bewaring en raadpleging? <\/p>\n\n\n\n<p class=\" translation-block\">In een eerste artikel (<a rel=\"noreferrer noopener\" aria-label=\"ici (opens in a new tab)\" href=\"http:\/\/archivesquarantainearchief.be\/fr\/2020\/04\/10\/hoe-pak-je-het-archiveren-van-de-coronacrisis-aan\/\" target=\"_blank\"><strong>hier<\/strong><\/a>), geeft onze collega Willem Vannest van de Universiteit Antwerpen een eerste reeks raadgevingen en reflectiepistes om jouw webarchiveringsproject te lanceren.<\/p>\n\n\n\n<p class=\" translation-block\">In deze bijdrage stellen we enkele archiveringsoplossingen voor uit de Handleiding digitaal archiveren voor particulieren en tools en programma\u2019s van de <a href=\"http:\/\/netpreserve.org\/web-archiving\/tools-and-software\/\" target=\"blank\">International Internet Preservation Consortium<\/a>.<\/p>\n\n\n\n<p>We proberen het kort te houden : aarzel vooral niet om zelf aan de slag te gaan met de verschillende applicaties.<\/p>\n\n\n\n<div class=\"wp-block-file translation-block\"><a href=\"https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/20200414_OUTILS_web_VH1.pdf\" target=\"_self\">Wenst u deze handleiding te hergebruiken of delen? Download dan hier het PDF-formaat.<\/a><a href=\"https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/20200414_OUTILS_web_VH1.pdf\" class=\"wp-block-file__button\" target=\"_self\">Download<\/a><\/div>\n\n\n\n<h3>Belangrijke opmerkingen<\/h3>\n\n\n\n<p>We pretenderen hier niet dat we doorwinterde informatici zijn en we zullen dan ook niet al te diep ingaan op de details in deze bijdrage.<br> Daarnaast is het ook belangrijk om tijdens het downloaden en archiveren van afbeeldingen, videos en teksten op websites rekening te houden met het auteursrecht. Vrij beschikbaar betekent niet automatisch vrij van rechten. De bewaring op lange termijn om (cultuur)historische redenen is op zich niet problematisch voor een publiek beschikbare website. Het hergebruik en de communicatie ervan naar derden kan meer discussie opleveren. Het valt daarom aan te raden om aan de beheerder van een website, blog of pagina op een sociaal netwerk de expliciete toestemming te vragen om een deel van een website te archiveren en te bewaren op de lange termijn.<br> Wees heel duidelijk over uw doelstellingen : het gaat hier om de bewaring van een getuigenis voor toekomstige generaties en niet om een onderhandse manier om bv. foto\u2019s te hergebruiken.<br>Daarnaast dient ook rekening te worden gehouden met aspecten zoals gegevensbescherming en privacy: de aanwezigheid van commentaren kan er bijvoorbeeld voor zorgen dat je gearchiveerde content niet zomaar kan worden gepubliceerd op internet, maar dat deze wel nog beschikbaar blijft voor historisch en wetenschappelijk onderzoek.<\/p>\n\n\n\n<h3>Voorstelling van de tools <\/h3>\n\n\n\n<ol><li><em><strong>Capture door derden<\/strong><\/em><br>Vooreerst is het belangrijk om te weten of u over de nodige technische middelen beschikt (server, infrastructuur, enz.) beschikt om een website te bewaren en of u de moed heeft om eraan te beginnen\u2026<br><img loading=\"lazy\" width=\"372\" height=\"149\" class=\"wp-image-1261\" style=\"width: 350px;\" src=\"https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/182680-1.png\" alt=\"\" srcset=\"https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/182680-1.png 372w, https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/182680-1-300x120.png 300w\" sizes=\"(max-width: 372px) 100vw, 372px\" \/><br>Aarzel dus niet om de <a rel=\"noreferrer noopener\" aria-label=\"Wayback Machine (opens in a new tab)\" href=\"https:\/\/archive.org\/web\/\" target=\"_blank\">Wayback Machine<\/a> van het Internet Archive te gebruiken : \u201cSave Page Now\u201d maakt het mogelijk om webpagina\u2019s eenvoudig te archiveren. Deze website is de oudste en bekendste op vlak van webarchivering en biedt al jarenlang snapshots aan van websites die inmiddels van het web verdwenen zijn.<\/li><li><strong><em>Een post op een sociaal netwerk<\/em><\/strong><br> Maak de zaken niet ingewikkelder dan nodig: de eenvoudigste oplossingen zijn soms de beste. Wanneer we naar sociale media kijken wilt u misschien \u00e9\u00e9n post bewaren als getuigenis. Misschien volstaat het om hiervan een printscreen te nemen. Het is niet altijd noodzakelijk of pertinent om het grote geschut boven te halen.<\/li><li><strong><em>U wenst \u00e9\u00e9n pagina of een klein aantal pagina\u2019s te bewaren ?<\/em><\/strong><br><br><em> a. Oplossing zonder account : twee extensies voor Firefox en Chrome<\/em><br><br>Het merendeel van de tijd zult u zich uit de slag kunnen trekken met een simpele browserextensie. \"<a rel=\"noreferrer noopener\" aria-label=\" (opens in a new tab)\" href=\"https:\/\/addons.mozilla.org\/fr\/firefox\/addon\/single-file\/\" target=\"_blank\">SingleFile\u201d<\/a> of \"<a rel=\"noreferrer noopener\" aria-label=\"Save Page WE (opens in a new tab)\" href=\"https:\/\/addons.mozilla.org\/fr\/firefox\/addon\/save-page-we\/\" target=\"_blank\">Save Page WE<\/a>zijn twee tools die het mogelijk maken om pagina\u2019s op te slaan in HTML-formaat en ze te bewaren als \u00e9\u00e9n bestand. De extensies bestaan zowel voor Google Chrome\/Chromium als voor Firefox.<br>Deze extensies werken ook om op sociale media gedeeltes van pagina\u2019s op te slaan: u scrolt tot de datum die u als startpunt wil nemen (in dit geval, het begin van de lockdown) en gebruikt dan de extensie. Voor lange posts dient u deze ook te openen (meer\/verder lezen).<br><br><em>b. Oplossing met acount: <\/em><a rel=\"noreferrer noopener\" aria-label=\"www.webrecorder.io  (opens in a new tab)\" href=\"https:\/\/webrecorder.io\/\" target=\"_blank\"><em>www.webrecorder.io<\/em> <\/a><br><\/li><\/ol>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"alignleft size-large is-resized\"><img loading=\"lazy\" src=\"https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-3.png\" alt=\"\" class=\"wp-image-1338\" width=\"398\" height=\"130\" srcset=\"https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-3.png 795w, https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-3-300x98.png 300w, https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-3-768x250.png 768w\" sizes=\"(max-width: 398px) 100vw, 398px\" \/><\/figure><\/div>\n\n\n\n<p>Met een eenvoudig, gratis aan te maken account kunt u collecties cre\u00ebren met een geheel van pagina\u2019s. De pagina\u2019s van eenzelfde collectie kunnen gedownload worden in WARC-formaat. Er zijn aparte functionaliteiten voorzien (autopilot) voor het registreren van conten op sociale netwerken, YouTube, soundcloud, enz. <br><br><em>c. Een oplossing voor Linux: <a href=\"https:\/\/github.com\/pirate\/ArchiveBox\" target=\"_blank\" rel=\"noreferrer noopener\" aria-label=\"ArchiveBox (opens in a new tab)\">ArchiveBox<\/a><\/em><br>Met ArchiveBox kunt u eveneens een reeks pagina\u2019s bewaren op basis van een map met bladwijzers of een browsergeschiedenis.<br>De eenvoudige html-interface geeft toegang tot verschillende formaten, met een link naar de originele website, de datum van archivering en eventuele updates. Deze metadata maken het makkelijk om een interface aan te bieden aan een eindgebruiker of een lezer. <br>Een interessant element van deze software is dat er vrij eenvoudig een offline portaal mee kan gecre\u00eberd worden waarin gearchiveerde versies in alle formaten kunnen worden aangeboden: HTML, PDF, PNG, WARC\u2026<\/p>\n\n\n\n<figure class=\"wp-block-image size-full is-resized\"><img src=\"https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-4.png\" alt=\"\" class=\"wp-image-1339\" width=\"747\" srcset=\"https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-4.png 1347w, https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-4-300x128.png 300w, https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-4-1024x438.png 1024w, https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-4-768x328.png 768w\" sizes=\"(max-width: 1347px) 100vw, 1347px\" \/><\/figure>\n\n\n\n<p> 4. <strong><em>Een volledige website of een groot gedeelte ervan<\/em><\/strong><\/p>\n\n\n\n<p><br>a. <em>De meest courante oplossing: <a href=\"https:\/\/www.httrack.com\/\" target=\"_blank\" rel=\"noreferrer noopener\" aria-label=\"Httrack (opens in a new tab)\">Httrack<\/a><\/em><br><\/p>\n\n\n\n<div class=\"wp-block-image\"><figure class=\"alignleft size-large is-resized\"><img loading=\"lazy\" src=\"https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-6-1024x521.png\" alt=\"\" class=\"wp-image-1341\" width=\"312\" height=\"159\" srcset=\"https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-6-1024x521.png 1024w, https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-6-300x153.png 300w, https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-6-768x391.png 768w, https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-6.png 1495w\" sizes=\"(max-width: 312px) 100vw, 312px\" \/><\/figure><\/div>\n\n\n\n<p>De bekendste oplossing om volledige websites te capteren is Httrack, een gratis opensource programma dat zowel onder Linux als onder Windows werkt (en dit zonder verdere installatie).<br>De software biedt de mogelijkheid om heel eenvoudig volledige websites op te slaan in HTML formaat voor een offline raadpleging, en dit op basis van een url voor een volledige website (bv. www.gemeenteX.be.) of voor een deel ervan (bv. www.gemeenteX.be\/gezondheid\/covid19). <\/p>\n\n\n\n<p class=\" translation-block\">De software biedt de mogelijkheid om de diepte van archivering te parametreren (te bewaren aantal submenu\u2019s, links naar externe websites, enz.). Er wordt ook deels rekening gehouden met dynamische aspecten van websites (video, flash, enz.).<br>\nUiteraard is het ook mogelijk om een individuele pagina op te slaan.<\/p>\n\n\n\n<p><em>b. Een mogelijkheid voor Linux: Wget <a href=\"http:\/\/www.gnu.org\/software\/wget\/\" target=\"_blank\" rel=\"noreferrer noopener\" aria-label=\"Wget (opens in a new tab)\">Wget<\/a><\/em><br> Voor archivarissen die wat verder willen gaan is er ook Wget voor Linux (er bestaat een Windows-port, maar deze is niet ingebouwd in het systeem en moet apart gedownload worden). Wget werkt via de command-line interface en biedt de mogelijkheid om WARC-output te genereren. Aarzel niet om de documentatie op de Ubuntu wiki te raadplegen. U vindt er een eerste overzicht van de functionaliteiten op <a href=\"https:\/\/www.gnu.org\/software\/wget\/manual\/\" target=\"_blank\" rel=\"noreferrer noopener\" aria-label=\"https:\/\/doc.ubuntu-fr.org\/wget  (opens in a new tab)\">https:\/\/www.gnu.org\/software\/wget\/manual\/<br> <\/a><\/p>\n\n\n\n<h3>Gearchiveerde bestanden raadplegen <\/h3>\n\n\n\n<p>Wat nu gedaan met de gearchiveerde bestanden ? Hoe kunnen ze geopend worden? Hoe kunnen ze hergebruikt worden?<\/p>\n\n\n\n<figure class=\"wp-block-image size-large is-resized\"><img src=\"https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-8.png\" alt=\"\" class=\"wp-image-1349\" width=\"150\" srcset=\"https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-8.png 372w, https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/image-8-295x300.png 295w\" sizes=\"(max-width: 372px) 100vw, 372px\" \/><\/figure>\n\n\n\n<ul><li><em><strong>Een enkele HTML-pagina: SingleFile, Save Page We<\/strong><\/em><br> Het raadplegen van een enkele HTML-pagina is vrij eenvoudig: de courante webbrowsers hebben hier geen enkel probleem mee.<\/li><li><em> <strong>HMTL-bestand(en) met gelinkte elementen\/mappen: Httrack<\/strong><\/em><br>De raadpleging verloopt eveneens via een webbrowser.<br>Waarom zou men kiezen voor dit formaat? Alle verschillende elementen van een pagina worden opgeslaan. Zo kunnen alle afbeeldingen van een website of een pagina geselecteerd worden.<br>Let wel op: indien de bestanden verplaats worden naar een andere plaats of drager moet u ervoor zorgen dat alles samen wordt gekopieerd.<\/li><li class=\" translation-block\"><em><strong>WARC-bestand (Web Archives) : Wget, webrecorder.io<\/strong><\/em><br>Om dit bestandstype te lezen is aparte software nodig. Die is online beschikbaar (<a href=\"https:\/\/wab.ac\/\" target=\"_self\">https:\/\/wab.ac\/<\/a>) of hij kan lokaal gedownload worden. Je kan bv. <a href=\"https:\/\/github.com\/webrecorder\/webrecorder-player\" target=\"_self\">Webrecorder player<\/a> downloaden op je eigen computer.<\/li><li> <em><strong>Hybride oplossing: ArchiveBox<\/strong><\/em><br>Globaal genomen werkt de raadplegingsinterface van ArhiveBox zoals een klassieke webbrowser. De interface geeft toegang tot meerdere versies, twee in HTML, \u00e9\u00e9n in PDF en een printscreens alsook een link naar de originele website en een verwijzing naar de Wayback Machine van Internet Archive. Dit biedt de gebruiker meerdere opties: een printscreen behoudt sowieso de grafische layout van een pagina, daar waar een HMTL-bestand dit niet altijd doet. E\u00e9n van de menu\u2019s biedt eveneens de mogelijkheid om bestanden in WARC of Json formaat te downloaden. <\/li><\/ul>\n\n\n\n<p><\/p>","protected":false},"excerpt":{"rendered":"<p>We kunnen het niet voldoende herhalen : internet vormt vandaag een goudmijn aan informatie en getuigenissen. De huidige crisis vormt hierop geen uitzondering. Maar hoe pakken we de bewaring van deze informatie aan ? Welke Touls kunnen ons helpen voor de offline bewaring en raadpleging?<\/p>","protected":false},"author":15,"featured_media":1286,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_links_to":"","_links_to_target":""},"categories":[7,68,67],"tags":[],"uagb_featured_image_src":{"full":["https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/firefox-ie-chrome-safari.jpg",930,400,false],"thumbnail":["https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/firefox-ie-chrome-safari-150x150.jpg",150,150,true],"medium":["https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/firefox-ie-chrome-safari-300x129.jpg",300,129,true],"medium_large":["https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/firefox-ie-chrome-safari-768x330.jpg",768,330,true],"large":["https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/firefox-ie-chrome-safari.jpg",930,400,false],"1536x1536":["https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/firefox-ie-chrome-safari.jpg",930,400,false],"2048x2048":["https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/firefox-ie-chrome-safari.jpg",930,400,false],"trp-custom-language-flag":["https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/firefox-ie-chrome-safari.jpg",18,8,false],"neve-blog":["https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/firefox-ie-chrome-safari.jpg",930,400,false],"audioigniter_cover":["https:\/\/archivesquarantainearchief.be\/wp-content\/uploads\/2020\/04\/firefox-ie-chrome-safari.jpg",560,241,false]},"uagb_author_info":{"display_name":"Virginien Horge, Ville de Mons","author_link":"http:\/\/archivesquarantainearchief.be\/nl\/author\/vhorge\/"},"uagb_comment_info":1,"uagb_excerpt":"On ne le dira jamais assez : internet est aujourd\u2019hui une mine d\u2019informations et de t\u00e9moignages. La crise actuelle ne fait pas exception. Mais, comment conserver ces t\u00e9moignages ? Quels outils pour la lecture et la conservation hors ligne ?","_links":{"self":[{"href":"http:\/\/archivesquarantainearchief.be\/nl\/wp-json\/wp\/v2\/posts\/1258"}],"collection":[{"href":"http:\/\/archivesquarantainearchief.be\/nl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/archivesquarantainearchief.be\/nl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/archivesquarantainearchief.be\/nl\/wp-json\/wp\/v2\/users\/15"}],"replies":[{"embeddable":true,"href":"http:\/\/archivesquarantainearchief.be\/nl\/wp-json\/wp\/v2\/comments?post=1258"}],"version-history":[{"count":10,"href":"http:\/\/archivesquarantainearchief.be\/nl\/wp-json\/wp\/v2\/posts\/1258\/revisions"}],"predecessor-version":[{"id":1868,"href":"http:\/\/archivesquarantainearchief.be\/nl\/wp-json\/wp\/v2\/posts\/1258\/revisions\/1868"}],"wp:featuredmedia":[{"embeddable":true,"href":"http:\/\/archivesquarantainearchief.be\/nl\/wp-json\/wp\/v2\/media\/1286"}],"wp:attachment":[{"href":"http:\/\/archivesquarantainearchief.be\/nl\/wp-json\/wp\/v2\/media?parent=1258"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/archivesquarantainearchief.be\/nl\/wp-json\/wp\/v2\/categories?post=1258"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/archivesquarantainearchief.be\/nl\/wp-json\/wp\/v2\/tags?post=1258"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}