ArchiveBox

ArchiveBox

Web Webový archív s vlastným hostiteľom s otvoreným zdrojom.Berie históriu prehliadača / záložky / Pocket / Pinboard / atď., Ukladá HTML, JS, PDF, médiá a ďalšie.
  • Bezplatná
Pretože moderné webové stránky sú komplikované a často sa spoliehajú na dynamický obsah, ArchiveBox archivuje stránky v niekoľkých rôznych formátoch, nad rámec toho, čo sú verejné archívne služby ako Archive.org a Archive.is schopné ukladať.ArchiveBox naimportuje zoznam adries URL zo stdin, vzdialenej adresy URL alebo súboru a potom pridá stránky do lokálneho archívneho priečinka pomocou wgetu na vytvorenie prehľadávateľného klonu html, youtube-dl na extrahovanie médií a úplnej inštancie prehliadača Chrome bez obsahu vo formáte PDF,Screenshot, a DOM výpisy, a ďalšie ... Použitie viacerých metód a na trhu dominantný prehliadač na vykonanie JS zaisťuje, že môžeme uložiť aj tie najzložitejšie, najjemnejšie webové stránky v najmenej niekoľkých vysoko kvalitných, dlhodobých dátových formátov.### Môžete importovať odkazy z: - Pocket, Pinboard, Instapaper - RSS, XML, JSON alebo obyčajné textové zoznamy - História prehliadača alebo záložky (Chrome, Firefox, Safari, IE, Opera a ďalšie) - Shaarli, Delicious, RedditUložené príspevky, Wallabag, Unmark.it a akýkoľvek iný text s odkazmi v ňom!### Môžete uložiť tieto veci pre každú lokalitu: - `favicon.ico` favicon stránky -` example.com / page-name.html` wget klon stránky, s príponou .html, ak nie je k dispozícii - `výstup.pdf` Vytlačené PDF stránky pomocou bezhlavého chrómu - `screenshot.png` 1440x900 snímka stránky s použitím bezhlavého chrómu -` output.html` DOM Výpis HTML po vykreslení pomocou bezhlavého chrómu - `archive.org.txt` Odkaz nauložená stránka na archive.org - `warc /` pre súbor html + gzipped warc.gz - `media /` akékoľvek mp4, mp3, titulky a metadáta nájdené pomocou youtube-dl - `git /` klon akéhokoľvek úložiska pre odkazy github, bitbucket alebo gitlab - `index.html` &` index.json`Indexové súbory HTML a JSON obsahujúce metaúdaje a podrobnosti Archivácia je aditívna, takže môžete naplánovať pravidelné spúšťanie súboru `. / Archive` a do indexu sťahovať nové odkazy.Celý uložený obsah je statický a indexovaný pomocou súborov JSON, takže žije navždy a je ľahko rozoberateľný, nevyžaduje žiadne neustále bežiace zálohovanie.
archivebox

Kategórie

Alternatívy k službe ArchiveBox pre všetky platformy s licenciou s otvoreným zdrojom