0
Newspaper
Noviny sú extrakciou metaúdajov v správach, plnotextových článkoch a článkoch vytvorených pomocou Pythonu 3. VLASTNOSTI - Funguje vo viac ako 10 jazykoch (angličtina, čínština, nemčina, arabčina, ...) - rámec na stiahnutie viacerých článkov - identifikácia adresy URL správ -Extrakcia textu z html - Extrakcia horného obrázka z html - Extrakcia všetkých obrázkov z html - Extrakcia kľúčových slov z textu - Súhrnná extrakcia z textu - Extrakcia autorov z textu - Extrakcia výrazov trendov Google
newspaper-metadata-extractor-
WebSite:
http://newspaper.readthedocs.io/Kategórie
Alternatívy programu Newspaper pre Self-Hosted
0
artoo.js
artoo.js je časť kódu JavaScript, ktorá sa má spustiť v konzole prehliadača, aby vám poskytla niektoré nástroje na zoškrabovanie.
- Bezplatná
- Chrome
- JavaScript
- Node.JS
- Web
- Self-Hosted