Newspaper

Newspaper

Noviny sú extrakciou metaúdajov v správach, plnotextových článkoch a článkoch vytvorených pomocou Pythonu 3. VLASTNOSTI - Funguje vo viac ako 10 jazykoch (angličtina, čínština, nemčina, arabčina, ...) - rámec na stiahnutie viacerých článkov - identifikácia adresy URL správ -Extrakcia textu z html - Extrakcia horného obrázka z html - Extrakcia všetkých obrázkov z html - Extrakcia kľúčových slov z textu - Súhrnná extrakcia z textu - Extrakcia autorov z textu - Extrakcia výrazov trendov Google
newspaper-metadata-extractor-

Kategórie

Alternatívy programu Newspaper pre Self-Hosted s licenciou zadarmo