123
DiffBot

DiffBot

* Získavajte údaje z webových stránok automaticky: Rozhranie API pre počítačové videnie spoločnosti Diffbot premení web na vašu databázu.* AUTOMATIC API: Extrahujte automatickyZískajte štruktúrovaný obsah z článkov, produktov a iných známych typov stránok.
Prečo Diffbot?Zameriavame sa výlučne na získavanie lepších webových údajov.Niektoré z dôvodov, prečo stovky zákazníkov každý mesiac uskutočňujú (stovky) milióny hovorov: # Najlepším nástrojom na extrahovanie obsahu na webe: Diffbot pracuje automaticky - bez pravidiel alebo školení.Neexistuje lepší spôsob, ako extrahovať údaje z webových stránok.Pozrite sa, ako sa Diffbot hromadí s inými metódami extrahovania obsahu: Porovnanie funkcií Porovnanie kvality extrakcie textu # Automatické identifikovanie stránok: Rozhranie API na analýzu slúži na automatické vyhľadávanie a extrahovanie všetkých produktov, článkov, diskusií alebo obrázkov počas prehľadávania ľubovoľnej lokality.Analyzovať API #Rozšírené údaje o produktoch: Rozhranie API produktu automaticky vracia úplné informácie o produkte vrátane všetkých údajov o cenách, ID produktov, značiek a tabuliek úplných špecifikácií.Produktové API # Čistý text a html: Články, diskusné vlákna, popisy produktov a popisky obrázkov sa vracajú v čistom texte a dezinfikovanom HTML.Začnite testovať ešte dnes # Strukturované vyhľadávanie: Vyhľadávanie štruktúrovaného obsahu z ľubovoľného prehľadávania za behu pomocou nášho vyhľadávacieho rozhrania API a vracanie iba zodpovedajúcich výsledkov.Plus ... ¤ Všetky API vykonávajú Javascript, takže obsah je analyzovaný ako bežný prehliadač.¤ Funguje na väčšine neanglických stránok vďaka vizuálnemu spracovaniu.Norm Normalizácia dátumu: Datové značky sú normalizované a prezentované v štandardnom formáte RFC 1123 (HTTP / 1.1).¤ Viaceré články sa automaticky spoja do jednej odpovede API.Extraction Extrakcia entít: automatické označovanie identifikuje hlavné témy a entity v texte článku.¤ Opravte všetky problémy v reálnom čase pomocou API Toolkit.¤ Hromadné API umožňuje extrakciu stoviek až stotisíc strán.¤ Získajte prístup k údajom úloh Crawlbot a Bulk v plnom formáte JSON alebo CSV.¤ Voliteľne môžete prehľadávať pomocou rôznych polí IP adries.

Vlastnosti

Kategórie

Alternatívy programu DiffBot pre Self-Hosted s licenciou s otvoreným zdrojom