123
Disco MapReduce

Disco MapReduce

Disco je ľahký, open-source framework pre distribuované výpočty založený na paradigme MapReduce a napísaný v Pythone.
Disco je implementácia mapreduce pre distribuované výpočty.Disco podporuje paralelné výpočty na veľkých množinách údajov uložených na nespoľahlivom klastri počítačov, ako v pôvodnom rámci vytvorenom spoločnosťou Google.Vďaka tomu je dokonalým nástrojom na analýzu a spracovanie veľkých súborov údajov bez obáv z náročných technických problémov týkajúcich sa distribúcie, ako sú komunikačné protokoly, vyrovnávanie záťaže, uzamykanie, plánovanie úloh a odolnosť proti chybám, ktoré spracúva spoločnosť Disco.

Vlastnosti

Kategórie

Alternatívy Disco MapReduce pre všetky platformy s akoukoľvek licenciou

Apache Hadoop

Apache Hadoop

Apache Hadoop je softvér s otvoreným zdrojovým kódom, ktorý podporuje dátovo náročné distribuované aplikácie licencované na základe licencie Apache v2.
Apache Spark

Apache Spark

Apache Spark ™ je rýchly a všeobecný stroj na spracovanie rozsiahlych údajov. Programy Spomalené spustenie až 100x rýchlejšie ako Hadoop MapReduce v pamäti alebo 10x rýchlejšie na disku.
Amazon Kinesis

Amazon Kinesis

Služby Amazon Kinesis uľahčujú prácu s streamovanými dátami v reálnom čase v cloude AWS.
dispy

dispy

dispy je Python framework na paralelné vykonávanie výpočtov tým, že ich distribuuje do viacerých procesorov na jednom počítači (SMP), medzi mnoho počítačov v klastri alebo ...