Kaj je motor za obdelavo podatkov za Amazon Elastic MapReduce?
Kaj je motor za obdelavo podatkov za Amazon Elastic MapReduce?

Video: Kaj je motor za obdelavo podatkov za Amazon Elastic MapReduce?

Video: Kaj je motor za obdelavo podatkov za Amazon Elastic MapReduce?
Video: Введение в веб-сервисы Amazon, Лев Жадановский 2024, Maj
Anonim

Amazon EMR uporablja Apache Hadoop kot svojo distribuirano motor za obdelavo podatkov . Hadoop je odprtokodni programski okvir Java, ki podpira podatkov -intenzivne porazdeljene aplikacije, ki se izvajajo v velikih grozdih od blaga strojna oprema.

Poleg tega, kaj je Amazon Elastic MapReduce?

Amazon Elastic MapReduce ( EMR ) je Amazonove spletne storitve ( AWS ) orodje za obdelavo in analizo velikih podatkov. Amazon EMR obdeluje velike podatke v gruči navideznih strežnikov Hadoop Amazon Elastic Računalniški oblak ( EC2 ) in Amazon Enostavna storitev shranjevanja ( S3 ).

Poleg tega je Amazon EMR v celoti upravljan? Je v celoti upravljano storitev podatkovnega jezera, ki lahko loči shranjevanje podatkov od računalniških virov in namesto tega naredi računalniške gruče razširljive, na voljo za uporabo na zahtevo in vključuje možnost, da več grozdov hkrati dostopa do istih naborov podatkov.

Lahko se tudi vprašate, kako deluje AWS EMR?

Na splošno, ko obdelujete podatke v Amazon EMR , so vhod podatki, shranjeni kot datoteke v izbranem osnovnem datotečnem sistemu, kot je npr Amazon S3 ali HDFS. Ti podatki prehajajo iz enega koraka v drugega v zaporedju obdelave. Zadnji korak zapiše izhodne podatke na določeno lokacijo, kot je npr Amazon S3 vedro.

Kakšna je razlika med ec2 in EMR?

Za razliko od EMR , EC2 ne kategorizira podrejenih vozlišč v jedro in vozlišča opravil. To poveča tveganje izgube podatkov HDFS v primeru odstranitve/izgube vozlišča. EC2 uporablja knjižnice Apache (s3a) za dostop do podatkov na s3. Po drugi strani, EMR uporablja lastniško kodo AWS za hitrejši dostop do s3.

Priporočena: