Kaj je zmanjšati s ključem?
Kaj je zmanjšati s ključem?

Video: Kaj je zmanjšati s ključem?

Video: Kaj je zmanjšati s ključem?
Video: Kako najti Ključ do ravnovesja in kaj pričakovati od zasebne spletne šole Peti element? 2024, Maj
Anonim

Funkcija Spark RDD reduceByKey združi vrednosti za vsako ključ z uporabo asociativa zmanjšati funkcijo. To intuitivno pomeni, da ta funkcija proizvede enak rezultat, če se večkrat uporablja za isti niz podatkov RDD z več particijami, ne glede na vrstni red elementa.

Kakšna je potem razlika med groupByKey in reduceByKey?

groupByKey () je samo za združevanje vašega nabora podatkov na podlagi ključa. zmanjšatiByKey () je nekaj podobnega združevanju + združevanju. zmanjšatiByKey se lahko uporablja, ko izvajamo na velikem naboru podatkov. aggregateByKey() je logično enak kot zmanjšatiByKey (), vendar vam omogoča, da vrnete rezultat v drugačen tip.

Vedite tudi, zakaj je zmanjšanje delovanja v iskri? Zmanjšanje iskre operacija je dejanje vrsta operacije in sproži popolno izvedbo DAG za vsa postavljena lena navodila. Iskra RDD zmanjšati funkcija reducira elemente tega RDD z uporabo podanega komutativnega in asociativnega binarnega operaterja. Zmanjšanje iskre delovanje je skoraj podobno kot zmanjšati metoda v Scali.

Poleg zgoraj, kaj je Pairrdd?

Spark zagotavlja posebne operacije na RDD-jih, ki vsebujejo pare ključ/vrednost. Ti RDD-ji se imenujejo parni RDD-ji. Parni RDD-ji so koristen gradnik v številnih programih, saj razkrivajo operacije, ki vam omogočajo vzporedno delovanje na vsakem ključu ali ponovno združevanje podatkov v omrežju. ParRDD-jev so pari KLJUČ/VREDNOST.

Ali je reduceByKey dejanje?

reducira () izpiše zbirko, ki ne dodaja usmerjenega acikličnega grafa (DAG), zato je implementirana kot dejanje . Vendar pa zmanjšatiByKey () vrne RDD, ki je le še ena raven/stanje v DAG, zato je transformacija.

Priporočena: