Kazalo:

Kako lahko izboljšam svojo sqoop uspešnost?
Kako lahko izboljšam svojo sqoop uspešnost?

Video: Kako lahko izboljšam svojo sqoop uspešnost?

Video: Kako lahko izboljšam svojo sqoop uspešnost?
Video: Kumina za prebavo 2024, Maj
Anonim

Za optimizacijo izvedba , set the število nalog preslikave na vrednost, nižjo od the največje število povezav, ki the podpira bazo podatkov. Kontroliranje the količina vzporednosti, ki Sqoop bo uporabljen za prenos podatkov je the glavni način nadzora the obremenitev tvoj bazo podatkov.

Ustrezno temu, kaj se zgodi, če sqoop med procesom ne uspe?

Tipičen Sqoop opravilo, ki vnaša podatke iz izvorne baze podatkov v HDFS, bo kopiralo podatke v ciljni imenik. Kopirana datoteka bo izbrisana če sqoop ne uspe brez dokončanja.

Lahko se tudi vprašate, kako dosežete vzporednost v sqoop-u? Nadzorovanje Vzporednost . Sqoop vzporedno uvaža podatke iz večine virov baze podatkov. Z argumentom -m ali --num-mappers lahko določite število opravil preslikave (vzporednih procesov), ki jih želite uporabiti za izvajanje uvoza. Vsak od teh argumentov ima celo število, ki ustreza stopnji vzporednost zaposliti

Posledično, kako lahko izboljšam učinkovitost poizvedbe Hive?

Spodaj je seznam praks, ki jim lahko sledimo za optimizacijo Hive Queries

  1. Omogoči stiskanje v panju.
  2. Optimizirajte združitve.
  3. Izogibajte se globalnemu razvrščanju v panju.
  4. Omogoči Tez Execution Engine.
  5. Operator Optimize LIMIT.
  6. Omogoči vzporedno izvajanje.
  7. Omogoči strogi način Mapreduce.
  8. Enotno zmanjšanje za več skupin BY.

Kako deluje sqoop split?

Uporablja se lahko za izboljšanje učinkovitosti uvoza z doseganjem večje vzporednosti. Sqoop ustvarja razcepi na podlagi vrednosti v določenem stolpcu tabele, ki je določen z -- razdeliti -by uporabnik prek ukaza uvoz. Če ni na voljo, se za ustvarjanje uporabi primarni ključ vhodne tabele razcepi.

Priporočena: