Kaj je podatkovno jezero v Hadoopu?
Kaj je podatkovno jezero v Hadoopu?

Video: Kaj je podatkovno jezero v Hadoopu?

Video: Kaj je podatkovno jezero v Hadoopu?
Video: What is Data Lake | Understand the Data Lake Architecture | Data Lake using Apache Spark 2024, November
Anonim

A Podatkovno jezero Hadoop je podatkov platforma za upravljanje, ki obsega eno ali več Hadoop grozdi. Uporablja se predvsem za obdelavo in shranjevanje nerelacijskih podatkov , kot so datoteke dnevnika, internetni zapisi toka klikov, senzor podatkov , predmeti JSON, slike in objave v družbenih medijih.

Kakšna je v tem pogledu razlika med podatkovnim skladiščem in podatkovnim jezerom?

Podatkovna jezera in podatkov skladišča se pogosto uporabljajo za shranjevanje velikih podatkov , vendar niso zamenljivi izrazi. A podatkovno jezero je ogromen bazen surovega podatkov , katerega namen še ni opredeljen. A podatkovno skladišče je skladišče za strukturirane, filtrirane podatkov ki je bil že obdelan za določen namen.

Poleg tega, kaj je arhitektura podatkovnega jezera? A Podatkovno jezero je skladišče za shranjevanje, ki lahko shrani veliko količino strukturiranih, polstrukturiranih in nestrukturiranih podatkov . Za razliko od hierarhične hiše Dataware kjer podatkov je shranjena v datotekah in mapah, Podatkovno jezero ima stanovanje arhitekturo.

Kaj v zvezi s tem pomeni podatkovno jezero?

A podatkovno jezero je skladišče za shranjevanje, ki vsebuje veliko količino surovega podatkov v izvorni obliki, dokler ni potreben. Medtem ko je hierarhično podatkov skladiščnih trgovin podatkov v datotekah ali mapah, a podatkovno jezero za shranjevanje uporablja ravno arhitekturo podatkov . Izraz podatkovno jezero je pogosto povezan s shranjevanjem objektov, usmerjenim v Hadoop.

Ali je Elasticsearch podatkovno jezero?

A podatkovno jezero je preprosto mesto za parkiranje podatkov dokler ga ne potrebujete, in bi lahko vključeval HDFS (najpogostejši), shranjevanje objektov, škatle NAS ali kar koli drugega. v bistvu Elastično iskanje je orodje za indeksiranje podatkov , ne za shranjevanje podatkov sama.

Priporočena: