Kazalo:

Kako ravnate z vrednostmi NA v R?
Kako ravnate z vrednostmi NA v R?

Video: Kako ravnate z vrednostmi NA v R?

Video: Kako ravnate z vrednostmi NA v R?
Video: Глазные болезни. Новообразования на веках. Как лечить? 2024, Maj
Anonim

Ko uvozite nabor podatkov iz drugih statističnih aplikacij, manjkajoče vrednosti je lahko kodiran s številko, na primer 99. Da bi dovolili R vedeti, da je a manjkajoča vrednost morate ga prekodirati. Še ena uporabna funkcija v R do obravnavati manjkajoče vrednosti je na . omit(), ki izbriše nepopolna opazovanja.

Samo tako, kako ravnate z NA v R?

Možnosti NA v R

  1. izpusti in na. exclude: vrne objekt z odstranjenimi opazovanji, če vsebujejo manjkajoče vrednosti; razlike med izpuščanjem in izključitvijo NA je mogoče opaziti v nekaterih funkcijah napovedi in preostalih.
  2. pass: vrne objekt nespremenjen.
  3. neuspešno: vrne objekt samo, če ne vsebuje manjkajočih vrednosti.

Podobno, kako ravnate z manjkajočimi kategoričnimi podatki v R? Obstajajo različni načini za obravnavo manjkajočih vrednosti kategoričnih načinov.

  1. Prezrite opažanja manjkajočih vrednosti, če imamo opravka z velikimi nizi podatkov in manjkajoče vrednosti ima manj zapisov.
  2. Prezrite spremenljivko, če ni pomembna.
  3. Razvijte model za napovedovanje manjkajočih vrednosti.
  4. Manjkajoče podatke obravnavajte kot samo še eno kategorijo.

Podobno se lahko vprašate, kako nastavite manjkajoče vrednosti v R?

V R , manjkajoče vrednosti so predstavljeni s simbolom NA (ni na voljo). Nemogoče vrednote (npr. deljenje z nič) so predstavljene s simbolom NaN (ne število). Za razliko od SAS, R uporablja isti simbol za znake in številke podatkov . Za več prakse pri delu z manjkajoči podatki , preizkusite ta tečaj čiščenja podatki v R.

Kaj pomeni Na Rm v R?

Ko uporabljate funkcijo podatkovnega okvirja na . rm v r se nanaša na logični parameter, ki pove funkciji, ali naj se odstrani ali ne NA vrednosti iz izračuna. To dobesedno pomeni NA Odstrani. To ni niti funkcija niti operacija. To je preprosto parameter, ki ga uporablja več funkcij podatkovnega okvirja.

Priporočena: