Kazalo:

Kaj so izstopajoči pri analizi podatkov?
Kaj so izstopajoči pri analizi podatkov?

Video: Kaj so izstopajoči pri analizi podatkov?

Video: Kaj so izstopajoči pri analizi podatkov?
Video: Gregory Chaitin: Complexity, Metabiology, Gödel, Cold Fusion 2024, November
Anonim

V statistiki, an presežek je podatkov točka, ki se bistveno razlikuje od drugih opažanj. An presežek je lahko posledica variabilnosti meritev ali lahko kaže na eksperimentalno napako; slednji so včasih izključeni iz podatkov set. An presežek lahko povzroči resne težave pri statistične analize.

Glede na to, kako v podatkih najdete izstopajoče?

Točka, ki sodi zunaj podatkov notranjost nabora je razvrščena kot manjša presežek , medtem ko je tisti, ki pade zunaj zunanjih ograj, razvrščen kot glavni presežek . Da bi našli notranje ograje za svoje podatkov nastavite, najprej pomnožite interkvartilni razpon z 1,5. Nato dodajte rezultat Q3 in ga odštejte od Q1.

Ali moram poleg zgoraj navedenega odstraniti izstopajoče vrednosti iz svojih podatkov? Za the večinoma, če vaše podatke na vas vplivajo ti ekstremni primeri lahko vezan the prispevek k zgodovinskemu predstavniku vaše podatke to izključuje izstopajočih . Od primera do primera določite, kaj the učinek izstopajočih je bil. In od tam se odločite, ali želite Odstrani , spremenite ali obdržite presežek vrednote.

Kako se v zvezi s tem analiza podatkov ukvarja z izstopajočimi?

Tu so štirje pristopi:

  1. Odstranite izstopajoče zapise. V primeru Billa Gatesa ali drugega resničnega izstopa je včasih najbolje, da ta zapis popolnoma odstranite iz nabora podatkov, da ta oseba ali dogodek ne izkrivlja vaše analize.
  2. Omejite svoje izstopajoče podatke.
  3. Dodeli novo vrednost.
  4. Poskusite s preobrazbo.

Kaj je primer izstopajočega?

Izstopajoče . več Vrednost, ki "leži zunaj" (je veliko manjša ali večja od) večine drugih vrednosti v nizu podatkov. Za primer pri ocenah 25, 29, 3, 32, 85, 33, 27, 28 sta oba 3 in 85 " izstopajočih ".

Priporočena: