Home \ index
 

Jukse med statistiske data.

 

Som alle vet med et øye for detaljer, kan statistikk være en veldig glatt ting hvis du ikke kan tolke dem riktig. Fortsett å lese for å forstå komplisert og misvisende statistikk og bruk den kunnskapen til din fordel.

              

Fremgangsmåte .

    

    1      Fusk med gjennomsnitt  ,

    
     
  1.            1      Forstå terminologien. Ordet "gjennomsnitt" kommer stadig opp når man diskuterer statistiske data. Ved første øyekast virker begrepet ganske klart: gjennomsnittet returnerer et tall som representerer gjennomsnittet av summen av tallverdiene. Det er imidlertid en rekke forskjellige gjennomsnitt som kan villede deg hvis du ikke kan fortelle dem fra hverandre.  
       
    • Den aritmetiske gjennomsnittet beregnes ved å legge sammen alle tallene i et datasett og dele dem med antall datapunkter. Med andre ord, hvis du har tallene 3, 3, 5, 4 og 7, legger du til dem og får 22 og deler den summen med 5 (fordi posten består av 5 tall).  
         
      • I dette eksemplet er det aritmetiske gjennomsnittet 4,4.
      •  
       
    •  
    • median av et datasett representerer verdien som ligger i midten mellom de lave og høye tallene. Med samme tall som i forrige eksempel (3, 3, 5, 4 og 7) er medianen 4 fordi 2 tall er mindre og 2 er større.
    •  
    • modus representerer det vanligste nummeret på en plate. I vårt eksempel er modusen 3 fordi det nummeret vises to ganger.
    •  
           
  2.  
  3.             2      Jukse med det aritmetiske gjennomsnittet. Det aritmetiske gjennomsnittet kan virke som den mest logiske måten å beregne et middel på, men det er selvfølgelig ikke tilfelle. Årsaken til dette er at svært høye eller lave verdier i et datasett kan forvride det slemme. Å jukse med det aritmetiske gjennomsnittet, samle utbyttere i datasettet og la dem strømme inn i beregningen.  
       
    • Anta at du intervjuer 50 husstander i et nabolag i henhold til deres inntekt. De fleste husholdninger tjener mellom 25 000 og 45 000 euro i året, men en husholdning har en inntekt på 5 millioner euro. Hvis du nå beregner gjennomsnittlig inntekt, er den mye høyere enn den "virkelige" gjennomsnittlige inntekten til dette området, fordi de 5 millioner euro er så mye høyere enn inntektene til en vanlig husholdning.
    •  
    • På samme måte, hvis du har data som viser at 9 personer har 1000 euro på sin konto, men den tiende er bare 1 euro, er gjennomsnittet 900.10 euro - nesten 10% lavere enn det vanligste beløpet.
    •  
    • I seriøse undersøkelser fjernes de svært høye og svært lave datapunktene ofte før gjennomsnittet beregnes. Men ikke alle undersøkelser som vises i media er seriøse. Hvis du ikke har tilgang til de innsamlede dokumentene, og det ikke er noen skriftlig forsikring om at utjevningene er fjernet, bør du anta at dette ikke er gjort.
    •  
           
  4.  
  5.             3      Fusk med medianen. Faktisk er det relativt vanskelig å jukse med medianen fordi den aldri kan bli for høy eller for lav i sammenligning. Det må være tvunget til å jukse i midten. Medianen er derfor egnet for å gjemme veldig store eller små tall. For eksempel, hvis posten din er 1, 1, 2, 3, 4, 5, 3000, er medianen 3.  
       
    • Hvis du har et jevnt antall datapunkter, kan du finne medianen ved å beregne gjennomsnittet for de to mellomoppføringene. Men så har du fortsatt problemet med utelukker.
    •  
    • Bli oppmerksom hvis medianen brukes til å representere endringer over tid. Et selskap hvis priser stiger med 3% hvert år kan øke dem med 20% på ett år, og dette kan være B. ved å indikere medianverdien for de siste 9 årene.
    •  
           
  6.  
  7.             4      Juks med modusen. For noen ting er det nesten umulig å jukse med modusen. For eksempel, i gjennomsnitt, antall billetter kjøpt av en person for en fotballkamp. Dette er nesten alltid gjengitt korrekt av modusen. Likevel, selv med modusen, kan viktige datapunkter bli skjult, spesielt i små datasett.  
       
    • Hvis du for eksempel har en plate med alle tallene i området 1 til 100, men nummer 1 vises tre ganger, er modusen Record 1, selv om gjennomsnittet (mye mer fornuftig i dette eksemplet) vil være 50.
    •  
    • Enhver undersøkelse hvis spørsmål besvares på bred skala, kan enkelt manipuleres med modusen. Hvis du z. For eksempel, hvis 100 personer vurderte noe fra 1 til 10 og flere personer besvarte spørsmålet med "10" enn noe annet nummer, er modusen 10, selv om bare en person vurdert spørsmålet 10 mer enn antall personer som gjorde det vurdert dem som 1
    •  
           
  8.  
  9.             5      Juksekoder med representativt antall. Hvis du har et datasett som ikke inneholder konkrete men abstrakte tall (for eksempel en kundetilfredshetsundersøkelse), er det veldig enkelt å manipulere. Hvis man spør folk om å vurdere sin tilfredshet på en skala fra 1 til 3, viser dette ikke nødvendigvis at kunder som har valgt 3, er tre ganger mer fornøyde enn kunder som vurderer fakta som 1. På denne måten blir gjennomsnittet manipulert veldig ofte, men det skjer også med medianen og noen ganger til og med modusen.                  
  10.  
             

    2      Fusk med dataserier  ,

    
     
  1.             1      Bruk en liten post. Enhver god statistiker vet at den eneste måten å få et anerkjent gjennomsnitt eller følge med på, er å beholde størst mulig datasett. Hvis du har informasjon fra 100 personer, vel; 10.000 er selvsagt mye bedre. Jo mer informasjonen din inneholder, desto mer sannsynlig vil du få nøyaktige gjennomsnitt. Hvis du bruker et datasett med 3 til 5 datapunkter, får du resultater som absolutt ikke gjenspeiler virkeligheten på riktig måte.  
       
    • Anta at du vet at to personer som nylig har skadet seg med noe helt outlandish, som en pute, og bruker dem som de eneste elementene i datasettet. Du kan da hevde at puter er generelt svært farlige. Uansett hvilket gjennomsnitt du bruker, så lenge du ikke avslører at du bare har to datapunkter, kan ingen motbevise kravet ditt.
    •  
           
  2.  
  3.             2      Bruk en kontrollert plate. De mest pålitelige postene er ikke bare store, men også vidt spredte. En geolog som studerer typer mineraler funnet i en ørken, får bedre resultater ved å ta mange prøver på forskjellige steder enn ved å samle 1000 prøver på ett sted. Ved å begrense omfanget av datainnsamlingen, kan du påvirke resultatene vesentlig.  
       
    • Noen ganger er det rimelig og ment å gjøre det. Demografere vil for eksempel finne ut om yrker som utøves av menn og derfor bare spørre menn. Så lenge en slik begrensning er tydelig fra dataene, er det helt legitimt å fortsette.
    •  
    • Datarier av små forskningsprosjekter ved universiteter har ofte en tendens til å presentere et kontrollert datasett som et generelt resultat. Årsaken til dette er at mange universitetsprosjekter ikke har nok tid og penger til å samle store, tilfeldige prøver av vanlige borgere og i stedet fokusere på studenters utfall. Dette er i sin tur ikke et problem så lenge fakta tydelig fremgår av studien, men aviser på jakt etter overskrifter som å kaste denne detaljene til side for å piske opp små universitetsstudier.
    •  
           
  4.  
  5.             3      Bruk en ubalansert post. Denne teknikken er spesielt smart fordi den lar deg uklare resultater, selv om mange detaljer er gitt til betrakteren. Trikset er å bruke data som ikke kan sammenlignes rimelig, men behandle det som tilsvarende. For eksempel kan man sammenligne en by på 100 000 innbyggere, som har fått 10 000 nye innbyggere de siste ti årene, med en landsby på 10 innbyggere, med 10 innbyggere. Prosentvis sammenligning viser at landsbyen har vokst mye raskere enn byen.  
       
    • Denne teknikken brukes noen ganger av folk som analyserer markedsdata for å gi et misvisende bilde av salgstallene. Anta at man observerer salget av epler og appelsiner, men selv om studien løper, er det ikke flere appelsiner på grunn av en flaskehals. Hvis du fortsetter studien, vil du plutselig se et hopp i den relative økningen i eplesalget sammenlignet med oransje, selv om epler ikke sannsynligvis vil være i mye høyere etterspørsel plutselig.
    •  
           
  6.  
             

    3      Fusk med grafikk  ,

    
     
  1.             1      La beskrivelsen stå på y-aksen. Grafer eller diagrammer er den eneste måten å tydelig kartlegge data på, men de kan også manipuleres for å produsere forskjellige effekter. En grunn til dette er at seerne pleier å se på figurer og størrelser i grafen før du tar hensyn til tallrike detaljer. Den enkleste måten å manipulere y-aksen på, er bare å ikke beskrive den.  
       
    • Hvis du har 5 underavdelinger på x-aksen, men du ikke vet hvordan de forholder seg til hverandre, er det umulig å fortelle om det er betydelige forskjeller mellom dem.
    •  
           
  2.  
  3.             2      Bruk svært store eller små tall på y-aksen. La oss si at rekordet varierer fra 1 til 50. For å skjule forskjellene, plott y-aksen i trinn på 100; For å understreke dem overdrevet, legg dem i 1/10 trinn. Forskjellen mellom 3 og 10 ser gigantisk ut i en skala fra tiendedeler av trinnene (de er 70 enheter fra hverandre!), Men er nesten usynlige på en graf på 100-tallet Trinn (de er mye mindre enn en enhet fra hverandre!).        
  4.  
  5.             3      Start y-aksen halvveis i dataserien. Hvis posten varierer fra 11 til 51, kan du gjøre det laveste tallet lavere og det høyeste tallet enda høyere ved å ha y-aksen startet klokken 10. Således er stangen på 11 bare like utenfor x-aksen. Det er nesten ikke-eksisterende hvis ingen ser nøye ut og merker at grafen starter på 10 og ikke 0.  
       
    • Verdien 51 på denne grafen ser 50 ganger større ut enn verdien 11 fordi den bare er en enhet høy. Hvis du hadde startet grafen ved 0, ville baren med verdien 51 bare vært fem ganger høyere enn verdien av verdien 11.
    •  
           
  6.  
  7.             4      Bruk upassende skalering. Hvis du finner ordene "ikke skaleres" hvor som helst i fotnoten, har du sannsynligvis kommet over et eksempel. Det skjer ikke alltid med ondsinnet hensikt, noen ganger er tallene i et datasett så stor forskjellig at det blir umulig å representere dem nøyaktig på samme side. Men denne metoden kan også brukes til å villede folk.  
       
    • For eksempel kan en visuell presentasjon av størrelsen vises i oppskalere, men ikke breddeskalaen, og objektet (for eksempel en bygning) vises større og også tynnere eller bredere enn det faktisk er.
    •  
           
  8.  
  9.             5      Bruk grafikk for å hoppe over data. Denne teknikken finnes ofte i storskalaundersøkelser som deler resultater i bestemte kategorier, for eksempel et amerikansk berømt kart som viser hvilket uttrykk som er mest populært for en karbonholdig drikkevare i hvilket amerikansk fylke. Ved første øyekast ser informasjonen seg veldig detaljert ut, men snart oppstår det spørsmål: Hvor bredt er forskningsdataene? Hva er terskelen for å bestemme resultatet? Var gjennomsnittlig, median eller modus brukt?  
       
    • Hvis du bare bruker ett resultat fra hver region du har undersøkt og utelater de andre, kan du kontrollere resultatene fra regionen uten å avsløre at prøvestørrelsen var svært liten. Igjen mangler det informasjon som til slutt ikke tillater kvantifisering av resultatene.
    •  
           
  10.  
            

Tips .

                  

Advarsler .

             
Index populær:
Starte sitt eget land.

Lag en regnpinne.

Fjern tomatsaus fra stoff.

Kom deg ut av et tennissett.

Vedlikehold mykt, smidig tørt hår.

Behandle bleieutslett.

Snakk med din ektefelle om ditt ønske om en baby.

Forhindre å heve baby pounds.

Kjenne en tyr.

Planlegger et ekteskap.

Ta tak i oppveksten av ens eget barn.

Gjør fetaost.

Kontroller væskenivået i bilen.

Send inn og trykk.

Forbereder Kheer.

Babymassasje.

Vedta stiftebarnet ditt.

Kjøp ingenting.

Bli en mannlig stripper.

Sørger.

Raskt amme.