Wat is Gaussiaanse distributie?

Posted on
Schrijver: Louise Ward
Datum Van Creatie: 11 Februari 2021
Updatedatum: 1 November 2024
Anonim
What is a Gaussian Distribution?
Video: What is a Gaussian Distribution?

Inhoud

In statistieken wordt de Gaussiaanse of normale verdeling gebruikt om complexe systemen met veel factoren te karakteriseren. Zoals beschreven in Stephen Stigler's The History of Statistics, heeft Abraham De Moivre de distributie uitgevonden die de naam van Karl Fredrick Gauss draagt. Gauss 'bijdrage lag in zijn toepassing van de distributie naar de kleinste kwadratenbenadering om fouten bij het aanpassen van gegevens met een lijn die het beste past te minimaliseren. Hij maakte het daarmee de belangrijkste foutverdeling in de statistiek.

Motivatie

Wat is de verdeling van een steekproef van gegevens? Wat als u de onderliggende distributie van de gegevens niet kent? Is er een manier om hypothesen over de gegevens te testen zonder de onderliggende verdeling te kennen? Dankzij de Central Limit Theorem is het antwoord ja.

Verklaring van de stelling

Het stelt dat een steekproefgemiddelde van een oneindige populatie ongeveer normaal is, of Gaussiaans, met gemiddelde hetzelfde als de onderliggende populatie, en variantie gelijk aan de populatievariantie gedeeld door de steekproefomvang. De benadering verbetert naarmate de steekproefgrootte groter wordt.

De benaderingsverklaring wordt soms verkeerd weergegeven als een conclusie over convergentie met een normale verdeling. Aangezien de geschatte normale verdeling verandert naarmate de steekproefomvang toeneemt, is een dergelijke verklaring misleidend.

De stelling is ontwikkeld door Pierre Simon Laplace.

Waarom het overal is

Normale distributies zijn alomtegenwoordig. De reden hiervoor komt van de Central Limit Theorem. Vaak is een waarde, wanneer een waarde wordt gemeten, het someffect van veel onafhankelijke variabelen. Daarom heeft de gemeten waarde zelf een steekproefgemiddelde kwaliteit. Een verdeling van de prestaties van de atleet kan bijvoorbeeld een klokvorm hebben, als gevolg van verschillen in voeding, training, genetica, coaching en psychologie. Zelfs herenhoogten hebben een normale verdeling, en zijn een functie van vele biologische factoren.

Gaussiaanse Copulas

Wat een "copula-functie" met een Gaussiaanse distributie wordt genoemd, was in 2009 in het nieuws vanwege het gebruik ervan bij het beoordelen van het risico van beleggen in zekerheidsobligaties. Het misbruik van de functie was van groot belang in de financiële crisis van 2008-2009. Hoewel er veel oorzaken van de crisis waren, hadden Gaussiaanse distributies achteraf waarschijnlijk niet moeten worden gebruikt. Een functie met een dikkere staart zou grotere waarschijnlijkheid hebben toegekend aan bijwerkingen.

Afleiding

De centrale limietstelling kan in vele lijnen worden bewezen door de moment genererende functie (mgf) van (steekproefgemiddelde - populatiegemiddelde) /? (Populatievariantie / steekproefgrootte) te analyseren als een functie van de mgf van de onderliggende populatie. Het benaderende deel van de stelling wordt geïntroduceerd door de mgf van de onderliggende populatie uit te breiden als een vermogensreeks en vervolgens aan te tonen dat de meeste termen onbeduidend zijn naarmate de steekproefomvang groter wordt.

Het kan in veel minder regels worden bewezen door een Taylor-uitbreiding op de karakteristieke vergelijking van dezelfde functie te gebruiken en de steekproefgrootte groot te maken.

Computationeel gemak

Sommige statistische modellen veronderstellen dat de fouten Gaussiaans zijn. Dit maakt het mogelijk verdelingen van functies van normale variabelen, zoals de chikwadraat- en F-verdeling, te gebruiken in hypothesetesten. Specifiek is in de F-test de F-statistiek samengesteld uit een verhouding van chikwadraatverdelingen, die zelf functies zijn van een normale variantieparameter. De verhouding van de twee zorgt ervoor dat de variantie teniet wordt gedaan, waardoor hypothesetesten mogelijk zijn zonder kennis van de varianties, afgezien van hun normaliteit en constantheid.