Soohyun’s Machine-learning

[statistic]: normal distribution, standard deviation 본문

Machine Learning/Math & Stats

[statistic]: normal distribution, standard deviation

Alex_Rose 2017. 10. 19. 12:21

normal distribution    (정규분포)    or    Gaussian distribution (가우스 분포)



연속 확률 분포의 하나. 정규 분포는 수집된 자료의 분포를 근사하는데에 자주 사용되며, 중심극한정리에 의해 독립적인 확률 변수들의 평균은 정규분포에 가까워지는 성질이 있기 때문이다. 정규분포는 2개의 parameter 평균 와 standard deviation   (small sigma)에 대해 모양이 걸졍이 되고, 이때의 분포를 N(,)로 표기한다. 특히, 평균이 0이고 표준편차가 1인 정규분포 N(0,1)을 standard normal distribution이라고 한다. 

출처 : https://ko.wikipedia.org/wiki/%EC%A0%95%EA%B7%9C%EB%B6%84%ED%8F%AC




standard deviation    (표준편차) = just square root of variance 



variance에 square root을 씌워서 나오는 값이 standard deviation임 ㅇㅇ



자료의 산포도를 나타내는 수치로, 분산의 양의 제곱근으로 정의된다. 표준편차가 작을수록 평균값에 변량들과의 거리가 가깝다. 


khan academy explain : 

standard deviation measures the spread of a data distribution. The more spread out a data distribution is, the greater its standard deviation. stddev cannot be negative. A stddev close to 0 indicates that the data points tend to be close to the mean



standard deviation




 


normal distribution : https://ko.wikipedia.org/wiki/%EC%A0%95%EA%B7%9C%EB%B6%84%ED%8F%AC

standard distribution : https://en.wikipedia.org/wiki/Standard_deviation




Measures of spread : range, variance & standard deviation


A : -10, 0, 10, 20, 30

B : 8, 9, 10, 11, 12


둘의 mean값은 동일한 10이다. 그러나 실질적으로 각각 구성하는 elements들은 다른게 보인다.




How far away from average? = std dev



1. range : 


숫자중 가장 큰 것 - 가장 작은 숫자 = 거리


A : 30 - (-10) = 40        40만큼 떨어져 있다.

B : 12 - 8 = 4               4만큼 떨어져 있다. 




2. variance :          (squared small sigma)


 A's

variance

 


 B's

variance

 



A's stddev = 

B's stddev = 











'Machine Learning > Math & Stats' 카테고리의 다른 글

[Discrete math] Propositional logic  (0) 2018.07.29
[statistics]:  (0) 2017.10.23
[statistic]: Two-way tables  (0) 2017.10.19
[statistic] : mean, median, mode  (0) 2017.10.17
[math]: 연쇄 법칙 (chain rule)  (1) 2017.10.14
Comments