일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 영어회화
- #직장인영어
- 뉴노멀챌린지
- Ringle
- #링글후기
- 링글리뷰
- 장어랑고기같이
- 링글
- 소통챌린지
- #영어발음교정
- #Ringle
- 링글커리어
- 둔촌역장어
- 영어공부
- #링글
- #nlp
- 총각네장어
- 오피스밋업
- 영어시험
- 강동구장어맛집
- 영어공부법
- 스몰토크
- #영어공부
- 성내동장어
- CommunicateWiththeWorld
- 링글경험담
- 화상영어
- 해외취업컨퍼런스
- #체험수업
- 영어로전세계와소통하기
- Today
- Total
Soohyun’s Machine-learning
[statistic] : mean, median, mode 본문
khan academy 정리
1. mean
일반적인 의미의 average (전체 값을 sum한 것을, 전체 개수로 나눠준 것). specific하게 들어가면 좀 다른 것 같으나.. 일단 칸 아카데미 강의에서는 average 로 그냥 보는 듯
ex) 23, 29, 20, 32, 23, 21, 33, 25
mean : (23 + 29 + 20 + 32 + 23 + 21 + 33 + 25) / 8
2. median
---------> median값의 개수가 even number (짝수)이면 sum( median numbers ) / 2 = 24 이렇게 24가 median이 된다.
ex) 20, 21, 23, 23, 25, 29, 32, 33
-------
---
20, 21, 23, 24, 25, 29, 32
---> median 값의 개수가 odd number (홀수)이면 그냥 이걸로 쓴다.
3. mode
most frequent. 최빈수. 가장 많이 등장하는 숫자
통계쪽에서 #은 number라는 뜻이다.
e.g.) Ana played 5 rounds of golf, and her lowest score was an 80. The scores of the first 4 rounds and the lowest round are shown in the following dot plot.
● ● ● ● ●
|------------------|------------------|------|-----|----|---|--------------|
80 85 90 92 94 95 96 100
median : 92
mean : 90 * 2/5
It was discovered that Ana broke some rules when she scored 80, so that score will be removed from the data set.
● ● ● ●
|------------------|------------------|------|-----|----|---|--------------|
80 85 90 92 94 95 96 100
그러면 mean과 median 값은 어떻게 변화할까? (dataset에서 최소값이 사라졌을 때)
median : 93
mean : 93
Both of them increase
IMPACT ON MEDIAN & MEAN : increasing an outlier
e.g.) A group of 4 friends likes bowl together, and each friend keeps track of his all-time highest score in a single-game. Their high scores are all between 180 and 220, except for Adam, whose high score is 250.
Adam then bowls a great game and has a new high score of 290.
How will increasing Adam's high score affect the mean and median?
180 ? 220 250 base dataset
---- ---- ---- ----
180 ? 220 290 new dataset
---- ---- ----- -----
- median won't change
- mean will increase
INTERQUARTILE RANGE (IQR)
사분위간 범위, spread 정도를 측정하는 애.
e.g.)
4 |
4 |
10 |
11 |
15 |
7 |
14 |
12 |
6 |
Find the Interquartile range of the dataset
1)
4, 4, 6, 7, 10, 11, 12, 14, 15 ----> 우선 정렬한다
2)
4, 4, 6, 7, 10, 11, 12, 14, 15 ----> median을 찾는다.
3)
4, 4, 6, 7, 10, 11, 12, 14, 15 ----> median 값을 중심으로 나눠진 애들을 찾는다.
----------- ---------------
first half second half
4)
4, 4, 6, 7, 10, 11, 12, 14, 15 ----> 나눠진 애들에서 average 를 찾는다.
↓ ↓
만약에 median이 even number일 경우..
e.g.) Find the IQR of the data in the dot plot below.
songs on each album in Shane's collection
●
● ● ●
● ● ● ● ● ●
|-----|-----|-----|-----|-----|-----|-----|-----|-----|
6 7 8 9 10 11 12 13 14 15
Number of songs
7 9 9 10 10 10 11 12 12 14
1)
7 9 9 10 10 10 11 12 12 14
7 9 9 10 10 10 11 12 12 14
------------------------ -----------------------------
first half second half
average : average :
9 12
y-intercept : y 절편, x=0이 되는 지점에서의 y값
'Machine Learning > Math & Stats' 카테고리의 다른 글
[statistic]: normal distribution, standard deviation (0) | 2017.10.19 |
---|---|
[statistic]: Two-way tables (0) | 2017.10.19 |
[math]: 연쇄 법칙 (chain rule) (1) | 2017.10.14 |
[math]: Dell operator, Tensor (기호 설명) (0) | 2017.10.14 |
[math]: 선형 대수 (Linear algebra) (0) | 2017.10.14 |