반응형
추론통계
점추정 : 모수 즉 모평균이나 모표준편차 등과 같은 추정치를 이에 대응하는 통계량으로 추정
> 모수와 추정량 처리
모수 | 추정량 |
모평균(𝜇)에 대한 점추정 | 표본집단의 표본평균 x̄ = (1/k) * Σ (i=1부터 k까지) xi |
모분산(𝜎 2 )에 대한 점추정 | 표본집단의 표본분산 s² = (1 / (n - 1)) * Σ (i=1부터 n까지) (xi - x̄)² |
모비율에 대한 점추 | P̂ = X / n X : 표본 중에 성공으로 나타난 개체수, n : 표본의 개체수 |
편향 : 기대하는 추정량과 모수의 차이, 편향이 0이 되면 불편추정량
최대우도추정량 : 표본을 얻을 확률이 가장 높은, 즉 주어진 관찰값을 가장 잘 설명해주는 𝜃̂
구간추정 : 첨추정에 오차의 개념을 도입하여 모수가 포함되는 확률변수구간을 어떤 신뢰성 아래 추정하는 것
> 모평균 신뢰구간 정리
구분 | 신뢰구간 |
모집단의 분산을 아는 경우 | X̄ - (Zα/2) * (σ / √n) ≤ μ ≤ X̄ + (Zα/2) * (σ / √n) |
모집단의 분산을 모르는 경우 (표본크기가 작음) |
X̄ - (tα/2, n-1) * (S / √n) ≤ μ ≤ X̄ + (tα/2, n-1) * (S / √n) |
모집단의 분산을 모르는 경우 (표본크기가 큼) |
X̄ - (Zα/2) * (S / √n) ≤ μ ≤ X̄ + (Zα/2) * (S / √n) |
> 모분산, 모비율 신뢰구간
모분산 신뢰구간 | 모비율 신뢰구간 |
(n - 1)S² / χ²(1-α/2) < σ² < (n - 1)S² / χ²(α/2) | p̂ - Zα/2 * √(p̂(1 - p̂) / n) < p < p̂ + Zα/2 * √(p̂(1 - p̂) / n) |
가설검정 : 검정통계량의 표본분포에 따라 채택여부를 결정짓는 통계적 분석과정
귀무가설 H0 : 현재 통념적으로 믿어지고 있는 모수에 대한 주장 또는 원래의 기준이 되는 가설
대립가설 H1 : 연구자가 모수에 대해 새로운 통계적 입증을 이루어 내고자 하는 가설
실제 상황검정 결과H₀ 채택H₀ 기각
\ 실제상황 검정결과 |
H0 | H1 |
H₀ 채택 | 성공 (Success) | 제1종 오류 (Type 1 Error) |
H0 기각 | 제2종 오류 (Type 2 Error) | 성공 (Success) |
유의수준 : 귀무가설이 맞는데 틀렸다 결론 내리게 될 확률, 제 1종 오류를 범할 확률의 최대 허용한계
p-value : 귀무가설을 기각하려고 할 때 필요한 최소의 유의수준
> 집단크기에 따른 검정통계량 설정
대표본 또는 모집단이 정규분포 | 정규분포 따르면서 소표본 |
Z = (X̄ - μ) / (σ / √n) ~ N(0, 1) | T = (X̄ - μ) / (S / √n) ~ t(n - 1) |
> 표본에 따른 검정통계량 설정
두 독립표본의 평균차이 검정 | 대응표본의 평균차이 검정 |
T = (Xˉ−Yˉ\bar{X} - \bar{Y}) / (Sₚ * √(1/𝑛_X + 1/𝑛_Y)) | T = D / (SD / √n) |
S_p^2 = ((n-1)S_1^2 + (m-1)S_2^2) / (n+m-2) | SD2=n−1∑(Di−Dˉ)2 |
단일표본모분산에 대한 가설검정(x^2 검정) | 두 모분산비에 대한 가설검정(F 검정) |
χ² = (Σ(xᵢ - x̄)²) / σ₀² = ϕS² / σ₀² | F = S₁² / S₂² |
참고도서
이기적 빅데이터분석기사필기(2024)
반응형
'빅데이터분석기사 > 필기' 카테고리의 다른 글
[빅데이터분석기사 / 필기] 빅데이터 모델링2 (1) | 2024.08.29 |
---|---|
[빅데이터분석기사 / 필기] 빅데이터 모델링 (1) | 2024.08.26 |
[빅데이터분석기사 / 필기] 빅데이터 탐색2 (2) | 2024.08.21 |
[빅데이터분석기사 / 필기] 빅데이터 탐색 (1) | 2024.08.13 |
[빅데이터분석기사 / 필기] 빅데이터의 이해 (1) | 2024.08.08 |