빅데이터분석기사/필기

[빅데이터분석기사 / 필기] 빅데이터 탐색3

록스타★ 2024. 8. 26. 10:13
반응형

추론통계

점추정 : 모수 즉 모평균이나 모표준편차 등과 같은 추정치를 이에 대응하는 통계량으로 추정

 > 모수와 추정량 처리

모수 추정량
모평균(𝜇)에 대한 점추정 표본집단의 표본평균
x̄ = (1/k) * Σ (i=1부터 k까지) xi
모분산(𝜎 2 )에 대한 점추정 표본집단의 표본분산
s² = (1 / (n - 1)) * Σ (i=1부터 n까지) (xi - x̄)²
모비율에 대한 점추 P̂ = X / n
X : 표본 중에 성공으로 나타난 개체수, n : 표본의 개체수

 

편향 : 기대하는 추정량과 모수의 차이, 편향이 0이 되면 불편추정량

최대우도추정량 : 표본을 얻을 확률이 가장 높은, 즉 주어진 관찰값을 가장 잘 설명해주는 𝜃̂

구간추정 : 첨추정에 오차의 개념을 도입하여 모수가 포함되는 확률변수구간을 어떤 신뢰성 아래 추정하는 것

 > 모평균 신뢰구간 정리

구분 신뢰구간
모집단의 분산을 아는 경우 X̄ - (Zα/2) * (σ / √n) ≤ μ ≤ X̄ + (Zα/2) * (σ / √n)
모집단의 분산을 모르는 경우
(표본크기가 작음)
X̄ - (tα/2, n-1) * (S / √n) ≤ μ ≤ X̄ + (tα/2, n-1) * (S / √n)
모집단의 분산을 모르는 경우
(표본크기가 큼)
X̄ - (Zα/2) * (S / √n) ≤ μ ≤ X̄ + (Zα/2) * (S / √n)

 

> 모분산, 모비율 신뢰구간

모분산 신뢰구간 모비율 신뢰구간
(n - 1)S² / χ²(1-α/2) < σ² < (n - 1)S² / χ²(α/2) p̂ - Zα/2 * √(p̂(1 - p̂) / n) < p < p̂ + Zα/2 * √(p̂(1 - p̂) / n)

 

가설검정 : 검정통계량의 표본분포에 따라 채택여부를 결정짓는 통계적 분석과정

 

귀무가설 H0 : 현재 통념적으로 믿어지고 있는 모수에 대한 주장 또는 원래의 기준이 되는 가설

대립가설 H1 : 연구자가 모수에 대해 새로운 통계적 입증을 이루어 내고자 하는 가설

실제 상황검정 결과H₀ 채택H₀ 기각

              \ 실제상황
검정결과
H0  H1
H₀ 채택 성공 (Success) 제1종 오류 (Type 1 Error)
H0 기각 제2종 오류 (Type 2 Error) 성공 (Success)

 

유의수준 : 귀무가설이 맞는데 틀렸다 결론 내리게 될 확률, 제 1종 오류를 범할 확률의 최대 허용한계

p-value : 귀무가설을 기각하려고 할 때 필요한 최소의 유의수준

 

 > 집단크기에 따른 검정통계량 설정 

대표본 또는 모집단이 정규분포 정규분포 따르면서 소표본
Z = (X̄ - μ) / (σ / √n) ~ N(0, 1) T = (X̄ - μ) / (S / √n) ~ t(n - 1)

 

 > 표본에 따른 검정통계량 설정

두 독립표본의 평균차이 검정 대응표본의 평균차이 검정
T = (Xˉ−Yˉ\bar{X} - \bar{Y}) / (Sₚ * √(1/𝑛_X + 1/𝑛_Y)) T = D / (SD / √n)
S_p^2 = ((n-1)S_1^2 + (m-1)S_2^2) / (n+m-2) SD2=n1(DiDˉ)2
단일표본모분산에 대한 가설검정(x^2 검정)   두 모분산비에 대한 가설검정(F 검정)
χ² = (Σ(xᵢ - x̄)²) / σ₀² = ϕS² / σ₀² F = S₁² / S₂²

 

 

참고도서

이기적 빅데이터분석기사필기(2024)

반응형