2. Fisher의 직접확률 검정

만약 사건 발생 수, 빈도 수가 극히 적거나(특히 5개 이하의 빈도가 전체 셀 중 20%이상 존재하는 경우) 서로의 빈도 수의 차이가 큰 경우
→ 카이제곱검정 의 정확도가 낮아짐

→ 피셔의 직접확률 검정(피셔의 정확검정) 사용

귀무가설 : A의 효과가 없었다.
대립가설 : A의 효과가 있었다.

# 패키지 import
import pandas as pd
import numpy as np
import scipy.stats as stats

# fake : 가짜약, real : 진짜약, good : 효과 있음, bad : 효과 없음
# 귀무가설 : 약의 효과가 없었다, 대립가설: 약의 효과가 있었다.
data = pd.DataFrame([[1,6], [5,2]], index = ['good','bad'], columns = ['fake','real'])
data

	fake	real
good	1	6
bad	5	2

odds, pvalue = stats.fisher_exact(data)

print("오즈비 : ", round(odds,3),'\n''p-value : ', round(pvalue,3 ))

오즈비 :  0.067 
p-value :  0.103

결과해석 : p-value가 0.103으로 귀무가설을 채택한다. 즉, 약의 효과가 없었다고 볼 수 있다(약의 유효성 확인x)

3. Macnemar 검정

짝지어진 자료(paired data, 같은 대상자로부터 두 번 측정한 자료)에서는 그룹 간 값들이 종속적임(독립x)
따라서, 그룹 간 비율을 비교하려면 카이제곱 검정보단 맥네마 검정을 해야함

paired data 예) 인슐린 치료 전후의 당뇨병성 케톤산혈증 발생 여부 조사, 동일 환자의 MRI와 CT로 한 번씩 반복 검사하여 질병 발생 여부 확인

귀무가설 : 전후의 차이가 없다.
대립가설 : 전후의 차이가 있다.

# 필요한 패키지 import
from statsmodels.stats.contingency_tables import mcnemar
import pandas as pd
import numpy as np

# BF : 투약 전, AF : 투약 후, 0 : 발작 발생x, 1 : 발작 발생
data = pd.DataFrame([[16, 10], [27, 31]], index = ['BF_0','BF_1'], columns = ['AF_0','AF_1'])
data

	AF_0	AF_1
BF_0	16	10
BF_1	27	31

# b+c > 25일때
# 데이터 프레임 사용x, 배열 형태여야 함
data = np.array(data)
result = mcnemar(data, exact = False, correction = True)

print('stat : ', round(result.statistic,3),'\n''p-value : ', round(result.pvalue,3))

stat :  6.919 
p-value :  0.009

# b+c < 25일때
result2 = mcnemar(data, exact = True)
print('stat : ', round(result2.statistic,3),'\n''p-value : ', round(result2.pvalue,3))

stat :  10.0 
p-value :  0.008

결과해석 : p-value가 0.009로 귀무가설을 기각한다. 즉, 투약 전후의 발작 발생 비율이 유의하다.