헤맨 만큼 내 땅이다

Python/빅데이터분석기사 실기

빅데이터 분석기사 실기 체험 문제 3유형 3번 문제 (25.6/7)

mm대장 2025. 6. 7. 11:54

③ 2번 문제에서 구한 합동 분산 추정량을 이용하여, 두 집단의 로그 리지스턴 값에 유의미한 차이가 있는지 독립표본 t-검정을 수행하고, p-값을 구하여라

 

scipy.stats 이용

# 독립표본 t-검정 수행
# 검정 가설:
# 귀무 가설 (H0): 두 집단 로그 리지스틴 값의 평균에는 차이가 없다.
# 대립 가설 (H1): 두 집단 로그 리지스틴 값의 평균에는 차이가 있다.

# equal_var=True로 설정하여 두 집단의 분산이 같다고 가정하고 (합동 분산 사용) 검정 수행
ttest_result = stats.ttest_ind(group1_data['Log_Resistin'],
                               group2_data['Log_Resistin'],
                               equal_var=True)


# 결과 출력
t_statistic = ttest_result.statistic
p_value = ttest_result.pvalue

#print("\n독립표본 t-검정 결과 (분산 동일 가정):")
#print(f"t-통계량: {t_statistic}")
print(f"p-값: {p_value}")

round_p_value = round(p_value,3)
print(round_p_value)