일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 언제또가보지
- 필기후기
- 청청구역
- selenium
- 보라카이
- 색상변경
- 크롤링
- OpenGL
- 호주
- 정말
- 애니메이션
- 빅데이터분석기사
- 가고싶은데
- 방향변경
- 오류
- 너무오래됐다
- 데이터전처리
- 빅데이터분석기사후기
- 사각형변형
- 갈자신이없다
- BeautifulSoup
- 멜버른
- 마우스클릭
- 파이썬
- 유니코드 제거
- 빅데이터분석기사필기
- 예쁜곳
Archives
- Today
- Total
wisdiom 아니고 wisdom
26. 범주형 자료 분석 본문
범주형 자료 분석
종속변수가 하나이고 범주형인 데이터를 분석하여 모형의 유의성과 독립변수의 유의성을 알아보는 분석 방법
- 독립변수 - 범주형
- 분할표 분석
- 교차 분석(카이제곱 검정)
- 피셔의 정확 검정
- 독립변수 - 수치형
- 로지스틱 회쉬 분석
(1) 분할표 분석
- 1원(One-way) 분할표 : 범주형 변수 1개
- 2원(Two-way) 분할표 : 범주형 변수 2개
- 다원(Multi-way) 분할표 : 범주형 변수 3개 이상
사건 발생 O | 사건 발생 X | 합계 | |
관심 집단 | a | b | a + b |
비교 집단 | c | d | c + d |
합계 | a + c | b + d | a + b + c + d |
📍 상대위험도(Relative Risk, RR)
관심 집단의 위험률과 비교 집단의 위험률에 대한 비, (a/(a+b)) / (c/(c+d))
* 상대위험도 결과
- RR < 1 : 관심 집단의 특정 사건 발생 확률이 낮다.
- RR = 1 : 관심 집단과 특정 사건의 발생에는 연관성이 없다.
- RR > 1 : 관심 집단의 특정 사건 발생 확률이 높다.
📍 승산비(Odds Ratio, 교차비, 대응위험도)
특정 조건이 있을 떄의 성곤 승산을 다른 조건이 있을 떄의 성공 승산으로 나눈 값, ad / bc
(2) 교차분석(카이제곱 검정)
χ²값은 편차의 제곱 값을 기대빈도로 나눈 값들의 합
- 적합도 검정 : 표본 집단의 분포가 주어진 특정 이론을 따르고 있는지를 검정하는 기법
- 가정된 확률 검정 : 카이제곱 검정
- 정규성 검정 : 샤피로-윌크 검정, 콜모고로프-스미르노프 적합성 검정, Q-Q Plot
- 독립성 검정 : 여러 범주를 가지는 2개의 요인이 독립적인지, 서로 연관성이 있는지를 검정하는 기법
- 동질성 검정 : 각각의 독립적인 부모집단으로부터 정해진 표본의 크기만틈 자료를 추출하는 경우에 관측값들이 정해진 범주 내에서 서로 동질한지 여부를 검정하는 기법
(3) 피셔의 정확 검정(Fisher's Exact Exam)
표본 수가 적거나 표본이 셀에 치우치게 분포되어 있을 경우 실시(기대빈도가 5 미만인 셀이 20%를 넘는 경우)
반응형
'👩🎓✍ > BigData 분석기사' 카테고리의 다른 글
28. 시계열 분석 (0) | 2021.03.20 |
---|---|
27. 다변량 분석 (0) | 2021.03.20 |
25. 군집 분석, Cluster Analysis (0) | 2021.03.18 |
24. 연관성 분석, Association Analysis (0) | 2021.03.18 |
23. 서포트 벡터 머신, SVM (0) | 2021.03.16 |
Comments