일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 마우스클릭
- 크롤링
- 빅데이터분석기사후기
- BeautifulSoup
- 방향변경
- 오류
- 너무오래됐다
- OpenGL
- 호주
- 청청구역
- 색상변경
- 데이터전처리
- 유니코드 제거
- 갈자신이없다
- 예쁜곳
- 언제또가보지
- 빅데이터분석기사필기
- 멜버른
- 빅데이터분석기사
- 파이썬
- 애니메이션
- 필기후기
- 사각형변형
- 보라카이
- 정말
- selenium
- 가고싶은데
Archives
- Today
- Total
wisdiom 아니고 wisdom
3. 데이터프레임 응용(3) 본문
3️⃣ Filtering, 필터링
📢 불린 인덱싱(boolean indexing)
boolean indexing이란,
Series 객체에 어떤 조건식을 적용하면 각 원소에 대해 참/거짓을 판별하여 boolean(True, False) 값으로 구성된 Series를 반환한다. 이때, True에 해당하는 값을 따로 선택하는 것을 말한다.
📍 DataFrame객체 [boolean Series]
📌 boolean Series란?🚨🔥
>> 데이터프레임의 각 열(시리즈 객체)에 조건식(>, <, ==, ...)을 적용하면 각 원소가 조건을 만족하는지 여부를 True, False로 표시한 것
예시)
# 나이가 10세 미만이거나 60세 이상인 승객의 age, sex, alon 열만 선택
mask3 = (tt.age < 10) | (tt.age >= 60)
tt_under10_morethan60 = tt.loc[mask3, ['age', 'sex', 'alone']]
tt_under10_morethan60.head()
📢 isin() 메소드 활용
특정 값을 가진 행들을 따로 추출할 수 있다.
📍 DataFrame객체['열 이름'].isin(추출하려는 값 리스트)
📍 DataFrame객체.열이름.isin(추출하려는 값 리스트)
예시)
isin_filter = tt['sibsp'].isin([3, 4, 5])
tt_isin = tt[isin_filter]
📢 잠깐!! ✋
📌 위 예시를 boolean indexing을 이용해 필터링 해보자 🚨🔥
bool_filter = (tt.sibsp == 3) | (tt.sibsp == 4) | (tt.sibsp == 5)
tt_bool = tt[bool_filter]
💡 실행결과
> 위 실행결과를 통해 열 값에서 조건을 걸 경우, boolean indexing 방법보다 isin() 메소드를 사용하는 것이 효율적이다.
반응형
'👩💻 > pandas' 카테고리의 다른 글
3. 데이터프레임 응용(4) (0) | 2021.01.31 |
---|---|
3. 데이터프레임 응용(0) (0) | 2021.01.31 |
3. 데이터프레임 응용(2) (0) | 2021.01.31 |
3. 데이터프레임 응용(1) (0) | 2021.01.31 |
2. 데이터 사전 처리 (0) | 2021.01.27 |
Comments