일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 멜버른
- 청청구역
- 보라카이
- 예쁜곳
- 사각형변형
- 갈자신이없다
- 정말
- 방향변경
- 색상변경
- 파이썬
- selenium
- 빅데이터분석기사
- 데이터전처리
- 너무오래됐다
- 가고싶은데
- BeautifulSoup
- 빅데이터분석기사후기
- 유니코드 제거
- 빅데이터분석기사필기
- 호주
- 크롤링
- 언제또가보지
- 마우스클릭
- 필기후기
- OpenGL
- 오류
- 애니메이션
- Today
- Total
목록👩💻/pandas (19)
wisdiom 아니고 wisdom

Machine Learning (기계학습) 컴퓨터가 스스로 학습하여 인공지능의 성능을 향상 시키는 기술 방법 🎂 머신러닝 종류 🍒 Reinforcement Learning (강화 학습) : 어떤 환경에서 정의된 에이전트가 현재의 상태를 인식하여 선택 가능한 행동들 중 보상을 최대화 하는 행동 혹은 행동 순서를 선택하는 방법 🧊 Supervised Learning (지도 학습) : 정답 데이터(Label)가 포함된 데이터를 통해 컴퓨터를 학습시키는 방법 Prediction(예측) Regression(회귀분석), ANN(신경망) Classification(분류) K-NN(k-최근접 이웃), Naive Bayes(나이브 베이즈), SVM(서포트 벡터 머신), Decision Tree(의사결정 나무) 🍰 Uns..

6️⃣ MultiIndex, 멀티 인덱스 판다스는 행 인덱스를 여러 레벨로 구현할 수 있도록 멀티 인덱스 클래스를 지원한다. 📍 pandas.DataFrame.xs(key, axis=0, level=None, drop_level=True) - key : label or tuple of label - axis 0 or 'index', 1 or 'columns' - level : key가 포함된 위치 또는 label # sex 값이 male인 행 선택 avg.xs('male', level='sex') 7️⃣ Pivot, 피벗 판다스 pivot_table() 함수는 엑셀에서 사용하는 피벗테이블과 비슷한 기능을 처리한다. 📍 pandas.pivot_table(data, values=None, index=None..

5️⃣ 그룹 연산 그룹 연산이란 복잡한 데이터에 특정 기준을 적용하여 몇 개의 그룹으로 분할하여 처리하는 것을 말한다. 특히, 그룹 연산은 데이터를 집계, 변환, 필터링하는데 효율적이다. ☝ 분할(split) : 데이터를 특정 조건에 의해 분할 ✌ 적용(apply) : 데이터를 집계, 변환, 필터링하는데 필요한 메소드 적용 👌 결합(combine) : 2단계의 처리 결과를 하나로 결합 📢 그룹 객체 만들기 (분할 단계) 📍 pandas.DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, observed=False, dropna=True) (참고) https://pandas.pydata.org/pa..

4️⃣ 데이터프레임 합치기 📢 데이터프레임 연결 서로 다른 데이터프레임들의 구성 형태와 속성이 균일하다면, 행 또는 열 중에 어느 한 방향으로 이어 붙여도 데이터의 일관성을 유지할 수 있다. 기존 데이터프레임의 형태를 유지하면서 이어 붙이는 개념으로 Pandas concat() 함수를 활용한다. 📍 pandas.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=True) - objs : DataFrame 또는 Series로 이루어진 리스트 - axis - 0 or 'index' : 위 아래 행 방향으로 연결 - 1 or ..

DataFrame Structure 데이터프레임에는 데이터프레임의 크기, 데이터 구성 항목, 자료형, 통계 수치 등 여러 정보를 확일할 수 있는 속성과 메소드가 포함되어 있다. 1️⃣ 데이터 내용 미리보기 📍 앞부분 미리보기 : DataFrame객체.head(n) 📍 뒷부분 미리보기 : DataFrame객체.tail(n) * n은 숫자 2️⃣ 데이터 요약 정보 확인하기 📢 데이터프레임의 크기(행, 열) 📍 DataFrame객체.shape 데이터프레임 클래스의 shape 속성은 행과 열의 개수를 튜플 형태로 보여준다. 📢 데이터프레임의 기본 정보 📍 DataFrame객체.info() - 클래스 유형 - 행 인덱스의 구성 - 열 이름의 종류와 개수 - 각 열의 자료형과 개수 - 메모리 할당량 📢 데이터프레임..

3️⃣ Filtering, 필터링 📢 불린 인덱싱(boolean indexing) boolean indexing이란, Series 객체에 어떤 조건식을 적용하면 각 원소에 대해 참/거짓을 판별하여 boolean(True, False) 값으로 구성된 Series를 반환한다. 이때, True에 해당하는 값을 따로 선택하는 것을 말한다. 📍 DataFrame객체 [boolean Series] 📌 boolean Series란?🚨🔥 >> 데이터프레임의 각 열(시리즈 객체)에 조건식(>, = 60) tt_under10_morethan60 = tt.loc[mask3, ['age', 'sex', 'alone']] tt_under10_morethan60.head() 📢 isin() 메소드 활용 특정 값을 가진 행들을 따..

2️⃣ 열 재구성 📢 열 순서 변경 📍 DataFrame객체[ 재구성한 열 이름의 리스트 ] # ☝ 알파벳 순으로 열 순서 변경하기 # 1) 기존 열 이름을 리스트로 만든다. # 2) 오름차순 정렬한다. # 3) 열 순서를 변경한다. df_sorted = df[sorted(list(df.columns.values))] # ✌ 열 이름을 기존 순서의 역순으로 정렬하기 df_reverse = df[list(reversed(df.columns.values))] # 👌 사용자 임의로 열 순서 재배치하기 df_custom = df[['pclass', 'sex', 'age', 'survived']] 📢 열 분리 🔥 주가 데이터 '연월일'열에서 '연', '월', '일' 데이터로 분리하기 astype() 메소드를 사용..

1️⃣ 함수 매핑 함수 매핑은 시리즈 또는 데이터프레임의 개별 원소를 특정 함수에 일대일 대응시키는 과정을 말한다. 사용자가 직접 만든 함수(lambda 함수 포함)를 적용할 수 있기 때문에, 판다스 기본 함수로 처리하기 어려운 복잡한 연산을 판다스 객체에 적용하는 것이 가능하다. 📢 Series객체 함수 매핑 📍 Series객체.apply(func) 시리즈 객체에 apply() 메소드를 적용하면, 매핑 함수에 시리즈의 모든 원소를 하나씩 인자로 전달한다. 리턴값으로 같은 시리즈 객체를 받는다. 예시) # 사용자 정의 함수 def add_two_obj(a, b): return a+b # Series 객체와 숫자에 적용 : 2개의 인수(시리즈 + 숫자) sr = df['age'].apply(add_two_..