일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- 크롤링
- 오류
- 언제또가보지
- 유니코드 제거
- selenium
- 필기후기
- OpenGL
- 애니메이션
- 빅데이터분석기사
- 빅데이터분석기사후기
- 색상변경
- 방향변경
- 갈자신이없다
- 가고싶은데
- 파이썬
- 예쁜곳
- 사각형변형
- 정말
- 너무오래됐다
- 마우스클릭
- 호주
- BeautifulSoup
- 멜버른
- 보라카이
- 청청구역
- 빅데이터분석기사필기
- 데이터전처리
Archives
- Today
- Total
wisdiom 아니고 wisdom
4. 빅데이터 플랫폼 본문
(1) 빅데이터 플랫폼(Bigdata Platform) 개념
: 빅데이터에서 가치를 추출하기 위해 일련의 과정(수집 - 저장 - 처리 - 분석 - 시각화)를 규격화한 기술이다.
(2) 빅데이터 플랫폼 구성요소
- 데이터 수집 ⭐
- 원천 데이터 정형/반정형/비정형 데이터 수집
- ETL, 크롤러, EAI 등
- 데이터 저장 ⭐
- 정형 데이터, 반정형 데이터, 비정형 데이터 저장
- RDBMS, NoSQL 등
- 데이터 분석
- 텍스트 분석, 머신러닝, 통계, 데이터 마이닝
- SNS 분석, 예측 분석 등
- 데이터 활용
- 데이터 가시화 및 BI, Open API 연계
- 히스토그램, 인포그래픽 등
(3) 빅데이터 플랫폼 데이터 형식
- HTML
- HyperText Markup Language
- 웹 페이지를 만들 때 사용되는 문서 형식
- 텍스트, 태그, 스크립트로 구성
- XML
- eXtensible Markup Language
- SGML 문서 형식을 가진, 다른 특수한 목적을 갖는 마크업 언어를 만드는 데 사용하는 다목적 마크업 언어
- 데이터 표현을 위해 태그 사용
- 엘리먼트, 속성, 처리 명령, 엔티티, 주석, CDATE 섹션으로 구성
- CSV
- Comma Separated Values
- 몇 가지 필드를 쉼표(,)로 구분한 텍스트 데이터 및 텍스트 파일
- JSON
- JavaScript Object Notation
- <키-값>으로 이루어진 데이터 오브젝트를 전달하기 위해 텍스트를 사용하는 개방형 표준 포맷
(4) 분산 컴퓨팅 환경 소프트웨어
- 맵리듀스(Map Reduce), 얀(YARN), 아파치 스파크(Apache Spark) , 하둡 분산 파일(HDFS), 아파치 하둡(Apache Hadoop)
반응형
'👩🎓✍ > BigData 분석기사' 카테고리의 다른 글
6. 분석 로드맵 설정 (0) | 2021.03.07 |
---|---|
5. 개인정보보호법 · 제도 (0) | 2021.03.07 |
3. 빅데이터 조직 및 인력 (0) | 2021.03.07 |
2. 빅데이터 위기 요인 및 통제 방안 (0) | 2021.03.07 |
1. 빅데이터 특징 (0) | 2021.03.07 |
Comments