반응형

빅데이터 분석기사 2

[빅데이터분석기사 / 필기] 빅데이터 탐색2

#1 고급데이터 탐색시공간 데이터 : 공간적 정보에 시간의 흐름이 결합된 다차원 데이터시간 데이터 : 데이터에 유효 시간, 거래 시간, 사용자 정의 시간과 같은 연관된 시간 표현 정의공간 데이터 : 래스터, 벡터 공간, 기하학, 위상적 타입 등 정의 공간 데이터 모델관계형 모델정적 모델, 표현이 유연하지 못해 실세계 공간 객체의 특징 표현에 한계객체지향 모델비 구조적, 자연스런 표현, 연산과 함수 확장이 쉬움, 무결성 검사 용이 시공간자료 질의어시공간자료정의언어- 시공간 테이블 인덱스 및 뷰의 정의문, 변경문 등- 공간적, 시간적 속성을 동시 포함시공간자료조작언어- 객체의 삽입, 삭제, 변경 등의 검색문- 시간지원, 공간 연산자를 포함, 공간관리와 이력정보 제공   다변량 데이터 탐색 : 변수들간 인과관..

[빅데이터분석기사 / 필기] 빅데이터 탐색

#1 데이터 정제데이터 정제 과정 : 다양한 매체로부터 데이터 수집, 원하는 형태로 변환, 원하는 장소에 저장, 활용가능성을 타진하기 위한 품질 확인, 사용이 원활하도록 관리 > 비정형 데이터의 경우 구조화된 정형 데이터로 변환을 수행, 결측치와 오류 수정 과정 필요전처리데이터 저장 전 처리, 대상 데이터와 입수 방법 결정, 저장 방식/장소 선정  후처리데이터 저장 후 처리, 저장 데이터의 품질관리 등의 과정 포함  결측치 (missing data, 손실 데이터) : 어떠한 자료값도 관측 대상변수에 저장되지 않을 때 발생완전 무작위 결측어떤 변수상에서 결측 데이터가 다른 변수와 아무런 연관이 없는 경우무작위 결측결측 데이터가 관측된 다른 변수와 연관이 있지만 비관측값들과는 연관되지 않는 경우, 결측이 완..

반응형