본문 바로가기

반응형

공부/빅데이터 분석기사

(4)
빅데이터 분석기사 필기 합격 후기 (비전공자) 2021 2회 이지만 처음인... 빅데이터 분석기사 시험을 응시했다. 시험 준비 요약 비전공자 코딩경험 있음 데이터 경험 없음 빅데이터 분석기사 필기 책 (수제비) 약 2주간 준비 하루 평균 2-3시간 후기 이번이 처음인 시험이고 데이터 분석에 대한 관심도 있었다. 하지만 이전 까지는 데이터 분석에 대한 지식이 전무하였고 통계에 대한 부분을 하나도 몰랐었다. 그래서 글로만 읽기에는 어려운 부분이 있었던 것은 사실이었다. 하지만 운이 좋게도? 합격할 수 있었다. 약 2주간 하루 1시간정도? 하고 시험 다가올때는 조금 빡세게 공부하였다. 관련 개념을 이해하려고 노력하였고 용어 암기위주로 먼저하다가 3단원에서 집중적으로 관련 개념 이해와 통계 이해를 위해 노력하였다. 실제 시험에서는 예상했던 바와 조금은 달랐..
빅데이터 모델링 빅데이터 모델링 1. 분석 모형 설계 분석 모형 선정 분석 모형 선정 목적에 적합하고, 변수들을 고려하여 분석 모형을 선정하는 과정 현상에서 패턴발견 - EDA, 추론 및 예측 - 머신러닝 통계기반 분석 모형 선정 기술 통계 확률통계적으로 요약하는 기초적인 통계 분석 초기단계에서 데이터 분포의 특징 파악 상관분석 두개 이상의 변수 간에 존재하는 상호 연관성 정도 측정 변수의 개수및 데이터 속성에 따라서 세부 모델들로 분류 단순상관, 다중상관, 변수간의 상관분석 회귀분석 하나 이상의 독립변수들이 종속변수에 미치는 영향을 추정 단순 회귀 : 독립변수 1개, 종속변수와 직선 관계 다중 회귀 : 독립변수가 K개, 종속변수와의 관계가 선형 다항 회귀 : 독립변수와 종속변수와의 관계가 1차 함수 이상인 관계 곡선회..
빅데이터 탐색 빅데이터 탐색 1. 데이터 전처리 데이터 정제 결측값을 채우거나 이상값을 제거하는 과정을 통해 데이터의 신뢰도를 높이는 작업 데이터 정제 절차 오류 원인 분석 결측값 : 누락, 중심 경향값넣기로 처리 가능 노이즈 : 일정범위 중간값 대체 이상값 : 하한,상한값 대체 대상 선정 정제방법 결정 정확한 데이터로 수정하거나 삭제하는 과정 삭제, 대체, 예측값 삽입 등으로 시행 데이터 정제 기술 데이터 일관성유지를 위해 수행하는 정제 기법 변환 : 다양한 형태로 표현된 값을 형태 변환 - 코드변환, 형식변환(YYMMDD -> YY.MM.DD) Parsing : 정제규칙 적용위해 최소단위로 분할 - 주민등록번호를 생년월일, 성별로 분할 보강 : 추가 정보를 반영 데이터 정제 기술 ETL : 추출, 가공 하여 데이터..
빅데이터 분석 기획 빅데이터 분석기획 1. 빅데이터의 이해 빅데이터 특징 빅데이터 개념 빅데이터는 정형+비정형(반정형) DIKW 피라미드로 표현가능 data, information,Knowledge, Wisdom 데이터는 단순한 데이터 정보는 의미가 도출된 데이터 지식은 일반화 시킨 결과물 지혜는 창의적 아이디어 특징 전통의 3V Volume 규모 Variety 다양성 Velocity 속도 5V, 7V Veracity , Value 추가 (신뢰성, 가치 ) Validity, Volatility 추가 ( 정확성, 휘발성) 빅데이터의 유형 정형 - 스키마 구조 DBMS에 저장될 수 있는 구조 Oracle, MS-SQL 반정형 - 데이터 구조에 대한 메타정보 포함 (XML, HTML, JSON) 비정형 - 데이터객체로 구분 -그..

반응형