빅데이터분석기사 필기 오답노트 블로그
빅데이터분석기사 필기 오답노트
1과목 : 빅데이터 분석 기획
1. 다음 중 데이터에 대한 설명으로 틀린 것은?
① 데이터는 일반적으로 정형, 비정형, 반정형 데이터로 구분된다.
② 비정형 데이터는 텍스트, 음성, 영상 등 특수한 데이터이다.
③ 정형 데이터는 흔히 볼 수 있는 주로 숫자로 구성된 데이터이다.
④ 정형 데이터는 비정형 데이터보다 품질이 우수하며 다양한 분석이 가능하다.
정답 : 4번
- 정형, 비정형, 반정형 데이터의 구분은 품질과는 무관하며, 정형 데이터보다 비정형 데이터가 일반적으로 다양한 분석을 시도하기에 유리하다.
2. 다음 중 정보의 특징이 아닌 것은?
① 적정성
② 일관성
③ 관련성
④ 적시성
정답 : 2번
- 정보는 정확성, 적시성, 적당성, 관련성의 특징을 가진다.
3. 다음 중 지식창조 매커니즘의 단계가 아닌 것은?
① 표출화(Externalization)
② 내면화(Internalization)
③ 통합화(Integration)
④ 공통화(Socialization)
정답 : 3번
- 지식창조 매커니즘은 공통화, 표출화, 연결화, 내면화 총 4단계로 구성되어있다.
4. 다음 중 데이터 웨어하우스의 구성요소가 아닌 것은?
① 데이터 모델(Data Model)
② 데이터 전처리(Data Pre-processing)
③ ETL(Extract, Transform, Load)
④ ODS(Operational Data Store)
정답 : 2번
- 데이터 웨어하우스는 데이터 모델, ETL, ODS, DW Meta Data, OLAP, 데이터 마이닝, 분석 TOOL과 경영 솔루션으로 구성된다.
5. 다음 중 데이터 산업 구조의 서비스 영역으로 틀린 것은?
① 데이터 활용 교육
② 데이터 처리 제공
③ 데이터 기반 컨설팅
④ 도출된 인사이트 기반의 새로운 아이디어 제공
정답 : 4번
- 서비스 영역에서는 데이터 자체나 데이터를 가공한 정보를 제공한다.
- 새로운 아이디어는 서비스를 제공받는 사람이 생각해야 한다.
6. 다음 중 집중 조직구조에 대한 설명으로 틀린 것은?
① 전사 분석 업무를 별도의 분석 전담조직에서 수행한다.
② 분석 결과를 현업에 빠르게 적용할 수 있다.
③ 현업 부서의 분석 업무와 이원화될 가능성이 높다.
④ 전략적 중요도에 따라 분석조직이 우선순위를 정하여 진행 가능하다.
정답 : 2번
- 2번에 대한 선지는 분산형 조직구조에 대한 설명이다.
7. 다음 중 인공지능에 대한 설명으로 틀린 것은?
① 데이터 확보 후 애노테이션을 통해 학습이 가능한 데이터로 가공하는 작업이 필요하다.
② 오토인코더는 데이터로부터 더욱 효율적인 코드로 표현하도록 학습하는 신경망으로 강화학습 방법이다.
③ 기계학습은 인공지능의 연구 분야 중 하나로 인간의 학습 능력과 같은 기능을 실현하고자 하는 기술이다.
④ 딥러닝은 기계학습 방법 중 하나로 컴퓨터가 스스로 학습할 수 있도록 인공신경망 등의 기술을 이용한다.
정답 : 2번
- 오토인코더는 라벨이 설정되어있지 않은 학습 데이터로부터 더욱 효율적인 코드로 표현하도록 학습하는 신경망으로 비지도학습 방법 중 하나이다.
8. 다음 중 개인정보 비식별화에 대한 설명으로 틀린 것은?
① 가명 처리는 개인정보 중 주요 식별 요소를 다른 값으로 대체하는 방법이다.
② 총계 처리는 데이터의 총합 값을 보여주고 개별 값을 보여주지 않는 방법이다.
③ 데이터 삭제는 개인을 식별하는데 기여할 확률이 높은 주요 식별자를 보이지 않도록 처리하는 방법이다.
④ 데이터 범주화는 데이터를 범주의 값으로 변환하여 숨기는 방법이다.
정답 : 3번
- 3번에 대한 설명은 데이터 삭제가 아니라 데이터 마스킹이다.
- 데이터 삭제는 데이터 공유나 개방 목적에 따라 데이터셋에 구성된 값 중 필요없는 값 또는 개인 식별에 중요한 값을 삭제하는 방법이다.
9. 다음 중 빅데이터 플랫폼의 등장배경이 아닌 것은?
① 데이터 처리 복잡도 증가
② 데이터 구조의 변화
③ 데이터 처리의 신속성 요구
④ 데이터 처리 유연성 증대
정답 : 4번
- 데이터 처리 유연성이 아닌, 데이터 분석 유연성 증대가 맞다.
10. 다음 중 딥러닝 분석 기법이 아닌 것은?
① LSTM(Long Short-Term Memory)
② RNN(Recurrent Neural Network)
③ K Nearest Neighborhood
④ Auto-encoder
정답 : 3번
- K Nearest Neighborhood는 딥러닝 분석 기법이 아닌 머신러닝 분석 기법이다.
11. 다음 중 2020년에 개정된 데이터 기본 3법의 주요 개정 내용으로 옳지 않은 것은?
① 데이터 이용 활성화를 위한 익명정보 개념 도입 및 데이터간 결합 근거를 마련하였다.
② 개인정보보호 관련 법률의 유사, 중복된 규정을 정비 및 거버넌스 체계 효율화를 이루었다.
③ 데이터 활용에 따른 개인정보처리자 책임을 강화하였다.
④ 다소 모호했던 개인정보의 판단기준을 명확하게 하였다.
정답 : 1번
- 2020년에 개정된 데이터 기본 3법에서는 익명정보가 아닌 가명정보를 도입하였다.
12. 다음 중 비식별화 방법이 아닌 것은?
① 가명처리
② 데이터 삭제
③ 데이터 범주화
④ 데이터 표본화
정답 : 4번
13. 다음 중 빅데이터를 활용하는 과정에서 사생활 침해를 방지하기 위하여 데이터에 포함된 개인정보를 삭제하거나 알아볼 수 없는 형태로 변환하는 방법을 무엇이라 하는가?
정답 : 익명화