3 분 소요

빅데이터분석기사 필기 오답노트

1과목 : 빅데이터 분석 기획

1. 다음 중 데이터에 대한 설명으로 틀린 것은?

① 데이터는 일반적으로 정형, 비정형, 반정형 데이터로 구분된다.

② 비정형 데이터는 텍스트, 음성, 영상 등 특수한 데이터이다.

③ 정형 데이터는 흔히 볼 수 있는 주로 숫자로 구성된 데이터이다.

④ 정형 데이터는 비정형 데이터보다 품질이 우수하며 다양한 분석이 가능하다.

정답 : 4번

  • 정형, 비정형, 반정형 데이터의 구분은 품질과는 무관하며, 정형 데이터보다 비정형 데이터가 일반적으로 다양한 분석을 시도하기에 유리하다.

2. 다음 중 정보의 특징이 아닌 것은?

① 적정성

② 일관성

③ 관련성

④ 적시성

정답 : 2번

  • 정보는 정확성, 적시성, 적당성, 관련성의 특징을 가진다.

3. 다음 중 지식창조 매커니즘의 단계가 아닌 것은?

① 표출화(Externalization)

② 내면화(Internalization)

③ 통합화(Integration)

④ 공통화(Socialization)

정답 : 3번

  • 지식창조 매커니즘은 공통화, 표출화, 연결화, 내면화 총 4단계로 구성되어있다.

4. 다음 중 데이터 웨어하우스의 구성요소가 아닌 것은?

① 데이터 모델(Data Model)

② 데이터 전처리(Data Pre-processing)

③ ETL(Extract, Transform, Load)

④ ODS(Operational Data Store)

정답 : 2번

  • 데이터 웨어하우스는 데이터 모델, ETL, ODS, DW Meta Data, OLAP, 데이터 마이닝, 분석 TOOL과 경영 솔루션으로 구성된다.

5. 다음 중 데이터 산업 구조의 서비스 영역으로 틀린 것은?

① 데이터 활용 교육

② 데이터 처리 제공

③ 데이터 기반 컨설팅

④ 도출된 인사이트 기반의 새로운 아이디어 제공

정답 : 4번

  • 서비스 영역에서는 데이터 자체나 데이터를 가공한 정보를 제공한다.
  • 새로운 아이디어는 서비스를 제공받는 사람이 생각해야 한다.

6. 다음 중 집중 조직구조에 대한 설명으로 틀린 것은?

① 전사 분석 업무를 별도의 분석 전담조직에서 수행한다.

② 분석 결과를 현업에 빠르게 적용할 수 있다.

③ 현업 부서의 분석 업무와 이원화될 가능성이 높다.

④ 전략적 중요도에 따라 분석조직이 우선순위를 정하여 진행 가능하다.

정답 : 2번

  • 2번에 대한 선지는 분산형 조직구조에 대한 설명이다.

7. 다음 중 인공지능에 대한 설명으로 틀린 것은?

① 데이터 확보 후 애노테이션을 통해 학습이 가능한 데이터로 가공하는 작업이 필요하다.

② 오토인코더는 데이터로부터 더욱 효율적인 코드로 표현하도록 학습하는 신경망으로 강화학습 방법이다.

③ 기계학습은 인공지능의 연구 분야 중 하나로 인간의 학습 능력과 같은 기능을 실현하고자 하는 기술이다.

④ 딥러닝은 기계학습 방법 중 하나로 컴퓨터가 스스로 학습할 수 있도록 인공신경망 등의 기술을 이용한다.

정답 : 2번

  • 오토인코더는 라벨이 설정되어있지 않은 학습 데이터로부터 더욱 효율적인 코드로 표현하도록 학습하는 신경망으로 비지도학습 방법 중 하나이다.

8. 다음 중 개인정보 비식별화에 대한 설명으로 틀린 것은?

① 가명 처리는 개인정보 중 주요 식별 요소를 다른 값으로 대체하는 방법이다.

② 총계 처리는 데이터의 총합 값을 보여주고 개별 값을 보여주지 않는 방법이다.

③ 데이터 삭제는 개인을 식별하는데 기여할 확률이 높은 주요 식별자를 보이지 않도록 처리하는 방법이다.

④ 데이터 범주화는 데이터를 범주의 값으로 변환하여 숨기는 방법이다.

정답 : 3번

  • 3번에 대한 설명은 데이터 삭제가 아니라 데이터 마스킹이다.
  • 데이터 삭제는 데이터 공유나 개방 목적에 따라 데이터셋에 구성된 값 중 필요없는 값 또는 개인 식별에 중요한 값을 삭제하는 방법이다.

9. 다음 중 빅데이터 플랫폼의 등장배경이 아닌 것은?

① 데이터 처리 복잡도 증가

② 데이터 구조의 변화

③ 데이터 처리의 신속성 요구

④ 데이터 처리 유연성 증대

정답 : 4번

  • 데이터 처리 유연성이 아닌, 데이터 분석 유연성 증대가 맞다.

10. 다음 중 딥러닝 분석 기법이 아닌 것은?

① LSTM(Long Short-Term Memory)

② RNN(Recurrent Neural Network)

③ K Nearest Neighborhood

④ Auto-encoder

정답 : 3번

  • K Nearest Neighborhood는 딥러닝 분석 기법이 아닌 머신러닝 분석 기법이다.

11. 다음 중 2020년에 개정된 데이터 기본 3법의 주요 개정 내용으로 옳지 않은 것은?

① 데이터 이용 활성화를 위한 익명정보 개념 도입 및 데이터간 결합 근거를 마련하였다.

② 개인정보보호 관련 법률의 유사, 중복된 규정을 정비 및 거버넌스 체계 효율화를 이루었다.

③ 데이터 활용에 따른 개인정보처리자 책임을 강화하였다.

④ 다소 모호했던 개인정보의 판단기준을 명확하게 하였다.

정답 : 1번

  • 2020년에 개정된 데이터 기본 3법에서는 익명정보가 아닌 가명정보를 도입하였다.

12. 다음 중 비식별화 방법이 아닌 것은?

① 가명처리

② 데이터 삭제

③ 데이터 범주화

④ 데이터 표본화

정답 : 4번

13. 다음 중 빅데이터를 활용하는 과정에서 사생활 침해를 방지하기 위하여 데이터에 포함된 개인정보를 삭제하거나 알아볼 수 없는 형태로 변환하는 방법을 무엇이라 하는가?

정답 : 익명화

태그:

카테고리:

업데이트: