한국방송통신 대학교/1학년 1학기
데이터정보처리입문(형성평가)
GheaK
2024. 10. 17. 18:15
1강. 데이터 분석과 컴퓨터
- 컴퓨터를 통하여 데이터 정보를 효율적으로 처리하기 위해 요구되는 사항이 아닌 것은?
- 컴퓨터를 쉽게 사용할 수 있어야 한다.
- 정보를 검색하고 수집․분석하기 위해서는 반드시 컴퓨터 프로그램 언어를 알아야 한다.
- 데이터 분석에 대한 기본개념과 방법론들을 숙지하여야 한다.
- 데이터 분석을 위한 다양한 소프트웨어의 활용법을 숙지하여야 한다.
- 다음 중 범용 통계패키지에 대한 설명으로 잘못된 것은?
- SPSS는 GUI 환경아래에서 통계분석 및 자료처리가 이루어지므로 쉽게 분석처리를 할 수 있다.
- SAS는 방대한 양의 자료 처리 기능이 뛰어나며 다양한 통계 분석 절차를 제공하고 있다.
- 파이썬은 미국에서 개발된 프로그램 언어로 스프레드시트 형태의 데이터 입력을 취하고 있다.
- R은 객체지향 프로그래밍 언어로서 대화형 통계분석과 그래프 기능이 뛰어나다.
- R 통계패키지를 다운받고자 한다. R 공식 사이트는 ?
- www.r-package.org
- www.r-project.org
- www.r-package.com
- www.r-project.com
- 일반적인 데이터분석 절차이다. ( )안에 순서대로 가장 적합한 것은?
( - 지문 ( a ) - 조사, 실험의 계획 - 데이터의 수집 - ( b ) - 분석결과의 평가)
- a : 문제의 정의, b : 설문지 평가
- a : 설문지 작성, b : 데이터의 정리, 분석
- a : 전문가와의 상담, b : 데이터의 분석
- a : 문제의 정의, b : 데이터의 정리, 분석
- 오늘날과 같이 효율적인 정보의 수집, 수집된 정보의 가치판단, 정보활용 능력이 필수적으로 요구되는 사회를 가장 잘 나타낸 말은?
- 유비쿼터스사회
- 전자정보화사회
- 지식정보화사회
- 전자통신사회
2강. 데이터 입력과 점검
- 설문문항에서 명목척도에 해당하는 것은?
- 문항1, 문항3
- 문항2, 문항3
- 문항2, 문항4
- 문항3, 문항4
- 주어진 설문지를 이용하여 100명의 학생들에게 응답을 얻었다. 데이터의 구성에 대한 올바른 설명은?
- 4개의 케이스와 100개의 변수로 구성된다.
- 100개의 케이스와 4개의 변수로 구성된다.
- 50개의 케이스와 4개의 변수로 구성된다.
- 4개의 케이스와 50개의 변수로 구성된다.
- 다음의 데이터에 대한 설명 중 올바른 것끼리 짝지어진 것은?
- Ⅰ, Ⅱ
- Ⅰ, Ⅲ
- Ⅱ, Ⅲ
- Ⅰ, Ⅱ, Ⅲ
- 다음 측정 수준에 대한 설명 중 옳지 않은 것은?
- 명목척도에서 각 조사단위에 부여된 숫자는 구분을 목적으로 부여된 기호에 불과하다.
- 섭씨온도, 습도, 지능지수 등은 구간척도로 측정된 값이다.
- 변수의 측정수준이 적합한 통계 분석 기법의 선택에 영향을 미치지는 않는다.
- 계란을 크기에 따라 대·중·소로 구분하면 순서척도로 측정된 것이다.
- 데이터를 입력한 후, 제대로 입력되었는지 점검하고자 한다. 데이터의 오류를 점검하기 위한 방법이 아닌 것은?
- 각 변수의 입력 범위를 벗어난 케이스를 확인해 본다.
- 변수간의 논리적 연관성을 고려하여 확인한다.
- 각 케이스를 조사된 설문지와 비교하면서 점검한다.
- 설문항목 중 하나라도 응답하지 않은 경우가 있다면 해당 설문지는 분석에서 제외한다.
- 통계·데이터과학과에 재학 중인 학생들을 대상으로 통계조사를 실시하였다. 다음에 제시된 변수를 조사하였는데, 이 중 명목척도로 측정된 변수는 몇 개인가?
- 없음
- 1개
- 2개
- 3개
3강. 통계정보의 검색 및 활용 1
- 통계청 사이트는?
- http://kosis.kr/
- http://ecos.bok.or.kr/
- http://kostat.go.kr/
- http://laborstat.molab.go.kr/
- 한국사회과학데이터센터 사이트는?
- http://ww.ksdc.re.kr
- http://ecos.bok.or.kr/
- http://lib.stat.cmu.edu/DASL
- http://www.itl.nist.gov/div898/strd/
- 국가경제에 관한 통계들을 제공하는 한국은행 경제시스템 사이트는?
- http://kosis.kr/
- http://ecos.bok.or.kr/
- http://kostat.go.kr/
- http://laborstat.molab.go.kr/
- NIST(National Institute of Standards and Technology)에서 여러 통계 분석 등과 관련하여 유용한 데이터를 제공하는 사이트는?
- http://ww.ksdc.re.kr
- http://ecos.bok.or.kr/
- http://lib.stat.cmu.edu/DASL
- http://www.itl.nist.gov/div898/strd/
- 다음 중 카네기 멜론 통계학과에서 운영하는 사이트로서 다양한 데이터를 제공하는 사이트는?
- http://kosis.kr/
- http://ecos.bok.or.kr/
- http://lib.stat.cmu.edu/DASL
- http://www.itl.nist.gov/div898/strd/
4강. 통계정보의 검색 및 활용 2
- 조사된 자료가 다음과 같다. 중앙값은? (지문 : 22 5 21 16 18 20 23 24 32 490 36)
- 20
- 21
- 22
- 23
- 자료의 개수나 측정단위가 다른 두 개 이상의 자료에 대한 표본집단 간의 상대적인 산포를 비교할 때 이용되는 측도로, 두 집단의 단위가 다르거나, 단위는 같지만 평균의 차이가 클 때 두 그룹의 산포를 비교하는 데 유용하게 이용되는 측도는?
- 중앙값
- 표준편차
- 표준오차
- 변동계수
- 탐색적 자료분석의 관점에서 살펴볼 때 한 묶음의 자료를 정리하는 숫자로서 다섯숫자요약이란 다음 중 무엇인가?
- 중앙값, 평균, 분산, 제1사분위수, 제3사분위수
- 중값, 평균, 표준편차, 제1사분위수, 제3사분위수
- 최소값, 최대값, 중앙값, 제1사분위수, 제3사분위수
- 최소값, 최대값, 평균, 제1사분위수, 제3사분위수
5강. 문서작성
- 다음은 한글 2018 사용법에서 한자 변환에 대한 설명이다. 옳은 설명을 모두 고른 것은?
- Ⅰ, Ⅱ
- Ⅰ, Ⅲ
- Ⅱ, Ⅲ
- Ⅰ, Ⅱ, Ⅲ
- 수식편집기창을 이용하여 다음 수식을 작성하고자 한다. 수식편집창의 다음 (○), (◎), (⊕)에 적합한 것은?
- ㉠chi, ㉡: &, ㉢: vert
- ㉠chi, ㉡: &, ㉢: over
- ㉠theta, ㉡: &, ㉢: vert
- ㉠theta, ㉡: &, ㉢: over
- 한글 2018의 수식편집기창을 이용하여 다음 수식을 작성하고자 한다. 수식편집창의 다음 ( ) 안의 a, b에 적합한 것은?
- a=cases, b=&
- a=vert, b=&
- a=cases, b=#
- a=vert, b=#
- 다음은 한글 2018 사용법에 대한 설명이다. 옳은 설명을 모두 고른 것은?
- Ⅰ, Ⅱ
- Ⅱ, Ⅲ
- Ⅰ, Ⅲ
- Ⅰ, Ⅱ, Ⅲ
- 다음 괄호 안에 알맞은 용어로 짝 지어진 것은?
- 각주: 미주
- 미주: 각주
- 장평: 간격
- 간격: 장평
6강. 엑셀을 이용한 데이터 처리 1
- 다음은 엑셀의 통합문서(workbook)와 워크시트(worksheet)에 대한 내용이다. 잘못된 것은?
- 통합문서는 데이터 입력이나 분석 작업을 하여 그 결과를 저장하는 하나의 파일을 의미한다.
- 통합문서는 워크시트(worksheet), 차트시트(chart sheet), 매크로시트(macro sheet)를 포함한다.
- 통합문서를 한 권의 책에 비유한다면 하나의 워크시트는 한 페이지를 의미한다.
- 워크시트는 항상 고정된 이름을 가지며, 한번 정해지면 바꿀 수 없다.
- 데이터를 입력한 후 이웃하지 않은 셀들을 선택하고자 한다. 올바른 방법은?
- ALT 키를 누른 상태에서 마우스로 원하는 셀들을 선택한다.
- CTRL 키를 누른 상태에서 마우스로 원하는 셀들을 선택한다.
- SHIFT 키를 누른 상태에서 마우스로 원하는 셀들을 선택한다.
- TAB 키를 누른 상태에서 마우스로 원하는 셀들을 선택한다.
- 선택된 셀의 정보를 보여주고, 데이터를 입력하거나 수정할 수 있으며, 계산을 위해서 수식을 입력할 수 있는 부분을 무엇이라 하는가?
- 메뉴표시줄
- 도구모음
- 워크시트
- 수식입력줄
- 다음 중 엑셀의 중요한 기능이라고 할 수 없는 것은?
- 그래프 표현 기능을 가지고 있다.
- 통계분석 기능을 가지고 있다.
- 인터넷 검색기능을 가지고 있다.
- 데이터베이스의 관리도구 기능을 가지고 있다.
- 다음은 엑셀에 대한 함수 사용방법에 대한 설명이다. 옳은 설명끼리 짝지어진 것은? [지문] 가. 값, 셀참조, 함수 등을 사용하여 새로운 값을 생성한다. 나. 함수식은 등호(=)로 시작한다. 다. 엑셀에서 함수 이름은 대문자로만 입력해야 한다.
- 가, 나
- 가, 다
- 나, 다
- 가, 나, 다
7강. 엑셀을 이용한 데이터 처리 2
- 엑셀에서 B2셀의 값이 60보다 작으면 “불합격”, 60이상이면 “합격”을 D2셀에 표시하고자 한다. 적합한 엑셀함수 사용은?
- =(IF(B2<60) “합격“ ELSE “불합격”)
- =(IF(B2<60) “불합격“ ELSE “합격”)
- =IF(B2<60, “합격“, ”불합격“)
- =IF(B2<60, “불합격“, ”합격“)
- B2와 C2 셀에 데이터를 입력한 후 두 값의 평균점수를 구하고자 한다. 적합한 수식입력은?
- AVERAGE(B2:C2)
- =AVERAGE(B2:C2)
- STDEV(B2:C2)
- =STDEV(B2:C2)
- 데이터를 입력한 후 그림과 같이 각 케이스에 대하여 평균점수를 구하고자 한다. (A) 부분에 적합한 수식입력은?
- AVERAGE(B2:C2)
- =AVERAGE(B2:C2)
- MEDIAN(B2:C2)
- =MEDIAN(B2:C2)
- D2 셀에 =IF(SUM(B2:C2)>=130, “합격“, ”불합격“)를 입력하였을 때 그 결과는?
- 140
- 70
- 합격
- 불합격
- D2 셀에 =$B$2+$C$2를 입력한 후 드래그&드롭 기능을 이용하여 D11 셀까지 채워 넣었다. 이 때 D3 셀의 결과는?
- 136
- 121
- 오류 발생
- 알 수 없음
8강. 엑셀을 이용한 그래프 그리기 1
- 사람들이 즐겨보는 TV 프로그램에 대한 비율을 다음과 같이 조사하였다. 이러한 경우 전체에 대한 항목별 비율을 비교하거나, 특정 항목을 강조하기 위해 가장 적합한 그래프는?
- 히스토그램
- 산점도
- 원 그래프
- 꺾은선 그래프
- 시간의 흐름에 따라 관측된 시계열 데이터의 추세 변화나 경향을 파악하고자 한다. 다음 중 이와 같은 분석 목적에 가장 적합하지 않은 그래프는?
- 꺾은선 그래프
- 원 그래프
- 세로 막대형 그래프
- 분산형 그래프
- 다음과 같은 성별 도수분포를 그래프로 나타내고자 한다. 적합한 그래프끼리 묶인 것은?
- 막대그래프, 원그래프
- 히스토그램, 원그래프
- 막대그래프, 방사형 차트
- 원그래프, 분산형 차트
- 엑셀을 이용하여 간격이 일정한 시계열 데이터의 경향을 파악하고자 한다. 엑셀 차트 중에서 가장 적합한 차트 유형은?
- 세로 막대형이나 가로 막대형
- 영역형
- 분산형
- 꺾은선형
- 통계청 홈페이지를 방문하여 최근 5년간의 매월 소비자 물가지수 데이터를 구하여 적합한 그래프를 엑셀로 그려서 전체적인 경향을 파악하고자 한다. 가장 알맞은 차트의 종류는 무엇인가?
- 원형
- 히스토그램
- 방사형
- 꺾은선형
9강. 엑셀을 이용한 그래프 그리기 2
- 도수분포표에 대한 다음 설명 중 옳지 않은 것은?
- 겹치지 않는 몇 개의 범주 또는 계급에 속한 관측치의 개수를 요약하여 작성한 표이다.
- 연속형 데이터에 대한 분석에서 도수분포표를 기초로 히스토그램을 그릴 수 있다.
- 연속형 데이터에 대해 도수분포표를 작성할 때는 계급의 개수와 폭을 결정하는 것이 중요하다.
- 정성적 데이터에 대한 분석에는 활용할 수 없다.
- 엑셀 함수를 이용하여 구한 시간의 흐름에 따른 전압 값을 다음과 같은 그래프로 표시하였다. 이와 같은 그래프를 얻기 위해서 사용된 엑셀 차트의 유형은 무엇인가?
- 히스토그램
- 세로 막대형
- 원형
- 분산형
- 다음의 산점도에 대한 상관계수로 가장 적합할 것으로 생각되는 값은?
- r = -0.87
- r = 0.25
- r = 0.92
- r = 1.02
- 두 연속인 변수 X와 Y 사이의 상관계수를 구했더니 0.9가 나왔다. 올바른 해석은?
- X값이 커지면 Y값은 직선관계를 가지고 커진다.
- X값이 커지면 Y값은 직선관계를 가지고 작아진다.
- X값이 커지면 Y값은 곡선관계를 가지고 커진다.
- X값이 커져도 Y값은 변화가 없다.
- 두 변수들 사이의 관계를 살펴보기 위해 산점도를 그리고자 한다. 차트마법사의 차트 종류 입력상자에서 선택할 차트 종류는?
- 세로 막대형이나 가로 막대형
- 영역형
- 분산형
- 꺾은선형
10강. 엑셀 활용 1
- A2 셀에 “대한민국”이라고 입력되어 있다. “=MID(A2, 2, 2)“의 결과로 알맞은 것은?
- 대
- 대한
- 한민
- 민국
- G2 셀에 어떤 사람의 생년월일이 “1980-12-5”로 같이 입력되어 있다고 한다. 엑셀 함수 “=YEAR(NOW())-YEAR(G2))“의 결과를 바르게 설명한 것은?
- 현재 시점의 연도가 표시된다.
- 현재 시점의 나이를 구한다.
- 위의 함수식에 NOW()는 인수가 없기 때문에 잘못된 함수이다.
- 이 사람의 생년월일 중에서 연도에 해당하는 1980이 표시된다.
- 학과코드의 첫 번째 자리 알파벳이 A이면 통계·데이터과학과, B이면 컴퓨터학과 학생이다. 학과 셀에 학과를 표기하고자 한다. C2 셀에 알맞은 함수식은?
- =IF(RIGHT(A2,1)=“A”, “통계·데이터과학”, “컴퓨터”)
- =IF(RIGHT(A2,1)=“A”, “컴퓨터”, “통계·데이터과학”)
- =IF(LEFT(A2,1)=“A”, “통계·데이터과학”, “컴퓨터”)
- =IF(LEFT(A2,1)=“A”, “컴퓨터”, “통계·데이터과학”)
- 최종 점수는 시험점수와 과제물, 태도점수의 합계에서 결석일수에 5를 곱한 수를 뺀 것으로 계산하고자 한다. H2 셀에 알맞은 함수식은?
- =AVERAGE(D2:F2)-5G2
- =AVERAGE(D2:F2)+5G2
- =SUM(D2:F2)-5G2
- =SUM(D2:F2)+5G2
- 다음과 같이 워크시트에 값이 입력되어 있을 때 ’=SUMPRODUCT(A1:A3, B1:B3)’을 D1 셀에 입력하면 얻게 되는 계산값은 얼마인가?
- 10
- 12
- 14
- 16
11강. 엑셀 활용 2
- 함수마법사 기능
- 꺾은선형 그래프
- 데이터분석 기능
- 목표값 찾기 기능
- 세로 막대형이나 가로 막대형
- 영역형
- 분산형
- 꺾은선형
- 다음과 같이 셀 C7에 입력되어 있는 수식을 드래그 & 드롭으로 C11까지 채워서 1월부터 6월까지의 미달러($) 기준의 수출액을 원화(₩) 기준으로 바꾸고자 한다. 셀 C6에 입력할 수식으로 맞는 것은?
- =B6*B2
- =B$6*B2
- =B6*B$2
- =B$6*B$2
- =$B$1*(1+B2)^A5
- =$B$1(1+B$2)^$A5
- =$B$1*(1+B$2)^A$5
- =$B$1*(1+$B2)^$A$5
12강. R을 활용한 자료분석 1
- 데이터 객체 ex.data의 변수들을 직접 사용하고자 한다. 유용한 명령은?
- load(ex.data)
- detach(ex.data)
- unload(data)
- attach(ex.data)
- 데이터 객체의 처음 6개의 케이스를 출력하고자 한다. R 명령은? ( b )(ex.data)
- head
- list
- output
- 그룹변수인 성별(sex)의 값에 따라 변수 salary의 평균(mean)을 구하는 명령은?
- sapply(salary, sex, mean)
- sapply(mean, sex, salary)
- tapply(salary, sex, mean)
- tapply(mean, sex, salary)
- package xlsx를 인스톨하였다. 이를 가동시키기 위한 명령은?
- system(xlsx)
- use(xlsx)
- library(xlsx)
- load(xlsx)
- 다음과 같은 텍스트파일을 읽어들이는 R 명령은? ex.data = ( a )(“c:/data/example.txt”, header=T)
- scan
- read.table
- data.frame
- read.xlsx
13강. R을 활용한 자료분석 2
- 다음 R 명령 수행결과는?
- 1.414
- 8
- 16
- 32
- 상자그림을 그리는 명령은?
- stem(ex.data)
- boxplot(ex.data)
- box(data)
- box.plot(ex.data)
- 다음 R 명령 수행결과는?
- 1.414
- 8
- 16
- 32
- 다음 R 명령 수행결과는?
- 1.414
- 2
- 4
- 8
14강. 파이썬을 활용한 자료분석 1
- 파이썬을 설치하기 위한 아나콘다 사이트는? 정답: www.anaconda.com
- 파이썬에서 딕셔너리로 선언하고자 한다. 적합한 것은?
- me = [‘height’ : 180, ‘weight’: 70 ]
- me = {‘height’ : 180, ‘weight’: 70 }
- me = {‘height’ = 180, ‘weight’ = 70 }
- me = [‘height’ = 180, ‘weight’ = 70 ]
- 다음과 같이 파이썬 함수문을 작성하였다. hello2(“Jeong”) 의 결과는? 정답: Hello Jeong !
- Python 패키지를 설치하고 관리하는 프로그램이다. Dos 창에서 ( ) 안에 맞는 명령은? 정답: pip
- 다음 파이썬 프로그래밍에서 a[4] 의 결과는? 정답: 5
15강. 파이썬을 활용한 자료분석 2
- 변수 edu 의 막대그림을 그리고자 한다. ( ) 명령은? 정답: plt.bar
- 다음 출력결과와 같이 데이터객체 nex8의 각 변수의 기술통계량을 구하고자 한다. ( ) 명령은? 정답: nex8.describe()
- 파이썬에서 csv 텍스트 파일을 읽기 위한 명령 ( )는? 정답: pd.read_csv
- 파이썬에서 nex8.head( ) 의 결과가 다음과 같다. 여기서 변수 id를 제거하고 나머지 변수를 가져오기 위한 명령 ( )은? 정답: nex8.iloc[:, 1:]
- 파이썬에서 엑셀 파일을 읽기 위한 명령 ( )는? 정답: pd.read_excel