1. 자료 정리란?
자료는 수집된 형태로 직접적인 분석이 불가능하므로 이들 자료는 분석이 가능한 형태로 정리되어야 합니다. 자료가 수집되면 이 자료들은 전반적인 편집 또는 부호화 등의 과정을 거쳐서 자료 정리표에 기입됩니다. 일반적으로 모든 수집된 자료에 대해서는 일정한 형태를 갖는 자료 정리표가 필요합니다. 자료 정리표는 자료가 펀치카드로 옮겨지기 이전에 자료를 명백히 정리하고 조직하며, 그 자료에 대한 여러 가지 참고사항을 간명하고도 종합적으로 밝혀주는 것입니다.
2. 자료 행렬
모든 자료는 그 내용을 분석적으로 볼 때 그 나름의 일정한 성질, 측정단위, 측정시점 이라는 각기 다른 3차원의 속성으로 이루어집니다. 자료를 분석함에 있어서 3차원의 자료 속성을 동시에 전부 분석할 수는 없기 때문에, 이를 2차원 평면 자료체로 한정할 수밖에 없습니다. 이와 같이 3차원의 자료 입방체에서 2차원의 평면 자료체로 표시되는 것이 곧 자료 행령입니다. 자료 행렬은 3가지 정도로 구분을 할 수 있습니다.
R 자료행렬 : 자료의 성질과 측정단위라는 두 가지 요인으로 성립되는 자료 행렬입니다. 가장 많이 사용되는 자료 행렬로서, 자료의 두 구성요인인 성질이 변수로 되고, 측정단위가 사례로 되어 있는 경우입니다. 단순히 자료 행렬이라고 말하는 것은 이것을 뜻하는 것입니다.
Q 자료행렬 : 이것은 R 자료 행렬과 같이 자료의 구성요인인 성질과 측정단위로 이루어지며, 이 경우 측정단위가 변수로 되고 성질이 사례로 되는 것입니다. Q 자료 행렬은 요인 분석에 있어 측정단위 등을 그 성질에 따라 집단화하는 데 있어서 유용한 자료 행렬입니다.
P 자료 행렬 : 이것은 성질이 변수로 되고, 측정 시점이 사례로 되는 것입니다. P 자료 행렬에 의해 분석을 하는 경우에는 시간차에 따른 성질의 변화 상태가 파악되어 연구 현상에 대한 시계열 분석 또는 시간에 따른 종적 연구가 가능해집니다.
3. 부호화
자료처리의 제2단계는 각 조사항목에 대한 응답을 분류하는 일인데, 이러한 분류 구분을 명확히 하기 위해 붙이는 계통적인 문자 또는 수자를 부호라고 합니다. 부호화는 이 부호를 부호 지침에 따라, 코더가 질문지의 각 항목에 대해 체계적인 숫자나 기호로 변환하여 부호지에 옮겨놓도록 하는 것입니다. 여러 가지의 정보를 몇 가지 한정된 수의 카테고리로 대치함으로써 자료의 처리를 단순화하는 데 목적이 있습니다. 조사 대상인 사례수가 많거나 조사항목이 많을수록 또는 통계적 처리가 복잡할수록 매우 유효합니다. 부호화의 과정은 분류 카테고리의 결정, 각 카테고리에 대한 부호의 선정, 응답의 부호화로 구분할 수 있습니다.
4. 분류 카테고리의 결정
결정 원칙은 카테고리의 연구 문제나 연구목적에 따라서 분류되어야 합니다. 분류되는 사례나 단위가 망라적이어서 하나도 남김없이 각 카테고리에 귀속되도록 해야 합니다. 분류되는 카테고리는 상호 배타적이어서 각 사례는 한 번만 분류되어야 합니다. 이를 위해 변수의 정의가 분명하고 명료해야 합니다. 분류 카테고리는 하나의 차원에서 제시되어야 합니다. 이는 각 변수가 하나의 차원이기 때문에 각각 별개로 취급되어야 한다는 것을 의미합니다. 가능하면 같은 종류의 다른 조사 결과를 비교할 수 있도록 동일한 분류 단위를 사용하도록 해야 합니다.
카테고리의 수는 일반적으로 적은 것보다는 많은 것이 유리합니다. 이는 이미 부호화된 응답을 세분하기보다는 카테고리를 줄이는 것이 쉽기 때문입니다. 카테고리의 수는 예상되는 통계적 분석과 사례수에 따라서도 결정이 됩니다. 사례수가 극히 적은 카테고리는 연구자가 특별히 관심을 가진 경우가 아닌 한, 하나의 카테고리로 취급하는 것은 큰 의미가 업습니다.
'확률통계' 카테고리의 다른 글
미수집자료를 보완하자 (0) | 2021.06.19 |
---|---|
부호의 종류와 소개 (0) | 2021.06.18 |
자료의 편집과 정리 (0) | 2021.06.16 |
질문지의 완성과 안내문 (0) | 2021.06.16 |
질문의 형태와 형식 (0) | 2021.06.15 |