이 연구는 어휘 풍요도의 통계적 측정을 위해 앞서 처리해야 할
몇 가지 문제를 정리하고 이를 바탕으로 한국어 학습자의 문어 산출물을
새롭게 측정하는 데 그 목적이 있다. 먼저 어휘 풍요도의 통계적 측정을
위해 앞서 처리해야 할 몇 가지 문제로 단어가 무엇인지, 다중어 어휘 항
목은 어떻게 세야 되는지 그리고 텍스트 길이와 통계 수치는 관련이 있는
지, 오류를 어떻게 처리할 것인지를 꼽았다. 이런 문제에 대한 정리를 토
대로 한국어 문어 산출물에 나타난 어휘 풍요도를 측정하였는데, 그 결과
어휘 밀도는 학습자간 차이가 많았으며, 텍스트 길이에 따라 어휘 밀도가
반비례함을 알 수 있었다. 그러나 어휘 변이에서는 텍스트의 길이가 짧을
수록 어휘 다양도가 높아진다고 하는 가설에 부합하지 않았다. 학습자별
평균 덩이 사용 비율은 4.5%에 지나지 않았지만 학습자별 편차가 큰 편이었다. 그리고 오류 수에서는 평균 오류 비율은 8.6%이었고 학습자별로 살
펴보았을 때 오류 수는 텍스트의 길이와 무관한 개인적 어휘 능력과 관련
이 있어 보였다. 전반적으로 이 연구는 통계적 측정에서의 어휘 단위의
설정 문제가 해결되지 않으면 통계 측정에 오류가 발생할 수 있음을 확인
할 수 있었다는 점에서 그 의의가 있다고 하겠다.
The purpose of this research is to settle some issues which should be resolved
prior to the measures of lexical richness and to newly test measures of KFL written
production based on that solution. At most, what a word is, how the multi-word
lexical items should be counted as single units and how text length and statistical
values are related were chosen as issues that should be settled prior to the
measures of lexical richness.
Based on the suggestion from those issues, At most, LD consisting lexical
richness fits the usual lexical density ratio of written text, which is different from
former discussions. Furthermore, the fact that length of text and LD were related
inversely was limitedly identified. As usual, it is known that the shorter the length
of text is, the higher the TTR is, yet this research similar to the former ones showed
the inverse results. Conversely, in a chunk ratio measured as a part of TTR, result
that fits the theory was yielded. Lastly, in the ETR which shows the number of
errors, as a matter of length of text, the ETR of shorter one was higher than that
of longer one, though the gap was small. (이하 생략)
한국어 학습자 문어 산출물에 나타난 어휘 풍요도 측정을 위해 해결해야 할 몇가지 문제
