外语能力达到母语者的水平是很多外语学习者梦寐以求的心愿。现今,一些外语学习机构也宣称通过他们的学习/习得方法,孩子能够获得和母语者一样或者相似的语言能力。但是,事实是这样的么?为了搞清这个问题,也许我们应该先搞清楚以外语为母语者的水平是如何的。在语言的语音、词汇、语法及句法等几项能力中,词汇量是最容易度量和让人有直接感受的。下面我们就以英语为例,来讨论一下有多少词汇量才能达到母语者的水平。
以英语为母语的成人的词汇量
以英语为母语的普通人有多少词汇量?是一个很难回答的问题,或者说是一个有着太多答案、让人无所适从的问题。不同的研究者给出了不同的估算,少的有9,800个(Milton & Treffers-Daller, 2013[1]) , 多的则高达210,000个 (Hartmann, 1946[2]) ,两者相差不止20倍。那么为何不同的估算之间会有如此大差异?原因主要在于对于以下两个问题,不同的估算给出了不同的答案:
什么被计为一个单词?
首先,大多数估算都会把专有名词(prop noun,专有名词指的是特定的或独一无二的人或物(人名、地名、国家名、景观名))排除在计数之外,原因在于大多数专有名词(名字)与特定的语言无关,而与人的知识水平有关,测量它并不能很好的反映出特定语言的能力。
其次,在不同地区拼写不同的同音异形词往往被视为一个单词,比如英音的advertise和美音的advertize被视为一个单词。
再次,可以通过去除词汇的屈折变化(inflection,英语中的屈折变化:对于动词来说,plays/played/playing是play的屈折变化;对于名词来说,cars是car的屈折变化 ;对于形容词来说,bigger/biggest是big的曲折变化),而只计入原形的方式来精简词汇量。这种原形单词(play、car及big)被称为lemma。英语的词汇(已除去专有名词)在进行这种方式的精简之后会减少到原来数目的60%左右。
更进一步,不难想到在lemma中还是有大量的冗余存在的,比如,lemma happy的前缀/后缀变化都会衍生成新的lemma(unhappy,happiness,happily),也就是说一组lemma可能被归约为同一个源头词汇,这种源头词汇在不同的估算中有不同的名称,比如有词族(word family),根词(root word),基词(base word),中心词 (head word)等不同的叫法,而且不同的估算使用的归约规则也并不相同。
在现有的估算中,有些估算采用lemma进行计数(但是即使是使用lemma进行计数的估算,对lemma的筛选也有所不同),有些采用源头词汇进行估算。一些具体的例子详见表3.1。
会一个单词的标准是什么?
会不会一个单词,实际上是说一个人是否具备掌握某个词汇的能力。而词汇能力分为接受性词汇能力与表达性词汇能力。前者指能够理解在听、读等接受性语言活动中出现的词汇的能力; 后者指在说、写等表达性语言行为中能够自如的使用词汇的能力。在现有的估算中,大部分估算的是被测试人接受性词汇的数量。而不同的估算中,接受性词汇能力的测试方法可能不同。比如,Zechmeister 等 (1995)[3] 中提供多个选项供被测人选择,而在 Milton 和 Treffers-Daller (2013)[1]中需要被测者提供同义词或是解释。
除去以上两点之外,每种估算所考虑的词汇的范围也会影响估算的结果。
一些以英语为母语的成人词汇量的估算结果及其计数方式、测试方法被总结在下表中。表中最后一行以前的数据来自Brysbaert 等 (2016)[4],最后一行总结自Brysbaert 等 (2016)[4]。
表3.1 以英语为母语的成人词汇量的研究汇总
由上表的数据,我们可以知道:
“什么被计为一个单词”及“会一个单词的标准”对估算结果有非常大的影响。
在使用lemma计数时:在lemma总的词汇量足够大的情况下,成人lemma词汇量的估计值是40,000多 (Anderson & Nagy, 1993[5]; Brysbaert et al., 2016[4]) 。
在使用源头词汇计数时:成人源头词汇量的估计值范围是从17,200到9,800 (Goulden et al., 1990[6]; Milton & Treffers-Daller, 2013[1]; Brysbaert et al., 2016[4]) 。
不妨给出一个具体的估算作为参考,在Brysbaert 等 (2016)[4]的估算中:
20岁的以美式英语为母语的普通人知道衍生于11,100个词族的42,000个lemma及4,200个非直观的词组(non-transparent multiword expression)。词汇量的范围在27,000个lemma(词汇量最少的5%的人群的词汇量)和52000个lemma(词汇量最多的5%的人群的词汇量)之间。一个普通人在20到60岁之间会增加6,000个lemma的词汇量,也就是说每两天会学到一个新词(lemma)。
如果文章对您有所帮助,不妨点赞、评论和转发一下。感谢您的支持。
更多宝宝的外语习得知识,请访问 微信公众号 宝宝的外语习得
参考
1. Milton, J., & Treffers-Daller, J. (2013). Vocabulary size revisited: the link between vocabulary size and academic achievement. Applied Linguistics Review, 4(1), 151–172. https://doi.org/10.1515/applirev-2013-0007
2. Hartmann, G. W. (1946). Further evidence on the unexpected large size of recognition vocabularies among college students. Journal of Educational Psychology, 37(7), 436–439. https://doi.org/10.1037/h0056310
3. Zechmeister, E. B., Chronis, A. M., Cull, W. L., D’Anna, C. A., & Healy, N. A. (1995). Growth of a Functionally Important Lexicon. Journal of Reading Behavior, 27(2), 201–212. https://doi.org/10.1080/10862969509547878
4. Brysbaert, M., Stevens, M., Mandera, P., & Keuleers, E. (2016). How many words do we know? Practical estimates of vocabulary size dependent on word definition, the degree of language input and the participant’s age. Frontiers in Psychology, 7(JUL), 1–11. https://doi.org/10.3389/fpsyg.2016.01116
5. Anderson, R. C., & Nagy, W. E. (1993). The Vocabulary Conundrum. In Technical Report No 570 from the Center for the Study of Reading. University of Illinois.
6. Goulden, R., Nation, P., & Read, J. (1990). How large can a receptive vocabulary be? Applied Linguistics, 11(4), 341–363. https://doi.org/10.1093/applin/11.4.341