中国語の習得語彙

英語のレベルチェックのスレッドを見ていて、私も自分自身シェアしたコンテンツのレベルを再度検討しようと思います。
中国語の場合、HSKの語彙レベルを参照しつつ、気がついた時点で変更します。

ところで、以前から気になっていたのですが、中国語の習得語彙とレベルに関して、LingQのシステムでは問題があるように感じます。

ちなみに新HSK語彙レベルは、

1級 150語程度の基礎常用中国語及びそれに相応する文法知識 A1 初級1

2級 300語程度の基礎常用中国語及びそれに相応する文法知識 A2 初級2

3級 600語程度の基礎常用中国語及びそれに相応する文法知識 B1 中級1

4級 1200語程度の常用中国語単語 B2 中級2

5級 2500語程度の常用中国語単語 C1 上級1

6級 5000語以上の常用中国語単語 C2 上級2

習得語彙の関係で、LingQでは未だに5000語を超えることができません。
ちなみに、私は来年新HSK5級を目指しております。

中国語に関して、習得語彙とレベルの相関関係を変更すべきだと思います。いかがでしょうか?

補足します。

LingQのシステムでは、以下のようになっています。

0~2500語 入門
2500語~5000語 初級1
5001語~10000語 初級2
10001語~15000語 中級1
15001語~20000語 中級2
20001語~25000語 上級1
25001語~ 上級2

しかし、これは中国語に関しては、上のHSKのレベル表と照らし合わせてみると全く当てはまらないことに気付きます。
つまり、中国語では5000語以上習得ですでに上級レベルなのです。

あと、もう1つ気付いたのですが、
時々、他の方のコンテンツを覗くことがあるのですが、未知単語が非常に多いのに驚いてしまいます。

実は、未知単語が多いのではなく、全て漢字がすき間なく書かれているので、システムが勝手に意味のない漢字をつなげて新単語を作り上げてしまっているのです。

たとえば、·以下の文があったとします。

我是日本人。

単語の正しい分け方は以下のとおりになります。

我 是 日本人。

しかし、LingQのシステムでは、(手動で単語を分けていなければ)以下のように意味のない分かれ方になってしまうことがあります。
我是 日本人。
我 是日 本人。

つまり我是、是日などが新しい単語として認識されてしまうということです。

私は、自分でシェアするコンテンツに関しては、以上の弊害を防ぐために「全て意味のある単語ごとに分けて」からシェアするように心がけております。

今後、HSK5級を目指すため、総復習用にHSK常用語単語リストをすべてネイティブに読み上げてもらってシェアすることを計画しております。
4級常用単語はすでにシェア済みです。

LingQのシステムでは、
HSK常用語単語リストを使って上級1レベルの単語を全て覚えても、まだ初級2にも達しないおかしな現象が起こります。

どう思いますか?

最近、面白い実験をしました。

実は、本試験では、新HSK大綱で定めていた常用単語以外の単語も出題されているのです。

手順は以下の通りです。

  1. 以下のサイトで、問題をコピーする。
    http://www.chinesetesting.cn/index.do

  2. PinCov+
    chinese
    の単語自動分割機能で、
    意味のある単語ごとに分割する。

    分割されたテキストをざっと見る。

    この時点で、明らかに誤分割の単語は修正する。

3)単語ごとに分割された状態のテキストをLingQにインポートする。

4)インポートされたテキストを見て、
青文字単語を修正するため、QuickLingQ Viewをクリックする。

5)この時点で、どの辞書にも載っていない単語(=誤分割単語)は、
分割する必要があると思われるので、
修正画面に戻って、分割する。

*逆に1文の意味がよくわからない場合は、
成語、熟語、人名などが使われている可能性があるので、
わからない部分の漢字をつなげることもある。

6)再度、青文字単語のLingQ登録のため、
QuickLingQ Viewをクリックする。

すでに1~5級の単語を単語リストでインポートしている状態
(=新HSKで定められている常用単語を全て登録した状態)
にもかかわらず、
(辞書で検索可能な)青文字の単語が20語以上ありました。

この程度は、問題文で推測可能ということでしょうか?

実際、4級受けた時も読解問題で知らない単語はありましたが、
マークシート方式だったので、推測で選んで8割は取れました。
(ただし、作文は7割の出来だったので、
リスニング、読解の選択問題に関しては85%ぐらいに跳ね上がる)

(PS.Google検索で、「中国語の習得語彙」と入力して検索していたら、
偶然私の投稿が3番目にヒットしたので、気が付いた部分を補足させていただきました。)

習得語彙数は、数え方にもよると思います。
あと、母語が何であるかによっても変わってきます。

たとえば、
私たち日本人は、
以下の(日本の小学校で習得済みの)漢字が
中国語で意味が対応することさえ覚えれば、
曜日名を一つ一つ、語彙としてカウントする必要がありません。
それは、曜日は合成語だからです。

星期






日本語→中国語→英語
日曜日→星期 天→Sunday
月曜日→星期 一→Monday
火曜日→星期 二→Tuesday
水曜日→星期 三→Wednesday
木曜日→星期 四→Thursday
金曜日→星期 五→Friday
土曜日→星期 六→Saturday

このほか、国名+人の場合も、
英語話者の中国語学習の場合は、一つ一つを単語として判断しますが、
日本語話者の場合は、合成語として各構成要素のみを語彙と判断します。

なので、
こう言った違いから、
習得語彙は、学習者の母語によって違うのだと結論に達しました。

結局、語彙習得数は、
「(母語であれ、外国語であれ)
人がどれだけの多くの分野において
(会話が可能である)守備範囲にあるか」
の表示であると言えます。

ただし、同じ1万語習得でも、
専門分野が何であるかによって大きく変わってきます。

削除しました。