中国語資料室 > 『現代漢語常用字表』制定の経緯 > 現代漢語常用字表説明 > 《现代汉语常用字表》
原文 | 和訳

現代漢語常用字表説明

語文(国語)教育、辞書編纂および漢字機械処理、情報処理など各方面の需要に適応するため、国家語言文字工作委員会漢字処は、1986年6月から現代漢語常用字表の研究を開始した。1987年7月、国家語言文字工作委員会は教育、言語、情報処理などの専門家を招聘し、字表草案の論証を行った。同年8月、山西大学計算機科学系にサンプリング検証を依頼、国家教育委員会関連部門が字表草案の改正作業に参加した。国家語言文字工作委員会漢字処は、各方面から出された意見に基づき、字表草案の整理・修正を行い、1988年1月に現代漢語常用字表を制定した。

【統計資料】

現代漢語常用字表の制定は、過去の作業およびその成果の基礎の上に行った。使用した統計資料は以下の15種類である。

  1. 語体文応用字彙(4261字)--1928年6月 陳鶴琴
  2. 常用字選(2000字)--1946年8月 四川省教育科学院
  3. 常用漢字登記表(1017字)--1950年9月 中央人民政府教育部社会教育司
  4. 常用字表(2000字)--1952年6月 中央人民政府教育部公布
  5. 識字正音3500字表(3559字)--1954年1月 中国大辞典編纂処
  6. 普通話常用字表(3000字)--1958年8月 山東省教育庁
  7. 常用字表(3100字)--1965年3月 北京市教育局中小学教材編審処
  8. 4500字表(4444字)--1975年 中国文字改革委員会漢字組
  9. 漢字頻度表(常用字部分4152字)--1976年12月七四八工程査頻組
  10. 増訂2500字表--1979年7月 中国文字改革委員会漢字組
  11. 信息交換用漢字編碼字符集·基本集(一級字3755个)--1981年5月 国家標準局発布
  12. 六年制小学語文統編教材生字表(3189字)--1984年 人民教育出版社
  13. 常用構詞字典(3994字)--1984年3月 中国人民大学語言文字研究所
  14. 社会科学、自然科学総合漢字頻度表(常用字部分3500字)--1985年3月 北京航空学院計算機科学与工程系、中国文字改革委員会漢字処
  15. 漢字頻率表(4574字)--1985年7月 北京語言学院語言教学研究所

通用字の資料の中からは以下の5種類を使用した。

  1. 印刷通用漢字字形表(6196字)--1965年1月 中華人民共和国文化部和中国文字改革委員会聯合発布。
  2. 現代漢語詞典--1978年8月 中国社会科学院語言研究所
  3. 新華字典--1979年 商務印書館
  4. 標準電碼本(7292字)--1983年 中華人民共和国郵電部
  5. 1986年度新聞信息流通頻度(6001字)--1987年1月新華社技術研究所

【期間】

常用字表の材料選択期間は1928年~1986年である。この期間内で異なる密度のサンプリングを行った。サンプル量は時期が新しくなるほど増し、最近の資料を主なサンプリング対象とした。社会での用字は、政治・経済・文化の発展と密接に関係しているため、異なる時期の用字状況にはやや違いがある。ある短い期間の用字状況だけによって文字を選択するなら、時間的な限界がある。統計の時間を適度に長くし、異なる各時期の用字状況を見渡せば、ある字の使用が安定したものか否かを測ることができる。安定した字を選択して使用すれば、文字選択の偶然性を回避できる。

【分布と使用度合】

常用字表制定時には、さらに異なる学科での漢字の分布と使用度合も統計した。漢字の異なる学科での分布を統計することによって、ある字の使用分布が平均的か否かを測定できる。1つの学科での使用頻度は高いが、その他学科ではめったに使用されないということは、その分布が平均的ではないことを示す。これに反し、使用頻度が高いだけでなく、多くの学科でも使用されているということは、その分布が平均的であることになる。分布が平均的な字を選択し、文字選択の偏りを避けた。1985年3月に北京航空学院計算機科学与工程系と中国文字改革委員会漢字処が共同で統計した『現代漢語用字頻度表』を漢字の使用分布の統計資料とした。同資料には10科の用字頻度表がある。1.文体生活用字頻度表。2.歴史哲学用字頻度表。3.政治経済用字頻度表。4.新聞報道用字頻度表。5.文学芸術用字頻度表。6.建築運輸用字頻度表。7.農林牧漁用字頻度表。8.軽工業用字頻度表。9.重工業用字頻度表。10.基礎知識用字頻度表である。

使用度合は、漢字の使用頻度とその字の各学科での分布に総合的考察を行う一種の計算方法である。漢字使用度合の計算式は次の通りである。

上の公式の計算条件は、各学科のサンプル量が平均的であると仮定することである。このうち、Nki とは k 字の第 i 類の言語資料の中での相対頻度、Nk とは k 字の総合類の中での相対頻度、n とは言語資料の分類数、Dk とは k 字の散布係数、Sk とは k 字の標準分布偏差、Uk とは k 字の使用度合、Fk とは k 字の出現回数である。漢字の使用度合統計時には、上の公式を調整した。調整後の公式は以下の通りである。

  

このうち、DIk と DEk はいずれも我々が採用した k 字の散布係数で、Lk は k 字の分布係数である。

【文字選択原則】

常用字表制定の文字選択原則は以下の通り。

  1. 漢字の使用頻度に基づき、使用頻度の高い字を選択する。
  2. 使用頻度が同じの場合、学科での分布が広く、使用頻度の高い字を選択する。
  3. 漢字の字構成能力と語構成能力に基づき、字構成能力と語構成能力の高い字を選択する。
  4. 漢字の実際使用(語義機能)状況に基づいて取捨する。書面語の中ではめったに使用されず、用字統計時には統計できないが、日常生活の中では比較的常用であるという字は、これも適切に選択すべきである。

以上の4原則を総合運用する。単にある1つの原則によって取捨を決定しない。

【サンプリング検証】

常用字表に収録した常用字が理にかなっているかを検証するため、山西大学計算機科学系に依頼し、コンピュータを利用して200万字の言語資料をサンプリング統計し、収録常用字の使用頻度を検査した。サンプル材料は、1.1987年7月の『人民日報』(挿絵、広告、見出し、非漢字記号を除いた計150万字)、2.1987年7月の『北京科技報』(挿絵、広告、見出し、非漢字記号を除いた計20万字)、3.1987年の『当代』第三期(挿絵、見出し、非漢字記号を除いた計30万字)である。

検証の結果、2500個の常用字の被覆率は97.97%、1000個の次常用字の被覆率は1.51%で、合計(3500字)被覆率は99.48%だった。『現代漢語常用字表』が実際状況に符合することが示された。

【参加者】

『現代漢語常用字表』研究作業の参加者は、傅永和、孫建一、張書岩、魏励、朱范貞。人民教育出版社の莘乃珍、劉永譲は『現代漢語常用字表』第三稿と第四稿の修正に参加した。研究過程では、蒋仲仁、孔岐、劉涌泉、常宝儒、劉慶隆、石云程、姚世全、魯元魁、肖金卯、李健民、劉連元、華蔚蒼らの指導と協力も得た。


>>《现代汉语常用字表》