語文(国語)教育、辞書編纂および漢字機械処理、情報処理など各方面の需要に適応するため、国家語言文字工作委員会漢字処は、1986年6月から現代漢語常用字表の研究を開始した。1987年7月、国家語言文字工作委員会は教育、言語、情報処理などの専門家を招聘し、字表草案の論証を行った。同年8月、山西大学計算機科学系にサンプリング検証を依頼、国家教育委員会関連部門が字表草案の改正作業に参加した。国家語言文字工作委員会漢字処は、各方面から出された意見に基づき、字表草案の整理・修正を行い、1988年1月に現代漢語常用字表を制定した。
現代漢語常用字表の制定は、過去の作業およびその成果の基礎の上に行った。使用した統計資料は以下の15種類である。
通用字の資料の中からは以下の5種類を使用した。
常用字表の材料選択期間は1928年~1986年である。この期間内で異なる密度のサンプリングを行った。サンプル量は時期が新しくなるほど増し、最近の資料を主なサンプリング対象とした。社会での用字は、政治・経済・文化の発展と密接に関係しているため、異なる時期の用字状況にはやや違いがある。ある短い期間の用字状況だけによって文字を選択するなら、時間的な限界がある。統計の時間を適度に長くし、異なる各時期の用字状況を見渡せば、ある字の使用が安定したものか否かを測ることができる。安定した字を選択して使用すれば、文字選択の偶然性を回避できる。
常用字表制定時には、さらに異なる学科での漢字の分布と使用度合も統計した。漢字の異なる学科での分布を統計することによって、ある字の使用分布が平均的か否かを測定できる。1つの学科での使用頻度は高いが、その他学科ではめったに使用されないということは、その分布が平均的ではないことを示す。これに反し、使用頻度が高いだけでなく、多くの学科でも使用されているということは、その分布が平均的であることになる。分布が平均的な字を選択し、文字選択の偏りを避けた。1985年3月に北京航空学院計算機科学与工程系と中国文字改革委員会漢字処が共同で統計した『現代漢語用字頻度表』を漢字の使用分布の統計資料とした。同資料には10科の用字頻度表がある。1.文体生活用字頻度表。2.歴史哲学用字頻度表。3.政治経済用字頻度表。4.新聞報道用字頻度表。5.文学芸術用字頻度表。6.建築運輸用字頻度表。7.農林牧漁用字頻度表。8.軽工業用字頻度表。9.重工業用字頻度表。10.基礎知識用字頻度表である。
使用度合は、漢字の使用頻度とその字の各学科での分布に総合的考察を行う一種の計算方法である。漢字使用度合の計算式は次の通りである。

上の公式の計算条件は、各学科のサンプル量が平均的であると仮定することである。このうち、Nki とは k 字の第 i 類の言語資料の中での相対頻度、Nk とは k 字の総合類の中での相対頻度、n とは言語資料の分類数、Dk とは k 字の散布係数、Sk とは k 字の標準分布偏差、Uk とは k 字の使用度合、Fk とは k 字の出現回数である。漢字の使用度合統計時には、上の公式を調整した。調整後の公式は以下の通りである。

このうち、DIk と DEk はいずれも我々が採用した k 字の散布係数で、Lk は k 字の分布係数である。
常用字表制定の文字選択原則は以下の通り。
以上の4原則を総合運用する。単にある1つの原則によって取捨を決定しない。
常用字表に収録した常用字が理にかなっているかを検証するため、山西大学計算機科学系に依頼し、コンピュータを利用して200万字の言語資料をサンプリング統計し、収録常用字の使用頻度を検査した。サンプル材料は、1.1987年7月の『人民日報』(挿絵、広告、見出し、非漢字記号を除いた計150万字)、2.1987年7月の『北京科技報』(挿絵、広告、見出し、非漢字記号を除いた計20万字)、3.1987年の『当代』第三期(挿絵、見出し、非漢字記号を除いた計30万字)である。
検証の結果、2500個の常用字の被覆率は97.97%、1000個の次常用字の被覆率は1.51%で、合計(3500字)被覆率は99.48%だった。『現代漢語常用字表』が実際状況に符合することが示された。
『現代漢語常用字表』研究作業の参加者は、傅永和、孫建一、張書岩、魏励、朱范貞。人民教育出版社の莘乃珍、劉永譲は『現代漢語常用字表』第三稿と第四稿の修正に参加した。研究過程では、蒋仲仁、孔岐、劉涌泉、常宝儒、劉慶隆、石云程、姚世全、魯元魁、肖金卯、李健民、劉連元、華蔚蒼らの指導と協力も得た。