諸橋轍次博士著『大漢和辞典』(大修館書店刊行、以下、諸橋大漢和)を全部 コード化してコンピュータで使えるようにすれば、文字コード問題は 解決するという意見がある。諸橋大漢和は質量ともに極めて優れた 漢和辞典であることはいうまでもない。しかし、そのまま情報交換用の 符号化文字集合として扱うには問題が多い。このことは、 「諸橋轍次編『大漢和辞典』の<音義未詳字>」 で考えたことがある。最近、譌字について調査する機会があったので、 簡単にその結果を報告しておこう。
「譌字」は「カジ」と読む。最近、新版の出た『広辞苑第五版』(新村出博士 編、岩波書店、1998年11月11日)や、新解さんで話題の『新明解国語辞典第四版』 (山田忠雄氏主幹、三省堂、1997年3月31日)を見ても「譌字」は掲載されていない。 そこで、『角川新字源』(小川環樹博士他編、角川書店、1996年1月20日改訂再版) を見ると、「譌」は独立した項目としては立てられず、「訛」(言部4画、7551番) の本字として示されていた。 「訛」(カ)の意味は、「(1)うそ。偽言。(2)あやしいことば。妖言。(3)なまり。 方言。(4)なまる。ことばや文字を誤る。(5)いつわる。(6)あやまる(誤)。あやまり。 (7)のび(野火) (8)うごく(動)。かわる。(9)《俗》かたる(騙る)。 人のものをだましとる。」といった説明が与えられている。 この後、「訛音(カオン)」「訛言(カゲン)」などの熟語を5語ほど 掲げるは、「訛字」は見えない。
そこで、諸橋大漢和で「譌」を検索してみると、熟語の説明中に「譌字」が あり、「うそ字。誤字。訛字。」と説明が与えられている。
要するに、「譌字」とは「誤字」のことである。現代日本語では 「譌字」というような難しい言い方はしなくなっているが、 その意味は「誤字」と同義であるから、以下、「譌字」は「誤字」のことと して読んでもらいたい。
譌字とは誤字のことであるから、 これを、JIS漢字のような符号化文字集合へ入れるのは適切ではない。 誤字であるから、日本語の文章の中で使うことが出来ない。使い道がないのである。 あるとすれば、誤字の例として掲げるか、諸橋大漢和にはこのような譌字が掲 げられていると例示するぐらいであろう。
そうした非常に限定された特殊な目的のためにJIS漢字に採用するというのは 賛成出来ない。 非常に限定された特殊な目的でも、例えば、 説文解字などで使われ、由緒正しい漢字であれば、 それは別の理由(学術研究上、必要度が高いなど)で検討の対象となるであろう。
一般に字書は規範的性格が強いと言われる。つまり、正しいことば、正しい 漢字の字体を示すことが字書の目的である。譌字や誤字を掲げるのは、 そうした漢字を使うべきではないという意味で掲げてあるのである。 譌字を使うことを推奨しようとして掲げているのでない。このことは、誰でも 理解できよう。
諸橋大漢和を全部コンピュータに入れることによって、文化の継承を 主張される方がいるようだが、諸橋大漢和で譌字を掲げるのは、 そうした漢字を誤って使わないようにするのが本来の趣旨である。 そうした諸橋大漢和編纂の本来の趣旨を理解せずに、 諸橋大漢和を全部入れれば、即、文化の継承につながるのだ、というような 短絡的な発想は、根本的に誤った認識である。
もちろん、諸橋大漢和にある漢字をすべてコンピュータで表示・印刷 出来るようにすることは必要であろう。諸橋大漢和やその土台となった 康煕字典を利用したり研究するにはそうした作業が必要である。 しかし、そのために、JIS漢字に諸橋大漢和を全部入れる必要は全然ない のである。諸橋大漢和のすべての漢字を画像として処理するソフトは 既に公開されいて、誰でも利用できる。 京都大学のe漢字のプロジェクトは 学術目的であれば、無償で利用出来る。 今昔文字鏡は 有料だが、低価格であり、検索のデータベースもたいへん充実した ものである。これらは、漢字不足に悩むコンピュータの ユーザに推奨出来る物である。(東京大学のGT明朝のプロジェクトもあるが、 全体は未公開である。一部公開のものについて感想 (「東大明朝とJIS漢字の包摂規準」) を書いたので参照されたい。)
現在、我々が通常用いているJIS漢字は、現代日本語を書き表すために 開発されたものである。遙か 20年前、コンピュータなど使えない時代に、 これだけの文字集合を収集整理されたことには深い敬意を払わずに いられない。むろん、足りない文字はあるであろう。しかしそれは、 JIS漢字があったればこそ足りないことに気づくのである。 この点を忘れてはならない。
現在、新JIS漢字(第3・4水準)の開発が進められている。そこでは、 20年前に制定されたJIS漢字の目的を踏まえ、現代日本語を書き表すのに 必要かつ十分な文字を収集し、それを符号化することを目指している。
すなわち、新JIS漢字(第3・4水準)の開発は、 これからの情報化時代に向けて必要不可欠な文字を抽出する作業なのである。
当然、そこでは切り捨てられるものが出てくる。しかし、言うまでもなく、 「文化」を生み出すには、過去を切り捨てることが必然的に要求されるのである。
すでにコンピュータは多くのものを切り捨ててきた。 もうすぐ年賀状を書く時期になるが、手書きで宛名を書くことも少なくなってきた。 (私は、せめて宛名ぐらいはと思い、手書きしている。数が多くないから出来るの だが。)また、 電子メールは、手書きによる手紙・葉書を捨てつつある。そうした例は 挙げればキリがないであろう。 (このあたりについては、 藤本裕之氏の批評が参考になった。)
切り捨てられるのは、まっぴらゴメンだということであれば、 それは存在を主張するしかない。いや、存在だけではだめで、存在することの 価値を主張することが求められているのである。 存在の価値が認められた文字を優先する、 あるいは存在の価値が認められるべき文字を絶対に落とさない、 これが新JIS漢字(第3・4水準)の 基本的な思想と言えるだろう。
もちろん、存在の価値がすぐに認められない文字(漢字)だからといって 完全に切り捨てることは正しくない。そういう意味では、 一文字でも使う人がいれば、コード化すべきだという主張には傾聴すべき 点があるだろう。この問題を文字コードの 問題として扱うためには、一文字でも使う人がいるということを具体的な 事実をもって示し、何を要求しているかを明確にする必要がある。 その作業を怠けるのは、結局、甘えでしかない。
諸橋大漢和を全部JISにいれなさい、と主張することは、 譌字(誤字)をJISに入れなさいと主張するのに等しい。
では、譌字(誤字)はどれくらい諸橋大漢和にあるのか。
諸橋大漢和の第八巻(白部から糸部)の5429字 について調査した結果、85字の譌字を見出すことが出来た。 これは、調査範囲の1.56%に相当する。 諸橋大漢和約50000字の1.56%といえば、781字である。 音義未詳字は、第八巻前半の調査では、7%であった。 50000 x ( 0.0156 + 0.070 ) = 4280 であるから、 諸橋大漢和の4000字以上が譌字(誤字)と音義未詳字であり、 それらは諸橋大漢和を印刷・表示する くらいしか使い道がないということになる。
「諸橋大漢和を全部JISに入れなさい」と主張することは (そうした主張があるとすればの話であるが) 4000字以上の譌字(誤字)・音義未詳字をJISに入れなさい と主張していることに等しいのである。 このことを十分に認識した上で、 「諸橋大漢和を全部JISに入れなさい、入れるべきである」と主張してほしい ものである。
諸橋番号,部首,画数,諸橋の記述(典拠は書名のみ) 22696,白,4,カウ 〓(3-5889)の譌字。〔正字通〕 22775,白,11,ベン 〓(9-30128)の譌字。〔正字通〕 22800,白,14,クワウ 〓(8-22770)の譌字。〔正字通〕 22885,皮,9,タツ 〓(8-22919)の譌字。〔康煕字典〕 22937,皮,17,ジヤウ 〓(5-13441)の譌字。〔正字通〕 22942,皿,2,ケイ 〓(10-33966)の譌字。〔正字通〕 23046,皿,11,チウ 〓(8-23071)の譌字。〔正字通〕 23067,皿,12,バウ マウ 〓(3-5674)の譌字。〔字彙補〕 23082,皿,14,レイ 〓(8-23087)の譌字。〔正字通〕 23095,皿,17,チヨ 〓(8-23096)の譌字。〔中華大字典〕 23119,目,3,アツ 〓(8-23197)の譌字。〔正字通〕 23130,目,3,ガイ 〓(4-7421)の譌字。〔正字通〕 23134,目,3,イ 〓(10-36667)の譌字。〔康煕字典〕 23148,目,4,ベキ 覓(10-34815)の譌字。〔正字通〕 23149,目,4,バク 〓(8-23320)の譌字。〔正字通〕 23150,目,4,コ 〓(5-13796)の譌字。〔正字通〕 23247,目,5,イ 〓(8-23261)の譌字。〔正字通〕 23293,目,6,ジ 〓(9-29444)の譌字。〔正字通〕 23294,目,6,ソウ 〓(8-23528)の譌字。〔正字通〕 23300,目,6,エン 〓(8-23562)の譌字。〔正字通〕 23309,目,6,クワツ 〓(8-23220)の譌字。〔正字通〕 23357,目,7,クワン 〓(8-23352)の譌字。〔正字通〕 23365,目,7,カウ 膏(9-29800)の譌字。〔正字通〕 23401,目,7,ゼン ネン 〓(9-29547)の譌字。〔字彙補〕 23507,目,9,テキ 〓(8-23656)の譌字。〔正字通〕 23509,目,9,シン 〓(9-23396)の譌字。〔康煕字典〕 23521,目,9,ク 〓(8-23479)の譌字。〔康煕字典〕 23732,目,13,シヨク 〓(13-23732)の譌字。〔正字通〕 23767,目,14,ブ 〓(8-23710)の譌字。 〔正字通〕 23977,矢,7,エイ 〓(6-16634)の譌字。 〔康煕字典〕 23990,矢,8,シ 熾(7-19385)の譌字。 〔正字通〕 24458,石,11,ラク 犖(7-20126)の譌字。〔字彙補〕 24718,示,7,コン 〓(5-12131)の譌字。〔正字通〕 24729,示,8,ヒ 裨(10-34338)の譌字。〔康煕字典〕 24862,示,15,クワウ 〓(7-20774)の譌字。〔龍龕手鑑〕 24974,禾,4,テイ 梯(6-14881)の譌字。〔字彙補〕 25015,禾,5,ダ 陀(11-41600)の譌字。〔字彙補〕 25151,禾,9,コク 〓(8-25064)の譌字。〔正字通〕 25245,禾,11,リツ 〓(8-27095)の譌字。〔正字通〕 25480,穴,5,ハツ 〓(9-29357)の譌字。〔淮南子・集解〕 25500,穴,6,カウ 〓(8-25470)の譌字。〔韓非子・集解〕 25534,穴,7,シ 〓(8-25501)の譌字。〔字彙補〕 25537,穴,7,フン 汾(6-17178)の譌字。〔呂覽・校正〕 25574,穴,8,イ 〓(3-7139)の譌字。〔康煕字典〕 25596,穴,10,シユン 〓(7-21558)の譌字。〔正字通〕 25605,穴,10,キウ 〓(3-7349)の譌字。〔中華大字典〕 25703',穴,16,セツ 竊(8-25713)の譌字。〔字彙補〕 25782,立,7,タン 端(8-25806)の譌字。〔五音篇海〕 25896,竹,4,カウ 〓(8-25883)の譌字。〔字彙補〕 25918,竹,5,チク 筑(8-26002)の譌字。〔篇海〕 26159,竹,8,タウ 〓(8-26343)の譌字。〔正字通〕 26166,竹,8,サン 〓(2-2659)の譌字。〔康煕字典〕 26217,竹,9,カ 葭(9-31449)の譌字。〔正字通〕 26261,竹,9,チク 築(8-26289)の譌字。〔正字通〕 26279,竹,9,サイ 〓(8-26278)の譌字。〔康煕字典〕 26295,竹,9,ヰ 〓(8-26564)の譌字。〔康煕字典〕 26384,竹,10,ダイ 〓(8-26667)の譌字。〔康煕字典〕 26641,竹,13,セウ 篠(8-26328)の譌字。〔字彙補〕 26642,竹,13,ハク 〓(8-26495)の譌字。〔康煕字典〕 26808,竹,19,ヒ 〓(9-32595)の譌字。〔康煕字典〕 26839,米,2,シン 〓(8-26842)の譌字。〔字彙補〕 27252,糸,3,ジユン 純(8-27277)の譌字。〔篇海〕 27269,糸,4,カウ 〓(8-27292)の譌字。〔正字通〕 27283,糸,4,ジン 〓(8-27245)の譌字。〔正字通〕 27316,糸,4,ハ 〓(8-27441)の譌字。〔字彙補〕 27387,糸,5,カウ 〓(8-27292)の譌字。〔康煕字典〕 27388,糸,5,シヨ 〓(8-27276)の譌字。〔字彙補〕 27455,糸,6,メン 緬(8-27674)の譌字。〔康煕字典〕 27456,糸,6,シウ 〓(8-27747)の譌字。〔康煕字典〕 27532,糸,7,ケイ 絅(8-27375)の譌字。〔正字通〕 27720,糸,9,ケイ 〓(8-27792)の譌字。〔康煕字典〕 27721,糸,9,ヘキ 〓(8-27961)の譌字。〔康煕字典〕 27798,糸,10,ム 〓(8-27648)の譌字。〔字彙補〕 27800,糸,10,サク 索(8-27306)の譌字。〔康煕字典〕 27802,糸,10,サウ 〓(8-27854)の譌字。〔康煕字典〕 27803,糸,10,エウ 〓(8-27856)の譌字。〔字彙補〕 27850,糸,11,ハン 繁(8-27849)の譌字。〔正字通〕 27894,糸,12,イン 〓(8-28000)の譌字。〔正字通〕 27898,糸,12,チヨウ 〓(8-27650)の譌字。〔正字通〕 27934,糸,12,ソ 〓(8-27731)の譌字。〔字彙補〕 27946,糸,12,エウ 〓(10-35851)の譌字。〔正字通〕 28029,糸,15,クワン 〓(8-27486)の譌字。〔正字通〕 28065,糸,16,ハウ 繁(8-27852)の譌字。〔字彙補〕 28073,糸,17,ベツ 〓(8-28038)の譌字。〔篇海〕 28098,糸,20,シ 〓(8-28094)の譌字。〔正字通〕