最終更新:1998年2月4日

『電脳文化と漢字のゆくえ』拾い読み


池田証寿

入手まで

平凡社編,『電脳文化と漢字のゆくえ 岐路に立つ日本語』,平凡社,1998年1月28日,四六版303ページ,ISBN4-582-40322-0,1900円(税別)

ニフティサーブのfshtext mes(11) の00013の豊島正之さんの 発言中にこの本の出版のことが言及されていた。で、早速、 札幌旭屋書店に行って入手。ついでに(といっちゃ失礼だが) 富田倫生さんの『本の未来』(アスキー出版局)も購入。

本屋でパラパラと見て、「と」本の雰囲気を感じた。 奥付には「編者――平凡社」とあるだけで、だれが主体となって 編集した本なのかぼかしてあるとの印象をもった。

正誤表

最初の「と」本かもしれないという印象は、添付されていた 「お詫びと訂正」と題された正誤表を一見して、より強まった。 参考のために以下に引用しておきましょう。

お詫びと訂正

本書の左記の点について、お詫びして訂正します。

二三三頁六行目
はじめて漢字符号 (JIS漢字第一水準、二九六五字)
 傍線部分削除(池田注、赤色で示す)
同頁一一行目
五年後に第二水準三三八八字を追加した改正版を
 第二次規格として
二四〇頁一行目
      1             2
JIS第一水準の出現から約二〇年、第二水準の制定からでも十数年を経て、
 1 第一次規格
  2 第二次規格
                              以上

要するに、JIS漢字の第一水準・第二水準と、第一次規格(78JIS・第二次規格 (83JIS)とが混乱してるのだ。 いずれ再版の際には修正されるでしょうが、これを見落とした編集者は お粗末。この本で展開されている主題の一つは現行のJIS漢字に対する批判 的検討であるはずであり、かんじんの部分についての認識が欠如してることを 露呈してしまった。

しかし、「お詫び」とあるので、これくらいにしておきましょう。

目次

タイトルと著者を抜き書き。敬称略。

あと、用語解説(加藤弘一)、参考文献、関連ホームページURL、筆者紹介が あります。

関連ホームページURLには私のページが載ってて、驚き。載ってるURLは古いもの でした(それはそうだ、先月に移したんだから)。 中身についてメールもらったのは、福井大の岡島昭浩さんくらいで、 結構見る人もいるのかしらん。あと、国立国語研究所の笹原宏之さんが いろいろ教えてくれました。

漢字が足りない?

この本の帯に「漢字が足りない?」とあり、諸氏もその点に触れています。 足りないのは確かで、私もそのあたりは調べたことがあります。 「篆隷万象名義データベースについて」 (「国語学」178集、1994年9月30日、国語学会、東京、武蔵野書院)他。 足りないという事実の認識は同じですが、そこに至る過程は人それぞれ違うでしょう。

この本に登場するJCS委員会幹事兼エディタの豊島正之さんには、 『キリシタン版ぎやどぺかどる本文・索引』(清文堂刊、1987年)という 本があり、12年前の段階で電子テキストによる本文を翻刻し、漢字索引作成の ためのコンピュータ用の字書(Ydicの前身ですね)を開発されています。 もうこの段階でJISの漢字が不足していることは認識されていたわけですが、 その認識の仕方がJISのすべての漢字について『角川新字源』諸橋『大漢和辞典』 と対照するという作業を経た上でのことに注意しておく必要があります。

足りない漢字を一字二字あげるなら造作もないことですが、 全般的な把握はなかなか困難です。私も約一万六千字を収録する 『篆隷万象名義』(てんれいばんしょうめいぎ、 空海撰、高山寺本が現存)の掲出漢字の分析で、 第一水準・第二水準(JIS X 0208)、補助漢字(JIS X 0212)、 ユニコード(ISO/IEC 10646-1、JIS X 0221)との対照を行い、漢字コードに ないことを判断することの難しさを痛感しています。

『篆隷万象名義』の場合だと、万から数千字のレベルで不足ですね。ですから これだけたりないよという文書を作成するだけでもやっかいなことです。

取り敢えず、コンピュータで扱える漢字が足りなくて困っているという 私の現状です。

JIS漢字の採録規準

さて、今回のJIS X 0208:1997の改正の目玉の一つは、第一次規格(78JIS)の 原典資料を探し当て、それによって、当初どのような規格を意図していたのかを 明らかにしたことです。

特に諸氏が疑問として指摘するJIS漢字の採録規準も明らかになっています。 具体的には解説(4ページ)に書かれていますが、次の主要四漢字表に基づいて 漢字が選定されています。

ところが、規格解説の書き方が悪かったのか、このことは無視されてます。

生命保険会社や官庁等が持っていた各種の漢字表を集めてきて、これをもとに 漢字の選定が行われました。(吉目木晴彦さん、31ページ)

JIS漢字について論じるさいには、必ず『日本工業規格』中の 『情報交換用漢字符号系・JIS C 6226』を参照する必要がある。その巻末 解説に選定の経緯が記されているからだ。これによると、選定のさい 調査対象となった資料三七点の大部分が、生命保険会社や電話会社の人名漢字 、現代新聞の活字調査表といった種類のものばかりであること、 委員会のメンバー一六人が産業界中心であることがわかる。実質的にはこの 中に含まれている少数の国語学者の一人が原案を作成し、多少の修正を 経て成立したといわれる。(紀田順一郎さん、233-234ページ)

この引用部分は、「と」本的です。

基本的に主要四漢字表にあるかどうかで、JIS漢字に採録されるかどうかが 決まっています。地名・人名に関しては『JIS漢字字典』と所収のコラム22を参照。 国土行政区画総覧を唯一の典拠とするJIS漢字をインターネットで検索するにも同様のデータあり。

「行政管理庁基本漢字」は、他の漢字表に共通する漢字がほとんどです。ですから、 地名・人名の資料によっていない漢字は、ほとんど情報処理学会の 「標準コード用漢字表(試案)」によるものです。

上には二つの引用文を掲げましたが、後の引用の委員構成に触れた箇所で 「この中に含まれている少数の国語学者の一人が原案を作成し」とありますが、 この書き方だと、二名以上の国語学者がいて、そのうちの一人が原案を作成した と読めますが、JIS C 6226-1978の委員名簿に見える国語学者は林大氏 お一人です。もっとも、78JISには複数の刷りがあって中身も違っているとことが 分かっていますので、「少数の国語学者」の氏名が挙げられた規格解説があるのか もしれません。もしそうなら大発見(?)です。

情報処理学会での話と混同があるかもしれませんが、よくわからない箇所です。

包摂規準

加藤弘一さんは座談会で次のように発言しています。

97JISの規格票にある「区点位置詳説」は大変な労作ですが、いろいろな機会に 問題にされてきた二〇〇字ほどの漢字について考察していて、徹底したJIS コード批判になっています。ただ、字体包摂が明示してあるのはここに 出てくる文字と、包摂規準の説明に例示されている文字だけで、「JIS基本漢字」 の六五〇〇余字すべてについてかいてあるわけではないんです。(92ページ)

この発言を池澤夏樹さんが「なるほどね。あとは推して知るべしという方針ですか」 と受けています。

規格票の「附属書6(規定)漢字の分類及び配列」を参照していただければ わかりますが、包摂規準が適用される区点位置については網羅的に示すのが 方針です。

k) 連番(参考) 漢字を包摂した場合に、適用される包摂規準の 連番(本体の6.6.3を参照)を示す。(61ページ)

さらに、「参考表 各実装字形差一覧」にも包摂が問題となる例が網羅的に 挙げられています。

『JIS漢字字典』では、見出しに採用したヒラギノ明朝と、JIS規格票の例示 字体に採用した平成明朝と差も示してあります(これは座談会に間に合わなかった でしょう)。

これだけやっても「あとは推して知るべしという方針ですか」ということで まとめられては、まあ、なんともどうすればいいのでしょうか。

次は長島弘明さんの文章の一部から引用。

一つの文字を他から区別し特定する同定作業や、形が違っているどの文字と どの文字が同一の文字であるのかという字体の包摂の弁別作業は、現在の JISコードや漢字表でも、明文化されているかどうかは別として、はっきりと 行われている。その作業を今のような乱暴な文字包摂ではなく、少しきちんとし、 少し工夫しさえすればよい。漢字は有限である。(151ページ)

前の部分をはしょったので分かりにくいかもしれませんが、ここの部分は私も 基本的に同様の考えを持っています。今回のJIS漢字の改正作業では、 「乱暴な文字包摂」と受け止められることを恐れず、78JISの文字同定方針を 忠実に再現すべく努力しています。「乱暴」に見える大きな原因は、 いうまでもなく、83JISにあります。また、同様な過ちは90JISにもあります。 メーカの実装にもゆれがあります。NECは第一次規格の誤植をそのまま継承し、 IBMや富士通は独自の見識で、字体を変更しています。

つまり、JIS漢字の二十年に及ぶ歴史は、規格の字体がゆれ、 メーカの実装の字体がゆれることで作られてきたのです。 こんな現実を見せられたら、誰でもいやになります。いやになるけれど、どの字が ないかをはっきりさせるためにはこうするよりほかないと考えるわけです。 追加・拡張しようにもどの漢字がないかをはっきりさせないことには前へ進めないのです。そのあたりまで読みとってほしいというのは無理でしょうか。

ここで問題になるのは、(1)JISがほんとうに字体の標準を決めていいのか という問題、さらに(2)平成明朝を字体の標準にされるのはたまらんという問題があり ます。(1)はやっぱり「国語審議会」でしょう。 (2)も文化とか美意識に関わる問題だけに 平成明朝を標準というのは難しいでしょう。

そうすると、今度は表外字の字体の規準をどうするかが問題になるのはいうまでも ありません。

『康煕字典』と諸橋『大漢和辞典』

次は吉目木晴彦さんの文章からの引用

コンピュータの漢字セットをめぐる議論の中では、特定の辞典・字典類を 神聖するのは誤りであるとする主張があります。よく槍玉に上がるのは諸橋 轍次の『大漢和辞典』や『康煕字典』です。が、この主張で根本的に おかしいのは、『大漢和辞典』や『康煕字典』をも一文献として収録できるように する、という発想を欠いていることです。(38ページ)

はい、『大漢和辞典』や『康煕字典』をデータベース化しているところはあります (昔からやっているのは京大人文研ですね)。 ですから、だいたい問題点は把握できていると思うのですが、 上の引用文を見ると気になるので私の理解を書いておきます。

コード化するメリットは、検索できるという点に尽きます。印刷だけなら 「今昔文字鏡」など有用なソフトがあります。改良もされていくでしょう。 検索で問題になるのは、『康煕字典』や『大漢和辞典』には重出があるとい うことです。これを拾うのがとてもたいへんです。拾いきれないかもしれない。 この二つの辞書は代表としてあげているので、他の辞書でも同様なことが 問題になります。もちろんしかるべくプロジェクトを組んで研究をすすめれば よいということになるでしょうが、どれほどの労力がかかるのか見積もりを とるのもそんなに簡単ではないと思いますよ。 フォントを作るのは外注できるでしょうし、番号付けもアルバイトでできるでしょうが、私の乏しい経験からいっても、重出字のチェックはかなりの困難がともなうと考えます。

もう一つ問題になるのは、『康煕字典』や『大漢和辞典』が版によって 違いがあることです。当然、字体が違っていることがあります。 『康煕字典』の本文研究、諸本研究は学位論文 になるくらい大きなテーマです。まあ、少なくても五年から十年はかかる のではないかと思います。

重出もあってもよい、諸本の異同があっても適切な一本をきめればよいという 考え方もあるでしょう。確かにそうかもしれない。しかし、そういったことを 知らないでやるならともかく、問題点を知ってしまった以上、それを無視すること は研究者としてできません。『康煕字典』や『大漢和辞典』に掲載の漢字を 使いたいというのは相当な専門家、教養人にちがいありません。そういう方たちなら 『康煕字典』や『大漢和辞典』に代表される漢字の辞書を研究することに それ相応の意義を認めてくださるでしょう。こういう場合、JISがやるからとか 文化庁がやるからとかは関係ありません。そうしたことに関わる人間の 学問的良心の問題です。

数万の漢字のコード化には、その前提として数十万の漢字のデータベース化が 必要です。それは恣意を加えない原本そのままの字形がもっとも望ましいと考えます。 私などにとって 必要なのは高性能のスキャナー、高解像度のディスプレイ、 大容量の記録媒体、画像処理ソフトとデータベースソフトです。

参考までに、この本のカバー裏にある「GT明朝(東大明朝)フォント・セット (部分)」を見ましょう。次はその一部です。

『電脳文化…』カバー裏

問題は、次の左側に挙げる「乕」によく似た漢字です。

乕β 諸橋の00148番

左の漢字は『康煕字典』にはありません。 『大漢和辞典』を見ると右側のようになっています。

「二」の部分の左側がついてるのが確認できるでしょうか。「GT明朝」と 『大漢和辞典』とをよく見比べてください。「GT明朝」は「二」の部分の左側 が離れています。

問題は、「GT明朝」と諸橋『大漢和辞典』とに示される漢字の字体が同じ と見なしてよいかどうかです。字形が違うのは誰が見ても歴然としていますから、 デザイン差とするか、字体差とするかが問題です。そしてどちらと見るにしても その根拠が必要になります。

そして、もっとやっかいなことは『JIS漢字字典』のコラム30(587ページ) で指摘されている問題との関係です。結論をいえばJISの「乕」と諸橋 『大漢和辞典』の上の漢字とを同じと見ることはできません。 詳しくは上記のコラムを参照してほしいのですが、『大漢和辞典』は 新たな字体を作り出してしまったといわざるを得ないのです。 そして「GT明朝」も新たな 字体を作り出してしまったかに見えるわけです。

話がずれましたが、現行のJIS漢字では実際に 使用された漢字を採録するというのが基本方針です。この実際に使用されたかどうか を検証するのは学問的には実に興味深いテーマです。 『康煕字典』『大漢和辞典』をコード化する文字コードがあってもいいと思いますが、 それは明らかに現行のJIS漢字とは性格を異にするものになります。 また上に挙げたような、大変だけれど知的好奇心を刺激する興味深い研究テーマも あります。『康煕字典』が全部使えれば便利でしょ、ということの 裏側に『康煕字典』諸本研究なんてやる価値がないという判断がなければ幸いです。

もうとっくに結論は出ているのです。必要とする人が、必要とする漢字を 必要なだけ組み込んだシステムを、人をあてにしないで作るということです。 ここでは人をあてにしないというのが重要です。 ネットワークの時代ですから、いいものならみんなが使ってあっという間に 広まるでしょう。

終わりに

『電脳文化と漢字のゆくえ』という本で、今回のJIS X 0208:1997 の改正が評価されている部分もあり、批判されている部分もあります。 規格の改正に多少とも関わった者として評価されれば単純にうれしいし、 有益な批判は有り難いと思います。

しかし、今回の改正の成果として注目してほしい点に触れられず、 相変わらずの「JIS神話」を展開されるのはとても残念です。というか、 研究の世界では、先行研究を十分に参照して論を展開せよというのがイロハ なのですが、どうも先行研究をろくに参照せずいいたいことをいう流儀がある ようです。 そういうのを読むとなんとなくもやもやとして自分の仕事の能率もあがりません。

最後に、誤植・誤記とおぼしい箇所を指摘しておきます。

(210ページ)日立製作所の小池建
名前は「建」さんです。
(296ページ)ケン・ルンデ『日本語情報処理』
Ken Lundeさん本人はケン ランディと書くようです。本人の名刺にそのように印刷されてます。

最初に「と」本かもしれないということを書きましたが、 有益な議論も多々あり参考になりました(特に小林龍生さんの文章。 また、丹羽基二さんのには「妛」が出てるようです)。 「と」本という評価はひとまず撤回しましょう。まあ、「と」本的な内容 に関して触れた次第。

他にも言及すべき点はありましょうが、「拾い読み」ということで ここでうち切ります。

1998年2月4日 池田証寿


[→このページの最初] [→雑文] [→JIS漢字] [→古辞書] [→ホームページ]
池田 証寿(いけだ しょうじゅ) Copyright (C) 1998 IKEDA Shoju, All rights reserved.
E-mail shikeda@Lit.Let.hokudai.ac.jp/KGH01365@nifty.ne.jp