『電脳文化と漢字のゆくえ』拾い読み

池田証寿

入手まで

平凡社編,『電脳文化と漢字のゆくえ　岐路に立つ日本語』,平凡社,1998年1月28日,四六版303ページ,ISBN4-582-40322-0,1900円（税別）

ニフティサーブのfshtext mes(11) の00013の豊島正之さんの発言中にこの本の出版のことが言及されていた。で、早速、札幌旭屋書店に行って入手。ついでに（といっちゃ失礼だが）富田倫生さんの『本の未来』（アスキー出版局）も購入。

本屋でパラパラと見て、「と」本の雰囲気を感じた。奥付には「編者――平凡社」とあるだけで、だれが主体となって編集した本なのかぼかしてあるとの印象をもった。

正誤表

最初の「と」本かもしれないという印象は、添付されていた「お詫びと訂正」と題された正誤表を一見して、より強まった。参考のために以下に引用しておきましょう。

お詫びと訂正
本書の左記の点について、お詫びして訂正します。
二三三頁六行目
はじめて漢字符号（ＪＩＳ漢字第一水準、二九六五字）
正　傍線部分削除（池田注、赤色で示す）
同頁一一行目
五年後に第二水準三三八八字を追加した改正版を
正　第二次規格として
二四〇頁一行目
　　　　　　１　　　　　　　　　　　　　２
ＪＩＳ第一水準の出現から約二〇年、第二水準の制定からでも十数年を経て、
正　１　第一次規格
　　２　第二次規格
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　以上

要するに、JIS漢字の第一水準・第二水準と、第一次規格(78JIS・第二次規格 (83JIS)とが混乱してるのだ。いずれ再版の際には修正されるでしょうが、これを見落とした編集者はお粗末。この本で展開されている主題の一つは現行のJIS漢字に対する批判的検討であるはずであり、かんじんの部分についての認識が欠如してることを露呈してしまった。

しかし、「お詫び」とあるので、これくらいにしておきましょう。

１　いま、何が、なぜ、問われているのか……吉目木晴彦
２　座談会＜私＞の言い分、＜私たち＞の望む明日……池澤夏樹、加藤弘一、島田雅彦
３　研究者の立場から
- 地名からJIS漢字コード表をみる……金井弘夫
- 清書できないワープロ、劣化したデジタル資料……長島弘明
- 苗字――この不思議な符帳……丹羽基二
- 点字と文字コード――すべての漢字を六点漢字に……長谷川貞夫
４　開発者の立場から
- 漢字六万四千字フォントセット公開に向けて……田村毅
- 漢字の符号化の過程と今後について……加藤重信
- 要求する側の責任ということについて……小林龍生
５　文字コード問題と国語国字問題……紀田順一郎
●特別対談　日本人と漢字世界……江藤淳、白川静

あと、用語解説（加藤弘一）、参考文献、関連ホームページURL、筆者紹介があります。

関連ホームページURLには私のページが載ってて、驚き。載ってるURLは古いものでした（それはそうだ、先月に移したんだから）。中身についてメールもらったのは、福井大の岡島昭浩さんくらいで、結構見る人もいるのかしらん。あと、国立国語研究所の笹原宏之さんがいろいろ教えてくれました。

漢字が足りない？

この本の帯に「漢字が足りない？」とあり、諸氏もその点に触れています。足りないのは確かで、私もそのあたりは調べたことがあります。「篆隷万象名義データベースについて」（「国語学」178集、1994年9月30日、国語学会、東京、武蔵野書院）他。足りないという事実の認識は同じですが、そこに至る過程は人それぞれ違うでしょう。

この本に登場するJCS委員会幹事兼エディタの豊島正之さんには、『キリシタン版ぎやどぺかどる本文・索引』（清文堂刊、1987年）という本があり、12年前の段階で電子テキストによる本文を翻刻し、漢字索引作成のためのコンピュータ用の字書（Ydicの前身ですね）を開発されています。もうこの段階でJISの漢字が不足していることは認識されていたわけですが、その認識の仕方がJISのすべての漢字について『角川新字源』諸橋『大漢和辞典』と対照するという作業を経た上でのことに注意しておく必要があります。

足りない漢字を一字二字あげるなら造作もないことですが、全般的な把握はなかなか困難です。私も約一万六千字を収録する『篆隷万象名義』（てんれいばんしょうめいぎ、空海撰、高山寺本が現存）の掲出漢字の分析で、第一水準・第二水準（JIS X 0208）、補助漢字（JIS X 0212）、ユニコード（ISO/IEC 10646-1、JIS X 0221）との対照を行い、漢字コードにないことを判断することの難しさを痛感しています。

『篆隷万象名義』の場合だと、万から数千字のレベルで不足ですね。ですからこれだけたりないよという文書を作成するだけでもやっかいなことです。

取り敢えず、コンピュータで扱える漢字が足りなくて困っているという私の現状です。

JIS漢字の採録規準

さて、今回のJIS X 0208:1997の改正の目玉の一つは、第一次規格（78JIS）の原典資料を探し当て、それによって、当初どのような規格を意図していたのかを明らかにしたことです。

特に諸氏が疑問として指摘するJIS漢字の採録規準も明らかになっています。具体的には解説（4ページ）に書かれていますが、次の主要四漢字表に基づいて漢字が選定されています。

「標準コード用漢字表（試案）」6086字
「行政管理庁基本漢字」2817字
「日本生命収容人名漢字表」3044字
「国土行政区画総覧使用漢字」（地名）3251字

ところが、規格解説の書き方が悪かったのか、このことは無視されてます。

生命保険会社や官庁等が持っていた各種の漢字表を集めてきて、これをもとに漢字の選定が行われました。（吉目木晴彦さん、31ページ）

JIS漢字について論じるさいには、必ず『日本工業規格』中の『情報交換用漢字符号系・JIS C 6226』を参照する必要がある。その巻末解説に選定の経緯が記されているからだ。これによると、選定のさい調査対象となった資料三七点の大部分が、生命保険会社や電話会社の人名漢字、現代新聞の活字調査表といった種類のものばかりであること、委員会のメンバー一六人が産業界中心であることがわかる。実質的にはこの中に含まれている少数の国語学者の一人が原案を作成し、多少の修正を経て成立したといわれる。（紀田順一郎さん、233-234ページ）

この引用部分は、「と」本的です。

基本的に主要四漢字表にあるかどうかで、JIS漢字に採録されるかどうかが決まっています。地名・人名に関しては『JIS漢字字典』と所収のコラム22を参照。国土行政区画総覧を唯一の典拠とするJIS漢字をインターネットで検索するにも同様のデータあり。

「行政管理庁基本漢字」は、他の漢字表に共通する漢字がほとんどです。ですから、地名・人名の資料によっていない漢字は、ほとんど情報処理学会の「標準コード用漢字表（試案）」によるものです。

上には二つの引用文を掲げましたが、後の引用の委員構成に触れた箇所で「この中に含まれている少数の国語学者の一人が原案を作成し」とありますが、この書き方だと、二名以上の国語学者がいて、そのうちの一人が原案を作成したと読めますが、JIS C 6226-1978の委員名簿に見える国語学者は林大氏お一人です。もっとも、78JISには複数の刷りがあって中身も違っているとことが分かっていますので、「少数の国語学者」の氏名が挙げられた規格解説があるのかもしれません。もしそうなら大発見（？）です。

情報処理学会での話と混同があるかもしれませんが、よくわからない箇所です。

包摂規準

加藤弘一さんは座談会で次のように発言しています。

97JISの規格票にある「区点位置詳説」は大変な労作ですが、いろいろな機会に問題にされてきた二〇〇字ほどの漢字について考察していて、徹底したJIS コード批判になっています。ただ、字体包摂が明示してあるのはここに出てくる文字と、包摂規準の説明に例示されている文字だけで、「JIS基本漢字」の六五〇〇余字すべてについてかいてあるわけではないんです。（92ページ）

この発言を池澤夏樹さんが「なるほどね。あとは推して知るべしという方針ですか」と受けています。

規格票の「附属書6（規定）漢字の分類及び配列」を参照していただければわかりますが、包摂規準が適用される区点位置については網羅的に示すのが方針です。

k) 連番（参考）　漢字を包摂した場合に、適用される包摂規準の連番（本体の6.6.3を参照）を示す。（61ページ）

さらに、「参考表　各実装字形差一覧」にも包摂が問題となる例が網羅的に挙げられています。

『JIS漢字字典』では、見出しに採用したヒラギノ明朝と、JIS規格票の例示字体に採用した平成明朝と差も示してあります（これは座談会に間に合わなかったでしょう）。

これだけやっても「あとは推して知るべしという方針ですか」ということでまとめられては、まあ、なんともどうすればいいのでしょうか。

次は長島弘明さんの文章の一部から引用。

一つの文字を他から区別し特定する同定作業や、形が違っているどの文字とどの文字が同一の文字であるのかという字体の包摂の弁別作業は、現在の JISコードや漢字表でも、明文化されているかどうかは別として、はっきりと行われている。その作業を今のような乱暴な文字包摂ではなく、少しきちんとし、少し工夫しさえすればよい。漢字は有限である。（151ページ）

前の部分をはしょったので分かりにくいかもしれませんが、ここの部分は私も基本的に同様の考えを持っています。今回のJIS漢字の改正作業では、「乱暴な文字包摂」と受け止められることを恐れず、78JISの文字同定方針を忠実に再現すべく努力しています。「乱暴」に見える大きな原因は、いうまでもなく、83JISにあります。また、同様な過ちは90JISにもあります。メーカの実装にもゆれがあります。NECは第一次規格の誤植をそのまま継承し、 IBMや富士通は独自の見識で、字体を変更しています。

つまり、JIS漢字の二十年に及ぶ歴史は、規格の字体がゆれ、メーカの実装の字体がゆれることで作られてきたのです。こんな現実を見せられたら、誰でもいやになります。いやになるけれど、どの字がないかをはっきりさせるためにはこうするよりほかないと考えるわけです。追加・拡張しようにもどの漢字がないかをはっきりさせないことには前へ進めないのです。そのあたりまで読みとってほしいというのは無理でしょうか。

ここで問題になるのは、(1)JISがほんとうに字体の標準を決めていいのかという問題、さらに(2)平成明朝を字体の標準にされるのはたまらんという問題があります。(1)はやっぱり「国語審議会」でしょう。 (2)も文化とか美意識に関わる問題だけに平成明朝を標準というのは難しいでしょう。

そうすると、今度は表外字の字体の規準をどうするかが問題になるのはいうまでもありません。

『康煕字典』と諸橋『大漢和辞典』

次は吉目木晴彦さんの文章からの引用

コンピュータの漢字セットをめぐる議論の中では、特定の辞典・字典類を神聖するのは誤りであるとする主張があります。よく槍玉に上がるのは諸橋轍次の『大漢和辞典』や『康煕字典』です。が、この主張で根本的におかしいのは、『大漢和辞典』や『康煕字典』をも一文献として収録できるようにする、という発想を欠いていることです。（38ページ）

はい、『大漢和辞典』や『康煕字典』をデータベース化しているところはあります（昔からやっているのは京大人文研ですね）。ですから、だいたい問題点は把握できていると思うのですが、上の引用文を見ると気になるので私の理解を書いておきます。

コード化するメリットは、検索できるという点に尽きます。印刷だけなら「今昔文字鏡」など有用なソフトがあります。改良もされていくでしょう。検索で問題になるのは、『康煕字典』や『大漢和辞典』には重出があるということです。これを拾うのがとてもたいへんです。拾いきれないかもしれない。この二つの辞書は代表としてあげているので、他の辞書でも同様なことが問題になります。もちろんしかるべくプロジェクトを組んで研究をすすめればよいということになるでしょうが、どれほどの労力がかかるのか見積もりをとるのもそんなに簡単ではないと思いますよ。フォントを作るのは外注できるでしょうし、番号付けもアルバイトでできるでしょうが、私の乏しい経験からいっても、重出字のチェックはかなりの困難がともなうと考えます。

もう一つ問題になるのは、『康煕字典』や『大漢和辞典』が版によって違いがあることです。当然、字体が違っていることがあります。『康煕字典』の本文研究、諸本研究は学位論文になるくらい大きなテーマです。まあ、少なくても五年から十年はかかるのではないかと思います。

重出もあってもよい、諸本の異同があっても適切な一本をきめればよいという考え方もあるでしょう。確かにそうかもしれない。しかし、そういったことを知らないでやるならともかく、問題点を知ってしまった以上、それを無視することは研究者としてできません。『康煕字典』や『大漢和辞典』に掲載の漢字を使いたいというのは相当な専門家、教養人にちがいありません。そういう方たちなら『康煕字典』や『大漢和辞典』に代表される漢字の辞書を研究することにそれ相応の意義を認めてくださるでしょう。こういう場合、JISがやるからとか文化庁がやるからとかは関係ありません。そうしたことに関わる人間の学問的良心の問題です。

数万の漢字のコード化には、その前提として数十万の漢字のデータベース化が必要です。それは恣意を加えない原本そのままの字形がもっとも望ましいと考えます。私などにとって必要なのは高性能のスキャナー、高解像度のディスプレイ、大容量の記録媒体、画像処理ソフトとデータベースソフトです。

参考までに、この本のカバー裏にある「GT明朝（東大明朝）フォント・セット（部分）」を見ましょう。次はその一部です。

『電脳文化…』カバー裏

問題は、次の左側に挙げる「乕」によく似た漢字です。

諸橋の00148番

左の漢字は『康煕字典』にはありません。『大漢和辞典』を見ると右側のようになっています。

「二」の部分の左側がついてるのが確認できるでしょうか。「GT明朝」と『大漢和辞典』とをよく見比べてください。「GT明朝」は「二」の部分の左側が離れています。

問題は、「GT明朝」と諸橋『大漢和辞典』とに示される漢字の字体が同じと見なしてよいかどうかです。字形が違うのは誰が見ても歴然としていますから、デザイン差とするか、字体差とするかが問題です。そしてどちらと見るにしてもその根拠が必要になります。

そして、もっとやっかいなことは『JIS漢字字典』のコラム30（587ページ）で指摘されている問題との関係です。結論をいえばJISの「乕」と諸橋『大漢和辞典』の上の漢字とを同じと見ることはできません。詳しくは上記のコラムを参照してほしいのですが、『大漢和辞典』は新たな字体を作り出してしまったといわざるを得ないのです。そして「GT明朝」も新たな字体を作り出してしまったかに見えるわけです。

話がずれましたが、現行のJIS漢字では実際に使用された漢字を採録するというのが基本方針です。この実際に使用されたかどうかを検証するのは学問的には実に興味深いテーマです。『康煕字典』『大漢和辞典』をコード化する文字コードがあってもいいと思いますが、それは明らかに現行のJIS漢字とは性格を異にするものになります。また上に挙げたような、大変だけれど知的好奇心を刺激する興味深い研究テーマもあります。『康煕字典』が全部使えれば便利でしょ、ということの裏側に『康煕字典』諸本研究なんてやる価値がないという判断がなければ幸いです。

もうとっくに結論は出ているのです。必要とする人が、必要とする漢字を必要なだけ組み込んだシステムを、人をあてにしないで作るということです。ここでは人をあてにしないというのが重要です。ネットワークの時代ですから、いいものならみんなが使ってあっという間に広まるでしょう。

終わりに

『電脳文化と漢字のゆくえ』という本で、今回のJIS X 0208:1997 の改正が評価されている部分もあり、批判されている部分もあります。規格の改正に多少とも関わった者として評価されれば単純にうれしいし、有益な批判は有り難いと思います。

しかし、今回の改正の成果として注目してほしい点に触れられず、相変わらずの「JIS神話」を展開されるのはとても残念です。というか、研究の世界では、先行研究を十分に参照して論を展開せよというのがイロハなのですが、どうも先行研究をろくに参照せずいいたいことをいう流儀があるようです。そういうのを読むとなんとなくもやもやとして自分の仕事の能率もあがりません。

最後に、誤植・誤記とおぼしい箇所を指摘しておきます。

（210ページ）日立製作所の小池建雄: 名前は「建夫」さんです。
（296ページ）ケン・ルンデ『日本語情報処理』: Ken Lundeさん本人はケン　ランディと書くようです。本人の名刺にそのように印刷されてます。

最初に「と」本かもしれないということを書きましたが、有益な議論も多々あり参考になりました（特に小林龍生さんの文章。また、丹羽基二さんのには「妛」が出てるようです）。「と」本という評価はひとまず撤回しましょう。まあ、「と」本的な内容に関して触れた次第。

他にも言及すべき点はありましょうが、「拾い読み」ということでここでうち切ります。

1998年2月4日　池田証寿

[→このページの最初] [→雑文] [→JIS漢字] [→古辞書] [→ホームページ]

E-mail shikeda@Lit.Let.hokudai.ac.jp/KGH01365@nifty.ne.jp