1998年11月13日公開
1998年11月15日改訂
1998年11月16日一部修正・加筆
1998年11月18日文字鏡に関する記述を修正
1998年11月20日「五重塔」関係の文章へのリンク追加

JIS漢字批判のために(改訂版)


池田証寿/shikeda@lit.let.hokudai.ac.jp

ライン・ラボ の読書録(11月15日)で取り上げていただき有り難かった。 私としては、随分はっきり書いたつもりだが、 「控えめな表現」との評を頂いた。そこで、 【】内にいくらか「控えめでない表現」を入れておくことにした。また、 敬称は略した。 11月16日記す。】

1. はじめに

「This is 読売」12月号は「どこへ行く漢字」と題して 文字コード問題を特集。 坂村健、池澤夏樹、中沢けい、高島俊男の各氏がそれぞれの立場から 意見を述べている。私の理解しているJIS漢字とはずいぶんと 違った見方をされているようで、それはそれで興味深い。

【この雑誌の「編集後記」に

「文字コード」といわれても 最初はピンと来なかった。ワープロ歴はもう十余年、 時折「漢字が出ない」ことにイライラするぐらい。 だがどうやら急を要する 問題とわかるのは特集「どこへ行く漢字」の準備を始めてから。 インターネット時代の「社会基盤」の問題でありながら、 どこかで戦後以来の「国語国字」論争になりかねない火種を 抱えている。何が問われているのかご一読を。

と見える。この雑誌の編集者の文字コード問題に対する 見識の程度がうかがえる。「文字コード問題」と 「国語国字問題」とは別だが、だとしても、戦後、新聞・ 出版・雑誌等のメディアが当用漢字(と常用漢字)をほぼ 忠実に守り、それによって「文化」を築いてきたという歴史的 事実を忘れてもらっては困る。

メディアに関わる方は、 自らが実践してきたことを充分認識した上で、文字コード問題を 論じてもらいたい。

ここでは、上記の各氏の意見にコメントすることはせず、 私の理解するJIS漢字規格を述べてみよう。ここ 何年かJIS漢字規格の改正とその拡張の作業に関わっており、 その作業を進めるJCS委員会WG2の一委員として の責任を果たしたいと考えるからである。

【コメントを【】内にバンバン書いてますが、ここはそのままに しときます。

また、「This is 読売」の記述を引用することがあるが、 JIS漢字批判に関しては、従来の主張の繰り返しで、特に 目新しいところはない。的外れの批判を繰り返していること に対する批判として、引用しているだけである。 】

2. 現状認識

(1)過去20年間に蓄積されたJIS漢字による資産が存在

いろいろなかたちでその資産が蓄積されており、 インターネットで公開された範囲で考えてみても、それは すでに文化的資産と呼んでいい水準に達している。

【「インターネット」の「イ」も話題にならなかった時期から、 「萬葉集」(吉村誠)や「源氏物語」(長瀬真理) の電子化テキストが作成・公開されていた。この 事実は記憶に留めておいてもらいたい。】

(2)JIS漢字による資産の継承の必要性

したがって、過去の資産を切り捨てれば、これはまさに 文化を切り捨てたことになってしまう。そうならないようにするのが、 工業規格としての責任と考える。

【いきなり過去のすべての文化的資産の継承を目指すのではなく、 まずここ20年間の文化的資産を確実に継承することが先決である。】

(3)インフラとしての文字コードの拡張の必要性

これは、上記「This is 読売」の意見にも見られるところで、 ほぼ万人の了解するところ。 ただ、これだけを主張するのは無責任であると考える。

【とはいえ、当用漢字、常用漢字という歴史的な事実を、無視することは出来ない。 これと旧字体、康煕字典体との関係を、どのように関係づけるか、 問題はそう簡単ではない。 】

とりわけ、共有可能な過去の資産(まさに文化的資産)を保持しない 技術者や、 電子テキストの資産を作り出す努力をせずその利用のみ主張するユーザが、 インフラとしての文字コードの拡張の必要性を主張しても説得力を感じない。

【すべての文字を扱えるTRONコードがすでに共有可能な電子化テキスト を保有し、公開しているなら、この発言は撤回する。 また、現行JIS漢字規格の範囲で、充分表現できる作品の電子化テキスト を、文芸家の方がどんどん公開するというなら、文字の不足の訴えにも 説得力が出てくると思う。文字コード問題が解決しないなら、作品を 発表しないという方がいるなら(そういう方はいないと思うが)、 作品を書けない自分自身の無能さを文字コードのせいにしているだけ である。】

3. JIS X 0208:1997に対する評価

(1)JIS漢字とは何かを実証的に解明した研究書である

今回の規格票は、 過去のJIS漢字批判者が、チームを組んで徹底的に資料を掘り起こし、 その分析を行ったものである。

【かつてJIS漢字をさんざんに批判してきた方々であるが、 昨今のJIS漢字批判のように、表面的な批判ではなく、 具体的な疑問として論じていた。 日経mixのfp会議、インターネットのニュースグループのfj.kanji等。 】

(2)規格としては「明確化」をしただけで何も新しいことはしていない

文字の拡張は必要として、では、現行JIS漢字は何を 規定しているのか。どの文字があって、どの文字がないか、 従来の規格票を隅から隅まで検討しても、それが明確でなかった。 今回97年の改正は、関連資料を発掘した上で、 JISに無い字がどれであるのか、それを明確化したものである。

(3)漢字の採録範囲と漢字字体の認定方法(包摂)は78年当時の意図を再現したのみ

97JISの改正委員会の仕事は、JISの漢字規格を歴史的に位置づけようと したもの、現状を追認したものである。 文字コードは、かくあるべしという考えを提示したものではない。

したがって、国民の大多数が、 現行JIS漢字は使い物にならないと判断するのであれば、 さっさと別のコード体系 へ移行すればよい。そうするのに充分な材料が提示されている。

また、仮に、 別コード体系へ移行したとしても過去のJIS漢字の資産を継承出来る ようにした配慮したのが 97JISの改正である。

ついでに言っておけば、 「鴎」「涜」等の拡張新字体に関しては、 規格票の表現として節度を保持しつつ、 批判的な態度を、最も鮮明に表明している。その辺りを きちんと読み取ってほしいと思う。

【高島俊男の次の発言は強烈である。

ガンはJISである。 何かといえば「規格票も精読しないでつべこべ言うな」と、 ふつうの日本人ならまず目にすることもない自分らの 文書をふりかざして批判をおさえこもうとする。「日本の 文字はおれたちがすべて仕切るのだ」という傲慢まる出しである。

しかし、括弧付きで引用された発言は、いつ、どこで、だれが行った ものなのか、不明である。少なくとも、 規格票にそのような文言、そういう趣旨の記述 は見えない。ただ、規格票そのものは 指摘のとおり、 「ふつうの日本人なら目にすることもない」であろう。 JIS漢字の改正・拡張にあたるJCS委員のどなたかの発言であろうか。 もし、実際に、そのような発言があるのであれば、 指摘のとおり「傲慢まる出し」であり、JIS漢字の 改正と拡張に携わる委員としてふさわしくないと思う。 是非とも情報のソースを明記していただきたい。 】

4. 新JIS漢字拡張

(1)現代日本における使用例のある漢字の実証的研究

今回の新JIS漢字拡張策定に際して行った調査とその成果は、 国語学・言語学の研究として見た場合、空前の業績として評価 されるものである。少なくとも、今回程度の規模で、現代日本語の 漢字が、 どれだけの分野(広さ)で、どの程度の必要度(深さ)を 持って使用されているか、 従来、ほとんど研究されてこなかった。 こうした研究自体、極めて「文化」的な事業である。 今回の新JIS漢字拡張の作業は、関係諸機関の協力とボランティアとして参加した 各委員の努力とによって遂行されている。日本の漢字に関する研究に多大の成果を 挙げたものと自負している。

仮に10万以上の漢字がコード化されるとしても漢字使用の広さと深さに関する 情報は必要不可欠である。たとえ、JIS漢字が<死んでも>、今回の研究の成果は生き残ると確信する。

【池澤と坂村との対談から
池澤 たくさんあると検索が大変というけれど、 いつも使う字と、めったに使わない字を、非常に特殊な場合しか 使わない字をそれぞれ階層化した上での検索システムなんて、 いくらでもつくれる。
坂村 そうそうそう。
池澤の指摘は核心に触れていると思う。ただ、「階層化した 上での検索システム」が「いくらでもつくれる」のか、「なんて」 と呼ばれる程度に容易なものかというと大いに疑問である。 残念ながら、現在の国語学・言語学の研究水準では、そうしたシステム を構築するのに充分なデータをもっていない(実はほとんどもっていない)。 10万字以上の文字をコード化したコンピュータが使えるように なったとして、その 使い勝手は、階層化した検索システムの出来次第となるであろう。 】

このような実証的研究そのものを否定するのであれば、それは国語学や言語学という 学問のあり方そのものに誤りがあると主張するに等しい。

(2)情報公開の努力

この点に関しては、予算・人員の関係で不足のところがあるかもしれない。 しかし、どのような方でも意見を述べることが出来るようになっていることは 確かであり、事実、各分野の専門家から委員会の席上意見を頂戴している。 (GT明朝紹介のパンフレットに登場される、東京大学文学部の長島先生 をJCS委員会お招きしてお話をうかがったこともある。)

【「だれが漢字を決めるのか」について、池澤と坂村との対談から

池澤 今度は少し増やす。
坂村 ちょっと増やすとか言うんだけれど、それだって、結局数が 足りないから。
池澤 おれが決めるってやる。
坂村 そうそう。しかもおれが決める、仕切るわけです。でも、増やす基準はどういう基準ですかというとはっきりしていない。
池澤 成文化されていないんですよ、ルールが。
坂村 そうそう。
池澤 奥の院で何か決まっていく。
JISは、どの文字をどのコードポイントにどういうふうに割り当てるか に責任を負っている。そういう意味では「おれが決め」ざるを得ないわけである。 なぜなら、めいめいがかってにコード化したのでは、情報交換が出来ないからである。

「増やす基準」については、すでに「成文化」して公開済みである。 1996年7月22日に 「JIS 漢字の拡張計画7 ビット及び 8 ビットの 2 バイト情報交換用符号化 漢字集合――第 3 水準及び第 4 水準」(http://www.tiu.ac.jp/JCS/)

また、「奥の院」で決めることはなく、現在公開レビューを実施中である。 「7ビット及び8ビットの2バイト情報交換用符号化拡張漢 字集合(案)」の公開レビューのお知らせ(http://jcs.aa.tufs.ac.jp/pubrev/

ほとんど言いがかりとしか思えない発言である。

また、JCS委員会の席上でご意見を 拝聴したいとの私信を、ほら貝の主宰者に送ったこともあるが、 断られてしまった。 】

5. JIS漢字批判は生みの親に対する批判となること

最後に主張したいのは次の一点である。

現代の情報化社会の基盤としてJIS漢字規格が存在して来た事実 を認めよう。
親(JIS漢字規格)の悪口をいうなとは言わないが、 「文化」とともに批判的言辞を弄するなら、 それにふさわしい物言いがあると思うのである。


【 初稿では、このあと、次の一文を加えていた。

別な言い方をすれば、JIS漢字規格は、情報化社会の生みの親の一人であり、 いくらいやでも親を変えることは出来ないということである。

同じ趣旨のことの 繰り返しになるが、 どうしてあれほどまで「親」の悪口が言えるのか、 ほとんど信じられないというのが正直なところである。 】


【中沢けいの「どこかヘン 文字コード論争」。

自身のパソコン・ワープロ使用の経験を語る中で、 文字コード問題をわかりやすく解説しようとする。 社会基盤の一つとして文字コードを整備すべきという意見は 基本的に賛成である。ただ、現状の認識に関しては、 パソコンで扱える漢字は決定的に少ない、と理解している。 この現状認識についての私の考えは、すでに述べたので繰り返さない。

「論争」のあり方について言及されている点に興味を引かれた。

文字コード問題の議論の多くはパソコンを使ったフォーラムや ホームページで展開されていたのだが、 どういうのだか、いたずらにけんか腰の論調が目立った。揚げ足取りでは ないかと思われる議論や、やたらに些末な問題を持ち出して論理の中心を 外してしまったり、ともかく「ひどい」の一言につきるようなものがかなり 目立った。

ネットワークの議論がけんか腰になりやすいのは確かである。 文字コード問題だからけんか腰ということは無い。 ネットワークでは揚げ足取りも多いし、些末な問題を持ち出して議論を ずらすのもよく見られることである。こういうネットワークでの議論を そのまま是認したいとは思わない。文字コードは「熱く」なりやすい 問題だが、文字コード問題だから「ひどい」というのではなく、 ネットワークでの議論自体に「ひどい」ものがあるというのに過ぎない。

こう書くと、それこそ些末な揚げ足を取っていると言われそうだが、 ネットワークでは相手が見えないだけに、どこまで共通に了解しているのか 、その確認に手間取るのである。そうしたやりとりを外から見ると、 「ひどい」議論と映るものが多いのに過ぎない。

問題はむしろ、文芸家の方がネットワークでの議論に積極的に関わって いないことである。議論をずらすようで恐縮だが、 もし、詳しいことは ほら貝にお任せで済ますということであるのなら、それはあまりに無責任である。

揚げ足取りと言われるだろうが、もう一点。

今昔文字鏡九万字、GT明朝六万八千字、さらには 京都大学で研究されているという京大e漢字など、 コンピュータのための大きな文字セットが今年から 来年にかけて登場する。

今昔文字鏡は昨年購入した。今年登場ということはない。(今、手元にないので 正確な日付はわからないが、1997年夏刊行の雑誌に広告があるから、 それ以前の発売である。) 字数は単漢字八万字。九万字ではない。 そのバージョンアップが年末に公開の予定。 《11月18日追記。 今昔文字鏡のページ(http://www.mojikoyo.gr.jp)には、 近刊の最新版の情報が掲示されているが、そこに 「収録文字数は、驚きの9万字」と見える。上述の記事は、 バージョンアップ版を指すもののようだ。 (でびさんのご指摘に感謝。) しかし、去年出てることに言及しないのは、フェアーじゃない ように思う。 》

京都大学のe漢字は今年のはじめころに一般公開済み。ただ、その土台となる 研究の成果はもうだいぶ前に公開されている。 (1994年5月に「漢字典」として刊行。) これは池田証寿「 「漢字典(All Kanji Catalog)」の思想」を参照されたい。

GT明朝は、六万四千字。六万八千字ではない。上記の著者は、 東大で行われた 「六万四千字」発表会の講師のはずだから、単なる誤植だろう。 それはともかく、GT明朝の全体はまだ公開されていない。年末から 来年にかけて公開されるものと思う。

また、今昔文字鏡と京大e漢字は、JIS漢字の不足するところを 補おうとする立場で作成・公開されており、実際、JIS漢字の足りない 部分を相当に補っている。

これに対して、GT明朝は、最終的には、TRONコードとして実装され、 JIS漢字を置き換えようとするプロジェクトである。この点は 明確に区別されなければならない。ついでに言っておけば、 GT明朝では、明朝体のデザインを一部修正される由であるが、 明朝体の誇張したデザインの修正は、すでに今昔文字鏡で実現して いるものである。

「どこかヘン 文字コード論争」とのことだが、 JIS以外のプロジェクトに関してこの程度の事実認識であると、 「どこかヘン」と疑問を発する主体に対して、 事実認識が「ヘン」ではないかという疑問を抱かざる得ない。 揚げ足を取るつもりは毛頭ないが、事実は正確に記してほしい ものである。】


【《追記》 ふと次のようなことを思いついた。 もしかしたらであるが、文芸家の方は、今昔文字鏡、京大e漢字、 そしてGT明朝/TRONをJISに変わりうる 同様なシステムと見なしているのではないだろうか。 つまり、三者をJISに変わりうるという点で同様なものと考えて、 JIS漢字の代替品が提供されているという視点から、安んじて JIS漢字を批判しているのではないかという疑問が生じてくる。 こうした基本的な点について共通の了解があるかどうかも心配になるのだが、 受け取り方によっては「揚げ足取り」 「言いがかり」「当てこすり」「ひどい議論」 と言われてしまうかもしれない。他意はないことを念のため記しておく。 】


【「誌上実験 四つの「五重塔」」。これは実に面白い。

(1)原テキスト=「尾花集」所収(明治25年10月、嵩山堂出版刊)
(2)JIS漢字内の「五重塔」幸田露〓
(3)ゲタ文字をJIS漢字内新字体等で代用した「五重塔」幸田露伴
(4)GT明朝で補足した「五重塔」幸田露伴

(1)の原テキストは組み直したもののようで、出来れば原典をそのまま コピーして挙げてほしかったが、すこし無理な要求かもしれない。

(2)JIS漢字内の「五重塔」幸田露〓では、JISに無い字は26字。 その多くはいわゆる「旧字体」である。露伴の「伴」の旧字体はJIS に無いというわけである。現行のJIS漢字規格では、 字体の違いが僅かな旧字体は、新字体に包摂されている。 したがって、「伴」「起」「程」「強」等に対応する旧字体 を「伴」「起」「程」「強」等と同一のコードポイントで表示・ 印刷しても規格に合致する。そういうやりかたはけしからんとの主張は 分かるが、78JIS以来の設計意図はそのようになっている。 (旧字体に関しては、その範囲を明確にすることが難しいという問題があるが、 ここでは触れない。)

そして、字体の違いが僅かな旧字体を新字体で代用したのが(3)である。

(3)ゲタ文字をJIS漢字内新字体等で代用した「五重塔」幸田露伴 では、代用したとしても3字が〓になるという。しかし、 この内の1字はJIS内字の「睥」の異体字であり、これで代用して差し支えない。 残り2字は、現行JIS漢字にないが、現在公開レビュー 中の 新JIS漢字拡張の 資料(http://jcs.aa.tufs.ac.jp/pubrev/NJ-klstb.pdf)に見えている。 したがって、現行JIS漢字とその拡張が全然使いものにならない という主張を裏付ける証拠としては充分ではない。

(4)GT明朝で補足した「五重塔」幸田露伴は、むろん〓はゼロである。 旧字体も表現出来ている。そういう意味では、GT明朝の優位性の 証明になっていると言える。

(《追記》 「優位性」云々は皮肉である。 現行JIS漢字+拡張新JIS漢字と、実は大差ないことを、 (3)の例が証明している。旧字体の表現はコードとして扱わずとも 可能なものである。)

しかし、GT明朝の優位性を完全に主張するには、このデータを パソコン上で容易に見えるようにする必要があろう。

池澤と坂村との対談の「原テキストで読めない文学作品」で 坂村は、

ところで、幸田露伴の『五重塔』のテキストを、 さっきお話ししたGT明朝でつくった、文芸家プロセッサーで今、 ご覧にいれましょう。(資料編=122ページ=参考)
拡大鏡で小さい字を見てもらうとわかるんですが、コモとか、コモる、 カノヨウニとか、山のように出てくるんですね。
こういう字、今は使わないかもしれないけれども、原文で こういう字が使われていたんだから、コンピュータ側で用意 することが、僕は筋じゃないかと思いますよ。(略)

「拡大鏡で小さい字を見てもらうとわかるんですが」と言っているが、 拡大鏡を使わなければわからないような違いにこだわるのは、 いくつかの問題点を含んでいる。 第一に、現在のコンピュータの性能をもってすれば数万の漢字を扱うことは 簡単なことだと主張するが、現実には、それを表示するだけのディスプレイが 開発されていないという点。 第二に、拡大鏡を使わなければわからないような違いを区別するようでは、 視力に障碍のある方に対する差別につながるという点。(後者の問題点は、 當山日出夫の指摘による。)

現在、 コンピュータの性能が飛躍的に向上していることを、無条件に受け入れているが、 それは誤りであると思う。活字で容易に 区別出来る程度の差を、パソコンのディスプレイで 区別出来るようにはなっていない。 仮に出来たとしても、 目が疲れるばっかりで、使い物になるかどうか、はなはだ疑問である。】

【11月20日追記。次の文章も参照されたい。 「五重塔」の《原テキスト》


【池澤、坂村の対談の最後で、池澤が

ただ、全体を見ていて、坂村さんたちの動きとはまた別に、 何か動いてきたなという気がするのは、 例えば、インターネットのテキストを縦書きにできる ソフトがある。

と述べ、こうした試みを評価している。 このソフトは、 たぶんボイジャーが開発した 「T-Time」のことだと思う。その使い方は、 富田倫生「インターネット快適読書術」(ひつじ書房、1998年10月、 5500円)に詳しい。 富田は青空文庫を主宰し、著作権の切れた作品を電子化して 広く社会に公開している。文字コードにも発言があり、 次の文章など、広く読んでいただきたいものである。

●「ワイアード、『電脳売文党宣言』、「すべての文字にコードを割り当てよう」の トホホ」
ニフティサーブのアプリケーション日本語環境フォーラム(FJAMEA)で発表。のち インターネットでも公開。URLは失念。
「正しい字とは何か」
青空文庫の「そらもよう」の欄に掲載された文章。

インターネットのテキストを縦書きにすることや、 電子化テキストの公開を実践している人物が、 文字コードについて、どのように考えているかを知ることが出来るだろう。 】


(関連の文章) 「五重塔」の《原テキスト》
[→このページの最初] [→雑文] [→JIS漢字] [→古辞書] [→ホームページ]
(C) Ikeda Shoju 1998 池田 証寿(いけだ しょうじゅ)
E-mail shikeda@Lit.Let.hokudai.ac.jp/KGH01365@nifty.ne.jp