ワープロ弱者と多漢字環境


池田 証寿(北海道大学文学部)/ shikeda@Lit.Let.hokudai.ac.jp

目次
1 ワープロ弱者とは
2 文字コードはマイナーな問題である
3 JIS漢字の不思議
4 どうやって足りない漢字を知るのか
5 不足する漢字の具体例---国書の漢字
6 電子テキストの文献学的研究
7 多漢字環境の世界へ

1 ワープロ弱者とは

最近ではワード・プロセッサー(ワープロ)やパーソナル・コンピュータ (パソコン)などの情報機器を利用して文書を作成することが ごく当たり前のこととなり、 ワープロで「表現できること」と 「表現できないこと」との差異についてかなり 意識的・自覚的になってきた。しかし、ワープロで 「表現できること」と「表現できないこと」との差異には さまざまなレベルがあって、 これを「表現」の問題として包括的・全体的に論じるのは なかなかやっかいである。 ここではワープロで「表現できない」ことに意識的・ 自覚的なユーザを〈ワープロ弱者〉と呼び、 その置かれた環境と問題点 をできる限り冷静に素描してみようと思う。

たとえば、操作法に不慣れな ために、本来は「表現できること」のはずなのだが 「表現できないこと」の段階で終わってしまうことを しばしば経験する。 漢字に振り仮名を付けるとか、小字で二行割注にするとかなど、 手書きであれば造作もないことなのに、ワープロでは面倒な手順を とらなければならない。振り仮名や小字二行割注など、最初から あきらめてしまうことも多い。 電子メールは今や携帯電話でも使用できる時代となったが、 文字化けした電子メールをパソコン等で受け取ることは 日常茶飯の事に属する。こうした、操作法に関する問題は純粋に 技術的な問題として説明されることが多いが、専門用語を ちりばめた説明には、何か釈然としない、消化不良の感覚が残る。 しかもこれを「表現」の問題として 意識的に取り上げようとしても、操作法に習熟していないだけだとの 批判(というか冷たい視線)を克服してまで取り上げる には至らないし、操作法に習熟すればそうした問題はあまり意識 にのぼらなくなってしまう。 だいたい、 操作法に関することがらを「表現」の問題として 述べるためには、実際のモニターの画面を ワープロの文書の中に読み込んだりすることが必要なわけで、 そのレベルに達していない者としてはそもそも問題を 表現しようがないのだ。

また別のレベルでは、求める文字がワープロやパソコンに 登載されていないため「表現できない」事態に陥ってしまったり、 登載されてはいるのだが探せないために「表現できない」事態に 陥ることも少なくない。 前者の、 登載されていないため「表現できない」事態に関しては、後ほど 詳しく述べるとして、 後者の、登載されてはいるのだが探せないというケースも案外多い。 最近見かけた例では、中国の地名「陝西省」の「陝」をわざわざ外字で 入れている例があった。この「陝」は類似した字形の「陜」を 誤って入力されるケースもままみうけられる。 こうした点はワープロやパソコンに登載された漢字の 検索システムを上手に利用すれば解決することであるが、 操作法に習熟するには一定の時間が必要であるし、 なにより情報機器に使われるという、いささか不愉快な経験を 経なければならない。さすが、この不愉快な経験を ストレートに表現することはあまりないが、陰微に蓄積していく。

かくして、常用漢字から僻字までを自在に操ってきた〈文の鉄人〉は、 ワープロという情報機器によって、あっという間に弱者の地位に 転落してしまった。

もっとも、こうした物言いには、 ワープロは所詮道具に過ぎない、という反論が用意されているし、 一定の説得力を持つ。しかしである。こうした発想には、「人文学」の研究 が情報処理の「科学」や「技術」よりも上位にあるのだという、未証明の前提に 依拠する特権的な姿勢がほの見えるし、なによりもワープロなど の情報機器が表現のメディアとして持つ問題性を隠蔽するという結果に陥っている。 すなわち、〈ワープロ弱者〉の意識があまりに希薄、というのが本稿で最終的 に問題提起したいことなのだ。

前置きが長くなった。本稿で具体的に取り上げたいのは、求める文字が情 報機器に登載されていないために「表現できない」事態である。 これは一般には文字コードの問題として論じられる。 情報機器での文字処理は、 一般に用いられている文字をコード化(符号化)することによって 実現している。したがって、 現在の情報機器で「表現できない」文字を「表現できる」ように するためには、文字の割り当てを拡張すればよいだけの話で ある。だが、これはなかなか簡単に行かない。それはなぜか。

2 文字コードはマイナーな問題である

現在、パソコンやワープロなどの情報機器で扱うことが可能な 文字は、 日本工業規格(JIS)によって規格化されている。 JISの第一・第二水準がそれで、六千数百字の漢字・記号類が 規定されており、正式名称は「JIS X 0208:1997 7ビット及び 8ビットの2バイト情報交換用符号化漢字集合」(注1)という。 この規格に定められた漢字は一般に「JIS漢字」と呼ばれている。

長年に渡ってJIS漢字の問題を論じてきた當山日出夫は、 「近年、このJIS漢字が非常な勢いで社会的関心の的と なっている」との現状認識を示している(注2)。 これは「JIS漢字が国語審議会のテーマともなり、 一般の新聞や雑誌に関係する 記事が多く掲載され、また専門にとりあげた書物も 多く刊行されるようになっている」ことを承けてのことであり、 この方面に関心を持つ者としては同感したいところであるが、 一般の関心という点でいうなら、残念ながらJIS漢字は 小さな問題と言わざるを得ない。 その理由は三つの観点から説明できる。

第一は、使用可能な字数である。 「常用漢字」(一九八一年)は一九四五字 であるのに対して、JIS漢字は六千字以上を収めている。 特定の用途に不足することがあるとしても、一般の 漢字使用に関しては充分すぎる字数である。

第二は、情報処理技術の観点である。文字コードは、共通化・標準化した ものを用いるのが前提であり、文字コードそのものは 技術者の興味をそそるようなテーマにはなりにくい。 いろいろな種類の文字コード規格が乱立する事態は望ましくない とすら言える。標準化された文字規格を用いて作成した電子テキストを どのように処理するかに関心はあっても、文字そのものはあまりに単純で 関心を呼ばない。

第三は、コンピュータの市場の大きさである。 パーソナル・コンピュータの販売台数は、 平成十一年度、一千万台の大台を超える見込みであり、この台数は カラーテレビを追い抜く勢いだという (毎日新聞、一九九九年十一月十日)。 文字コードを拡張しなくても 充分に「儲かっている」のである。

縦書き表示可能な読書専用ソフト『T-Time』を開発した ボイジャー・ジャパン社代表取締役の萩野正昭の次の発言は、 電子テキストそのものについての関心の低さをうまく表現している。

「コンピュータ産業は当面、モニターで文字を読もうとする人たちを 相手にしていないんですよ」という萩野に、「なぜ?」ときくと、 「儲からないから」という明快な答えがもどってきた。

「世界中のウェブサイトに、すぐれた研究や評論、歴史資料、文学作品 などが大量にアップロードされていますけど、そのほとんどが実は テキストデータなんです。つまり長い時間をかけて出版文化が築いて きた資産を、デジタル時代に、新しいやり方で展開したものなんです。 それくらい活字文化はすごい力をもっている。でも、その〈すごい力〉 はコンピュータ産業にとってはあまり魅力的じゃないんです。 あまりにも単純すぎて、新機能をつぎつぎに付加して儲ける かれらの手法に合わないんですよ」(注3)

では、當山をして「近年、このJIS 漢字が非常な勢いで社会的関心の的と なっている」と言わしめたのはどのような理由によるのか。 また、文字コードの問題は、電子的なネットワークの会議室などにおいて 相当に過激に議論されることが多いのだが、それはどうしてであろうか。

第一には、過去の活字テキストの遺産を完全にコンピュータに 移行しきれていないという点である。萩野がいうように 「活字文化はすごい力をもっている」のだが、それだけに取りこぼしを なんとかしなければならないという危機感が強い。 この危機感が、「多漢字環境」への熱望となって語られる。

第二には、多言語処理への期待である。多言語処理 は情報処理の研究者・技術者にとって 未開拓であり、かつ有意義なテーマである。 情報通信環境の基盤整備は緊急性の高い問題であり、 多言語処理の一部として「多漢字」処理が論じられる。

第三には、コンピュータの市場の大きさである。 現在とは違う文字コード規格が標準化されれば、それによって 莫大な利益が生み出されるであろうこと、経済やコンピュータ産業の 素人であっても容易に想像できよう。 たとえば、現在のJISの文字規格(JIS X 0208の第一・第二水準)には、 ハートマークがコード化されていない。ハートマークが情報機器で 使えるということは、パソコンや携帯電話の電子メールで使える ということであって、ハートマーク(に象徴される大衆性を 獲得した記号類)を実装できる文字コード規格が 標準化されれば、これが爆発的に利用されること、 ほとんど間違いないだろう(注4)

かくして、コンピュータにおける文字処理に関して 新たな提案がさまざまになされるのである。実際、 それを現実に使用できる環境も、 徐々にではあるが、整ってきている。 とはいうものの、活字文化の継承に対する熱望と コンピュータ産業の思惑とが複雑に絡み合う。 標準化への道はなかなかに厳しいと 言わなければならない。

3 JIS漢字の不思議

現行のJIS漢字(第一・第二水準) に不備があるのは事実であって、 これを批判するのはある意味でたやすい。 また、冒頭で述べたように、情報機器の扱いにくさや 操作法を修得するまでの、あまり愉快でない経験などは、 JIS漢字に対する批判を増幅させている面がある。 実際、JIS漢字批判をするのにも、JIS漢字を実装した パソコンやワープロを使わねばならず、そうした不快感を 完全に捨て去って冷静に批判を展開するのは難しい。

あまり知られていないが、従来のJIS漢字を徹底的に批判した書は、 最新のJIS漢字規格そのもの(JIS X 0208:1997)である。 批判の要点を述べる前に、 JIS漢字の規格の変遷を振り返っておこう。

JIS漢字は、一九七八年の第一次規格、一九八三年の第二次規格、 一九九〇年の第三次規格を経て、一九九七年の第四次規格に至っている。 特に一九八三年の第二次規格において、「」 を「鴎」に変更するなど、大幅な字体の変更があった。 現在、国語審議会の課題となっている表外字字体の 問題の直接の原因は、一九八三年の「改訂」である。 一九九〇年の改訂は、補助漢字(JIS X 0212)の策定に連動する ものであったが、 「」などを第一・第二水準に 追加するのではなく、補助漢字の方に割り当てたため、 字体の問題は先送りされることになってしまった。 「鴎」などの表外字の漢字字体の問題は、一九八三年の改訂 ばかりが悪者扱いにされるが、一九九〇年の段階で適切な 対応をとれなかったことを忘れてはならない。

ところで、一九七八年の第一次規格では林大(はやしおおき) (当時、国立国語研究所)、 一九八三年の第二次規格では野村雅昭(当時、国立国語研究所)という 二人の国語学者が規格の策定・改訂に関与している。 一九九〇年の第三次規格では国文学者の 田嶋一夫(当時、国文学研究資料館)が委員長を務めた。 JIS漢字は理系の人間が決めたという「神話」がまことしやかに 語られることがあるが、それは事実ではない。 国語学者・国文学者はJIS漢字の策定にかなり深いところで関与 していたのであって、このことはしっかりと記憶しておくべきことである。

一方、一九九七年の改訂 では、文字の追加・変更を 一切行わず、規格そのものの明確化をはかるという、 一見地味な作業が行われた。 その作業を担当したのは、芝野耕司(現在、東京外国語大学 アジア・アフリカ言語文化研究所)を委員長とする 符号化文字集合調査研究委員会である。 漢字に限って「明確化」の内容を説明すれば、次のようになる。

第一は、JISが符号化している漢字字体の 「ゆれ」の範囲を明確にしたことである。 従来の規格の解説には、たとえば草冠の三画と四画との違いや 一点しんにょうと二点しんにょうとの違いは 字形の僅かな違いとし同じコードポイントを割り当てることが 記されていたが、網羅的ではないため「ゆれ」の範囲が不明確であった。 これを一九七八年の第一次規格制定時の資料、第二次規格以降の 規格票の字体の変遷、各ベンダーの実装例、漢和辞典の記述などに 基づいて、一九七八年の第一次規格が当初意図した「ゆれ」の範囲を 明確にしていったものである。 その規準を最新のJISでは「包摂規準」として明文化した。 そうしたプロセスを通して一九八三年の第二次規格が行った 「」から「鴎」などへの変更は、 当初のJIS漢字が意図したゆれの範囲を逸脱するものであったことを 実証し、「過去の規格との互換性を維持 するための包摂規準」を別に設定したのである。 すなわち、一九八三年の第二次規格が行った 「」から「鴎」などへの変更は誤りであった ことを規格そのものが述べるものとなっているのである。 こうした措置について、国語審議会委員を務める小林一仁は 「具体的に言えば、パソコンをワープロとして 使用し、現代の日本語を漢字仮名交じり文で表す 場合に、ユーザーとしては「森 外」と表したいのに「森外」 としか表し出せない。しかし、略字体「鴎」はいわゆる 康煕字典体「」を包摂しているのだから、 さよう心得よ、というものである」(注5) と述べているが、 これは誤った認識と言わねばならない。 互換性を維持するための包摂規準を設定したのは、 近い将来、第三・第四水準の策定によって 「」と「鴎」とを別コード ポイントに割り当てるための布石なのであって、この点を押さえずに 論点をすり替えて議論がなされるのは、 一九九七年の第四次規格の改訂作業に参画した 筆者としては残念というほかない。

ついでに言えば、「鴎」などの文字はJIS漢字が作り出した 文字であるかのように言われるがこれは誤りである。 たとえば「電子化した文字コードのなかには、現代に至って はじめて作り出された新しい字体があるからである」(注6) という具合である。これはかなり慎重な言い回し をしているが、普通に読めば、 JISが新しい字体を作ったと言っているものであろう。 しかし、「鴎」などの略字はJIS以前に朝日新聞が用いていた、 いわゆる「朝日文字」である(注7)。規範的とされる 国語辞典においても、たとえば『広辞苑第一版』 (岩波書店、一九五五年)の「本辞典使用の字体について」 に、「鴎」はないものの、「掴」「屡」「醗」などが掲げられており、 JIS漢字だけが批判されるいわれはないのである。

第二は、JISの漢字表のみにあって一般の漢和辞典に見えない、 いわゆる「幽霊字」の典拠を明確にしたことである。 特に衝撃的だったのは「妛」という字であって、これは 滋賀県の地名「原(あけんばら)」に用いる 「」を作字しようとして、「山」と「女」とを 切り貼りした際に、糊付けの影が映り筆画の一部と誤認され、 それに気付かぬままJIS漢字に採用されたものである。 これは笹原宏之の調査によって判明した(注8)。 そもそも、こうした事態が発生したのは、一九七八年の第一次規格において 典拠の確認が充分でなかったからであるが、 それをそのままに放置した第二次規格、第三次規格にも責任の一端がある。

以上に述べた二点の明確化に限っても、 従来のJIS漢字に対する最も徹底的で実証的な批判であることが 理解できるであろう。 しかし、一般には、こうした実質的な批判はほとんど知られず、 官僚批判という時流のなかで、感情的な批判や怨嗟が炸裂し、 JIS漢字の「鴎」などが徹底的にこき下ろされる。

4 どうやって足りない漢字を知るのか

特に過去の 日本語文献をコンピュータで扱おうとした時に、求める文字が 情報機器に登載されていないために 「表現できない」事態に陥ることは多い。難字・ 僻字を扱う機会の多いユーザほど〈ワープロ弱者〉に 陥りやすいという事態が生じている。 ではどれぐらいの文字(漢字)が不足しているのであろうか。

それを述べる前に、JIS漢字の原典資料に言及しておきたい。 情報機器で漢字を扱おうとした時、JIS漢字を否応なしに 使わざるを得ない以上、JIS漢字がどのような漢字を中心に 採録しているかを見ることは無駄ではないからである。

JIS漢字の第一次規格(一九七八年) が典拠としたのは次の四つの漢字表である。

  1. 「標準コード用漢字表(試案)」…六〇八六字
  2. 「行政管理庁基本漢字」…二八一七字
  3. 「国土行政区画総覧使用漢字」(地名)…三二五一字
  4. 「日本生命収容人名漢字表」(人名)…三〇四四字

最初に挙げた「標準コード用漢字表(試案)」(一九七一年)は 情報処理学会が作成したもので、取りまとめは実質 、林大が一人で行っている。この漢字表をさらに遡ると 日下部重太郎が一九三三年に作成した漢字表にまで たどり着く(注9)。 「行政管理庁基本漢字」(一九七五年) は基本的な漢字が中心であり、 「標準コード用漢字表(試案)」にほとんど含まれている。

「国土行政区画総覧使用漢字」(一九七四年) は地名の資料である。 地名の漢字を重視したのは、JIS漢字の功績として高く評価すべき であろう(注10)

「日本生命収容人名漢字表」(一九七四年)は 人名の資料である。その当時としては 最善の努力を払ったものであるが、現時点ではかなり不足していること が判明している。また、人名の字体は、個人のアイデンティティにも 関わり問題が複雑になっている。

さて、文学・語学・歴史関係の漢字表がどの程度参照されたのが 気になるところであるが、端的に言って一九七八年の段階で 参考するに足る調査はなされていない。

そもそも漢字頻度調査は、漢字の字体の扱い方によって その調査結果がどのようにでも変わる。 たとえば「万」と「萬」、「寿」と「壽」、「学」と 「學」などの異体字のペアをまとめて同じ漢字と見て数値を出すか、 別の漢字と見て数値を出すかによって頻度は大きく変わってくる。 異体字をどのように扱うかは研究や翻刻の目的により異なるが、 『校本万葉集』に付された「校異を出さざる異体字表」 のようなものを欠く漢字頻度調査は、利用 価値が低いといわざるを得ない。

今回のJIS漢字が提示した「包摂規準」は、一般に用いられている 漢字の字体とJISの規定する符号位置との対応の規準を示したものである。 過去の文献資料の翻刻という観点からこれを 図式化すれば、次のようになる。 (2)が「一般に用いられている漢字の字体」のレベルである。

(1)写本・版本の字体 → (2)明朝体による翻刻本文の字体 → (3)JIS漢字によるコード化

(1)から(2)への解釈はユーザの裁量の範囲である。 (2)から(3)への過程についてJISの「包摂規準」によって コード化できるかどうか(表現できるかどうか)を判断すると いうものである。 この「包摂規準」の「精度の粗さ」に対しては、せめて一般の 漢和辞典で区別しているくらいの違いは区別して欲しいという 批判がある。これは理想の文字コード論の一つ として傾聴すべきものであるが、ここで重要なのは 現行のJIS漢字はこの程度の「精度」によって設計されている という事実認識である。 これを出発点にしない議論は理想論のぶつけ合いとなって、 現実的な解決から遠のくばかりである。

5 不足する漢字の具体例---国書の漢字

諸橋轍次著『大漢和辞典』(大修館書店)には約五万字が 登載されており、これをコード化すればコンピュータにおける 漢字問題は一気に解決するはずだ、という素朴な認識がある。 かくいう筆者もそのような認識をしていた時期があったが、 実際に作業をしてみると、それほど簡単でないことが分かってきた。 どういうプロセスを経て、そう考えるようになったかを述べるよりも、 具体例を挙げた方が早いだろう。ここでは、 最近調査した『補訂版国書総目録』(岩波書店)の JIS外字の結果を述べてみよう(注11)

『補訂版国書総目録』の「書名」から、 JIS漢字の「包摂規準」に従ってJIS漢字で表現できない 漢字を抽出すると、 一一七〇字となった。この一一七〇字の内、諸橋『大漢和辞典』 に見えるのは九二六字、見えないのは二四四字という結果であった。 こうした結果になったのは、そもそも『大漢和辞典』の 採録字種の範囲に偏りがあるからである。『大漢和辞典』の親文字の 中心資料は『康煕字典』である。漢籍は網羅するものの、 仏書に用いられる漢字や国字の類は用例の採取が充分ではない。 不充分な点については諸橋自身にも自覚があり 「第一音韻の研究が不十分だし、俗語の研究が 不十分だし、仏教語や日本の漢文学の材料が不十分だし、 そのほかたくさん欠点はあります」(注12) と述べている。

ちなみに、JIS漢字第一・第二水準(JIS X 0208)以外の 規格と照合してそのカバー率を調べた結果は表1のとおりである。

表1 各種規格のカバー率
規格 字数 カバー率
UCS 820 70.1%
JIS X 0212 694 59.3%
JIS X 0213 738 63.1%

UCS(ユニコード、ISO 10646-1、JIS X 0221)の基本多言語面の 漢字は約二万字、 補助漢字(JIS X 0212)の漢字は五八〇一字である。 二〇〇〇年一月制定の 第三・第四水準(JIS X 0213)の漢字は三六八五字である。

次の表2は、 諸橋『大漢和辞典』に掲載のない漢字(二六〇字)が 各種の文字規格にどれだけ採用されているかを調べた ものである。採用されることが歴然と少ないことが知られる。

表2 大漢和非掲載字と各種規格との対応
規格 字数
UCS 3
JIS X 0212 2
JIS X 0213 27

ここで『大漢和辞典』に見えない漢字が 「今昔文字鏡 単漢字8万字TTF版 Version 2.1」 (開発・製作:エーアイネット、 編集:文字鏡研究会)にどの程度採用されているかを調べてみよう 「今昔文字鏡」は「古今東西の漢字を、かつてない規模で収集した」 コンピュータ用の漢字処理ツールである。 そのユーザは仏教学や中国学を中心とする人文学の研究者であり、たとえば大正新脩大蔵経など、古典テキストの電子化に不可欠な漢字の登録が進められている。ただ、これを電子的な情報交換に用いるためにはいささか制限がある。 JIS漢字の第一・第二水準の漢字であれば、ほぼ無条件に電子的な情報交換が保証されているが、「今昔文字鏡」の場合には、電子的な情報交換を行おうとする 送信者と受信者との双方が「今昔文字鏡」を利用出来る環境をあらかじめ用意しておく必要がある。これはかなり大きな相違点である。つまり、「今昔文字鏡」は JISのような「規格」ではなく、漢字データベースと一定水準の品位を 備えた書体(フォント)とを統合した漢字処理ツールであって、無条件に情報交換が 保証されていないということなのである。

さて、『大漢和辞典』に見えない 『補訂版国書総目録』の漢字は、二四四字存するが、 「今昔文字鏡」で表現できるのは約三〇パーセントに当たる 七二字である。残りの一七二字は「今昔文字鏡」に 登録されていない。

「今昔文字鏡」に登録されている例を『補訂版国書総目録』第一巻から 若干掲げてみる。

  1. 伊豆日記 (あいおいいずにつき)…第一巻三頁、文字鏡番号65408「」。
  2. 足毛(あしげのこまごと)…五二頁、文字鏡番号65748「」。
  3. ノ箱崎(あとめろんけいずのはこざき)…七七頁、文字鏡番号65442「」、65215「」。
  4. 生木偶皐月花 (いきにんぎょうさつきのはなだし) …一五三頁、文字鏡番号65781「」。
  5. 艶菊月 (いたずらがみいろのきくづき) …二二六頁、文字鏡番号66148「」。

次は、「今昔文字鏡」に登録されていない例である。 同じく第一巻から掲げる。

  1. 中増弓勢贔負(あたりますゆみのひきかた) …七一頁。
  2. 阿麼(あまだい) …八五頁。
  3. 脚頭挿耶須(あゆいかざしめやす) …一〇一頁。
  4. 芳昔物語(いそのかみふるきよばなし) …二二三頁。
  5. 一当軍記 (いちのあたりふたばぐんき) …二三八頁。

人文科学分野のコンピュータ利用において 「学術情報交換用漢字に関わる基盤整備が不可欠」 (注13)との認識はほぼ 共通のものといえる段階に達しているが、 右に示した「今昔文字鏡」での登録状況を見ると、「国書」に関しては 仏教学や中国学の分野に比して少々立ち後れていると言わざるを得ない。

6 電子テキストの文献学的研究

これだけ情報機器が普及してくると、 通常の印刷された活字テキストの背後にある 電子テキスト(e-text)をどのように 考えるべきかということが問題になってくる。 従来の文献学的研究では、手書きテキストや木版テキストを 解読し、その解読結果を最終的には活字テキストとして 提示するという手法をとっていた。 これに電子テキストが一枚加わるとどうなるか。 電子テキストの元になる手書き・木版・活字のテキストが 存在する場合は、活字テキストと同様にその元の資料と 照合し、その質を吟味することになる。電子テキストは 検索には便利であり、従来のタイプの索引を不要と感じさせて くれる面もあるが、校訂が不充分な電子テキストも多く、 質の吟味の必要性はより強まっている。 OCRを使うため、 「工」と「エ」、「二」と「ニ」など、 漢字と片仮名とを混同して入力したり、 「ヘ」と「へ」、「リ」と「り」 など、片仮名と平仮名とを混同して入力し たりすることもあり、活字テキストとは違った配慮が不可欠である。

もう一つ問題となるのは、 「」から「鴎」へなど、一九八三年の第二次規格 でなされた非互換的な字体の変更である。 基本的には、とりあえず依拠したのが第何次の規格であるかを 明示しておき、将来「」と「鴎」とを 区別する文字コード規格が普及した段階で、適切なものに 修正するという対応であろう。 これは問題の所在がはっきりしている ので、対策はたてやすい。

むしろ、問題になるのは、「」から「鴎」などへの 変更を意図的に表現に取り込んだと解釈される場合である。 次にそうした例を筒井康隆『敵』(新潮社、一九九八年)から 挙げてみよう。

『敵』の主人公は、「西洋演劇史」を専門とする 元大学教授渡辺儀助、七十五歳。「朝食」の章から始まり、 「友人」「物置」「講演」と続き、「舞台」「幻聴」「春雨」と締めくくられる。 四十三の章から構成される。書名の『敵』が何か、謎として読者に与えられるが、 全四十三章の中程、二十三番に「敵」の章がある。この章は

パソコン通信には一日一度必ずアクセスするが儀助には 最近妙に気になることがある。 例の「恋人募集」騒ぎはまだ続いているが普段あまり顔を出さない「きくらげ」という ハンドルの人物がおかしな書込みをしているのだ。 (一六一頁)

という書き出しから始まる。儀助は、 電子的なネットワークに強い関心を抱く人物として 造形されている。と同時に、 「きくらげ」という人物の「敵です」 というメッセージから「敵」の謎が読者に仄めかされて行く。

さて、『敵』に登場する「森外」 は、筆者の見落としがなければ、 次の一箇所だけである。

古いモノクロの邦画では前進座の映画を好んでいる。 トーキー初期の作品なのでいずれ も音響が酷いが中でも「阿部一族」などというもの は音声が殆ど聞き取れない。どちら かといえば科白の 芝居だし何度か見直してやっと 理解ができるようになったものの外 の原作を知らなければ誰にも珍紛漢紛だろう。 (「映画」、二四七〜二四八頁)

新潮社版の『敵』では、「鳥」の左側はむろん「區」だが、 電子テキストでは普通、 左側が「区」で表示のはずである。

この文脈、「前進座」の映画が声の聞き取りづらさも手伝って、 「前進」なる名とは逆に遠い存在として感じる場面である。 森外「阿部一族」とのつながりをよりどころに、 かろうじてその映像・音声の受容が許されるという状況である。 しかしデジタル化された電子テキストの世界ではその 唯一のよりどころである「外」も、 非互換的な変更により時の彼方へ追いやられてしまう。

そもそも「阿部一族」は、江戸時代の武士社会における 殉死を主題とする作品であるが、 この主題は現代における関心事とはおよそ 無縁なものとなり果てている。

「森外」の「」が情報機器で 表示出来ない点は、本稿で規定する〈ワープロ弱者〉からの集中砲火を浴びる。 「森鴎外」という略字の表記は、実は、情報化社会の現代日本に 殉死させられた文学及び文学者の象徴として機能しているのだ。

しかし、一般になされる 「鴎」という略字に対する集中砲火的な批判は、次のような意識を隠蔽している。 森外の「」がよく知られた例である、有名な人物の名前である、そういう把握の仕方の背後にあって、意識化されない「文学者」の優位性、特権性。誰でも知っている例として森外を持ち出した時点で、「文学者」の優位性、特権性を暗黙の前提としてしまう、そういう構図が実は存在しているのだ。 こうした暗黙の前提をどれほどの人びとが嗅ぎ取っているかは定かでないが、 少なくとも右に引用した部分には、そうした特権性を嗅ぎ取りながら、 慎重に表現を選択している姿勢が読み取れるのである。

右に述べたように、デジタル化された、 『敵』というテキストの「外」は、 そうした重層性を巧みに表現している、というふうに読めてしまう。 「珍紛漢紛」という当て字も相当に効果的であって、 珍なる漢字により紛らわしくなった 「外」が読みとれて しまう仕掛けなのだ、という解釈を可能にしてしまう。

筒井康隆がパソコンなどの情報機器に通じている作家 であることは、筆者も心得ているが、右に述べたのは せいぜいその程度の一読者としての部分的な「読み」である。 このような「読み」は、JIS漢字にこだわりのある筆者の 過剰な読み方に過ぎない、との批判もあろう。 ただ、そうした「読み」を余儀なくさせたのは、 日本文芸家協会による 「漢字を救え!---文字コード問題を考えるシンポジウム---」 (一九九八年一月二十二日開催)や国語審議会への「要望書」 (一九九七年十月十三日付け) などの一連の動きであったとは断言できる(注14)。 作者の意図がどうあろうと、メディアの変革、 情報機器の普及、それに対する「同業者」の運動は、 「外」という表記に深読みを余儀なくさせて いるのである。

7 多漢字環境の世界へ

予言めいた発言は慎みたい。

ただ、多漢字環境への移行は時代の趨勢であり、 多少の紆余曲折はあれ、その方向に着実に進 むであろうとの期待は大きい。この期待感は事実であろう。 では、多漢字環境を熱望する〈ワープロ弱者〉は、その環境が 実現できた後に何を作り出そうとするのであろうか。 多漢字環境が実現できても、それはハートマークの 大衆性に支えられなければ、 日本語を扱う人すべてが共有するレベルで の実現は不可能のものである。 こうした認識は昨今の文字コード論にほとんど見あたらない。 むろん、筆者自身も〈ワープロ弱者〉の一員であることを 自覚してこのようなことを述べる わけなのだが、日本語を扱う人すべてが共有する 「多漢字環境」は、いわば逸脱が許されない制度 そのものである。その制度としての多漢字環境が 実現した時に、〈ワープロ弱者〉の持っていた 弱者性はどのように変質していくのであろうか、 興味は尽きない。

筒井康隆の『敵』は、欠陥の多いと評されるJIS漢字の環境 で生み出されたテキストだが、 「(鴎)外」という一つの表記をとってみても、 JIS漢字という環境に対する暗黙の批判、あるいは 今世紀におけるメディア(小説、演劇、映画、テレビ、ビデオ、 コンピュータ)の変革の認識として 深い洞察力を発揮してしまっている。 私には、 〈ワープロ弱者〉の持つ弱者性を、欠陥の多い、貧弱な JIS漢字の環境の中で、極限にまで突き詰めた表現と 思われてならないのだ。 多漢字環境の実現後、『敵』が到達した表現の重みは 忘れられてしまうかも知れない。的はずれとの批判を承知の上で 敢えて私見を開陳した理由はその点にある。

  1. 芝野耕司編『JIS漢字字典』(日本規格協会、一九九七年)に所収。
  2. 當山日出夫「コンピュータの 文字に対する意識について---錯綜する JIS漢字論の根底にあるもの---」(『国語と国文学』七十六巻五号、 一九九九年五月)
  3. 「地球切り抜き帳【日本】読書専用ソフト『T-Time』登場」 (『別冊・本とコンピュータ(1)『本はかわるか?』』トランスアート、一九九九年八月)
  4. 安岡孝一「JIS X0213の符号化表現」(『人文学と情報処理』第26号、勉誠出版、二〇〇〇年四月)
  5. 小林一仁「漢字の「字体」を考える」(『月刊しにか』十巻七号、大修館書店、一九九九年六月)
  6. 佐藤稔「擬製漢字(国字)小論」(『国語と国文学』七十六巻五号、 一九九九年)
  7. 「コラム26 拡張新字体と朝日文字--- 鴎外先生は本当は?」(『JIS漢字字典』五二五頁)など。
  8. JIS X 0208:1997の 「区点位置詳説」には図版が掲げられているので、参照されたい。
  9. 日下部重太郎『現代国語思潮続編』(中文館書店、一九三三年)
  10. この点については池田証寿「地名の漢字を インターネットで検索する」(『国語国文研究』百十三号、 一九九九年十月)を参照されたい。
  11. 詳しくは池田証寿「『補訂版国書総目録』の漢字」 (『古辞書とJIS漢字』第二号、北大文学部池田研究室、 一九九九年十月)を参照。 なお具体的な数値に関しては若干の修正を加えた上で、 本稿に示す。また、より詳しい説明を 池田証寿「『国書総目録』の漢字について---『大漢和辞典』に見えない例を中心に---」(京都大学大型計算機センター第64回研究セミナー「東洋学へのコンピュータ利用」、二〇〇〇年三月二十四日)で述べており、本稿はそれと重複する部分があることをお断りしておく。
  12. 『諸橋轍次著作集第十巻』(大修館書店、一九七七年)三〇〇頁。
  13. 高田時雄「フィロロジーと共同研究」(『学術月報』五十二巻八号、日本学術振興会、一九九九年八月)
  14. さらに蛇足を加えれば、 『ワイアード』三巻四号(DDPデジタルパブリッシング、 一九九七年四月)が、「文学、ビットに殉ず?!」 を特集し、『敵』執筆中の筒井康隆や 日本文芸家協会電子メディア対応特別委員会委員長の 島田雅彦へのインタビューを掲載したことは、 象徴的な出来事として記録に止めておいてよいだろう。

(初出:「日本文学」2000年9月号(49巻9号)、日本文学協会、pp.43-53 )


[→このページの最初] [→雑文] [→JIS漢字] [→古辞書] [→ホームページ]
(C) Ikeda Shoju 2000-2001 池田 証寿(いけだ しょうじゅ)
E-mail shikeda@Lit.Let.hokudai.ac.jp/KGH01365@nifty.ne.jp