「対応分析結果」というのは、JIS漢字の改正と拡張の原案作成の作業を行ったJCS委員会第二分科会(WG2)での呼び方であって、正式には「行政情報処理用標準漢字選定のための漢字使用頻度および対応分析結果」という。1974(昭和49)年、行政管理庁行政管理局から出された、ガリ版刷りの資料である。この資料は、JCS WG2によるJIS X 0208改正作業の過程で発掘したものであるが、この資料にたどり着くまでには、JCS WG2委員会の苦心があった。
JIS X 0208:1997の「解説」では、この「対応分析結果」をはじめとする JIS漢字第一次規格(78JIS)の「原典」について、簡にして要を得た説明が施されている。が、簡に過ぎた部分があったのか、副題に掲げた加藤弘一氏の近著『電脳社会の日本語』(文春新書、2000年3月)では、若干不正確な記述が見受けられる。
また、JCS委員会WG2の作業に関して、78JISの「原典」にたどり着くまでの苦心の一端を知ってもらうのもそれなりに意義のあることであろう。そこで、以下、加藤氏の記述を引き合いに出させてもらって、「対応分析結果」を中心に78JISの「原典」の持つ資料的価値を述べることにする。
ほら貝を主宰する加藤弘一氏の近著『電脳社会の日本語』は、いわゆる「文字コード問題」を一般向けに解説するとともに、規格の策定に関わった人物への直接取材などを踏まえ、その歴史的背景、現在の問題点、及び将来への課題を包括的に論じている。
従来から文字コードに関する本は少なくなかったが、それらは符号化方法の技術的な解説に重きがあるため、一般には取っつきにくい面があった。一方、どのような文字が必要かという文字集合をめぐる論においては、漢字の字体や字形の微妙な違いをあげつらうことがどうしても多くなり、これまた、一般の関心を引きにくいという側面があったのは否めない。
加藤氏の近著は、情報処理技術の背後に存在する設計思想やそれを必要とする社会経済的な背景、さらには行政側の対応など、文字コード問題を社会科学的な視点から取り上げており、この点は高く評価されるところであろう。特に、JIS漢字(78JIS)策定に至るまでの和田弘氏の活動や、ユニコードの統合漢字に田嶋一夫氏の論文が影響を与えたことを、調査・取材により明らかにした点は、評価が高い。
もっとも、近代活字印刷史で有名な「美華書館」を「華美書館」(219ページ)とするように、明らかな誤植も目につく。文字コード問題では、漢字字体の点画をあれこれいうことが多く、そうした文章に見える誤植は揚げ足取りの材料を提供するようなものである。もちろん、私は、揚げ足取りをしたいわけではない。加藤氏の近著は、文字コード問題に対する政治的な発言・提案をも含むわけで、特に固有名詞の表記などは、もう少し慎重でもよかったかなと思う。
加藤氏近著のもう一つの特色は、語り口のうまさであろう。加藤氏は、かつて群像新人賞を評論部門で受賞された文芸評論家とのことだから、文章の上手さをあれこれいうのは僭越というものだが、この本の説得力の強さは氏の文才からきているのは間違いない。皮肉めいた言い回しとか、若干の誇張を含んだ表現は、全体にメリハリを付ける効果を挙げているようで、文芸評論家の語りとはこういうものなのだなあ、と感心してしまった。
ただ、こうした文芸評論家としての修辞的バイアスが強く出過ぎたためか、事実が歪められてしまったと感じる箇所が一つ二つあった。標題に挙げた「対応分析結果」に関する記述がその一つである。以下、加藤氏の説明を引用しよう。JIS漢字第一次規格(78JIS)に至る歴史を述べた部分である。(赤色は池田による。以下同。)
その間にも漢字処理の研究は進み、運用をはじめるところも出てきた。行政事務のコンピュータ化を研究していた行政管理庁(現在の総務庁)行政管理局は、情報処理学会試案と人名漢字を集めた「日本姓名漢字コード表」、地名漢字を集めた「国土行政区画便覧」、公文書用漢字を集めた「行政管理庁基本漢字」の四つの文字セットをもとに、「行政情報処理用標準漢字選定のための漢字使用頻度および対応分析結果」をまとめつつあった。(77ページ) |
「行政情報処理用標準漢字選定のための漢字使用頻度および対応分析結果」という長いタイトルの資料は、先ほどから述べている「対応分析結果」のことである。実は、これを一読してJCS委員会でも発掘出来なかった未発見の資料があるのかと驚いた。「日本姓名漢字コード表」と「国土行政区画便覧」の二つの資料名は、まったく知らないものだったからである。実際、加藤氏は、強力な取材力を持つ方だから、そういうこともあるかもしれないと一瞬思ったのである。しかし、この箇所をよく読んでみると、JIS X 0208:1997の解説に基づきながら、資料名を誤記し、不正確な要約をしているように思われてきた。要点を記せば次のとおりである。
加藤氏は、JCS委員会の行ったJIS漢字の典拠調査に高い評価を与えている。多少ともそれに関わった者として、その評価を有り難く思うものであるが、発掘した資料の価値が正確に記述されていないのはたいへん残念であった。 1.は軽微な誤記であるのであまり問題はないが、2.と3.は78JISの評価の根幹に関わるだけに問題が大きい。
そこで加藤氏に四つの漢字表と八つの漢字表の名称を具体的に挙げて説明したメールをお送りしたのである。加藤氏は『電脳社会の日本語』のサポートページで、早速、私信の内容を紹介して下さった。素早い対応には感激した。しかし、紹介して下さった内容は、次のとおりであり、これを読む限り、78JISの原典資料の評価・位置付けに関しては依然として不正確な部分を感じざるを得なかった。というか、不正確さが増大し、資料的価値が歪められてしまったというのが正直な気持ちである。
78JISのもとになった文字セット |
私が指摘したのは、「対応分析結果」は上に挙げた八つの漢字表をまとめ、あわせて「行政管理庁基本漢字」を選定しているという点なのだが、それがどうしたわけか「78JISのもとになった文字セット」という具合になってしまった。78JISの原案作成委員会は、この「対応分析結果」及びその他の資料を検討し、次の四つの漢字表に基づいて文字を選定しているのである。第一水準と第二水準とをどのように分けるかについては、もっと細かな説明が必要であるが、この四つの漢字表にあれば78JISに採用されているといって差し支えない。
「対応分析結果」は、「行政情報処理用標準漢字選定のための漢字使用頻度および対応分析結果」という、長ったらしい標題が端的に示しているように、「行政情報処理用標準漢字」を「選定」するための調査研究の報告書である。行政管理庁は、上に挙げた八つの漢字表を収集し、官報での出現頻度を調査するなどして「行政情報処理用標準漢字」を選定しているのである。「行政情報処理用標準漢字」と「行政管理庁基本漢字」とは、同じものと考えておいてよい。(細かいことをいうと、「対応分析結果」を出した次の年に、「行政情報処理用基本漢字に対する符号付与に関する調査研究報告書“付表”」を出すのだが、これに記載されるのが「行政管理庁基本漢字」である。)
「行政管理庁基本漢字」は人名・地名を取り込んでいない。人名・地名をも取り込んだのは78JISの原案作成委員会の見識である。しかし、加藤氏の説明では、それが行政管理庁の手でなされたことになっている。評価の対象を完全に取り違えているのである。
こうしたことになるのは、加藤氏の責任というより、78JISの原典資料に関する情報が充分に公開されていないことの方が大きいのかもしれない。
JIS X 0208:1997とJIS X 0213:2000の関係資料は厖大であるが、近い将来に公開が期待できるものである。ただ、それらのすべてに目を通すのは大変時間のかかる作業であるし、特に「対応分析結果」のような、極めて重要な資料については、それだけ取り出して解説するようなことがあってもよいだろうと思う。そこで以下、「対応分析結果」について、いささか知るところを述べてみよう。入手の苦心が中心となり、自慢話めくことになるが、そのあたりはお目こぼしいただきたい。
JIS漢字第一次規格(78JIS)の制定に際して37の漢字表が集められた。 それらの名称は、78JIS以来97JISに至るまで、「解説表2 調査対象漢字表一覧」として解説に掲げられている。以下にそれを引用しておこう。
赤色で示したのは、78JISのもとになった四つの漢字表である。このうち「行政管理庁基本漢字」は16の「行政情報処理用基本漢字に対する符号付与に関する調査研究報告書“付表”」に記載されているものである。この赤色の四つの漢字表と青色で示した五つの漢字表が「対応分析結果」に記載のあるものである。(【2000年4月14日補足】「作成年月」は昭和の年号を略している。)
番号 | 漢字表 | 作成年月 | 新字源漢字数 | 追加漢字数 | 記号約物 | 漢字数 | |
1 | IBM2245漢字印刷装置文字セット一覧表 | 47.4 | 5883 | 909 | 48 | 6792 | |
2 | 情報処理学会漢字コード委員会標準コード用漢字表試案 | 46.10 | 5778 | 308 | 0 | 6086 | |
3 | 明治生命保険相互会社漢字コード表 | 46.6 | 4912 | 443 | 58 | 5355 | |
4 | 大蔵省主計局収容文字表 | 48.8現在 | 4204 | 72 | 0 | 4276 | |
5 | 富士通標準文字表 | 45.3 | 4173 | 98 | 74 | 4271 | |
6 | 大蔵省印刷局常用文字の調査 | 37.1〜41.12 | 3805 | 204 | 0 | 4009 | |
7 | 全日本漢字配列協議会全国統一新配列による常用漢字目録 | 43.7 | 3926 | 77 | 28 | 4003 | |
8 | 国立国会図書館収容漢字表 | 48.8現在 | 3764 | 192 | 0 | 3956 | |
9 | 林四郎,小林信子“語彙調査四種の使用度による漢字のグループ分け” | 46.9 | 3806 | 109 | 0 | 3915 | |
10 | 森岡健二“漢字の層別” | 49.1出版 | 3582 | 42 | 0 | 3624 | |
11 | 国土行政区画総覧使用漢字 | 47年度 | 2971 | 280 | 0 | 3251 | |
12 | 内閣調査室収容漢字表 | 48.8現在 | 3118 | 63 | 0 | 3181 | |
13 | 日本生命収容人名漢字 | 48.8現在 | 2884 | 160 | 0 | 3044 | |
14 | 読売新聞社1倍明朝(基本活字)文字数 | 47.1 | 2899 | 26 | 17 | 2925 | |
15 | 国立国語研究所資料集8“現代新聞の漢字調査”中間報告 | 41.1〜12 | 2828 | 48 | 0 | 2876 | |
16 | 行政情報処理用基本漢字に対する符号付与に関する調査研究報告書“付表” | 50.3 | 2788 | 29 | 55 | 2817 | |
17 | 日本タイプライター株式会社和文タイプライター文字配列表A | 40年頃 | 2763 | 29 | 23 | 2792 | |
18 | 国語シリーズ64 各種漢字表字種一覧 | 43.3 | 2678 | 18 | 0 | 2696 | |
19 | 日本タイプライター株式会社N.T.C漢字入力システム用文字コード表第一次分 | 50.1 | 2642 | 29 | 38 | 2671 | |
20 | 日本生命漢字コード表 | 42.2 | 2620 | 8 | 36 | 2628 | |
21 | NHK文研用語研究部“ラジオニュース語い調査漢字集計表”参考菅野謙 | 43.3 | 2592 | 21 | 0 | 2613 | |
22 | 株式会社写研SPICA“一寸ノ巾式”メインプレート | 49.4 | 2499 | 9 | 35 | 2508 | |
23 | サンケイ新聞社(大阪)サプトンシステム鑚孔機鍵盤文字配列及び符号表 | 48.10.1 | 2304 | 15 | 43 | 2319 | |
24 | 日本テレビ放送網株式会社“文字表示装置用字母” | 44.12 | 2286 | 16 | 17 | 2302 | |
25 | 電話番号簿活字鋳造量 | 39. | 1824 | 273 | 0 | 2097 | |
26 | 菅野謙“当用漢字表に含まれない漢字”(放送で使う漢字の範囲の検討のために) | 44.4 | 1997 | 98 | 0 | 2095 | |
27 | NHK文研用語研究部“国語教科書出現漢字表” | 49.6.19 | 2012 | 10 | 20 | 2022 | |
28 | 毎日新聞社さん孔機文字盤 | 49.9.1改 | 1990 | 2 | 30 | 1992 | |
29 | 6社協定新聞社用コード表(CO-59) | 34.8 | 1982 | 3 | 0 | 1985 | |
30 | 共同通信社文字出度調査100万字集計結果 | 46.6 | 1974 | 3 | 21 | 1977 | |
31 | 日本経済新聞社KKB文字表及び符号表 | 48.6.25改 | 1947 | 5 | 24 | 1952 | |
32 | 日本科学技術情報センター収容漢字表 | 48.8現在 | 1859 | 5 | 0 | 1864 | |
33 | 当用漢字表 | 21. | 1850 | 0 | 0 | 1850 | |
34 | 電総研漢テレコード表1 | 40年度 | 1833 | 1 | 51 | 1834 | |
35 | 電総研漢テレコード表2 | 44年度 | 1830 | 1 | 48 | 1831 | |
36 | 雑誌記事索引自然科学編における漢字の頻度調査 | 42.1 | 1403 | 8 | 0 | 1411 | |
37 | 日本工業標準調査会JIS職業分類コード(JIS C 6266-1972) | 47.3.1 | 736 | 1 | 0 | 737 |
JIS X 0208の改正にあたったJCS委員会では、37の漢字表をすべて入手することはできなかった。また、関連の資料を読み込んでいくと、37の漢字表をすべて入手しなくても、漢字の選定方針は明らかにできることが分かってきた。
資料1は、78JISの原案委員会の報告書である。資料2と資料3は97JISの改正作業の過程で見出したものである。JCS委員会は、1994年4月に発足したが、資料1と資料3はその当初から委員会内に配布され、種々の検討を重ねていた。その入手については、委員長である芝野耕司氏の苦心と関係各位の協力があったと聞いている。資料2は、ここで問題にしている「対応分析結果」である。
ところで、資料3の「漢字整理番号表」は、『新字源』(第63版、角川書店)を元に、調査対象漢字表の文字同定及び整理を行ったものである。対象となっている漢字表は、資料2の「対応分析結果」に掲げる漢字表の他、「林四郎,小林信子“語彙調査四種の使用度による漢字のグループ分け”」「森岡健二“漢字の層別”」など数種の漢字表を含んでいるが、これによっても37の漢字表がすべて揃わない。しかも、取り上げてある漢字は、『新字源』に掲載のあるものに過ぎない。一般の漢和辞典に掲出がなく、JIS漢字のみに存する、いわゆる「典拠未詳字」に関する情報は得られないのであった。
したがって、「妛」「穃」「粫」などの典拠未詳字に関しては、手掛かりのない状態がしばらく続いていたのである。地名の資料である『国土行政区画総覧』そのものも、通産省工業技術院の方が手配して下さり、閲覧もしたのであるが、あまりに厖大であるため、探索を放擲してしまった。(『国土行政区画総覧』の悉皆調査で有名となる笹原宏之氏は、1994年度、JCS委員会のメンバーに加わっていなかった。氏が参加するのは2年目の1995年度からである。)
事態は、振り出しに戻ってしまった。そこで、78JIS原案作成委員会の報告書である資料1「情報交換のための漢字符号の標準化に関する調査研究報告書」を丹念に読み直してみることにした。そうすると、「日本生命収容人名漢字表」と「国土行政区画総覧使用漢字」は、その名称の漢字表を直接参照したのではなく、資料2の「対応分析結果」によったという記述を見出したのである。注のかたちで、ごく簡単に記載されていたので、それまで見過ごしていたのであった。JCS委員会の席上、いま述べた資料1の記載があやしいのではないかという発言を私がしたことをはっきり記憶している。
この段階ではまだ、「対応分析結果」が78JISの原案作成において、決定的な資料であるという認識はなかった。その当時のJCS委員会は、関係がありそうであれば、とにかく入手し、内容を検討する、という作業の繰り返しであった。78JISの原案作成委員会の会議資料も大量にあり、子細に検討したのであるが、典拠未詳字に関して決定的な記述は見いだせないでいたのである。
「対応分析結果」があやしそうだという感触は、芝野委員長をはじめ他の委員の方も抱いたようだった。問題は、どこから入手できるかということだった。それまで、芝野委員長は、相当の時間を費やし、苦心の折衝を重ね、関連の資料を収集されていた。倉庫に入り、ほこりだらけになって資料を入手されたというようなお話をしばしば伺ったものである。しかし、そのなかに「対応分析結果」は含まれていなかった。JCS委員会の議事録を見直せば、はっきりするが、今その時間がなく、記憶で書くことにするが、確か委員会幹事の徳永英二氏にあてがありそうだ、ということだったと思う。
「対応分析結果」は、一ヶ月後のJCS委員会に資料として提出された。 その時の雰囲気は、はっきりと記憶している。委員会の会場は、いつものことであるが、赤坂にある日本規格協会の四階の会議室。委員会会場に入るなり、分厚いガリ版刷りの資料が机におかれているのが目に入った。資料を手にとって目にする。委員会開始の時間が近づき、委員が続々と会場に入り席に着く。委員会開始までの中途半端な時間、普段なら、雑談の一つ二つをするところなのだが、この日は違っていた。何か決定的な資料が入手できたという雰囲気。会議開始の時間が過ぎても誰も発言しない。じっと「対応分析結果」という資料をながめ、委員それぞれにその資料的価値を査定しようとしている。
JCS委員会(第一分科会、WG2)は、月に一回、定例の会議を開催していた。JISの原案策定が押し迫ってくると、ad hoc会議を持つことになるが、初年度はまだそういう段階でなかった。それでも一ヶ月後に資料が提出されるのは、かなり素早い対応だったと思う。素早い対応になったのは、「対応分析結果」という資料の持つ重要性が一見して明らかだったからであろう。
芝野委員長が資料を入手して委員会に提出した場合は、入手に至るまでの経緯をかなり詳細に報告されていた。先に書いたが、私の記憶だと、幹事の徳永氏のルートで「対応分析結果」を入手したのだと思うのだが、その入手の経緯について詳しい説明はなかった。実際は、説明があったのかもしれない。あったとしてもそれが耳に入らず、「対応分析結果」という78JISの「原典」をながめていたのであろう。
「対応分析結果」が78JISの「原典」であることを立証するためには、さらに時間を必要とした。その立証は、笹原宏之氏による「国土行政区画総覧」の調査によって完璧になされることになるのだが、先に述べたように、初年度(1994年度)、笹原氏はJCS委員会の委員ではなかった。氏が参加するのは、二年目の1995年度からである。JIS X 0208改正原案の公開レビュー以後、笹原氏の調査はよく知られることになるので、その経緯はここでは省略する。なお、余談ながら、国語学分野からは、既に豊島正之氏と私が参加しており、同じ分野の委員を増やすについては、外部に対してそれなりの説明も必要になるのであり、そのあたりの芝野委員長の識見は優れたものがあると思う。
「対応分析結果」の価値は、78JISの「原典」として価値である。これはいくら強調しても強調しすぎることはない。
「対応分析結果」の価値が明らかになった現時点において、過去を振り返り、「行政事務のコンピュータ化を研究していた行政管理庁(現在の総務庁)行政管理局は、(中略)「行政情報処理用標準漢字選定のための漢字使用頻度および対応分析結果」をまとめつつあった」(加藤弘一氏)と歴史を語るのは容易なのである。
何事もそうであろうが、評価が定まらない段階において、その資料的価値を主張して行くには種々の困難が伴うものである。いまでこそ、いわゆる典拠未詳字は、地名に残された国字を保存したものとして、JIS漢字の功績として語られるようになったのであるが、当初のJCS委員会においては、得体の知れない漢字があるので、少なくともその典拠を明らかにしなければJISとしての責任を果たせない、というどちらかといえば、消極的な捉え方だったように思う。現在では、JIS漢字は、地名字の保存により日本の文化に対する貢献をなしたのだという積極的が位置付けなされるようになっているが、このことも、調査研究と議論の積み重ねにより、共通の認識に到達したものであり、当初から一貫して高い評価を与えていたわけではないのである。
資料があってもその価値を見抜く目がなければ、その真価は見えてこない。「対応分析結果」の場合にもそうしたことがいえるのである。