「漢字典(All Kanji Catalog)」の思想

SUB:「漢字典(All Kanji Catalog)」の思想(長文)

「漢字典」の目指したところは、漢字の復権、正字の復権であると思います。

まず、全体の構成を示します。()内はページの分量。

例言(3ページ)
  「漢字典」の刊行にあたって
序説(7ページ)
  漢字典の性格とその役割
解説(35ページ)
  第1章  大型字典に見る漢字の数
  第2章  小漢字
  第3章  大漢字
  第4章  漢字合成法
漢字表(1891ページ)
部首索引(415ページ)
総画索引(413ページ)

以下、順を追って簡単に説明します(引用が多くなります)。

‖例言(3ページ)
‖  「漢字典」の刊行にあたって

ここでは、刊行の目的が以下のように語られています。

|    本書「漢字典」には57415字の漢字が収められている。これらは現在
|  のアジア各国規格や国際規格(ISO)を含むだけではなく、康煕字典や諸
|  橋大漢和辞典(大修館書店)などの大型漢字字典をもカバーするものである。
|
|    漢字表に掲載する漢字は従来とは全く異なる方法で印字されたものである。
|  これらの漢字は、コンピュータが動的に合成して生み出したもので、従来の
|  ような固定字形の印字ではない。
|    我々は次のような目的のために、新しい漢字合成法を開発した。
|
|  1:いかなる漢字字形であっても、それをコンピュータで生成する。
|  2:多種の漢字を含む文字データをコンピュータ処理する。
|  3:異体字・別体字・略字・古字などと表現されてきた漢字の字形変化を科
|      学的に解析する。
|  4:多種の漢字を含む文字印刷を可能にする。
|
|    また、本文の漢字は書体として伝統的な明朝体活字を基準にしつつ、部分
|  品の統一や字形の厳密さを考慮したもので、ひとつの標準となり得るものと
|  自負している。
|    しかし、我々は決して漢字字形の正誤を提示しようとするものではない。
|  むしろ、たとえ誤字であっても印刷する必要がある場合、あるいはコンピュ
|  ータに入力する必要がある場合、それを作らねばならない。いわばあらゆる
|  漢字字形を作り出すための方法を示すものである。
|    その意味で、本書の内容は固定的なものではなく、将来にわたって漢字の
|  収集と補正を続けていきたい。
|    読者諸賢のご教示、ご協力をお願い申し上げる次第である。
|  (以下、既発表論文と謝辞は省略)

「あらゆる漢字字形を作り出すための方法を示」したのが「漢字典」ということにな
りましょう。「漢字典」は既存の規格(JISやUnicode等)を参考にしていますが、そ
れにとらわれない発想をしているようです。そのことは序説や解説で詳しく語られて
います。

‖序説(7ページ)
‖  漢字典の性格とその役割
‖    ■  漢字の復権
‖    ■  活字から電字へ
‖    ■  電字の誕生から漢字典まで
‖    ■  電字のよりどころ  ―漢字典の性格・役割と正字の復権―

著者達は、活字に代わってコンピュータで用いられる漢字を「電字」と呼びます。そ
して「漢字典」は「活字から電字への過渡期に、活字文化を電字文化として花開かせ
るために生れた」としています。

電字のよりどころは正字であるとして漢字の復権を説きます。

|    漢字の復権とは、おそらく、正字の復権に他ならない。略字(簡体字)も
|  けっこうだが、正字をおろそかにしては貴重な文化遺産を失うことにもなり
|  かねない。電字は各国の略字を含むのみならず、正字を完全にサポートして
|  いる点が重要である。正字への統一はもちろんのこと、略字(簡体字)への
|  統一も、正字と略字が混じり合う処理も可能である。
|
|    康煕字典が正字のよりどころを示したように、漢字典は電字のよりどころ
|  を示すものである。我々は漢字典の作成にあたって、正字を基準にしつつも、
|  歴史的、社会的に存在したあらゆる漢字を対象とする立場に立った。漢字は
|  生きものであり、存在している以上、一個の人格(漢字格)を持つと考えた。
|  正字のみを“正しい”字として他を排斥することは、略字のみを“常用”字
|  として正字を無視することと同様に不合理である。極端に言えば誤字であっ
|  ても漢字であるし、祕→秘のおうにそのうち“公認”されるかもしれない。
|  我々が「〇」(漢字のゼロ)も漢字として採録したのは同様の理由による。

合成による漢字生成のシステムは他にもあるでしょうが、「電字のよりどころを示す」
と言い切るシステムは他にあるでしょうか。このように言い切れるのは、漢字文化圏で
康煕字典以外によりどころ(証拠)となる表現形式がないこと、京都大学人文科学研究
所のスタッフによって学問的な土台が固められていることによるものと考えられます。

‖解説(35ページ)
‖  第1章  大型字典に見る漢字の数
‖    ■  漢字の総数はいくつか?
‖    ■  康煕字典
‖    ■  大漢和辞典
‖    ■  漢語大字典
‖    ■  その他の字典と異体字
‖    ■  漢字典

「漢字典」の項で「小漢字コード」「大漢字コード」という考えが提出されます。

|    今回刊行した本書『漢字典』(第1版)には、過去の大規模字典もちろ
|  ん、現在のアジア各国の国家規格や国際規格(これらについては後述する)
|  の漢字を網羅した。さらに、従来は取り上げられることが少なかった国字や
|  異体字も積極的に収集した。その結果57415字の漢字を採録したが、こ
|  れとて全てを網羅しているわけではない。むしろ、これを土台としてさらに
|  多くの漢字を採集していく考えである。その方針として据えた「使用されて
|  きた漢字は全て採集する」という考え方を、我々は「大規模漢字コード系」
|  あるいは「大漢字コード」などと呼んでいる。反対に、現在のコンピュータ
|  やワープロで使用しているJIS規格のような限定された小規模な漢字コー
|  ド系を「小規模漢字コード系」あるいは「小漢字コード」などと呼んでいる。
|    我々は未来の理想的な漢字コード系として「小漢字コード」と「大漢字コ
|  ード」の併用を提言してきた。特に近未来の「情報ネットワーク」には大漢
|  字コードは不可欠になると考えている。その意味で今回の『漢字典』(第1
|  版)は大漢字コードの第1案とも言えるものだが、大漢字コードの説明の前
|  に、現在の小漢字コードとその問題点を整理してみることにしよう。
|

次の第2章で、小漢字コードの問題点が述べられますが、注目すべきはユニコードも
小漢字コードであるととらえている点です。以下、第2章の目次。

‖  第2章  小漢字
‖    ■  常用漢字と人名漢字
‖    ■  JIS漢字
‖    ■  JIS漢字の問題点
‖    ■  新JISと旧JISの問題
‖    ■  JIS補助漢字制定への動き
‖    ■  JIS補助漢字
‖    ■  JIS補助漢字の特徴
‖    ■  JIS補助漢字の問題点  ―異体字―
‖    ■  JIS補助漢字の問題点  ―字形の変更―
‖    ■  国際化の動き
‖    ■  ユニコード(ISO10646BMP)
‖    ■  ユニコードの問題点  ―どこまでを“同じ”とするか―
‖    ■  ユニコードの問題点  ―内包する弱点―
‖    ■  ユニコードの問題点  ―各国規格と国際規格―
‖    ■  小漢字から大漢字へ

小漢字コードと大漢字コードとの関係については、次のように述べます。

|  「小漢字コード」は「大漢字コード」に含まれるものなので、未来のある段
|  階で消滅する可能性がある。その場合は「大漢字コード」のみに一本化され
|  ると予想されるが、当面は「小漢字」と「大漢字」の併用になるだろう。
|

JIS X0208/0212やUnicode(ISO10646,JIS X0221)は「消滅する可能性がある」という
過激な発言が見えます。ここまで言い切るだけの裏付があるということでもありまし
ょうが、逆に言えば、JIS や ISO の規格が多くの問題を抱えていることの裏返しで
しょうね。

‖  第3章  大漢字
‖    ■  情報化社会の落し穴
‖    ■  小漢字ではカバーできない漢字
‖    ■  あるがままの漢字をサポートする  ―大漢字の発想―
‖    ■  理想的な大漢字とは
‖    ■  大漢字の実現

「理想的な大漢字とは」の項を引用します。

|    小漢字コード系の様々な問題点はそのまま大漢字コード化への手がかりと
|  なるものである。現在の問題点をまとめると、次のようになる。
|  
|  (1)康煕字典(49188字)などの大型字典の漢字の多くはコード化さ
|  れていない。これらの漢字はコンピュータ処理はもちろん、印刷することす
|  ら困難だ。
|  
|  (2)小漢字コード系の漢字であっても、そのバリエーション(異体字、バ
|  リアント)まで完備していない。これでは人名地名などの厳密な漢字処理を
|  行うことができないし、新たな外字を生み出す悪要因にもなっている。
|  
|  (3)漢字は変化している。新字もあれば滅んだ漢字(ベトナムの字喃、中
|  国周辺の西夏、契丹、女真文字など)もある。未知の漢字に対してどのよう
|  に対応していくのか。
|  
|    (1)に示した漢字の不足の問題は、コンピュータ用の漢字フォントを作
|  ることで解決できる。時間と手間、すなわちかなりの資金が必要になるが不
|  可能ではない。しかし(2)や(3)の問題に至るとこれまでの手法では解
|  決できないことに気付く。
|  
|    これまでは漢字を固定的に扱ってきたので、あらかじめ登録された漢字字
|  形以外は手も足も出ない。そのためにたとえわずかな違い(くさかんむり▼
|  を▲にすることなど)であっても、新たに外字作成する必要があったし、そ
|  の外字を従来のJIS漢字集合の中に挿入することもできなかった。
|    JISコードを昔の活字棚(文選工がそこから活字を選び取って活版を作
|  っていった)に例えると、現在のコンピュータが内蔵している活字棚は極め
|  て固定的で融通の効かないものだといえる。その点、昔の本物の活字棚は必
|  要に応じて棚を増減することができたし、もし漢字が見つからなければ活字
|  屋さんへ走って鋳造してもらい、棚を増やすこともできたのである。
|    このように考えてば、理想の大漢字コードは漢字を固定的に規定するもの
|  ではなく、必要に応じて追加、増殖を許す“活字棚”的なものが良いことが
|  わかる。活字棚ならば、全く新しい漢字が追加されても問題ないし、コンピ
|  ュータの効率を上げるために普段は常用棚だけに絞っておき、必要に応じて
|  棚を増やすことも可能である。そう考えれば小漢字コード系とは常用棚のこ
|  とであり、大漢字コード系は全活字棚を指すことが理解できよう。コンピュ
|  ータの能力が充分に進歩すれば将来は小漢字が不要になるであろう、という
|  予想はこの例えからもわかる。
|  (池田云、▼は3画の草冠、▲は4画の草冠)

「コンピュータの能力が充分に進歩すれば」だれでも大漢字コードを使うことが可能
になり、「将来は小漢字が不要になるであろう」と予想できるかどうかは、議論の余
地があるかもしれません。技術的に可能でもそれだけの需要があるかどうか。古典の研
究や地名・人名処理では確かに有難いが、国語の教育の分野、日本語の国際化の面で
問題がないかどうか。
もちろんそれらは承知のことで、技術的に可能なレベルまで達することと、きちんと
したよりどころ(証拠)を持つこと、この二つを目指しているのでしょう。それは充
分達成している思います。使う側の問題ということかもしれません。

‖  第4章  漢字合成法
‖    ■  字素と合成字
‖    ■  分解する基本“2分割”
‖    ■  分解の実際
‖    ■  漢字の構造
‖    ■  漢字の構成要素と漢字定義データ
‖    ■  字素の変形
‖    ■  明朝体の特徴
‖    ■  漢字の美しさ

漢字の合成法自体の考え方は、他の方が述べられてきたことと大きく変るような印象は
ありません。むろんかなり厳密に詳細なデータが示されたりしています。
正字を第一のよりどころとする点が、この漢字典の発想のベースであり、この点が他の
システムにない特色であろうと考えます。その発想からの漢字合成法です。

‖  漢字表(1891ページ)

57,415字を2分割した結果を部分品ごとにまとめたもの。以下の情報が示されます。

|  康          康煕コード
|  画数        左部品の総画数+右部品の総画数
|  D          大漢和辞典の漢字番号
|  ISO/U  ユニコード規格(Version1.0)
|  JIS      日本のJIS規格(0はX0208、1はX0212)
|  KS        韓国のKS規格(0はC5601、1はC5657)
|  CN        台湾のCNS規格(CNS11643の1,2,14面)
|  GB        中国のGB規格(0はGB2312、1はGB12345、
|              3はGB7589、5はGB7590、7はGPHL、8はGB8565)

字形については、次のように独自のものである旨が明瞭に示されています。

|    我々が作成した漢字字形と各規格表の字形は必ずしも一致しない。中には
|  あえて規格表とは異なる字形に作ったものもある。

漢字表の見本を少し。JIS X0208で示せる例だけですが。

|  【一】114字
|  00001     一  一      画数 01     GB0-5027 D00001
|  康 00001              JIS 0-1675  CN1-4421
|                        ISO/U 4E00  KS0-7673
|
|  -----------(略)-------------
|
|  00041--ZN 丙   ̄  内  画数 01+04  GB0-1791 D00035
|  康                    JIS 0-4226  CN1-455F
|                        ISO/U 4E19  KS0-6016
|
|  -----------(略)-------------
|
|  11738     旦  _  日  画数 01+04  GB0-2109 D13735
|  康 11738              JIS 0-3522  CN1-4659
|                        ISO/U 65E6  KS0-5109

各行の左上のコードは「拡張康煕コード」で、康煕字典に採録されている漢字は
康煕コードそのまま、康煕漢字からの派生漢字は変移パラメータを付加している
由です。「丙」字がその例でしょう。

漢字典の問い合せ先は、以前 FPRINT、MES 14、#416 に書きましたが、以下の通り
です。

57,415字の漢字構成データ集
勝村哲也・丹羽正之著「漢字典」

解説・索引付き/A4版/約2,800頁/15万円(消費税込)/ソフトなし
書店ルートでの入手不可。

申込先は、

京都漢字研究会
〒605 京都市東山区清水1-294,清水寺成就院内
phone 075-525-0051, fax 075-525-0038

問い合わせると、A4 三枚分のパンフがとどきましたが、現在は連絡が付かない
という情報がありました。

以上、長文にお付きあい頂き、お疲れ様でした。
---
池田  証寿(shikeda@gipac.shinshu-u.ac.jp/KGH01365@niftyserve.or.jp)