キーワード:篆隷万象名義、JIS漢字、ISO/IEC 10646-1、Unicode、統合漢字
〔要 旨〕
このデータベースは、篆隷万象名義の本文研究を主要な目的とするものであり、 篆隷万象名義に掲出される一万六千余字の所在、諸橋「大漢和辞典」番号、玉篇 巻数・部首番号、JIS区点番号等の情報を得ることができる。
作成上問題となるのは、第一にJISに無い字の扱い方。JISに無い字は篆隷万象 名義の掲出字の七割、ISO/IEC 10646-1でさえ三割に及ぶ。第二に掲出漢字の同定。 これは、篆隷万象名義の本文研究に役立つようなデータの扱い方が必要である。
漢字字書データベースとして見た篆隷万象名義データベースの特色は、漢字字 書の採録字やその配列の規準を解明するのに有効であることと、JISやISO/IEC 1 0646-1等の漢字コード表に採用された漢字の典拠を示すことである。
篆隷万象名義[1]は、原本玉篇[2]を抄録した漢字字書であり、弘法大師空海の 撰述に係る。ただし、全六帖の前半四帖が空海自撰、後半二帖は別人の続撰であ る。高山寺本が唯一の古写本で、国宝に指定されている。本書の価値は、大部分 散逸した原本玉篇(梁・顧野王撰)の内容を伝えている点にある。言うまでもな く、原本玉篇は、説文解字(後漢・許慎撰)、康煕字典(清・張玉書外編)等と 並んで中国を代表する漢字字書の一つであり、日本の古代中世の文芸・学問に甚 大な影響を与えた字書である。[3]
現在、筆者は、この篆隷万象名義の掲出漢字のデータベースを作成している。 これは、篆隷万象名義の本文研究や、玉篇ないし篆隷万象名義を土台として編纂 された日本の古字書の研究に応用することを主な目的とするものである。本稿で は、その概要、作成上の問題点等を述べる。
篆隷万象名義の本文研究の成果は、次の三つの業績に集約される。
上田正「新撰字鏡の切韻部分について」(国語学127集、1981年)は、白藤「索 引」と宮澤「一覧表」について「これは用意の行き届いた誤のほとんどない秀れ た労作である」と評している。宮澤「一覧表」は、篆隷万象名義、原本玉篇、宋 本玉篇の対校作業を篆隷万象名義の側から調査したものである。上田「総覧」は、 原本玉篇と篆隷万象名義に収集した逸文を加えて、玉篇のすべての反切をまとめ た書である。
三氏の研究は、信頼度が極めて高い。これらの成果を踏まえて篆隷万象名義の データベースを作成すれば、篆隷万象名義の研究に役立つばかりでなく、篆隷万 象名義や玉篇を利用して成立した日本の古字書の研究に活用することができるで あろう。このような考えから、白藤「索引」と宮澤「一覧表」とに基づき、篆隷 万象名義をデータベース化する作業に取り掛かった。しかし、実際にその作業を 行ってみると、両者の解読に違いがあることに気が付いた。むろん例はさほど多 くない。違いがあるといっても異体字の関係にある場合が大半である。白藤「索 引」の掲出漢字の同定は篆隷万象名義の原本に近く、宮澤「一覧表」のそれは宋 本玉篇に近い、という傾向。ただ両者に異同があるということは、篆隷万象名義 の本文の解読に未解決の点があるという見方ができる。両者ともデータとして採 用しておけば、篆隷万象名義の本文を研究する材料がかなり得られる。また、玉 篇ないし篆隷万象名義を利用した字書や玉篇の逸文と比較すれば、依拠した玉篇 の系統についても何等かの手がかりが得られるであろう。
篆隷万象名義や玉篇の研究と、それを利用することで成立した古字書の研究と は、密接な関係にあり、これを切り離すことはできない。この二点を目的として 篆隷万象名義データベースを作成することにした。
このデータベースは元来、図書寮本類聚名義抄と篆隷万象名義との関係を調査 するために作成を開始したものである。作成の範囲は、図書寮本に対応する篆隷 万象名義の十三の部首(玉土邑足心言水山石阜糸巾衣)である。その作成の手順 は、図書寮本名義抄掲出字データから篆隷万象名義に対応する字を抜き出し、図 書寮本に採録されていない字を篆隷万象名義から追加するというものである。そ のため、データの形式に不統一の部分を多く含んでおり、その統一に時間をとら れた。新規に篆隷万象名義のデータを作り、これを図書寮本のデータと照合した 方がよかったと反省している。
図書寮本類聚名義抄対応版作成の反省を踏まえて、次の手順で作成中である。
(1)の方法を採ったのは、類聚名義抄などの所在データの追加を考慮したためで ある。JIS第一水準と第二水準(JIS X0208-1990)[4]は、豊島正之・金水敏・古 田啓作成の計算機用漢字字書(Ydic)[5]を利用し、JIS補助漢字(JIS X0212-19 90)[6]は、筆者作成のファイルを利用した。現在は、(4)の段階。覆製本との照 合は適宜行っているが、最終的に全体を通しての照合が必要なのは勿論である。
図書寮本類聚名義抄対応版は、次の六つのフィールド(欄)からなる。
内容は、次のようになっている。
M2722100,27425,糸,g,6/126-51,0-2769 M2722100,27425,糸,z,6=126-61,0-2769 M2722101,27425,糸λ,z,6/126-61,4-0000 M2744800,27425,絲,z,6@126-61,0-6915 M2794400,27425,繭,z,6/126-62,0-4390 M2746600,27425,見χ,z,6/127+11,1-5178 M2784700,27425,慘ω,z,6=127+12,1-5246 (以下略)
大漢和辞典番号は、上5桁に諸橋轍次編「大漢和辞典」(大修館書店、1955-60 年初版)の番号を、下2桁に付加情報を示す。大漢和番号に ' を付すものは下2桁 を10に、大漢和に無い字は、上5桁に該当する部首・画数の最後の字の番号を採り、 下2桁を90、91、…とする(豊島・金水・古田作成の計算機用漢字辞書KLEXの仕様。 豊島が1982年に決定した方法の由)。ただし、所属部首や画数が不明だが、注文 から某字の古文などであることが明白な例は下2桁を01、02、…とする。
玉篇巻数と部首番号は、巻第二十七糸部第四百二十五を27425のように示す。玉 篇の巻数と部首番号は宮澤「一覧表」による。目録部分の巻数は00とする。
掲出字の字体は、白藤「索引」および宮澤「一覧表」の同定に従う。両者異な る場合は、原本に近い字体を採ることにする。上田「総覧」も適宜参照する。
掲出字のうちJIS漢字に無いものは以下の方法で示す。
M2746600,見χ 糸偏に見 | M2273500,百2 百を二つ並べた字 M3545200,洲ω 言偏に州 | M1082600,心3 蕊の草冠の無い字 M3542500,察λ 察の古字(通用・譌字等)| M2806300,▼ 以上で駄目な時 M0487300,経μ 経の旁の部分の字 |
この方法は、かつて岡田希雄が「類聚名義抄の研究」(一條書房、1944年)で 難字を×(糸偏に見)のように示したことや、豊島正之「「JISに無い字」をめぐ って」(しにか3-2、大修館書店、1992年)に示された考え方を参考にしたもので ある。
篆隷万象名義データベース完成版ではこれを削除する予定なので、説明を省く。
篆隷万象名義の所在は、三帖七丁表六行一字目を3/07+61のように、三帖七丁裏 六行二字目を3/07-62のように示す。
また、/を !、#、@、|、= に替えて、以下の情報を示す。
JISの区点番号を以下の要領で示す。
JIS第一水準・第二水準は、豊島・金水・古田作成の計算機用漢字字書による。
3-xxxxは、JIS漢字(JIS X0208-1990とJIS X0212-1990)に無く、ISO/IEC 106 46-1ないしUnicodeの統合漢字にある漢字のためとする。統合漢字は以下の規格書 による。
The Unicode Consortium. The Unicode Standard: Worldwide Character Encoding Version 1.0, Volume 1-2. Addison-Wesley.1991-92. ISO/IEC 10646-1:1993 Information technology - Universal Multiple Octet Coded Character Set (UCS) Part 1: Architechture and Basic Multilingual Plane. 1993.
ISO/IEC 10646-1 の BMP(Basic Multilingaual Plane)はUnicodeを採用して いる。
特に問題になるのは、やはりJISに無い漢字の処理。これについては、いろいろ な考えがあるが(豊島正之「「JISに無い字」をめぐって」前掲。當山日出夫「コ ンピュータであつかえない漢字−「和漢朗詠集」の場合−」汲古12、汲古書院、 1987年等)、前述の方法によった。万全ではないが、大漢和辞典をコードブック として利用する方法はよく行われているし(田嶋一夫「漢字シソーラスの構想と 課題」日本語学3-3、明治書院、1984年。齋藤秀紀「漢字コードの拡張法に対する 試案」国立国語研究所報告83 研究報告6、1985年等)、部首情報を付記すればあ る程度の実用性は確保できよう。
篆隷万象名義第一〜四帖(目録部分を含む)の範囲の掲出漢字(/を付した字の み)について、JISとISO/IEC 10646-1[7]の漢字でどれだけ処理できるかを調査し た結果を以下に示そう。また、参考として、史記(李暁光・李光編「史記索引」 北京、中国広播電視出版社、1989年)について調査したデータも示す。[8]
規格 篆隷万象名義 史記 JIS X 0208-1990 2899/8861(32.7%) 3543/4883(72.5%) JIS X 0212-1990 1881/8861(21.2%) 957/4883(19.6%) ISO/IEC 10646-1 6121/8861(69.1%) 4750/4883(97.3%)
例えば、規格JIS X0208-1990、篆隷万象名義の欄の2899/8861は篆隷万象名義第 一〜四帖の掲出字8,861字のうち、2,899字がJIS X0208-1990で処理できることを 表す。32.7%はその比率である。これによって、JISの第一・第二水準では篆隷万 象名義データベースの漢字の三割程度しか処理できないことが分る。
ISO/IEC 10646-1ではどうであろうか。これは、上に示したように篆隷万象名義 第一〜四帖の掲出字8,861字中、6,121字がISO/IEC 10646-1で処理できるという結 果であった。ISO/IEC 10646-1の漢字約20,000字に、JIS漢字(JIS X0208/0212) はすべて含まれるから、ISO/IEC 10646-1で篆隷万象名義の掲出字約16,000字の七 割近くが処理できる。つまり、JIS漢字(JIS X0208)に無い字は、篆隷万象名義 の掲出字の七割、ISO/IEC 10646-1でさえその三割に及ぶのである。
史記の例に見るように、通常の文献であれば、外字での対応も現実的である。 しかし、万を越える所収文字数の漢字字書のデータベースの場合、外字での対応 は困難である。
古字書のデータベースの試みに田島毓堂「類聚名義抄の注釈的研究−電算機利 用による−」(平成元年度科学研究費報告書、1990年)がある。この研究でJIS漢 字(JIS X0208)に無い漢字は「現段階は検討段階にあるので、とりあえず「○」 をいれておく」とする。処理の困難さがうかがえる。データの形式の詳細は不明 であるが、大漢和辞典番号が利用できる形式で公開されれば、より有用なデータ となろう。
篆隷万象名義第一〜四帖の範囲について調べたところ、白藤「索引」と宮澤「 一覧表」とで掲出漢字の同定が異なる例は、400箇所以上あった。篆隷万象名義全 体ではおそらく800箇所以上になるであろう。次に一例を挙げる(難字はABCD の符号で示す)。
M0069300,03023,▼,z,1/055+31,4-0000 (B) M0088500,03023,▼,z,1@055+31,4-0000 (D) 篆隷万象名義 A (I55オ3) 宋本玉篇 B (上26オ10) 新撰字鏡 C (82頁3行) 玉篇引用部分。 白藤「索引」 [B]A 1-55.3(375頁4段目) D 1-55.3 (376-1) 白藤「校勘篇」 A − B F (487-5) Fは「憶説(白藤)の考へ」の意。 宮澤「一覧表」 B (507-1) 上田「総覧」 D (注)A=人偏に巻の己を丶二つとする字。B=人偏に火の下に廾を書く字。 C=人偏に巻の己が無い字。D=人偏に巻の己を女に作る字。
篆隷万象名義の字体はAと見たが、影印が不鮮明でCのようにも見える。崇文 叢書は明らかにCである。Cが本来の字体であれば、上記のデータは次のように なる。
M0061900,03023,▼,z,1/055+31,4-0000 (C) M0069300,03023,▼,z,1@055+31,4-0000 (B)白藤「索引」 M0088500,03023,▼,z,1@055+31,4-0000 (D)白藤「索引」 M0069300,03023,▼,z,1|055+31,4-0000 (B)宮澤「一覧表」
こうした作業を積み重ねることで、より正確な解読を目指しているのである。
観智院本と玉篇との関係を実証した研究に、貞苅伊徳「観智院本類聚名義抄の 形成に関する考察 その1 字順をめぐる問題」(第48回訓点語学会口頭発表、 1983年5月20日)があり、玉篇ないし篆隷万象名義と同じ字順の「玉篇字順群」の 存在が指摘されている。これを以下確認して見よう。例は、貞苅のあげた巾部と する。観智院本類聚名義抄(風間書房)、図書寮本類聚名義抄(宮内庁書陵部、 1950年)の所在は、覆製本のページ数等を示す(104.13は104頁1行3段目の意。さ らに1桁付けて順序を調整したところがある)。
大 漢 和 漢字 玉 篇 万象名義 観本(法中) 図本 JIS 備考 (前略) M0905300 票χ 28432 6/145-61 106.54 281.74 1-2822 M0899700 剌χ 28432 6/146+22 106.64 4-0000 M0908100 無χ 28432 6/146+52 106.71 3-5E60 M0877700 匕χ 28432 6/145-32 106.74 4-0000 M0903800 祭χ 28432 6/145-41 106.82 4-0000 M0896900 兪χ 28432 6/145-42 106.83 4-0000 M0914900 孅ω 28432 6/146+31 107.11 4-0000 M0902000 蒙ω 28432 6/146+41 107.14 4-0000 M0902600 家χ 28432 6/146-61 107.22 3-5E4F M0899300 幃 28432 6/146+62 107.23 282.73 0-5475 M0905400 婁χ 28432 6/147-31 107.31 4-0000 M0888100 券ω 28432 6/146-11 107.33 3-5E23 M0914100 奮χ 28432 6/146-31 107.34 4-0000 M0898500 盾χ 28432 6/146-32 107.41 4-0000 M0880100 及χ 28432 6/146-41 107.43 4-0000 M0910900 賁χ 28432 6/146-42 107.51 3-5E69 M0915100 ▼ 28432 6!146-421 107.52 4-0000 ! M0894200 弦χ 28432 6/146-62 107.53 4-0000 M0910000 壁ω 28432 6/147+12 107.54 3-5E66 M0899400 幄 28432 6/147+21 107.61 280.71 0-5474 M0886700 百χ 28432 6/147+31 107.62 284.41 3-5E1E M0883700 粲ω 28432 6#147+311 107.63 4-0000 # M0910200 操ω 28432 6|147+32 107.71 3-5E67 M0897800 愁ω 28432 6/147+41 107.72 4-0000 M0892400 峽ω 28432 6/147+52 107.731 285.73 4-0000 M0888000 合χ 28432 6/147+61 107.732 3-5E22 M0894500 諂ω 28432 6/147+51 107.74 4-0000 M0893100 卑χ 28432 6/147-11 107.81 4-0000 M0905700 幗 28432 6/147-12 107.82 283.23 0-5478 M0907700 喬χ 28432 6/147-32 107.84 4-0000 M0891300 貌ω 28432 6/147-21 108.12 4-0000 M0888700 多χ 28432 6/147-22 108.14 4-0000 M0911000 著χ 28432 6/147-41 108.21 4-0000 M0891500 佇ω 28432 6#147-401 108.22 4-0000 # (以下省略)
紙幅の都合で引用は巾部の一部を示すにとどめたが、この部分をとってみても、 篆隷万象名義に無く宋本玉篇にある字(!や#を付す)の存在が理解できよう。観 智院本における宋本系の玉篇の影響は確実である。[9]
日本撰述の古字書のデータベース化は種々試みられなければならない。新撰字 鏡や類聚名義抄を直接データベース化するのも一つの方法であるが、その土台と なった玉篇や切韻(広韻)のデータベースを作成した上で、日本の古字書のデー タベースを作成するのが、より堅実な方法と考える。漢字音の研究では、切韻( 広韻)を規準にして、それとのズレを見ていくのが常道である。古字書(特に部 首分類体の漢字字書)の研究では、玉篇を規準にして、その採録範囲や配列の順 序のズレを検討していくのが有効であろう。
この研究は、篆隷万象名義の本文研究を主要な目的とするものであるが、電子 化テキストの国際的共有という点を勘案して、その特色を挙げれば次の二点にな ろう。
特色の(1)漢字字書の採録字やその配列の規準を解明するのに有効である点は、 従来の漢字字書データベースに無かった視点であると思う。
特色の(2)漢字コード表に採用された漢字の典拠を示す点は、ある漢字が正しい かどうかを判断する際の規準に関係してくる。一般に、ことばの正しさを判断す る規準として、伝統性、一般性、合理性等が指摘されている。[10]篆隷万象名義データベースは、JISやISO/IEC 10646-1等の文字表に含まれる漢字について、特 に、その「伝統性」を検証する上で大きな力となるのである。
なお、拙論で採り上げた「篆隷万象名義データベース」は粗稿が出来上がり、 internetで試験的に公開してます。
ftp://azumi.shinshu-u.ac.jp/pub/kanjidic/tenrei04.lzh【2001年5月17日追記】現在は次のサイトで公開している。
http://sh6.lit.let.hokudai.ac.jp/shikeda/kanjidic/tenrei04.lzh