西暦2000年の日本、官民こぞって「IT革命」[注1]を叫ぶ年となった。膨大な量の電子テキストが流通し、それをさまざまな分野で日常的に利用する段階となっており、時代の大きなうねりを感じる。かつて一部の限られた人たちが操作していたコンピュータは、インターネットの爆発的な拡大とともに、多くの人たちの手にする道具となった。電子テキストの生産性は極めて高い段階に達しているといえよう。 しかし、電子テキストにとって不可欠の要素である文字コードそのものに「ねじれ」の現象が存在することはあまり知られていない。ここではその事実を指摘し、さらに、その「ねじれ」の漢字が、実際の電子テキストでどのように出現するのかをCD-ROM版の電子辞書を資料として調査してみようとする。
[注1] 柳沢賢一郎・東谷暁(2000)は日経のデータベースを調査して「IT革命」ということばが1996年に2件、1997年に1件、1998年に15件、1999年に54件であったのが、2000年には7月までで400件を越えていることを指摘している。また、アメリカの好景気とITとに因果関係がないこと、生産性の向上にITが結びつくという理論の怪しげさなどを暴いていて興味深い。
西垣通(2000)によれば、インターネットの多言語問題の特徴は「第一に、当然のことだが、問題はもっぱら書き言葉に関わり、話し言葉は対象にならない」ことと、「第二の特徴は、イニシアチブをとるのが、主に技術・経済関連組織だということ」の二つだという。音声・画像・動画による情報交換は技術的に容易であり、もはや日常化している段階だ[注2]。イニシアチブに関しては、現在、情報機器で日本語を扱うための文字コードを管轄しているのが経済産業省(旧通商産業省)であることを指摘すれば十分であろう。いわゆるJISコード、JIS漢字は正式には、「JIS X 0208:1997 7ビット及び8ビットの2バイト情報交換用符号化漢字集合」と呼ばれる。日本の文字コードといえども、独自にその内容を決定することは出来ない。国際的な規格との整合性を配慮しながら、規格の策定を進めていかなくてはならない。
[注2] 情報機器で音声・画像・動画を管理するには、共通の約束に従って作成されたファイルを用いること、そして、それらのファイルは名前を付けて管理されることを考えると、システム設計や管理において文字による支えが不可欠となっていることが分かる。ユーザがそれを意識しないで済む、ということに過ぎない点は注意が必要である。
日本の国内に目を転じれば、常用漢字(1981年10月1日、内閣告示・訓令、1945字)及び人名用漢字(285字)の範囲に関しては、標準化されているが、それ以外の、いわゆる「表外字」に関してはよりどころというべき規範が明示されていない。いわば「漢字の常識」に強く依存した現実の運用がなされてきたと言えるが、常用漢字・人名用漢字の持つ均質性と対比したとき、表外字に内在する異質性が際立ってくる。国語審議会「表外漢字字体表」(2000年12月8日答申)は、「印刷標準字体」という概念を導入することによって、表外字に内在する異質性を整理しようとしたものと言える。この異質性は内なる「多言語問題」と言い換えることが出来る。人名・地名・組織名などの固有名、日本の古典文学・近代文学に用いられる「正典語」がその典型となろう。
どのような漢字がどのくらい使われているのか。漢字の種類とその種類ごとの使用頻度数を、時代や地域を越えて明らかにしたい。時代や地域を越えるのが無理なら、せめてある限定した範囲についてだけでも明らかにしたい。これは多くの人々の興味をひくテーマであったし、現在もそうである。興味をひくのは、一つは真理追求という学問的関心・知的好奇心によるものだが、もう一つは実際の役に立たせるためである。よく使う漢字とは、使用頻度の高い漢字のことであり、それは基本的な漢字であることを意味する。教育上、よく使う漢字から教えていくのは当然のことであろう。かつての活版印刷の文選において、よく使う漢字を、すぐに取れるようにしておくようにすることはその生産性と直接的に結びついていた。現在は、コンピュータを利用して印刷するのが普通となったが、事情は変わらない。そして、分野が異なれば、よく使う漢字は少しずつ違うわけだから、漢字使用頻度調査を行う理論的根拠はなくならないともいえる。
豊島正之(1999)が説くように、従来の漢字使用頻度調査では「暗黙の包摂」があった。たとえば「食へん」新旧の同一視、「殻」の一画増減などである。これを後からそれを復元することは困難である。紙メディアに用いられる漢字字体の標準は、「当用漢字表」(1946年11月16日、内閣告示・訓令)や「常用漢字表」(1981年10月1日、内閣告示・訓令)の影響下にあり、時代により相違がある。
たとえば「誘拐」の「拐」は、常用漢字で追加された文字である。追加される以前は、「拐」の旁の「刀」の部分は「力」に作る活字が普通であった。この二つを同じ漢字として数えるか、別の漢字として数えるかによって、使用頻度数は違ったものになる。これは無意識的に処理されることもあるだろうし、かなり意識的に処理されることもあるだろう。いずれにしても、何らかのバイアスがかかった調査結果となっていたことは否定できない。バイアスがかかることはやむを得ないが、それが隠され、純粋に客観的なデータであるかのように提示したり、受け止めたりすることが問題なのだ。
コンピュータの文字を制御するJIS漢字コードの例示字体は、第一次規格(1978年)から第三次規格(1990年)まで意識的・無意識的な変更が加えられている。第四次規格(1997年)は、明確化のために、追加・変更を一切行わなかった。
さて、JIS漢字の変更としてしばしば話題となるのは、第二次規格(1983年)における「意識的」変更である。変更点は、規格「改定」案作成の責任者である、野村雅昭がまとめた野村(1984)に詳しい。それよれば、変更点は、(1)非漢字の追加、(2)漢字の追加、(3)異体字の位置の変更、(4)印刷字形の変更の4点に及ぶ。(4)の詳細は不明であるが、野村論文に挙げる294字は、大体次のように分類できる。
次に無意識的な変更としては、第三次規格における平成明朝体開発に伴うものを挙げることができる。微妙な違いが多いが、Lunde(1995:382)は145字を例示している。
紙メディアの漢字にはその字体にゆれがあり、電子メディアの漢字にもその字体にゆれがある。両者のゆれが交差するところにおいて、微細なゆれは、時として大きなずれとなって立ち現れる。
この問題を正面から取り上げたのは、横山詔一ほか(1998)である。『朝日新聞』1993年一年分の記事を電子化したデータ(CD-HIASK’93)の解析を進めると同時に、実際の新聞紙面との照合を行い、電子メディアの文字データは、紙メディアの姿を忠実に反映していないこと、両者の照合により信頼度の高い漢字頻度表の作成に成功している。
この報告で「ねじれの漢字」と称するのは、横山ほか(1998)において「JIS漢字のネジレ部分」とされる漢字であり、上に一覧した(a)から(f)のうち、(d)異体字の位置に関するもの44字(22組)の漢字である。
JIS漢字第二次規格における非互換的な変更の影響するところは大きかったし、これについてはしばしば批判的に論及されてきた。ここでその批判を繰り返すつもりはない。非互換的な変更が施された漢字の使用実態を観察することによって、電子テキストの質を吟味するという方法をとってみたいと思う。この方法は、むろん、横山ほか(1998)に示唆されてのものであるが、我々の研究においては、紙メディアよりも電子メディアの方により重きを置いて考えてみたいと思う。すなわち、横山ほか(1998)では、紙メディアと電子メディアとを照合しているが、紙メディアが本当の使用実態(情報)であるという立場に立っている。その限りにおいて、電子メディアは紙メディアの情報がねじれ、歪められたものとして把握される。しかし、電子メディアにおける一見不統一な使用実態が、むしろ文字使用の自然な姿である可能性も存しているのではないか。そして、その自然な姿は、電子メディアの流通の拡大により失われ、統制されていくことが予想される。
辞典・事典(以下、辞事典)を取り上げる。その理由は、第一に、辞事典は他の電子テキスト資料に比べて、規範性がより強いと考えられるからである。第二に、CD-ROM版として刊行される辞事典は、書籍版として刊行されていたものがほとんどであり、電子テキストと照合できることが挙げられる。
調査にあたっては以下の資料を用いた。タイトル、出版社、刊行年を項目に掲げ、それぞれについて(a)対応OS、(b)データ形式、(c)検索ソフト、(d)収録内容、(e)その他の情報を摘記した。
以下、便宜上それぞれ「ジーニアス」、「広辞苑」、「ブックシェルフ」、「ニッポニカ」、「語彙大系」、「新英和・和英」、「マイペディア」、「新明解」と略記することとする。
検索する際には、各CD-ROMに付属のソフトを使用した。ここでは、その検索ソフトの検索方法を比較、概観してみる。
検索ソフトが検索する対象を各ソフトでは指定することができる。検索対象として、主なものとしては「全文検索」と「見出し語検索」がある。「全文検索」とは、CD-ROMに収録されている全テキストを対象として検索をかけるものであり、「見出し語検索」とは見出し部分を検索するものである。なお、「見出し語検索」とは、ViewIng95、ことといLight、DTONICの用語である。同様の検索機能を「ブックシェルフ」では「索引検索」、「マイペディア」では「項目名検索」と呼んでいる。
検索する文字列がどのように情報と一致するかを指定可能なものも、付属ソフトにはあった。一致タイプとして主なものは「完全一致」「前方一致」「後方一致」等がある。それぞれの意味は次のとおりである。
「マイペディア」は「前方一致」を「で始まる」と呼び、「後方一致」を「で終わる」と呼ぶ。
検索を行った際、検索ソフトによって用例の表示方法が異なっていた。見出し語検索の場合は(1)見出し語と説明(用例含む)を一括表示しているものと、(2)見出し語のみが表示されて、選択すると説明(用例含む)が表示されるものがあった。全文検索では、検索対象の語を含む見出し語が表示され、選択すると、用例を含む説明が表示されるものがあった。
以上の3つの観点から、各ソフトの検索方法を比較し以下の表1にまとめた。○は付属ソフトに用意さている機能。◎は実際に調査で使用した機能。×は用意されていなかった機能を示している。
辞事典 | 付属ソフト | 全文 検索 | 見出し 検索 | 前方 一致 | 後方 一致 | 部分 一致 | 完全 一致 |
---|---|---|---|---|---|---|---|
ジーニアス | ViewIng95 | × | ○ | ○ | ○ | × | × |
広辞苑 | ことといLight for windows | ○ | ○ | ○ | ○ | ○ | ○ |
ブックシェルフ | Quick Shelf (独自) | ◎ | ○ 索引 | × | × | ◎ | × |
ニッポニカ | 独自 | ○ | ◎ | ◎ | ◎ | × | × |
語彙大系 | ことといLight | ○ | ◎ | ○ | ○ | ◎ | ○ |
新英和・和英 | ViewIng95 | × | ◎ | ◎ | ○ | × | ○ |
マイペディア | 独自 | ○ | ◎ | ○ | ○ | ○ | ○ |
新明解 | DTONIC | × | ◎ | ◎ | ◎ | × | ◎ |
「広辞苑」「ジーニアス」「語彙大系」については、データ形式としてEPWINGという規格に準拠していた。このEPWINGとはどのような規格であろうか。
「アスキー・テジタル用語辞典」(http://www.ascii.co.jp/ghelp/09/000951.html)で検索して見ると次のように説明されている。
EPWING(いーぴーういんぐ)
電子出版物の共通フォーマットの1つ。「イー・ピー・ウィング」と読む。電子ブック(EB)がソニーを中心としてまとめられたのに対し、EPWINGは富士通を中心にまとめられた。EBは8cm CDを使用するのに対し、EPWINGでは12cm CDを使用する。ただしEBとEPWINGの基本的な構造は同じで、検索ソフトウェアなどには同じビューアを使うことができる。 EPWINGにはV1、V2、XA、STの4つの種類がある。このうちV1はEPWINGの基本検索機能を定義しており、モノクロ図版のほか、CD-DA の音声も再生できる。V2はV1に加え、カラー図版をサポートしている。XAはADPCMの圧縮音声をサポートする。STはストリームの略で、これまでの電子出版物とは少々趣が異なり、カラー画像の表示と音声の連続再生をサポートする。
EPWINGコンソーシアム(http://www.epwing.or.jp/epwing/epwing2/index.html)のページによれば、その規約は次のように規定される。
EPWING規約は、電子出版物を従来の書籍と同様に一般に広めるために、機種間の互換を実現することを目的としている。電子機器上で書籍データが、従来の書籍と同様に見ることができるのは勿論、電子出版物の優位点である「探すこと」が簡単に即座にできるようなCD-ROMデータ記録形式を規定している。
この規格に準拠したCD-ROMを共通で検索できるソフトが提供されている。その中でも代表的なものとして、Ddwin Ver2.57(2000.9.17、フリーソフト、草本和馬)がある。これは、インターネット上でフリーソフトとして一般に提供されているもので、EPWING規格に準拠したCD-ROMを検索することができる。また、一度に「串刺し検索」などを行うことも可能であるため、今後の調査で使用してもよいだろう。
見出し語を対象としてねじれの漢字を検索し、用例を集計することとした。調査結果は表2のとおりである。集計の都合で次の5資料の数値を示してある。
「広辞苑」「ブックシェルフ」「マイペディア」の3資料は、以下に述べる理由により用例数を集計しなかった。
「広辞苑」の検索ソフトは、ねじれの漢字について第一水準と第二水準とを区別しない。たとえば、「鴬」で検索しても「鶯」の検索結果もヒットしてしまう。作業量を勘案して今回は除外した。
「ブックシェルフ」は、多数の辞典を収録しているため、それらすべての単語を数えるのでヒット件数がかなりの数に上るが、重複が多い。質の異なる資料を区別しないことにもなるので、今回は除外した。
「マイペディア」は、見出し語検索の使い勝手がよくなかったのと、関連項目まで一挙に表示してしまい、それらの区別が容易でない。今回は除外することとした。
一水 | (1) | (2) | (3) | (4) | (5) | 小計 | 二水 | (1) | (2) | (3) | (4) | (5) | 小計 | |
1 | 鯵 | 10 | 0 | 0 | 1 | 0 | 11 | 鰺 | 2 | 2 | 3 | 0 | 11 | 18 |
2 | 鴬 | 28 | 0 | 0 | 0 | 0 | 28 | 鶯 | 0 | 4 | 9 | 1 | 62 | 76 |
3 | 蛎 | 18 | 0 | 0 | 1 | 1 | 20 | 蠣 | 2 | 0 | 3 | 0 | 18 | 23 |
4 | 撹 | 4 | 0 | 0 | 5 | 0 | 9 | 攪 | 0 | 3 | 4 | 0 | 13 | 20 |
5 | 竃 | 26 | 0 | 0 | 0 | 0 | 26 | 竈 | 0 | 2 | 6 | 0 | 57 | 65 |
6 | 潅 | 13 | 0 | 0 | 4 | 0 | 17 | 灌 | 1 | 6 | 8 | 1 | 30 | 46 |
7 | 諌 | 20 | 0 | 0 | 4 | 0 | 24 | 諫 | 1 | 3 | 10 | 0 | 23 | 37 |
8 | 頚 | 19 | 0 | 0 | 6 | 0 | 25 | 頸 | 5 | 5 | 8 | 0 | 67 | 85 |
9 | 砿 | 4 | 0 | 0 | 0 | 0 | 4 | 礦 | 30 | 0 | 4 | 0 | 4 | 38 |
10 | 蕊 | 18 | 0 | 6 | 3 | 4 | 31 | 蘂 | 3 | 2 | 1 | 1 | 3 | 10 |
11 | 靭 | 13 | 3 | 3 | 1 | 1 | 21 | 靱 | 0 | 3 | 0 | 0 | 15 | 18 |
12 | 賎 | 0 | 1 | 0 | 1 | 0 | 2 | 賤 | 16 | 2 | 7 | 2 | 56 | 83 |
13 | 壷 | 51 | 0 | 0 | 2 | 0 | 53 | 壺 | 1 | 3 | 24 | 2 | 91 | 121 |
14 | 砺 | 7 | 0 | 0 | 0 | 1 | 8 | 礪 | 8 | 0 | 0 | 0 | 4 | 12 |
15 | 梼 | 9 | 0 | 0 | 0 | 0 | 9 | 檮 | 1 | 0 | 0 | 0 | 1 | 2 |
16 | 涛 | 6 | 0 | 0 | 1 | 1 | 8 | 濤 | 7 | 0 | 4 | 0 | 56 | 67 |
17 | 迩 | 8 | 0 | 0 | 0 | 0 | 8 | 邇 | 3 | 0 | 0 | 0 | 3 | 6 |
18 | 蝿 | 16 | 3 | 0 | 5 | 0 | 24 | 蠅 | 0 | 0 | 12 | 0 | 98 | 110 |
19 | 桧 | 54 | 0 | 0 | 0 | 1 | 55 | 檜 | 110 | 3 | 6 | 3 | 27 | 149 |
20 | 侭 | 19 | 0 | 0 | 0 | 0 | 19 | 儘 | 0 | 0 | 11 | 0 | 3 | 14 |
21 | 薮 | 66 | 3 | 0 | 0 | 0 | 69 | 藪 | 89 | 11 | 15 | 9 | 80 | 204 |
22 | 篭 | 157 | 0 | 0 | 4 | 1 | 162 | 籠 | 101 | 7 | 48 | 14 | 114 | 284 |
合計 | 566 | 10 | 9 | 38 | 10 | 633 | 380 | 946 | 183 | 33 | 836 | 2,378 |
表2の結果から判明するように、ねじれの漢字22組のすべてが5資料に出現するわけではない。たとえば、1「鯵」「鰺」の組について見ると、「鯵」は(1)「語彙大系」と(4)「ジーニアス」の2資料に出現し、「鰺」は(1)「語彙大系」、(2)「新英和・和英」、(3)「新明解」、(5)「ニッポニカ」の4資料に出現する。この例のように、組となる漢字のいずれかが5資料に共通して出現するのであれば、その傾向性を考察することにも意味があるといえるだろう。しかし、たとえば、15「梼」「檮」の組は、「梼」が(1)「語彙大系」に、「檮」が(5)「ニッポニカ」に出現するが、(2)「新英和・和英」、(3)「新明解」、及び(4)「ジーニアス」にはいずれも出現しない。こうした例に基づいて傾向性を考えるのは無理があろう。そこで、「鯵」「鰺」のように、5資料に共通して出現するねじれの漢字を検討対象とすることにする。検討対象となるのは、22組のうち14組である。整理しなおしたのが次ページの表3である。資料名は表2と同じく(1)〜(5)で示す。さらに、●○▼▽=により、第一水準・第二水準のどちらに対応するのか、またその多寡はどうなっているかを示すこととした。記号の意味は次のとおりである。
鯵 | 鰺 | 頚 | 頸 | 蝿 | 蠅 | ||||||||
(1) | 10 | 2 | ▼ | (1) | 19 | 5 | ▼ | (1) | 16 | 0 | ● | ||
(2) | 0 | 2 | ○ | (2) | 0 | 5 | ○ | (2) | 3 | 0 | ● | ||
(3) | 0 | 3 | ○ | (3) | 0 | 8 | ○ | (3) | 0 | 12 | ○ | ||
(4) | 1 | 0 | ● | (4) | 6 | 0 | ● | (4) | 5 | 0 | ● | ||
(5) | 0 | 11 | ○ | (5) | 0 | 67 | ○ | (5) | 0 | 98 | ○ | ||
鴬 | 鶯 | 蕊 | 蘂 | 桧 | 檜 | ||||||||
(1) | 28 | 0 | ● | (1) | 18 | 3 | ▼ | (1) | 54 | 110 | ▽ | ||
(2) | 0 | 4 | ○ | (2) | 0 | 2 | ○ | (2) | 0 | 3 | ○ | ||
(3) | 0 | 9 | ○ | (3) | 6 | 1 | ▼ | (3) | 0 | 6 | ○ | ||
(4) | 0 | 1 | ○ | (4) | 3 | 1 | ▼ | (4) | 0 | 3 | ○ | ||
(5) | 0 | 62 | ○ | (5) | 4 | 3 | ▼ | (5) | 1 | 27 | ▽ | ||
撹 | 攪 | 靭 | 靱 | 薮 | 藪 | ||||||||
(1) | 4 | 0 | ● | (1) | 13 | 0 | ● | (1) | 66 | 89 | ▽ | ||
(2) | 0 | 3 | ○ | (2) | 3 | 3 | = | (2) | 3 | 11 | ▽ | ||
(3) | 0 | 4 | ○ | (3) | 3 | 0 | ● | (3) | 0 | 15 | ○ | ||
(4) | 5 | 0 | ● | (4) | 1 | 0 | ● | (4) | 0 | 9 | ○ | ||
(5) | 0 | 13 | ○ | (5) | 1 | 15 | ▽ | (5) | 0 | 80 | ○ | ||
潅 | 灌 | 賎 | 賤 | 篭 | 籠 | ||||||||
(1) | 13 | 1 | ▼ | (1) | 0 | 16 | ○ | (1) | 157 | 101 | ▼ | ||
(2) | 0 | 6 | ○ | (2) | 1 | 2 | ▽ | (2) | 0 | 7 | ○ | ||
(3) | 0 | 8 | ○ | (3) | 0 | 7 | ○ | (3) | 0 | 48 | ○ | ||
(4) | 4 | 1 | ▼ | (4) | 1 | 2 | ▽ | (4) | 4 | 14 | ▽ | ||
(5) | 0 | 30 | ○ | (5) | 0 | 56 | ○ | (5) | 1 | 114 | ▽ | ||
諌 | 諫 | 壷 | 壺 | ||||||||||
(1) | 20 | 1 | ▼ | (1) | 51 | 1 | ▼ | ||||||
(2) | 0 | 3 | ○ | (2) | 0 | 3 | ○ | ||||||
(3) | 0 | 10 | ○ | (3) | 0 | 24 | ○ | ||||||
(4) | 4 | 0 | ● | (4) | 2 | 2 | = | ||||||
(5) | 0 | 23 | ○ | (5) | 0 | 91 | ○ |
表3を一覧すると、白黒の出現が漢字により異なっているように見える。たとえば「薮」「藪」の組は▽と○しか出てこない、つまり第二水準字がどの資料にも多い。一方「蕊」「蘂」の組は、▼が4資料なのに○は1資料しかない。つまり第一水準字を使う資料が多い。そこで出現の偏りを見るために、●と○を1点、▼、▽、及び=を0.5点と計算して、第一水準字と第二水準字との比をとってみた。結果は表4の通りである。便宜上、用例が3例以上と1〜2例とを区別した。配列はおおよそ第二水準の優勢な漢字から第一水準の優勢な漢字へとした。
3例以上 | 1〜2例 | |
蕊蘂 | 2:00 | 0:01 |
靭靱 | 2.5:1 | 0:01 |
賎賤 | 0:04 | |
桧檜 | 0:04 | |
薮藪 | 0:04 | |
鯵鰺 | 0.5:2 | 1:01 |
鴬鶯 | 1:03 | 0:01 |
潅灌 | 1:03 | |
諌諫 | 1.5:3 | |
頚頸 | 1.5:3 | |
壷壺 | 01:03.5 | |
篭籠 | 0.5:3 | |
蝿蠅 | 3:02 | |
撹攪 | 2:03 | |
表4によると、おおよそ3グループに分けることができそうである。漢字は組で示し、該当する例に下線を施した。
表3の5資料に出現する漢字以外の例は、表5、表6、及び表7にまとめたので参照されたい。偏りの分析は省略する。
蛎 | 蠣 | 竃 | 竈 | 涛 | 濤 | ||||||
(1) | 18 | 2 | ▼ | (1) | 26 | 0 | ● | (1) | 6 | 7 | ▽ |
(2) | 0 | 0 | (2) | 0 | 2 | ○ | (2) | 0 | 0 | ||
(3) | 0 | 3 | ○ | (3) | 0 | 6 | ○ | (3) | 0 | 4 | ○ |
(4) | 1 | 0 | ● | (4) | 0 | 0 | (4) | 1 | 0 | ● | |
(5) | 1 | 18 | ▽ | (5) | 0 | 57 | ○ | (5) | 1 | 56 | ▽ |
砿 | 礦 | 侭 | 儘 | ||||
(1) | 4 | 30 | ▽ | (1) | 19 | 0 | ● |
(2) | 0 | 0 | (2) | 0 | 0 | ||
(3) | 0 | 4 | ○ | (3) | 0 | 11 | ○ |
(4) | 0 | 0 | (4) | 0 | 0 | ||
(5) | 0 | 4 | ○ | (5) | 0 | 3 | ○ |
砺 | 礪 | 梼 | 檮 | 迩 | 邇 | ||||||
(1) | 7 | 8 | ▽ | (1) | 9 | 1 | ▼ | (1) | 8 | 3 | ▼ |
(2) | 0 | 0 | (2) | 0 | 0 | (2) | 0 | 0 | |||
(3) | 0 | 0 | (3) | 0 | 0 | (3) | 0 | 0 | |||
(4) | 0 | 0 | (4) | 0 | 0 | (4) | 0 | 0 | |||
(5) | 1 | 4 | ▽ | (5) | 0 | 1 | ○ | (5) | 0 | 3 | ○ |
次に表8に用例を一覧するが、紙幅の関係もあり、(1)「語彙大系」、(2)「新英和・和英」、(3)「新明解」の例を示す。表8は末尾に附載した。
ねじれの漢字の出現状況を、比較的規範性が高いと考えられるCD-ROM版の電子辞書を中心に調査してみた。どのような資料を選択するか、どのような項目を調査対象とするか、どのような検索方法を用いるか、といった方法的な検討に時間を割かれてしまい、対象とした資料のすべてについて相互に比較しうるだけのデータを作ることができなかった。それでも第一水準の漢字が、予想した以上に多く使われていることを確認できた。表5の合計で示せば、5資料中のねじれの漢字の出現数は、第一水準字が633字、第二水準字が2378字である。第一水準字が四分の一、第二水準字が四分の三を占める。
ねじれの漢字の第一水準字には、「略字」「簡易字体」が多いが、どのような理由によってそれらが使用されたのであろうか。いくつかの理由が想定され、実際には、それらが複合しているものと考えられる。
ねじれの漢字は、1983年の第二次規格の改正に起因するものだが、それ以前からデータの入力を行っていた、あるいは、1978年の第一次規格の漢字を基本的に搭載したコンピュータでデータ入力を行っていたといった事情により、当初の意図に反して第一水準字が多く出現することになったということが考えられる。
また、コンピュータの仮名漢字変換システム(IME)の利用において、第一水準字が先に出るため一定の頻度が出てきたということもあるかもしれない。
さらに、より本質的な問題としては、第一水準字のような「略字」でも差し支えないとする意識があったことが考えられるだろう。いわば「暗黙の包摂」があったのだということである。こうした「暗黙の包摂」は規範性の強い資料においては排除すべきである、とするのも一つの考え方であろう。しかし、現実の漢字字体の認識は、ねじれの漢字をねじれと意識しない程度のものをも含んでいるのだと考えることもできるであろう。後者の線で考えて、出現の頻度やその意識の程度を見る方が研究としては面白い。
今後、調査対象の拡大と、調査方法の洗練とともに、こうした点について考察していきたい。