漢態射 Han Morphism Systemについて ▲▼

    1. 目的

    漢字による古典文献の電子テクストを構築するために、色々な技術を利用することができます。 その転写にあたっても様々な可能性がありますが、 ここでは導入の容易さから、文字コードで漢字を表現することを前提にして、 データベースシステムを構築します。 将来的に文字コード以外の技術を利用するとしても、 ここでの経験、知識は十分にいかすことができるでしょう。

    本データベースの目的は漢字を文字コードによって転写する際に、 何如に漢字についての情報を提供するかを模索することにあります。 そのため複数の古辞書を如何に連携するかを考慮する必要があります。 本データベースはそのための第一着手であります。 今後、様々な改良を経て、 漢字情報を提供する理想的なシステムを提供できるように努力してまいります。

    2. 特徴

    本システムは文献[1]において提出した発想をもとに、その基本的なモデルを構築しました。 それは文字を記述する形式的な言語のもとで、 個々の文字体系の間の写像を完全に情報化するというものでした。 この発想が本システムの名称「漢態射 Han Morphism System」になっています。 但し、残念ながらその発想の一部しか利用できていません。

    現在のシステムは文献「説文解字」「段注」「廣韻」「漢語大字典」に含まれる文字(文字体系)を関連付けている情報を検索、表示することができます。 各々の文字は文献構造と関係していると同時に、文字体系としての構造を持っています。 現在、取り扱っている文字体系に関する構造及び文献構造は以下です。

    1. 「説文解字」 : 説文部首(540)、反切
    2. 「段注」 : 説文部首(540)、古音17部、諧聲符;巻、上海古籍影印本の頁
    3. 「廣韻」 : 韻目(206)、小韻(3874);巻、葉、裏表、行、行内番号
    4. 「漢語大字典」 : 頁、頁内番号

    3. 使用法

    現在のシステムは大きく分けて、 以下の7つの部分から漢字情報にアプローチすることができます。

    1. 「主画面(HOME)」
    2. 「説文解字(大徐本)」
    3. 「説文解字注」(段注)
    4. 「宋本廣韻」
    5. 「十七部表」
    6. 「諧聲表」
    7. 「漢語大字典」

    「主画面」は本システムで提供する漢字情報を表示します。 「主画面」からは漢字を入力して検索できるほか、 その他の画面からはそれぞれの情報構造に従って、漢字を探すことができます。 画面を見れば、どのような情報構造が表示されているか明らかなので、 詳しい解説はいらないでしょう。

    4. 注意事項

    本システムは第一着手である故に、当初の構想を部分的にしか実現できていません。 実験のためのプロトタイプであるために、 インターフェイスやエラー処理には気を配っていない部分もあります。 その点にもご配慮願いたいと思います。また、以下のような制限事項にも注意下さい。

    • 『説文解字』の篆文には小篆フォントswfont.ttfを使用しています。 篆文の右下にUnicodeの対応する文字が括弧で示されていますが、 小篆フォントをインストールして下さい。
    • 『廣韻』の親字は本文をデータ化したものと、Unihanでの参照にずれがあります。 そのため、位置情報が表示されていても、韻目、小韻、注が表示されない場合があります。 また、その逆もあり得ます。今後、これらの擦り合せが必要です。
    • 現在、『説文解字』のデータを構築中なので不備があります。特に重文は含まれていません。

    参考文献

    1. 白須裕之「文字の指示概念に関する試論」, 情報処理学会「人文科学とコンピュータシンポジウム」論文集, 2008.
    2. 許慎撰, 徐鉉校定「説文解字」, 中華書局, 1963.
    3. 段玉裁「説文解字注」, 上海古籍出版社, 1981.
    4. 周祖謨校訂「校正宋本廣韻」(澤存堂複製), 藝文印書館, 1998.
    5. J.H.Jenkins, R.Cook: Unicode Han Database, Uncode Standard Annex 38, 2010.
    6. Unihan Database Lookup

謝辞

本システムのVer.0.3.1までの実装は、 一般財団法人 人文情報学研究所 人文情報学部門における人文情報学基盤構築プロジェクトの一環として作成されました。 ここに記して感謝申し上げます。

日頃から『説文解字注』についてご教示下さる「点注会」の皆さま、 特に古勝隆一先生には多くの教えを頂いております。

本データベースで使用している 多くを「漢字データベース」に依っています。

ライセンス

本システムで使用している『廣韻』、『段注』のデータは、 「漢字データベース」に依っています。 そのデータ配布のライセンスはGPLであり、本システムもこれに準拠致します。

現在、配布方法を検討しておりますが、 興味のある方は「問い合わせ先」までお願い致します。

問い合わせ先

古辞書のUnicodeテクストを提供できる方、 本システムとの連携を考えてみませんか。 どうかご検討下さい。

その他、改善点・お気付きの点など、ご教示頂ければ幸いです。 以下のメールアドレスまでお願い致します。

   白須裕之
   hanmorphism @ gmail.com