古文書のテキスト文書化

【古文書倶楽部2016-10】
2、古文書のテキスト文書化

古文書の画像ファイルが増えてゆくと、同時に、読み解いた文書ファイルも増えてゆくことになる。

文書ファイルの形式は、テキストファイル、または馴染んだワープロ文書ということになるだろう。テキストファイルは、MS-DOS時代からのシフトJIS形式でよい。

現在はパソコンで数万の漢字の使用も不可能ではないが、かな漢字変換で気軽に扱えるわけではない。かな漢字変換のことを考えると、シフトJISで定められた文字と記号のみを使うことになる。

漢字については、原則として、「本字」ではなく、現代の略字体を使う。古文書に書かれた漢字も、略字に置き換えることになる。
個人の趣味により、例外は設けられる。証文ではなく證文。武芸ではなく武藝、など。元号の慶應だけは書きたいとか、シフトJISでは、横の本字はないが、濱ならあり、1つだけでも使いたい、など。こういう例外を除けば、昭和後半以後の市町村史資料編の類では本字が(全体に)使われたものはまだ見たことがない。
「候」は、「ゝ」「イト」どう書かれてあっても「候」。
漢数字の壱・弐等は、一・二等にすれば即座に暗算で計算できて内容を把握しやすい場合には、そうするのが良い。字形にばかり忠実で、金額の高い低いの評価もわからないのでは、あまり頭を使ったことにはなるまい。
文書ファイルは他のパソコン等で表示させても同じ文字が表示されなければならず、機種依存文字は使用しない。

変体仮名、万葉仮名は、すべて「ひらがな」で。
助詞の「へ」にあたる「江」は、「え」ではなく「へ」。「より」を1字に書いたようなのも「より」の2字。
そのほかの仮名遣は、原則は、原文通り。近世文学研究者のなかには、正統な歴史的仮名遣に直してしまう人もあるが、村の文書では文学的なものは少ない。俳句や和歌などは直しても良いかもしれない。

句読点、引用符「」、書籍名『』などの記号の付加は、個人の趣味の問題。並列表記の「・」の付加はあまり感心しない。

日本の筆書き文書は、句読点がなくとも、あまり読みづらくもないのは、文字の微妙な大小を使い分けたり、微妙に文字の間隔を調整しながら書くなどするためである。したがって、空白の適宜な挿入は、重要なことだと思う。

判読不明文字を表す記号。
印刷本などでは「□」がよく流用されたが、パソコンの画面上では、口(くち)やロ(ろ)と区別しにくく、この「□」の記号は本来は、○や▲と同じ箇条書や数字文字などの頭に付ける記号なので、目的に沿った使い方ではない。
某大学のHPで近世文学関連のページを見たら、教授ごとに自由な記号を使っていたが、統一しなくともそれとなくわかるものである。ある研究者は「★」が目立つので良いという。虫食などで不明文字が連続する場合は、・・・・・・・・・・・・・・・・・とすれば入力も1秒以内で済むので良いと思う。確定できない字を{ }で括っておいても良い。後で修正を加える必要があるので、本人がすぐに探せないと具合が悪い。
ちなみに記号の○と、漢数字の〇は、後の検索のためにもきっちり区別したほうが良い。

画像ファイルとの関連づけのしかたなどについては、別に書く。
comments (0) | trackbacks (0) | 編集

Comments

Comment Form

icons:

Trackbacks