SSブログ

校訂テキストを作るためのXML [XML]

 文献研究を支援するために、単純なテキスト入力ではなく、校訂テキストを作成することを支援するようなツールがあると便利だ。

 最低限必要となるのは、本文と校注と行ページ番号と章節番号や見出しなどの校訂者が入力するテキスト部分の区別、そしてテキスト全体としては、文献の書誌情報、凡例、などの区別である。

 これらをそれぞれXMLの要素にする。表示はブラウザーを使用するが、単に表示だけではなく、入力もできるようにする。そのためには、テキスト全体を一ページに表示することはできないので、ある程度分割して表示することになる。そのためにも、章・節の区切りは必要であり、あるいは、場合によっては段落なども必要かも知れない。

 表示はXSLTとCSSを使って見やすくすると同時に、生のXMLでも表示が可能なようにする。入力は生のXMLとして書くようにする。そのため、XML自体も、出来る限り単純化して、文系でも容易に入力できるように工夫する。

 表示するときに、特に校注などを別の部分、たとえば、段落の後に注記の形で表示するようにする。これはXSLTを使えば簡単にできそうである。

 一方、テキスト自体は、全体を一つのテキストとして保存しておくようにする。表示するときには、それを動的に複数ページに分割して表示する。一方、編集したあとは、再び、複数ページを一つのテキストに合成して保存する。このように動的にページ分割とページ合成を行うために、テキストを分割する単位を決める必要がある。基本的には、章・節の区切りを切り分ける境界線と考える。したがって、章・節の要素は必須であり、そかも書き方も一定の規則に従ったものにする。

 検索機能も必要である。このためには、XMLで書かれたテキストを読み込んで、本文テキスト部分のみを検索対象にする必要がある。これらの処理はPerlかPHPのXML処理機能を使用して実現する。

 具体的には、まだ何も作られてはいないが、一応現在考えられる問題点や作り方の見通しは、以上のようなものである。


nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:パソコン・インターネット

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。