わかりやすいXMLとは

今回の記事について

XMLの具体的な例を挙げながら、本当にわかりやすいXML文書とは何かを考えていきます。

一般的なXMLアプリケーション

ほとんどの規格が階層構造を用いて、いかに優雅に、シンプルに、効率よくXMLを書けるかに力を注いでいます。そこで、例を挙げてみましょう。

優雅な例
<element name="x">
 <attribute name="y">
   <text/>
 </attribute>
 <attribute name="z">
   <text/>
 </attribute>
</element>

ちょっと、一般人にはとっつきにくく感じます。スキーマを理解できる人でも、果たして、書きやすいと感じるでしょうか。

上記の例を自然言語に置き換えてみる

まず、上記の例を自然言語に置き換えてみましょう。

ひとつの要素を定義する。要素名は「x」。さらに、その要素には、
「y」という属性があり、その内容は、テキスト。「z」という属性も同様に、
内容にテキストがある。

これにマークアップしてみましょう。

<element>
ひとつの要素を定義する。要素名は「<name>x</name>」。さらに、その要素には、
<attribute>「<name>y</name>」という属性があり、
その内容は、<text>テキスト</text>。</attribute>
<attribute>「<name>z</name>」という属性も同様に、
内容に<text>テキスト</text>がある。</attribute>
</element>

例は文書にタグを付け加えたのみ

この例の利点は、自然言語の内容を書き換えずに、スキーマを表現している点です。機械はスキーマとして処理できるかもしれません。また、電子文書として処理できます。
私がやったのは、文章にタグを付け加えてやっただけで、どこも削除していませんし、タグ以外の記述を一切、追加していません。
文章の区切りの始まりと終わりに、タグをつけているだけです。

マークアップ言語の理解しやすさ

よくマークアップ言語は、人間に理解しやすい言語だといわれますが、その理解しやすさとは、マークアップ言語特有の表現を指しているのではないと私は考えています。「文章の始まりと終わりに、タグを付ける」という作業の単純さを指しているのです。