XMLについて | DH入門編その3
XMLとはデータベースにも使われる言語で、ウェブサイトの記述法の一つです。以下のウィキペディアには詳しく書かれていますが、初心者向けとは言えません。
以前は「楽しいXML」という素晴らしいサイトがとても使い勝手よく、私もよく見ていたのですが、今は文字コードがShift-JISになっていて、エンコードが面倒になり、見ていません。(ああ、早くUTF-8で読めるようになりますように!)
今となっては英語版ですが、以下のサイトを使うのが一番手っ取り早そうです。
XMLを使うと、文章に意味を持たせることができます。上記サイトにある例から言うと、以下のようなデータベースを書くことができます。
<?xml version="1.0" encoding="UTF-8"?>
<breakfast_menu>
<food>
<name>Belgian Waffles</name>
<price>$5.95</price>
<description>
Two of our famous Belgian Waffles with plenty of real maple syrup
</description>
<calories>650</calories>
</food>
<food>
<name>Strawberry Belgian Waffles</name>
<price>$7.95</price>
<description>
Light Belgian waffles covered with strawberries and whipped cream
</description>
<calories>900</calories>
</food>
<food>
<name>Berry-Berry Belgian Waffles</name>
<price>$8.95</price>
<description>
Belgian waffles covered with assorted fresh berries and whipped cream
</description>
<calories>900</calories>
</food>
<food>
<name>French Toast</name>
<price>$4.50</price>
<description>
Thick slices made from our homemade sourdough bread
</description>
<calories>600</calories>
</food>
<food>
<name>Homestyle Breakfast</name>
<price>$6.95</price>
<description>
Two eggs, bacon or sausage, toast, and our ever-popular hash browns
</description>
<calories>950</calories>
</food>
</breakfast_menu>
ここから、priceが8ドル以上のもの、Caroriesが700以上のもの、などを抽出することができます。
デジタル・ヒューマニティーズではこの機能を使って、文字列に意味を持たせています。
例えば、東京大学は聖徳太子御製『勝鬘經義疏』をXMLで公開しています。
https://21dzk.l.u-tokyo.ac.jp/SAT/sat_tei/2185.xml
これだけ読むと何のことかわかりませんが、XSLTというファイルで読みやすいように変換すると、読めるようになります。ただし、以下のページにも書かれてある通り、「多くの方にとっては、このままでは利用することは困難であると思いますのでご注意ください。」とのことです。
XMLは便利なのですが、ブラウザで読み込む方法は統一化されていません。しかし上記のXMLがあるだけでも事情は全然違い、ローカル環境でXSLTファイルを作ることで自分の設定した条件でデータベースから必要なデータを抽出することができます。