動画のネイティブサポートに向けたMozillaの取り組み
Firefoxに間もなく搭載される新機能に、ビデオとオーディオのネイティブ・サポートがある。VorbisとTheoraというフリーのコーデックによるものだ。これを機にMozillaは、目や耳が不自由なユーザ向けのマルチメディア・アクセシビリティ機能を充実させる意向だ。Ogg VorbisとTheoraは、HTML 5で新たに採用されるvideoタグとaudioタグの公式なベースライン・コーデックとはなっていないが、Mozillaの実装ではこれらのコーデックが採用された。現在、Mozilla Foundationの資金援助により、クローズド・キャプションなどのマルチメディア・アクセシビリティ機能をOggのフォーマットおよびFirefoxでの実装に組み込むための取り組みが、調査員のSilvia Pfeiffer氏を中心として進められている。
Pfeiffer氏は、マルチメディア・アクセシビリティの分野で10年以上のキャリアを誇り、Xiph.orgのコミュニティでも長期にわたって活躍してきた。ビデオ・アクセシビリティへの取り組みに関しては、オープンなメーリングリストを立ち上げ、wikiの公開とあわせて、コミュニティからの幅広い参加を促そうとしている。この取り組みには大勢の参加が欠かせない。なぜなら、ここで行う決定は、複数の組織や団体に受け入れられるものでなくてはならないからだ。具体的には、Mozilla、Xiph.org、World Wide Web Consortium(W3C)、Web Hypertext Application Technology Working Group(WHATWG)、Opera Softwareといった組織である。OperaのWebブラウザでも、videoタグとaudioタグでOggがサポートされる予定だ。
アクセシビリティはすべてのユーザに関係
アクセシビリティ機能の中で特に広く議論されているのは、耳が不自由な人向けのクローズド・キャプションのトラックだが、ほかにも様々な機能が対象となる。音声注釈や手話のトラックなど、障害のあるユーザに役立つ機能に加え、音声のテキスト化、代替言語、埋め込みメタデータなどのトラックは、すべてのユーザに広く役立つ可能性がある。
障害を持つユーザにとってのマルチメディア・アクセシビリティ機能の価値は言うまでもない。だが、時と場合によっては、それ以外のユーザも、目や耳が不自由なユーザと似た状況に置かれることがある。たとえば、周りが騒がしいときには、動画の内容を理解するためにクローズド・キャプションが必要になるし、モバイル・デバイスでは、必ずしも画面を注視できないことがあり、音声注釈が必要となる。さらに、マルチメディア・ファイルの音声のテキスト化機能は特に重要度が高そうだ。これがあれば、HTMLに加え、動画や音声のインデックス化と検索を実現できる可能性が広がる。
また、動画の中の特定の時点に移動する方法があれば、目が不自由なユーザが再生ツールの時間スライダをうまくドラッグできない場合に役立つ。さらには、動画の先頭に限らず、任意の時点に対して、ハイパーリンクを張ることが可能となる。W3CのMedia Fragmentsワーキング・グループでは、まさにそうした時間指定の方法について検討が進められている。
Ogg用のタイミング付きテキスト
Pfeiffer氏によると、アクセシビリティ機能に対するMozillaの取り組みの第一歩は、Oggコンテナに適したキャプション・フォーマットの選出だという。Continuous Media Markup Language(CMML)、TimedText、VOBSubなど、選択肢はたくさんあり、それぞれ複雑さや技術面の詳細が異なる。Oggのような複数トラック対応のメディア・フォーマットへの埋め込み用として考案されたCMMLのようなフォーマットもあれば、他のジャンルや目的のために考案されたフォーマットもある。DVDの字幕用として考案されたSubRupや、カラオケ用に考案されたKateなどだ。
これらすべてのフォーマットに共通するのは、所定のタイミングで表示するためのテキストのトラックを組み込める点だ。既存の動画や音声のトラックとテキストとを多重化し、1つのコンテナ・ファイルにカプセル化することで、動画や音声のデータと同期したテキストを表示できる。あとは、複数のテキスト・トラックや複数言語、散発的なグラフィックの挿入(たとえば再生中の音楽を示すアイコンなど)に対応しているかどうかに基づいて、難しい選択をすることになる。
Pfieffer氏は現在、さまざまなキャプション・フォーマットの中からOgg用に推薦するフォーマットを選ぶための準備として、最新技術をリストアップする作業を進めている。「Xiph、Opera、Mozillaに関しては、何ら問題が生じるとは考えておらず、その点は幸いに思っています。現時点では技術面に的を絞って検討を進めたいと考えており、政治的な問題に直面する前に、技術的に最適な選択をしたいのです」と同氏は話す。
W3Cに関しては多少難航するかもしれないという。HTML 5へのVorbisとTheoraの採用がうまくいかなかった点をふまえてのことだ。それでも、先行きに関しては今でも楽観していると同氏は話す。「我々がきちんと務めを果たし、フォーマットを選んだ理由が技術的に明白であれば、政治的な議論は、結局のところ小さなものになると思います」。
Firefoxでの実装
だが、同氏のチームの作業は、キャプション・フォーマットさえ決まれば終わりではない。その先も長い道のりが待っている。フォーマットを決める以上に難題となるのが、Firefoxへのユーザ・インタフェースの実装だ。videoタグとaudioタグで直接表示されるのはOggコンテナだけだが、タイミング付きテキストなどのアクセシビリティ機能を有効にしたり操作したりするためのインタフェースは、スクリーン・リーダや点字ディスプレイなど、Webページやオペレーティング・システムのレベルのアクセシビリティ・フレームワークと統合する必要がある。理想的なのは、1つのソリューションですべてのプラットフォームに対応し、他の埋め込みメディア・タイプにも拡張していけるという状況だ。GStreamerやQuickTimeなど、外部のバック・エンドに依存する埋め込みメディア・タイプにも対応できるとよい。
wikiのドラフト案で示されているのは、求められる機能のうちで特に重要なサブセットを選び出してまず対応し、残りはその後順次対応していくという方式だ。また、オープンなライセンスのドキュメンテーションとテスト・ケースを一通り用意し、オーサリング・ソフトウェアやコンテンツの開発者に利用してもらうことも提案されている。再生用エンジンがキャプションや音声注釈に対応していても、オーサリング・ツールやコンテンツのホスティング・サイトがそうした手法を受け入れなかったり、複雑すぎて実装できなかったりしたら、ほとんど意味がなくなってしまうからだ。
現在のWebではメディア・アクセシビリティ機能が特別なものとなっており、当たり前の存在にはなっていないとPfeiffer氏は話す。「可能性があるのはFlash動画です。アクセシビリティ機能はあまり広く実装されておらず、実装方法もそれぞれに異なるため、互換性に欠けています」。同氏は、YouTubeに最近追加された字幕機能や、Easy YouTubeなどの実験的なプレーヤー、Jeroen Wijering氏のFLV Media Playerなどの独立系プロジェクトについて言及した。
Web動画という現象自体、まだ誕生から日が浅く、Webに与える影響の全体像についても、ほんのさわり程度しかわかっていないと同氏は指摘する。「我々は現在、Web動画のアクセシビリティを高める方法を探っている段階です。この後に標準の確立が始まります。今後数年のうちには、動画の分野における標準が、オンライン・サービスの標準にもなっていると思います」。
キャプションなど、Oggのアクセシビリティ機能をMozillaが実装したからといって、状況が大きく変わるかどうかは意見が分かれるところだ。Pfeiffer氏によると、最大の障害は、プロプライエタリなブラウザがOggフォーマット自体に対して潜在的な抵抗感を感じている点だという。「Oggを実装したブラウザが登場したからといって、他のブラウザの開発元が追随するとは思えません。現時点でOggをサポートしているブラウザはOpera(実験ブランチ)とMozilla(次期リリース)の2つです。残りのブラウザ、特にIEとSafariについては、簡単にはOggのサポートに動かないと思います」と同氏は話す。
アクセシビリティに及ぼす効果や影響については、同氏は楽観的な見方を変えていない。「Oggでアクセシビリティをサポートするための技術を選択したら、Oggを支持するすべての人に受け入れてもらえる可能性が高いと私は信じています。きちんとした情報に基づき、皆の意見を聞いたうえでその技術を選択したのであればです。私はその実現のために力を注いでいます。プロセスをオープンにしているのはそのためです」。