オープンソースソフトウェアにとっての出版業界への参入機会

現代の出版産業は1455年にグーテンベルグの初の聖書が出版されたときに始まったと言うことができる。 この日以降、より安価に出版できる方法を模索し続けてきた出版業者が今、注目しているのはオープンソースである。 先週、サンフランシスコで開催されたSeybold publishing conference では、私が訪れた最初の6つのブースのうちの4つでオープンソースが活用されていたのに驚いた。

新聞、雑誌、書籍を制作している会社はもちろん、 企業文書を作成している会社であっても、出版というのは内情が非常に広く知られたビジネスである。 大部分を占めるのは、コストを最低限度にまで切り詰め、少ないマージンで存立している会社だ。 それもこれも、ほかの出版業者やメディアとの激しい競争のせいである。 最近ではこの競争にインターネットが加わった。

印刷出版業界は、一握りの制作ツールに合わせてほぼ標準化されている。 豊富な機能を備えたThe GIMPのようなオープンソースツールもあるが、 出版人の多くは現行のツールやプラットフォームを変えようとは考えない。 トレーニングにずいぶん投資している上、印刷関係の多くの制作作業では、 ページレイアウトパッケージのQuarkXPress、 画像編集アプリケーションのAdobe Photoshop、ベクトルグラフィック操作のAdobe Illustratorのようなアプリケーションでの作業能力がものを言うからである。

印刷業界人はまた、忙しすぎて新しいソフトウェアについて学ぶ暇がない場合も多い。 現代の出版業者は高い生産性を求められている。そのため、 日常的な作業の多くがスクリプトによって自動化されている。 たたし、使われているのはPerlではない場合が多い。 また、この作業の非常に多くがMacintoshで行われ、自動化に最も多く使われているのはAppleScriptである。 Chicagoを拠点とするR.R.Donnellyは世界最大の印刷会社の1つだが、文字どおり、数百万行のAppleScriptと、 それらを保守するコーディング部門を備えている。

そもそもの始まりは…

グーテンベルグの最初の聖書を実際に印刷したのが、 グーテンベルグの初めての印刷機を差し押さえたベンチャービジネス投資家であることは、あまり知られていない。 この話には、数十億ドル にも上る出版テクノロジ市場への進出機会をうかがっている現代のオープンソース開発業者にとって参考になる物語が隠されている。

ベンチャービジネス投資家のJohann Fustはグーテンベルグの新規事業に800ギルダーを投資し、 この印刷業が数年後に生み出す利益を熱心に待ち望んでいた。 ところが、グーテンベルグは、ページあたり42行を想定して作った フォントが大きすぎることに気づき、手書きで書籍を筆写していた 競争相手の修道士たちよりも低コストで印刷することができなかった。

そこで、グーテンベルグは、基本的に最初から作り直すことになったとしてもフォントをもっと小さくして、同じ書籍をもっと少ないページ数で印刷できるようにしようと考えた。 この時代の紙は手漉きであり、書籍の制作で最もコストを要するものの1つだったからである。 ちなみに、1455年当時の書籍1冊のコストは、現在の価値で約300ドルに相当する。

ところが、Fustは何が何でもすぐに出版するようにグーテンベルグに迫った。 また、Fustは、娘婿(義兄弟という解釈もある)をグーテンベルグがアシスタントとして雇うことを投資の条件にしていた。 そのせいで、グーテンベルグの「やる気をそぐ」結果になり、 「グーテンベルグの」42行聖書を実際に印刷したのはFustと娘婿のPeter Schofferだったという史実につながったのである。

出版業界における成長分野の1つは、デジタル資産管理と制作の自動化である。 出版業者は制作済みの素材から最後の1ドルまで絞り出すのに懸命だ。 一般的に言って、手元にある素材から新しい商品を制作する方が、 まったく新たに制作するよりはるかに低コストだからである。 雑誌社が関連記事を集めて特集号として出版するのはその格好の例である。 ここで問題になるのが再利用可能な素材を見つけ出す作業だ。 AOL Time-Warnerのような大企業では、文字どおり数百万のファイルを所有しており、 それらは世界中の支社やサーバーに分散しているのが普通だからである。 もう1つの問題は、再利用プロセスの自動化である。 人間のオペレータがHTMLに変換するための書式設定を手作業でやり直していたのでは、 最初に制作したときと同様の手間を要してしまう(つまり、「コストががかる」ということだ)。

デジタル資産管理でこれを支援するため、 Googleは今週のSeyboldにSearch Applianceを出品した。 これは、1Uラックマウント方式の明黄色のサーバーで、 ファイルサーバー群に加えられるように設計されている。 ファイルサーバー群の中で、このサーバーは見つけたものすべてにインデックスを付ける作業を行う。 Googleの広報担当者Nathan Tylerによれば、 このマシンではRed Hatをベースにしたカスタム版のLinuxが動作しており、 Google固有の検索アルゴリズムが動作するように最適化されている。

再利用可能な素材探しの現状は以上のとおりなのだが、 「一般的なハードウェアで動作するカスタム検索ツールの作成に適したコード」という地位を占めることになるのは、 最近発表されたオープンソースの検索エンジンプロジェクトNutch ではないかと懸念する声もあることを付け加えておこう。 開発業者にとっては、大手メディア企業にこのようなツールを導入してカスタマイズしたり、 プロプライエタリなテクノロジを使うGoogleなどの検索会社よりもおそらくは低コストで 独自製品を開発したりするチャンスがあるはずである。

制作の自動化の分野では、 オープンソースを使って素材の再利用を容易にしている企業が2つある。ExegenixInnovation Gateだ。 どちらも、 TomcatApache、Linuxなどのオープンソーステクノロジに基づいて、 プロプライエタリなXML製品を作成している。 ちなみに、XMLは長年にわたり、印刷出版において一種の聖杯となっている。 そのため、見出し、筆者名、本文などを表すタグを素材に付けることができれば、 再利用が非常に楽になることは明白だ。 ところが、残念ながら、 10年以上にわたって出版業者が使い続けている製品が、 「12ポイントのTimes Roman」といった外観ではなく、 「本文」のような内容を表すタグを付ける機能を備えるようになったのはかなり最近のことである。

膨大な資産を手作業で変換すると非現実的なコストを要することは言うまでもない。 そのため、ExegenixとInnovation Gateは、多種多様な入力形式のファイルを取り込んで、 可能な限りXMLに変換し、結果をオペレータに表示して、 不十分な箇所を人間に判断してもらう製品を開発した。 ファイルがXML形式になっていれば、オペレータがテンプレートを用意して、 HTMLページ、PDFファイル、 あるいは新規印刷ページの作成を手作業の場合よりもはるかに速く自動化することができる。 保険会社や証券投資情報サービス会社にある同様の文書についても、 大きな時間の節約につながる可能性がある。 J2EEをサポートしたプラットフォームで動作するInnovation Gateや、 Win32とLinuxでネイティブに動作するExegenixは、 これらの製品を使ってコストの軽減や作業の高速化を図りたい企業クライアントをたくさん抱えている。

Artifexは、 出版向けのオープンソース開発業者として成功した最も古い企業の1つである。 技術最高責任者(CTO)のRaph Levienによれば、Artifexは1988年以来、 Ghostscript に基づいた製品を開発し続けてきており、IBM、HP、Macromedia、 Xeroxを含む80社以上のOEM顧客を抱えている。Artifexは、 ソフトウェアからインクジェットプリンタまでを含むほかの製品向けに、 PostScript、PDF、 PCLなどの形式からページを作成できる非常に広範なグラフィックスライブラリを提供している。 中核企業の社員は10名で、 特定プロジェクト向けに世界各地のGhostscript開発者から下請け業者やボランティアを募ることも多い。

参入の機会はほかにもある。印刷機や製版機で使うラスターイメージプロセッサは、 これまで、IrixのようなプロプライエタリUNIXで動作する、高価でプロプライエタリなソフトウェア であった。 出版業界はジョブ定義フォーマットと呼ばれるXML形式に基づいて標準化されているにもかかわらず、 複数分野の市場から興味を持たれるような汎用目的の出版ワークフローシステムを構築してみようとする業者はいなかった。 プロプライエタリなテクノロジに基づいたこれまでのシステムはあまりに高価で、柔軟性に欠けている。 つまり、出版業者はベンダの囲い込み戦略に踊らされていたわけだ。 MySQLPostgreSQLを使った開発業者にとっては、 自社のテクノロジを活用してワークフローシステムに参入する方法をうかがうチャンスがあると思われる。

オープンソース開発業者にはまた、隙間産業として参入する機会も多い。 出版は巨大産業であり、分野も多岐にわたる。 コストの節約になるという話なら喜んで聞いてくれる企業は多いだろう。 グーテンベルグが失敗した印刷出版業界だが、 オープンソース開発業者には成功の可能性がある。

Chris Gulkerはシリコンバレーを拠点とするフリーの 技術ライターで、1998年以来、130本を超える記事やコラムを執筆している。 事務所にはほぼ動きっぱなしの7台のコンピュータ、 オーストラリアン・シェパード、気取り屋のグレーの小さな猫が同居している。