Fedoraの統計情報に見るLinuxユーザ像

 Fedoraプロジェクトが先日、Fedora 7を使用しているシステムの数などを含む詳細な統計の内容を明らかにした。Fedora 7は5月末のリリース以来、30万人を越えるユーザを獲得しているという。この数字はかなり良いものに思われるものの、Fedora Core 6の時にはリリース後おおむね同じ期間で40万人を引き付けることに成功していた。この数字が何を物語っているのか、Fedoraプロジェクトのリーダーを務めるMax Spevack氏に聞いてみた。

 プロプライエタリのソフトウェア企業に対して言いたいことはいろいろあるだろうが、しかし、成功しているプロプライエタリ企業は(Linuxディストリビュータと違って)ユーザについてのデータを実に大量に集めて持っている。自社のソフトウェアをユーザはどのような目的に利用しているのか? 自社のソフトウェアのユーザは何人いるのか? 自社のソフトウェアをユーザはどのようなタイプのハードウェア上で利用しているのか? 自社のソフトウェアのユーザはボクサーなのかブリーフなのかレース付きなのか着用なしなのか? プロプライエタリなソフトウェア企業は、自社のユーザについてのデータをとにかく大量に持っているのだ。

 その一方でLinuxディストリビュータは、ほぼ暗闇の中にいるようなものだ。フリーで再配布可能であるソフトウェアのデメリットとして、何人の人が使用しているのかを正確に知る方法がなく、また、プロジェクトが平均的なユーザの像をはっきりと描くことができないという点がある。

 今のところはまだ、Linux一般(Fedora以外も含む)を使用している人や組織の数について確かなことは明らかになっていない。しかしFedoraプロジェクトの取り組みによって、Fedoraを稼動しているシステムの数とハードウェアのタイプとが、ある程度明らかになり始めている。

Fedora 7について

 Spevack氏は、Fedora 7がこれまでのところ、Fedora Core 6が最初の数週間で到達したユーザ数の約80%までしか達成していないことについて、特に心配はしていないという。「Fedora 7がこれまでに達成した数字については嬉しく思っている。私も含めてみな、Fedora Core 6の数字にはまったく驚かされたけれども、Fedoraのリリースサイクルが短いことを考えると、今のところは大まかに同程度の数字であれば問題ないと思っている。新たなIPアドレスは、リリース以来平均して毎週約75,000個にも上る。このような数字にがっかりしている人はいない」。

 しかしFedora Core 6の数字を越えないまでも、Fedora 7が同じ数字を達成していないのはなぜだろうか。Spevack氏によるとそれは、Fedora Core 6の新たなサポート期間に関係があるかもしれないという。 「2ヶ月ほど前に、Fedoraのリリースのサポート期間を延長するという変更を行なったので、リリースの度にアップデートしなければならないというプレッシャーがなくなった。今ではFedoraのどのリリース(例えばFedora Xとする)も、Fedora X+2のリリースの1ヶ月後までサポートされることになっている」。

 「そのため、『一つおきの新リリース』というアップデートスケジュールをユーザが望んだ場合でも、ユーザのマシンがアップデートを受け取ることができない状態に置かれてしまう期間はまったくない。したがって導入率が伸び悩んでいるのはそのことに関係があるかもしれないと思う。ユーザは今すぐにアップデートする『必要』がないので、おそらく全員が今アップデートしているわけではないのだろう」。

ハードウェアについての情報を集める

 Fedoraプロジェクトは、Fedoraを稼動しているシステムの数を知るだけでは満足せず、Smoltにも取り組んでいる。Smoltは、ハードウェアについてのデータをユーザから自動的に集めることに特化したハードウェアプロファイラだ。Spevack氏によるとSmoltは希望者のみを対象とするツールであり、「現在、Fedora以外の他のLinuxディストリビューションにまで広がる、Smoltを中心とするコミュニティを構築中」とのことだ。

 他のディストリビューションも活動に巻き込むため、Fedora開発者たちは他のディストリビューションにSmoltの使用を誘う招待状も出している。

 Spevack氏によると「われわれはSmoltを、Fedoraだけでなく全Linuxディストリビューションで使用可能な一般的なプロジェクトにしようと努めている。Smoltサーバを用意することが誰にでもできて、かつ、Smoltのクライアントパッケージができるだけ多くのディストリビューションで利用可能になっていれば、Linuxシステムで使用されているハードウェアデバイスについての非常にしっかりしたデータベースがやがてできあがるだろう。そのようなデータベースがあれば、ハードウェアベンダに仕様を公開してもらう際の説得材料として役立てることができる。さらに現在、ハードウェアについての情報を提出してもらうだけではなく、ハードウェアが特定のディストリビューションの下でどれ程順調に動いているのかについてのコメントもユーザに提出してもらうことができるようにする機能を実現したいと構想中だ。これが実現すればバグ追跡や開発などに役立つことだろう」とのことだ。

 「とは言え要は、Smoltはフリーソフトウェアとして開発されているので、世界中のすべての人がSmoltを使うことができるようになることと、世界中のすべての人に協力してもらえるようになることとを望んでいる」。

 しかし、これまでに集められたデータは、Linuxのユーザ像を最も正確に示したものというわけではないかもしれない。というのも、データはデスクトップシステム寄り、あるいは少なくともGUIを使用するシステムについてのものである傾向が高いと思われるためだ。

 Spevack氏によると「登録されたマシンのうちの約98%のマシンのランレベルが5だった」という。ランレベル5は、デスクトップユーザのデフォルトのランレベルだ。「何らかのGUIを使うようにFedora 7をインストールすると、firstbootが実行される。firstbootというのは、タイムゾーンの設定、最初のユーザの作成、ファイアウォールやSELinuxの設定などを手助けするアプリケーションだ。そのfirstbootの画面の一つに、ハードウェアのプロファイルを送信するかどうかを尋ねるものがある。したがってGUIを利用するユーザにとってはプロファイルの提出が非常に簡単にできるようになっている」という。

 逆に、FedoraをサーバOSとして設定するユーザは、データを提出するかどうかを尋ねられる可能性が低い。Spevack氏によると、以上の2点を考えると「現在のSmoltの統計がおそらく、Fedora 7のデスクトップ用のインストール像を強く反映したものになっている可能性が高い」ということになるという。

 それではFedora 7のデスクトップ用のインストール像とはどのようなものなのだろうか? データによると、登録された82,000台を越えるシステムのうち、デスクトップシステムであると判別できるものは60%近くであり、21%のシステムがノートPCだ。不明のシステムも多く、約20%が判別不可能となっている。またサーバとして登録されたシステムは0.7%に過ぎない。

 少なくとも8%のユーザがVMware上でFedoraを実行していて、ベンダごとの統計によると、判別されたベンダの中ではトップだった。実際には「システムベンダ」がトップなのだが、判別されたベンダの中ではVMwareがトップであり、次点がHewlett-Packard(5.7%)で、その次がIBM(2.7%)となっている。なおAppleは判別された数としては0.3%に留まっている。

 判別されたビデオカードの中ではATIが41.1%となっていて、40.1%であるNVIDIAカードを使用したシステムを抑えて、かろうじてトップとなっている。しかしその次のベンダであるIntelが23.8%、その後VMwareが8.1%、Via Technologiesが2.3%と続き、さらにその他いくつかのベンダも含めると、合計が100%を越えてしまうので計算がやや合わないように思われる。とは言え複数のビデオカードを搭載したシステムを利用しているユーザがいる可能性もあるので、システム数よりもビデオカード数が多いことの説明は付くのかもしれない。

統計情報の集め方

 Fedoraについてのこのような数字はどれほど信用することができるのだろうか。Fedoraプロジェクトの情報収集手法は、完璧な統計情報を収集しようとしているものではないが、ほどほどの概略をつかむには十分信頼することができる。Spevack氏によるとFedoraプロジェクトは、「Fedoraの『updates』レポジトリへの接続」を見て、使用されているFedoraのバージョンと接続元のIPアドレスの情報を収集しているのだという。

 Spevack氏はこの手法が完璧ではないことを認めている。「動的IPアドレスは重複してカウントされている可能性が高い。一方で、企業などで大規模にFedoraをインストールしている場合でも、プロキシなどのために単一のIPアドレスだけのように見えてしまっているだろう……それでもこの調査の結果として得られる数字は、大まかな目安としてはそれほど違っていないと思う」。

 Spevack氏はまた、(他のディストリビューションとは違って)使用している情報収集手法とその不備な点をきちんと理解できるように、統計のページに注意書きが書かれていると指摘した。「様々なディストリビューションが『何百万ユーザ』という形でインストール数を表現しているのをよく目にするが、(Fedora以外では)そのような数字がどのように得られたものかについての説明はあまり行なわれていない。それに対してFedoraでは、もっと詳しい情報が欲しいと言われる前に、データをありのままに公開している」。

その他の興味深い点

 Fedoraプロジェクトはまた、BitTorrent経由のダウンロードについても統計情報を収集している。それによると、ダウンロードのうちの約75%がFedora DVDのものであり、残りの25%がGNOMEライブCDとKDEライブCDのものになっている。GNOMEファンはKDEファンよりも優勢で、少なくともライブCDのユーザに限って言えば、60%のユーザがGNOMEを選び、40%がKDEを選んでいるとのことだ。

 「平均的な」ユーザが、Fedoraをデスクトップシステムとして導入しているのか、サーバOSとして導入しているのかということについて、現在のところはFedoraプロジェクトでははっきりとした状況はつかめていない。しかしSpevack氏によると、DVDはサーバ用としてもデスクトップ用としてもインストールされている可能性があるのに対し、ライブCDのユーザはおそらくFedoraをデスクトップシステムとして使用していると「考えても間違いではないだろう」とのことだ。Spevack氏は「つまり一言で言えば、Fedoraのサーバ/デスクトップの割合はかなり健全なものである」とした。

 またMugshotプロジェクトも、人気のあるアプリケーションについてのデータを集めている。このデータは実際には、アプリケーションが使用される頻度に関するものであり、単にどのアプリケーションがインストールされているのかということに関するものではない。Mugshotのアプリケーションについての統計ページによると、トップはFirefoxであり、僅差の次点がGNOME Terminal、続いてNautilus、Evolution、Evince、gedit、Thunderbird、Totemとなっている。

今後うまく行けば他のディストリビューションも、ユーザからデータを収集するFedoraの取り組みに習って、Linuxがどこでどのように使用されているのかを明らかにし、Linuxのさらなる改善に役立てるようになるのかもしれない。

Linux.com 原文