米Twitter、システム性能テレメトリツール「Rezolus」を公開

 米Twitterは8月19日、システム性能テレメトリツール「Rezolus」をオープンソースソフトウェアとして公開した。ランタイム性能を細かな時間枠で測定できるため、「確率が低いが重要な異常」なども発見できるという。

 Rezolusはプラグインサンプラーを使って、procfs、sysfs、perf_eventsサブシステムなどのさまざまなソースからテレメトリを収集するツール。

 開発の背景として、それまでTwitterでは高いスループットの合成ベンチマークを走らせていたが、ほんのわずかだが時に大きい異常があり、緻密な時間尺度上でシステム性能を理解したいというニーズを受けてスタートしたという。Rezolusは1年以上運用環境で利用しており、ランタイムの性能問題の診断やデータを使った最適化などに役立っているという。

 特徴の1つがeBPF(Extended Berkeley Packet Filter)をサポートした点。これによって、kprobesなどのカーネル計測機構で収集するデータも対象にできるとしている。ニーズに合わせてサンプラーはオン/オフしたり、各種設定ができる。

 各テレメトリソースはオーバーサンプルされ、時間周期でヒストグラムをを構築できる。時間は分単位をサポートする。このヒストグラムを利用して、高い頻度、低い頻度で発生するバリエーションをキャプチャできるという。

 このほか、アプリケーションとメトリクスコレクタの間のプロキシとしても使用できるとしている。

 RezolusはプロジェクトのWebサイトより入手できる。ライセンスはApache License 2。

Rezolus
https://github.com/twitter/rezolus