Midder...MidiSearchEngine
Midderはメロディからも検索できる開発中のロボット型MIDI検索エンジンです。

PR

→Midderが新しいMIDI検索を提案します。

  1. 独自性

    1. 巡回エンジンの独自性

       他に存在する日本語対応のMIDI検索エンジンは、サイト製作者側による明示的な更新表示が必要でした。しかし、Midderは自動的にWebを巡回し、新谷MIDIを発見した場合自動的にデータベースを更新します。つまりサイト製作者側からの連絡が必要なくなり、製作者側から更新表示が無い場合でも曲をインデックス化できます。
    2. インデックス化の独自性

       多くのMIDI検索エンジンでは曲名のみをインデックス化しています。しかしMidderは曲名だけでなく著作者名や入力者等の付加情報や歌詞情報、メロディまでをインデックス化し検索対象にします。同じ人のつくった,入力した曲を聴きたい場合には曲情報から検索。曲名を忘れてしまった曲を探す場合や自分で作曲したと思っていた曲は既に存在するものではないかを確認する場合に役立ちます。
       また、日本に存在する検索エンジンはHTMLのメタから取得していたため実際には存在しない曲もインデックス化されてしまう危険性や、再生できない曲も検索にかかってしまう事がありましたが、MIDIを取得する形式なのでそのような心配が無くなりました。
    3. 検索エンジンの独自性

       検索し、発見された曲をクリックした場合埋め込み型でその曲を再生します。それと同時に提供サイトのIndexを検索し表示させます。つまり探しているMIDIをすぐに再生開始でき、製作者のサイトも閲覧できるため感想を送信したり、他の曲を聴いたりする事が容易になります。
       また、Midderはデッドリンク(リンク先404)を無くすため再生を要求されるのと同時にMidderもそのサイトへ接続し、MIDIが存在するかを確認します。正常に確認できなかったMIDIは検索エンジンから一時的に取り除かれます。
  2. 有用性

     Midderは他の検索エンジンに比べ、より多くのMIDIをインデックス化できます。これはロボットサーチを使用しているからです。サイト製作者側からの連絡が必要ないのでいままででは見つからなかったような方が入力したMIDIも検索する事ができます。これはより多くのMIDIを発見できる可能性があるということを意味しています。
     自分の曲を無断で使用されていないかを確認するためにも役立ちます。たとえば、無断利用を禁止しているMIDIが他のサイトでBGM等に利用されていないかを確認できるということです。

企画

  1. 概要

     現在日本で稼働中のMIDI検索エンジンは作者が登録するものばかりで、多くのMIDIを検索する事ができない状態です。しかしWebページの検索においてはロボット型の検索エンジンが主流であり、探している情報をすぐに検索し、発見する事ができます。
     この文章で説明するMIDI検索エンジンは後者のロボット型で、作者の登録は基本的に必要ありません。ロボットが自動的にWebを巡回し、MIDIを発見し次第取得します。そのため今までより幅広いMIDIを検索することができるようになりました。
     また、今までの検索エンジンではタイトルから検索するものがほとんどでしたがこの検索エンジンは作者や歌詞、メロディ等の全情報から検索することができます。
  2. 巡回エンジンについて

     GNU Wgetを使用し、リンクを再帰的にたどります。そこにMIDIがあった場合はそれを保存します。Wget実行時のコマンドは以下を使用しています。
    $ wget -nv -r -H -l 0 -U lxtoMidiSearchRobot -A .mid,.MID
     特に要望が無い限り、全ホストを無条件に巡回する形になりますがrobots.txtで巡回を禁止しているホストや巡回停止を要求されたホストには巡回しないように設定を行っています。
  3. インデックス化について

     取得したMIDIはホスト名ごとのディレクトリに分けられ、そのままの形で保管されます。これらは一定期間ごとにインデックス化されます。まず、SPICE付属の逆コンパイラを使用しMMLに変換されます。変換されたデータを元に、タイトル,著作権者,製作者等の基本情報、歌詞に分割し、曲情報データベースを構築します。また、MMLで記述されたオクターブ情報、音の長さ等の情報を切り捨て、音階のみになったものをメロディデータベースとして構築します。最後に二つのデータベースを結合し、検索可能なファイルにするため曲のURIと一緒に記録します。
  4. 検索エンジンについて

    1. 検索時について
       検索の際、ユーザ側が検索モードの切り替えを行います。検索モードはタイトル検索、著作権者検索、製作者検索、歌詞検索、メロディ検索に分けられます。ユーザが要求した条件に基づき、サーバはデータベースから一致するものを含む行を抜き出します。抜き出された行を指定された条件で点数化し、アクセスできるようにします。
    2. ジャンプについて
       MIDIへ直接リンクすることは作者に迷惑がかかることや著作権的な問題から行いません。要求されたMIDIはそのサーバへのリンクとなり小さいフレームで再生され、再利用できない形になります。また、そのMIDIのURIからそのサイトのIndexを割り出し、ユーザをそこへアクセスさせるようにします。これによりユーザはすぐにMIDIを再生することができ、サイトへのアクセスもカウントされます。