CDTube - カウントダウンチューブ

今話題になっているCDTube著作権問題で取り上げている人がほとんどだと思いますが、実はタギング研究の視点から見てもかなり面白い素材なのでは。

このサイトに関する解説はCDTubeの使い道〜音楽配信メモを見ていただくとして、ここで注目したいのはYouTubeのデータベースの中から曲のクリップを引っ張るところだ。

CountDownTVのサイトからランキング情報を抽出するのは、そもそも毎週毎週同じHTMLレイアウトの中にテキストデータが埋め込まれているのだから簡単。また、amazon.co.jpの商品情報を引っ張るのもこのテキストデータがあれば大丈夫として、問題はYouTubeから当該曲のクリップを抽出するところ。

YouTubeはそもそもアメリカのサイトでタイトルが日本語でつけられていない、とかそういう問題ではなく、ポストされたクリップファイルにつけられたメタデータが、タイトルやタグを含めCountDownTVのサイトにあるように正確な日本語(英語のタイトルやアーティスト名もあるけれど、いずれにせよ同様)となっている保障はまったくないわけです。

楽曲のidentifyはiTunesなどではメタデータをつけてうんぬんではなく、Gracenoteなど音のデータをベースにして行われることがほとんど。もちろんDRMがくっついたファイルを版権者(ほとんどがレコードレーベル)がリリースするときには多少(どころではないかもしれないが)のメタデータがくっついているわけですし、さすがにそれらは正確な楽曲名・アーティスト名が付与されているでしょう。

しかし、YouTubeは消費者側が勝手につける。しかもアメリカのサイトで全世界に公開されるからといってご丁寧にメタデータをすべてアルファベット(ローマ字)でつけることがかなり多い。それでもかなりの順位の楽曲できっちりクリップを引っ張ってくるのだから凄いものである。引っ張られたファイル(というよりもYouTubeのURL)を見ると、CountDownTVのサイトにあった正確なタイトルがぜんぜんメタデータについていないものがあるわけで、どうやっているのやら。このサイトを見ていると計算機が扱うために必要なメタデータの精度って意外に低くて済むのでは、とすら思えてしまう。

あと、面白いのは個別の曲のURLをはてなブックマークしている人がいること。このサイトは毎週ランキングが更新されたら、すべての順位のエントリはご破算となって新しいものに切り替わる。つまり、Parmalinkがないのにかかわらず(1週間しか意味を成さない)はてブをしている人がいるのである。(12月6日20時時点で3名)ちなみにはてブされていた曲とは、、、、11位 - 「最強パレパレード」 by 平野綾、茅原実里、後藤邑子(このリンクも1週間しか意味を成さない)だったりして、はてなブックマークユーザの特徴をあらわ、、、、、、、、(あれ、そういえば自分も ユーザだっけ、、、)