npbには公式サイトがあり、公式サイトのスクレイピングは簡単な部類に入ると思います。
スクレイピング自体は簡単なのですが、スクレイピングしたデータを元にクイズサイトまたはクイズブログをつくるには、アイディアが必要です。
本記事ではアイディアを広く紹介します。
目次
npbの公式サイトを開く
https://npb.jp/
まずは上記のURLを開いてください。
URLを開いたらソース画面にする
URLを開いたらソース画面にしてください。
サイト上で右クリックしたら「ソース画面」にできるはずです。
トップページには阪神タイガースの、昨年度の成績表が記載されていました。
スクレイピングするときはタグを指定しますが、阪神タイガースの成績表には以下のタグが使われていました。
https://npb.jp/→参考サイト
<tr> <th><span class=”hide_sp“>阪神タイガース</span><span class=”hide_pc“>阪神</span></th> <td>143</td> <td>85</td> <td>53</td> <td>5</td> <td>.616</td> <td class=”gb“> – </td> </tr>
スクレイピングツールによって指定するタグは変わってくると思いますが、「阪神タイガース」の文字を探したら手っ取り早いです。
注意点
npbサイトのスクレイピングは簡単ですが、自分のサイトで利用するときは、「npbサイトのデータを参考にさせていただきました。」と明記してください。
それから頻繁にスクレイピングをしたらサイトに負荷がかかるので、頻度を考えましょう。
理想的には1週間に一回を限度にしたらいいと思います。
上記のデータだけでもクイズサイトは運営できるので、出題範囲によっては一回だけのスクレイピングで済むかもしれません。
スポンサーリンク
クイズサイト・クイズブログのアイディア集
これからはアイディアを紹介します。
昨年度の優勝チームと最下位チームの勝率差をクイズにする
昨年度の優勝チームの勝率を覚えている人は、案外多いかもしれません。
しかしそれではクイズにはならないので、もっと複雑な出題内容にしましょう。
昨年度の優勝チームと最下位チームの勝率差をクイズにしたら、おそらく答えられない人が大半でしょう。
スマホがあればnpbのサイトは閲覧できるので、答えられるかもしれませんが、回答時間を短くしたらスマホで検索する時間がなくなります。
回答時間内に答えることができなければ、自動的に次の問題に移るようにしたらいいですが、簡易言語のJavaスクリプトだけでも実装できると思います。
ただ出題数が多い場合はデータをデータベースに保存する必要があるので、サーバーサイドスクリプト言語の知識とデータベースの知識が必要になります。
球場情報
npbのサイトは利用した球場情報も公開していますが、球場がある地域は日本だけではなく海外にもあります。
この情報を活用したクイズも面白いです。
球場がある地域にちなんだクイズなどは受けそうです。
台北市立天母棒球場も利用していますが、利用したチーム名をクイズにしてもいいでしょう。
または台北市に関連がある野球選手を、クイズにしても面白いのではないでしょうか?
超難問のクイズを出題するのであれば、球場の広さをクイズにしたらいいでしょう。
ファーム情報
npbのサイトはファーム情報も公開しています。
ファームの成績をクイズにしてもいいですが、それだけでは面白みがないので、一軍の勝率と比較して、勝率の差がどれぐらいあったのかをクイズにしてもいいかもしれません。
完全に通向けのクイズですが、一部の熱狂的な野球ファンは、真剣な眼差しで見るかもしれません。
ファーム選手の個人成績も公開しているので、選手の成績をそのままクイズにしてもいいですが、少し捻った方が面白いです。
ファームでは三割以下のバッターなのに、一軍では三割以上打っている選手をクイズにしてもいいでしょう。(実際にいるかどうかは確認していません)
NPB公認バットメーカー一覧
npbのサイトはNPB公認バットメーカー一覧情報も公開していますが、選手がどのメーカーのバットを使っているのかを調べ、それをクイズにしても面白いです。
調べるのは大変ですが、Twitter等に目を通せば見つかる可能性はあります。
良いバッターは用具にもこだわりますが、クイズで好きな選手が使っているバットが解れば、そのメーカーのバットを購入する未来の野球選手もいるでしょう。
スポンサーリンク
柔軟にスクレイピングしたい人はフィルター機能を使う
npbのサイトは比較的スクレイピングが簡単ですが、柔軟にスクレイピングしたい人は、フィルター機能が優れているスクレイピングツールを使いましょう。
フィルター機能とは何か?
Excelの中級者以上はフィルター機能を使ったことがあると思いますが、フィルター機能は結果の絞り込みに非常に有効です。
本格的なスクレイピングツールはフィルター機能を有していることが多いですが、フィルター機能を使えば、npbサイトのスクレイピングは便利になるでしょう。
フィルター機能を使えばタグを指定しなくても目的のデータを取得できるし、二つのキーワードが指定できたら、スクレイピングの幅が広がります。
スクレイピングツールのフィルター機能はSQL言語で構築されていると思いますが、SQL言語は柔軟な処理ができるので、使用しているプログラマは多いと思います。
フィルター機能でできること
npbサイトには多くの選手名が登録されていますが、選手の姓が被っていることがあります。
このようなケースでは、フィルター機能が大変便利です。
異なる二つの姓が違うタグを使っている場合でも、フィルター機能を使えば簡単に抽出できます。
またナゴヤドームといった固有名詞が使われている場合も、フィルター機能は大変便利です。
フィルター機能は「ナゴヤドーム」というキーワードを元に情報を収集してくれます。
慣れたら二つのキーワードで情報を取得しよう
フィルター機能の基本を学んだ後は、二つのキーワードを含め情報を取得しましょう。
Google検索に慣れている人は複合検索に詳しいと思いますが、複合検索は研究すればするほど面白いです。
抽出したい単語を広い範囲から取得するときは、絶対にフィルター機能を使った方が効率がいいです。
フィルター機能を使い複合検索するには経験が必要ですが、何回も試すうちに複合検索のコツが解ってきますよ。
スクレイピングツールに無料体験があれば、フィルター機能も試そう
スクレイピングツールに無料体験があれば、是非ともフィルター機能を使ってほしいです。
スクレイピングツールによってフィルター機能の精度は変わってくるので、無料期間中にしっかりと精度を確かめることが大切です。
外国のスクレイピングツールを使うときは勝手に課金されるのが怖いと思いますが、信頼の置ける会社であれば問題はないです。
まとめ
npbサイトのスクレイピングについて解説をしましたが、npbサイトのスクレイピングは非常に簡単です。
でも大切なのはスクレイピングしたデータを自分なりに活用することなので、スクレイピングできたからといって安心しないでほしいです。
スクレイピング技術ができることは単純かもしれませんが、取得したデータを使いこなせるようになったときは、満足感を得ることができますよ。
npbサイトのスクレイピングに、オリジナルなツールは必要ありません。
本格タイプのスクレイピングツールであれば、不足を感じることはないでしょう。