最近はほぼすべての銀行がホームページを持っていますが、それらの情報をスクレイピングすることは可能です。
しかし無目的でスクレイピングしても時間の無駄なので、スクレイピングする前に項目を精査することが大切です。
本記事ではスクレイピングする価値がある、銀行情報を解説します。
目次
銀行情報をスクレイピングするメリット
銀行情報をスクレイピングするメリットは何でしょうか?銀行の歴史とか社員数をスクレイピングしてもあまり価値はないと思いますが、銀行の金利をスクレイピングすれば、価値を生み出すことができるのではないでしょうか。
銀行には多くの金融商品があるので、スクレイピングで金利情報などを取得したら、賢く取引できる可能性があります。
取得した銀行情報を自分のブログで、噛み砕いて説明してもいいでしょう。銀行はよく利用するけど、銀行の金融商品の仕組みがよく解らない・・・
このような人は、一定数います。
そのような人を対象に、スクレイピングしたデータを示し、銀行の金融商品の仕組みを解説するのも悪くはありません。
実際にある銀行のホームページから学ぼう
実際にある銀行のホームページから、大切な情報を知りましょう。
銀行のホームページを開く
https://www.smbc.co.jp/
今回は三井住友銀行のホームページを開きました。
トップページから見えるカテゴリーには以下があります。
- 商品・サービス
- 金利・手数料
- 各種お手続き
- 予約サービス
- よくあるご質問
- 店舗・ATM
この中からスクレイピングする価値がある項目は何と言っても、金利・手数料カテゴリーでしょう。
クリックしてページを開きます。
https://www.smbc.co.jp/kojin/kinri/
開くと金利と手数料の詳細が表示されました。
試しに円預金金利をクリックしました。
https://www.smbc.co.jp/kojin/kinri/yokin.html
すると以下の金利情報が表示されました。
- 定期預金金利
- 残高別金利型普通預金金利
- 貯蓄預金金利・普通預金金利
これらのスクレイピングは難解か?
上記の項目では金利情報について触れましたが、スクレイピングするのは難しいでしょうか?ソースを見て検証しました。
ソースの一部を掲載します。
<tr>
<th class=”jsHeadY tableTitle01″>6ヵ月</th>
<td><p class=”tRight”>0.002%</p></td>
<td><p class=”tRight”>0.002%</p></td>
<td><p class=”tRight”>0.002%</p></td>
</tr>https://www.smbc.co.jp/kojin/kinri/yokin.html
ここから引用させてもらいました。
テーブルタグを使っているのでメチャクチャ簡単そうですね。
もしかしてExcelでもスクレイピングできるのではないかと思い、挑戦してみました。
Excelで挑戦
Excelで挑戦したら、いとも簡単にスクレイピングできました。やはり表形式のデータはスクレイピングしやすいですね。
すべての銀行の情報が簡単にスクレイピングできるかどうかは解りませんが、難易度を知りたい人はソース画面にしてください。
ソース画面にテーブル関連タグが使われていたら、ほぼ間違えなく簡単だと思います。
スポンサーリンク
銀行のホームページをスクレイピングする際の注意点
これからは、銀行のホームページをスクレイピングする際の注意点を解説します。
あまりにも情報量が少ない場合はコピー&ペーストした方が早い
銀行の金利・手数料情報は情報量が少ないので、コピー&ペーストした方が効率的だと思います。ただ記事では難易度などもお伝えしたかったので挑戦しましたが、単に銀行の金利・手数料情報を知りたい人はコピー&ペーストをして、Excelなどに貼り付けた方がいいでしょう。
情報量が三十行以上になれば、スクレイピングした方が早いかもしれません。銀行のホームページにはさまざまな情報が掲載されているので、どのような方法を使うのかは各々で判断してください。
又売りはやめる
銀行の情報を又売りするのは、やめた方がいいです。著作権に触れる可能性があるからです。公開情報を個人的に利用するのは問題ないと思いますが、又売りとなるは話は別です。
それから銀行の金利・手数料情報は変更になる可能性があるので、常に情報が正しいとは限りません。
個人で利用するときも、その点はしっかり理解した方がいいと思います。
銀行のスクレイピングは練習にいい
銀行のホームページは、スクレイピングの練習にいいと思います。
初心者でも取っつきやすい
例外はあるかもしれませんが、一般的に銀行が提供している情報は表形式になっているものが多いので、初心者におすすめです。
また情報量が少ないので、きちんとスクレイピングできたかどうか確認しやすいです。
試しに他の銀行のホームページもチェックしましたが、表でデータを格納しているケースが圧倒的でした。そして情報量そのものも、すべからく少なかったです。
初心者がいきなり難しいサイトをスクレイピングしたら挫折する可能性がありますが、現時点の銀行のホームページであれば、初心者でも成功する確率は高いと思います。
役に立つ情報が多いのでスクレイピングして楽しい
貯蓄の意識が強い、地道に儲けたい・・・そのような人達にとって、銀行が提供する情報は役に立つでしょう。
役立つ情報が多いので、スクレイピングそのものも楽しくなるでしょう。
スポンサーリンク
銀行のスクレイピングから始める人も本格的なツール
銀行のスクレイピングから始める人にも、本格的なスクレイピングツールをおすすめします。
タグの指定が簡単
初心者用のスクレイピングツールの方がタグの指定が簡単だと思う人もいるかもしれませんが、私の知る限り、本格的なスクレイピングツールの方がタグの指定は簡単です。
スクレイピングの基本は対象のデータを格納しているタグを指定することですが、機能が貧弱なスクレイピングツールは、タグの指定方法にクセがあることが多いです。
プログラミングに慣れている人であればすぐに理解できると思いますが、まったくの初心者は右往左往すると思います。
出力形式が多様
本格的なスクレイピングツールは出力形式が多様なので、どのようなニーズにも向いています。
プログラマ向けのファイル形式もあるし、Excel用のファイル形式もあります。もちろん定番のCSVファイル形式も用意しています。
本格的なスクレイピングツールはクラウド形式が大半ですが、クラウド形式のツールを使えば、ディスク容量の少ないパソコンでも問題はありません。
出力したデータは各々のパソコンにダウンロードしますが、テキストファイルなので、極端にディスク容量が少ないパソコンでない限り、余裕でダウンロードできるでしょう。
まとめ
銀行のホームページのスクレイピングについて解説をしましたが、スクレイピング自体は超簡単でした。
スクレイピングツールを購入した人は、是非とも銀行のホームページで試してください。
あまりにもあっさりとスクレイピングできるので、「スクレイピングってこんなに簡単だったのか?」と思うかもしれません。