スクレイピングは信頼できる書籍から学ぶのが一番いいと思いますが、いきなりスクレイピングの書籍を読むのではなく、基礎を固めてから読んだ方が頭に入ってきやすいと思います。
本記事ではスクレイピング関連の書籍を購入する前にすることを、独自の視点で解説したいと思います。
日本語には急がば回れと言う言葉がありますが、本記事の本意も「急がば回れ」です。
目次
何故いきなりスクレイピング関連の書籍を購入しない方がいいの?
スクレイピング関連の書籍を購入することは無駄ではありませんが、いきなり購入するのはお金と時間の無駄です。
スクレイピングする人は最低限の知識が必要
スクレイピングはプログラムなので、最低限のHTMLの知識とプログラミング知識は必要です。
HTMLは基本的なタグが解っていれば問題はないですが、プログラミングに関しては変数の概念、繰り返し処理、スクレイピングによってはデータベースの知識が必要です。
これらの知識は専門学校レベルで大丈夫ですが、専門学校の学費は高いので、オンラインレッスンをおすすめします。
オンラインレッスンを受けるときは、予めスクレイピング技術を身に付けたいと伝えた方がいいでしょう。
基礎知識を学ぶときのアドバイス
基礎知識を学ぶときは、実際に自分で書くことをおすすめします。
HTMLは書式なので、そのまま書いても作動します。
プログラミングに関しても最初は、そっくりそのまま書き写すことが大切です。
ガリガリ書くことによって、プログラムのイロハが見えてくるからです。
プログラムのイロハが見えてきたら、変数の値を変えたり、繰り返し処理の値を変える練習をしましょう。
もしデータベースを学んでいるのであれば、データーベースの概念についても学びましょう。
データベースはSQLという言語で操作しますが、SQLも書いて覚えるのが一番です。
スポンサーリンク
スクレイピングに関心のある方はスクレイピング体験から始めましょう
HTMLの知識もないしプログラムを組んだこともない・・・このような人達は勉強を始める前に、スクレイピングの体験することをおすすめします。
体験することで、スクレイピングが面白くなり、結果的にスクレイピング技術をマスターできるからです。
まずはchromeの拡張機能を試しましょう
自分も使っていますが、chromeの拡張機能は便利です。
試しに今執筆している記事をスクレイピングします。
項目が多いのですべてをキャプチャーすることはできませんでしたが、この図を見るだけでスクレイピングの雰囲気は解るのではないでしょうか?
無料で追加できるので、関心のある方は試してくださいね。
Excelでも体験できます
データを表で表示している場合は、Excelでもスクレイピングは可能です。
上記の図はExcelで日本シリーズの結果を抽出したものですが、Excelでスクレイピングができたら本当に便利ですよ。
Excelにスクレイピング結果を取り入れることができたら、グラフにすることもできるし、ピボットテーブルにも活用できます。
私は仕事でスクレイピングをしていますが、スクレイピング結果はいつもExcelに取り込んでいます。
Excelに取り込めば、プレゼンテーションのときは便利ですよ。
最近は中古パソコンにもオフィスがプリインストールされているので、関心のある方はそのようなパソコンを購入すればいいでしょう。
もちろん新品のパソコンにもプリインストールされていることが多いので、新品を購入しても構いません。
まずは簡単なスクレイピングから始めましょう
スクレイピングの難易度はサイトによって異なりますが、テーブルタグで囲まれたデータのスクレイピングは簡単です。
Excelでも簡単に取得できるので、スクレイピングツールだったら間違えなく取得できます。
スクレイピングツールでテーブルタグに囲まれたデータを取得するときは、タグを指定する必要があるかもしれませんが、テーブルタグは使われている部品が少ないため簡単だと思います。
昔からデータをテーブルタグに格納するケースは多かったので、テーブルタグに囲まれたデータを取得する練習は意味のあることです。
スクレイピング書籍の選び方
スクレイピング技術の基礎が固まったら、スクレイピング書籍を購入しましょう。
直訳調の書籍ではなく自然な日本語の書籍を選ぶ
スクレイピング関連の書籍は英語圏のものが多く、日本で陳列されているものも翻訳された書籍が多いです。
基本的には翻訳された書籍で問題はありませんが、直訳調の書籍は読みにくいので、初心者は選択しない方がいいでしょう。
ある程度スクレイピングの経験がある人だったら、不自然な日本語でも理解できると思いますが、まったくの初心者は理解しやすい日本語で書かれた書籍を購入しましょう。
目的に合う書籍を購入
スクレイピング書籍を購入する人は何らかの目的があると思いますが、購入するときは目的をしっかり確認しましょう。
特定のwebサイトをスクレイピングしたいのであれば、特定のwebサイトを題材にした書籍を選ぶべきです。
特定のwebサイトに特化した書籍にはさまざまなアドバイスがあり、初めての人はきっと役に立つと思います。
ネット通販は立ち読みできませんが、街の大書店ならば立ち読みできるので、購入予定の書籍が本当に役立つかどうかしっかり確かめましょう。
英語が理解できる人は英書に挑戦
英語が理解できる人は、英書に挑戦してもいいかもしれません。
技術系の英文は専門用語さえ解れば理解できることが多いので、英語の達人である必要はありません。
現時点では英語圏の方がスクレイピング関連の書籍は多いので、英書に挑戦することは意味のあることです。
どうしても理解できない英語があったら、実際に自分でコードを書いてください。
コードを書き無事に動いたら、英語の意味がきっと解ると思います。
ボリュームのない書籍は電子本
ボリュームはないけど気になる解説がある書籍は、電子本で購入したらいいかもしれません。
電子本は一般的に紙の書籍よりは安いので、比較的買いやすいと思います。
電子書籍の中には中身のない本もありますが、中には紙の本でも読みたいような中身が濃い書籍もあります。
日本の電子書籍マーケットにはスクレイピング関連のものは少ないですが、英書まで範囲を拡げたら面白い書籍に出会えるかもしれませんよ。
スポンサーリンク
書籍でスクレイピングを学んだ後は実践あるのみ
書籍でスクレイピングを学んだ後は、実践あるのみです。
プログラミングというのは実践を繰り返すことで上手になるもので、決して頭だけで理解しようとしてはいけません。
書籍であればコードを掲載しているものが大半だと思うので、最初は一字一句書き写すことをおすすめします。
ガリガリ書くことで、スクレイピングの流れが解ってきますよ。
ある程度慣れてきたら、少しずつサンプルをアレンジして、自分なりのスクレイピングツールを構築してください。
まとめ
スクレイピング書籍をテーマに解説しましたが、スクレイピング関連の本はだいぶ増えてきました。
増えてきたのはスクレイピングの大切さが認識されてきたからだと思いますが、今後のビジネスはスクレイピングなくして成立しないかもしれません。
データビジネスは着実なビジネス手法ですが、意味のあるデータを取得しなければ時間の無駄です。
意味のあるデータをスクレイピングする時に役立つのは、フィルター機能が充実しているスクレイピングツールです。
以下のスクレイピングツールはお試しできるので、万人におすすめします。
コメントを残す