私は外国人の友達が多く、彼ら彼女らに日本語を教えることがあります。専門の教師ではありませんが、教えるときは工夫をしています。
教える際に効果的なのは、辞書の意味を提示することです。
スクレイピングで辞書の意味を収集するのは可能ですが、辞書の意味を収集したら面白いサイトが制作できそうです。
本記事では辞書の意味をスクレイピングし、面白いサイトを制作するヒントを解説します。
目次
スクレイピングするのはオンライン辞書
スクレイピングするのはオンライン辞書ですが、オンライン辞書にはどのような種類があるのかを整理します。
日本語の単語辞典
goo辞書には日本語の単語辞典があります。私は今そのページを開いていますが、検索ランキング順に表示しています。
単語をクリックすれば単語の意味を解説しているだけではなく、慣用句や熟語も紹介しています。日本人でも読むのが難しい単語、意味が解らない単語もありますが、パソコンやスマートフォンがあったら気楽に調べることができます。
英和・和英辞書
同じくgoo辞書ですが、英和・和英辞書もあります。こちらもランキング順に紹介していますが、馴染みの薄い単語も結構多いです。
単語をクリックすると、日本語の意味、英語の意味が見えます。
結構役立つのが和英辞書で、どう翻訳したらいいのか解らない日本語に出会ったときは、活用してください。
「高をくくる」などは英訳しにくい日本語ですが、辞書では「At first I took it lightly」と説明しています。
英英辞典
ロングマンの英英辞典もソース画面に内容が表示されるので、スクレイピングできると思います。
lit‧tle1 /ˈlɪtl/ ●●● S1 W1 adjective 1 SIZE [usually before noun] small in size a little house a cake decorated with little flowers She was cutting the meat up into little bits.little tiny/tiny little spoken (=extremely small) a little tiny puppylittle bitty American English spoken (=extremely small)a little something informal (=a small present, or a small amount of food) I’d like to buy him a little something to thank him.
「little」を調べましたが、上記の説明がありました。英語学習に英英辞典を活用する人は多いと思いますが、必要な単語をスクレイピングしたら、効率的に勉強できると思います。
こちらのオンライン辞書は音声も聞けるようになっていますが、残念ながら音声をスクレイピングで収集するのは無理です。
音声ファイルの場所が解ればダウンロードはできるかもしれませんが、文字情報だけでも十分でしょう。
スポンサーリンク
辞書の意味をスクレイピングしたら活用範囲は広い
辞書の意味をスクレイピングしたら、さまざまなことに活用できると思います。
テストに使用
言語は何でも構いませんが、辞書の意味をスクレイピングしたら、テストに使用できます。
テストの作成者は内容に迷うことが多いですが、スクレイピングで単語をストックしておけば、かなり楽に出題内容を決めることができるでしょう。
より楽に出題内容を決めたければ、スクレイピングした単語をレベル分けしたらいいと思います。レベル分けするときはExcelが便利です。
Excelにはフィルター機能があるので、出題内容を厳選するときは大変役に立ちます。
クイズに使用
スクレイピングした単語をクイズに使用しても面白いと思います。
一番受けそうなのは尻取りゲームですが、正解したら次のステージに進めるようにプログラミングしたらいいでしょう。
クイズに使うときは漢字を平仮名に変換した方が便利ですが、漢字を平仮名に変換してくれるwebサービスやアプリはあります。
私は使ったことがないので正確性は解りませんが、それでも全部手作業で実行するよりは遙かに効率的だと思います。
英単語の語彙力を増やす
英単語の語彙力を増やすときも、スクレイピングは便利です。
語彙力を増やそうと思ったら毎日英語に触れるのがいいと思いますが、忙しい人は時間を捻出するのが大変です。
しかし一日一単語ぐらいであれば、忙しい人でも無理なく勉強できると思います。
プログラミングできる人は、毎日違う単語が表示されるようにしたらいいでしょう。
アルゴリズムは簡単です。
単語のレコードに日付も一緒に格納するのです。そして本日の日付が格納されたレコードの英単語を出力するのです。
最近のプログラム言語はカレンダー関係の関数が多いので、レコードに日付を追加するのは難しくはありません。
漢字クイズ
漢字だけの単語があれば、意味と一緒にExcelなどに転記しましょう。
漢字クイズは昔から人気がありますが、膨大な数の漢字をスクレイピングしたら、長期間にわたって楽しめます。
ただ漢字の読み方を当てるだけでは面白みがないので、漢字の意味を択一式で選べるようにしたらどうでしょうか?
この手のクイズは作成が少々面倒ですが、多くの集客が見込めます。
多くの集客が見込めたら、アフィリエイト収入も期待できるのではないでしょうか。
スポンサーリンク
スクレイピングツールは本格タイプが便利
辞書の意味のスクレイピングは比較的簡単なので、既存のスクレイピングツールで十分です。ただあまりにも機能が貧弱だったら、不便を感じるでしょう。
単語も意味も一気にスクレイピングしたら効率的
単語も意味も一気にスクレイピングするには、使われているタグを同時に指定するしかありません。本格タイプのスクレイピングツールはタグの指定が簡単で、複数のタグを指定できるものもあります。
単語も意味も一気にスクレイピングしたら短時間で作業が終わるので、他の仕事にほとんど影響を与えることはありません。
膨大なオンライン辞書の場合はドメイン単位でスクレイピング
膨大なオンライン辞書は、多くのディレクトリーに単語と意味を格納している可能性があります。
このような辞書をスクレイピングするときは、ドメイン単位でスクレイピングできるツールが便利です。
ドメイン単位でスクレイピングできたら、10万単位の単語や意味であっても、比較的短時間で収集できます。
大量のデータを短時間で収集するのはスクレイピングの醍醐味ですが、ドメイン単位でスクレイピングできないツールだったら実現は難しいです。
頻繁に更新する人はプログラマ用のスクレイピングツール
頻繁に更新する人は、プログラマ用のスクレイピングツールが便利です。
アルゴリズムは簡単で、新たに加わった単語と意味をデータベースに格納するだけです。
格納した後は表示しなければいけませんが、SQL言語を使えば簡単ですね。
プログラマ用のスクレイピングツールは一般の人には難解ですが、プログラマにとっては非常に効率的なツールです。
プログラマの人は是非とも検討してほしいです。
まとめ
辞書の意味とスクレイピングをテーマにしましたが、辞書の単語と意味をスクレイピングするのは非常に有意義です。
一人で難読漢字に挑戦する人は、ローカルのデータベースソフトにデータを格納したら便利です。
辞書のスクレイピングは非常に有意義ですが、難易度は比較的低めなので、スクレイピング初心者にもおすすめします。
コメントを残す