例えば、A1のセルに情報を取得したいページのURLを入力し、B1のセルに「=ImportHTML(A1,"table", 1)」と入力すれば、当該ページにある表のデータをきれいに読み込むことができます。本当に手軽なスクレイピングツールです。
URLが別のグーグル・スプレッドシートだった場合、複数のシートがあっても、「=ImportHTML(A1,"table", 2)」とすれば2番目のシートのデータを読み込むことができます。
例えば、下記のような使い方ができます。
気象庁の月平均気温偏差の表をImportHTML()関数によって、スプレッドシートに読み込み、グーグルのダッシュボードのデータの取得先に設定しています。この仕組みによって、ダッシュボードのデータの入手、更新がとても簡単になります。
ダッシュボードでは、気象庁の数表がソート可能なインタラクティブな表になっています。
実際に以下のページのダッシュボードのデータは、スプレッドシートのImportHTML()関数で入手したデータになっています。
◆日本の月平均気温偏差(℃):月別の時系列データの分析:グーグルのデータポータルのダッシュボードによる、並べ替えができる表です
---------------------------------------------------
-
0 件のコメント:
コメントを投稿