Translate

2020年2月8日土曜日

◆グーグル・スプレッドシートの便利な機能:ImportHTML()関数は手軽なスクレイピングツールです

グーグルのスプレッドシートのImportHTML()関数はとても便利です。手軽なスクレイピングツールとして利用することができます。

例えば、A1のセルに情報を取得したいページのURLを入力し、B1のセルに「=ImportHTML(A1,"table", 1)」と入力すれば、当該ページにある表のデータをきれいに読み込むことができます。本当に手軽なスクレイピングツールです。

URLが別のグーグル・スプレッドシートだった場合、複数のシートがあっても、「=ImportHTML(A1,"table", 2)」とすれば2番目のシートのデータを読み込むことができます。

例えば、下記のような使い方ができます。

気象庁の月平均気温偏差の表をImportHTML()関数によって、スプレッドシートに読み込み、グーグルのダッシュボードのデータの取得先に設定しています。この仕組みによって、ダッシュボードのデータの入手、更新がとても簡単になります。

ダッシュボードでは、気象庁の数表がソート可能なインタラクティブな表になっています。

実際に以下のページのダッシュボードのデータは、スプレッドシートのImportHTML()関数で入手したデータになっています。

  ◆日本の月平均気温偏差(℃):月別の時系列データの分析:グーグルのデータポータルのダッシュボードによる、並べ替えができる表です
----------------------------------------------------

---------------------------------------------------
-

0 件のコメント:

コメントを投稿