sammi@DataScience

Python, Machine Learning, Deep Leaning, Data Science, Kaggle.

スポンサーリンク

pandas.read_gbqでBigQueryのデータをDataframeに出力

はじめに

  BigQueryに保存されているデータをpandasで弄りたい時に、pandasのread_gbqという関数を使うだけでBigQueryのデータをDataframeに出力することができます。今回はread_gbqについて紹介していきたいと思います。  

事前準備

  ①https://cloud.google.com/sdk/SDKパッケージをダウンロードしてCLOUD SDKをインストールします。
 
②ターミナルで、pip install google-api-python-clientと入力し、clientをインストールします。
 
③ターミナルで、pip install pandas-gbqと入力し、pandas-gbqをインストールします。
 

read_gbqの例

 

import pandas as pd
 
#project_id : 使用しているBigQueryのプロジェクト名  
project_id = 'xxxx'
 
#query : SQLを文字列として入力します。  
query = "SELECT * FROM `xxxx_dataset.xxxxx_table`;"
 
#dialect='standard'
#スタンダードSQL(レガシーSQLではなく)を指定しています
df = pd.read_gbq(query, project_id, dialect='standard')


実行すると"Enter the authorization codeという提示が出てきますので、提示にあるリンクをクリックし、許可コードをコピペするとBQのselect結果がDataframeに出力されるはずです。そして、2回目以降は許可コードは要らないです。

スポンサーリンク