はじめに
BigQueryでは、大量のデータを簡単に操作できるのが特徴ですが、クエリの内容次第でパフォーマンスに悪影響を与えるアンチパターンが存在します。そこでこの記事では、アンチパターンを回避するベストプラクティスを解説します。
BigQueryでのアンチパターンとベストプラクティス
SELECT * の使用を避ける
SELECT COUNT(*) の使用を避ける
LIMIT の使用はコストに影響しない
自己結合を避ける
日付で区切られたテーブルの全期間の読み込みを避ける
サブクエリでのORDER BY を避ける
参考
公式のドキュメント
https://cloud.google.com/bigquery/docs/best-practices-performance-patterns?hl=ja
https://cloud.google.com/bigquery/docs/best-practices-performance-communication?hl=ja