Alteryx Designer Desktopの「Google Driveコネクタ」を使用した際のパフォーマンス(実行時間)についての質問です。
現状、Google Driveコネクタを使用してファイルを読み込むと、標準のデータ入力ツールに比べて処理時間が著しく長くなってしまいます。
接続設定とGoogle Driveコネクタのバージョンは下記になります。
「DCM接続(認証方法:Built-In App を使用)」
「Google Driveコネクタ バージョン:[v1.3.5]」
下記に調査した内容を記載いたします。
【小さいデータの実行時間の違い】
読み込むファイルのデータ容量が小さい場合は早く完了しますが、標準のデータ入力ツールと比較すると長いと考えております。
・小さいデータ(3カラム × 3レコード)の場合
・Google Driveコネクタ経由:約7秒
・ローカルにダウンロードし (Excel形式に変換される)、標準のデータ入力ツールで読み込み:1秒未満
【異なる方法での実行時間の違い】
・「ファイル情報」
・対象ファイル形式:Google スプレッドシート(.gsheet)
・ファイル容量:約4MB
・ファイルの中身情報:約25,600レコード / 約60カラム / 3シート(※3シートとも同等のレコード・カラム数)
・「異なる方法での実行時間の比較」
・約2分30秒:Google Driveに格納されているファイルをGoogle Driveコネクタを使用して参照(問題となる方法)
・約2秒:同ファイルをローカルにダウンロード(Excel形式に変換)。再度Google Driveに格納し、Google Drive for Desktop経由(エクスプローラー)にて標準の「データ入力」ツールで参照
・約1秒:同ファイルをローカルにダウンロード(Excel形式に変換)し、ローカルから標準の「データ入力」ツールで参照
※Google Driveに格納したExcelファイルをGoogle Driveコネクタにて参照すると同等な実行時間になります。
調査の結果、ファイルの形式がスプレッドシート(.gsheet)かExcel形式かに関わらず、Google Driveコネクタを使用することで実行時間がかかると考えております。また、データ容量に比例して実行時間が増加する傾向にあると思います。
Excel形式であれば「Google Drive for Desktop + 標準データ入力ツール」にて実行可能なのですが、対象がスプレッドシート形式の場合標準データ入力ツールが対応していない状況でございます。
同等なパフォーマンス問題が発生しており、解決策等の知見がございましたらご教示いただけますと幸いでございます。
何卒、よろしくお願いいたします。