コールセンターには日々大量の音声データが蓄積されています。そこには、テキストデータだけでは把握しきれない「顧客の本音」や「潜在的な課題」が含まれています。
しかし従来は、外部サービスへのデータ転送や複雑なパイプライン構築が必要となるケースが多く、音声データ活用のハードルは高いものでした。
今回は、Snowflakeの AI_TRANSCRIBE をはじめとする Cortex AI関数 を活用し、データの移動を最小限に抑えながら、音声の文字起こしから感情分析、要約、改善提案の生成までをSnowflake上で一気通貫に実現する構成を検証しました。
最大のメリットは、「データをSnowflake外へ極力持ち出さずに分析できること」 にあります。
顧客情報を含む音声データを外部APIへ転送せずに処理できるため、GDPRや個人情報保護法などへの対応が行いやすくなります。
文字起こし結果をそのままSQLで分析できるだけでなく、既存の顧客マスターや契約情報などの業務データとも容易に結合できます。
SQLベースで実装できるため、外部サービス連携や複雑なインフラ構築を最小限に抑えられます。PoCから本番導入までを短期間で進めやすい点も大きなメリットです。
今回は「自動車保険コールセンターのスーパーバイザー」という想定で、担当者の対応品質や顧客感情、解決率を分析する仕組みを構築しました。
実装にあたっては、Snowflake Developer Guides を参考にしています。
通常どおりデータベースやスキーマ、権限設定を行ったうえで、 AI_TRANSCRIBE を利用するために以下2点を設定します。
①クロスリージョンでのAI利用を有効化 一部のCortex機能は特定リージョンで提供されているため、日本リージョンなどから利用する場合はクロスリージョン利用を許可する必要があります。
-- リージョンを跨いだCortex機能の使用を有効化ALTER ACCOUNT SET CORTEX_ENABLED_CROSS_REGION = 'ANY_REGION'; |
② 音声ファイル格納用ステージの作成 今回は、音声ファイル格納用の内部ステージを作成します。 ディレクトリテーブルを有効化することで、ステージ内ファイルの一覧やメタデータをSQLから参照できるようになります。
-- 音声ファイル用のステージを作成CREATE OR REPLACE STAGE call_center_analytics_db.analytics.audio_files DIRECTORY = (ENABLE = TRUE) ENCRYPTION = (TYPE = 'SNOWFLAKE_SSE') COMMENT = 'コールセンターの音声ファイル用ステージ'; |
まずは、ステージに保存された音声ファイルをテキスト化します。 AI_TRANSCRIBE は日本語を含む40以上の言語に対応しており、1ファイルあたり最大700MB、最大120分まで処理可能です。
CREATE OR REPLACE TABLE ai_transcribed_calls ASSELECT |
AI_TRANSCRIBE の戻り値から :text を取得するだけで、文字起こし結果を簡単に取得できます。
公式ガイドでは、これに加えて処理ステータスや文字数なども保持しています。これは大量ファイルの安定した運用や後続の分析を見据えた構成です。
まずはシンプルな構成で試し、必要に応じて運用向けの項目を追加していくとスムーズです。
文字起こし結果に対し、Snowflake Cortex関数を組み合わせて分析を行います。
SENTIMENT) 通話全体の感情傾向を数値化SUMMARIZE) 長文の会話内容を短く要約AI_COMPLETE) 顧客名や問い合わせ内容をJSON形式で抽出以下は、感情分析・要約・構造化抽出を同時に実行する例です。
CREATE OR REPLACE TABLE comprehensive_call_analysis ASSELECTtranscript_text,-- 感情分析SNOWFLAKE.CORTEX.SENTIMENT(transcript_text) AS sentiment_score,-- 要約 |
数行のSQLだけで、音声データから構造化されたインサイトを取得できる点は非常に強力です。
補足:実運用を見据えた高度な分析 Snowflake Developer Guidesでは、さらに実運用を想定した分析例も紹介されています。
単純なPoCにとどまらず、「運用可能な分析基盤」まで視野に入れられている点が参考になります。
蓄積した分析結果を用いることで、次のような活用が可能になります。
対応品質や解決率を可視化し、追加トレーニングが必要な領域を把握できます。
解約、契約変更、技術問い合わせなど、問い合わせ内容ごとの感情傾向を分析できます。
AIが生成した改善提案を活用することで、スーパーバイザーによるフィードバックを効率化できます。
Snowflake Cortexを活用することで、音声データを「保存するだけのデータ」ではなく、「業務改善につながる分析資産」 として活用できるようになります。
特に、文字起こしから感情分析、要約、構造化抽出までをSQL中心で実現できる点は大きな魅力です。
複雑なパイプライン構築に時間をかけるのではなく、「データからどのような価値を引き出すか」に集中できることこそ、AI統合型データ基盤の大きな価値だと感じました。
https://docs.snowflake.com/ja/sql-reference/functions/ai_transcribe
https://www.snowflake.com/en/developers/guides/