Zoom Memo Automation システム - Transcript API対応版
Zoom Memo Automation v2.0は、Zoom Transcript APIを活用して、文字起こし処理を大幅に効率化した次世代システムです。
説明: Zoom Recording APIから自動生成された文字起こしデータ(VTT形式)を取得・解析する新規サービス
実装場所: 1.src/services/transcriptService.js(新規作成)
状態: 🆕 設計完了・実装待ち
| メソッド名 | 機能 | 戻り値 |
|---|---|---|
| downloadTranscript(recording) | 録画データからVTTファイルを取得 | VTTコンテンツ or null |
| parseVTT(vttContent) | VTT形式を解析してテキスト抽出 | {fullText, speakers, timestamps} |
| hasTranscript(recording) | トランスクリプト有無判定 | boolean |
| extractSpeakers(vttContent) | 発言者情報の抽出 | Array<Speaker> |
| 項目 | 仕様 |
|---|---|
| 取得形式 | WebVTT(Web Video Text Tracks)形式 |
| 文字コード | UTF-8 |
| タイムスタンプ | HH:MM:SS.mmm形式を保持・除去可能 |
| スピーカー識別 | 話者名を抽出して構造化 |
| エラーハンドリング | VTT解析失敗時は音声処理へフォールバック |
説明: 文字起こし済みテキストから要約のみを生成する高速処理モード
実装場所: 1.src/services/aiService.js(既存拡張)
状態: 🆕 設計完了・実装待ち
| メソッド名 | 機能 | 処理時間 |
|---|---|---|
| generateSummaryFromText(text) | テキストから8項目要約生成 | 10-30秒 |
| getSummaryOnlyModel() | 要約専用軽量モデル選択 | 即座 |
| optimizeSummaryPrompt(text) | 要約用プロンプト最適化 | 即座 |
説明: Transcript API対応を追加した録画処理サービス
実装場所: 1.src/services/zoomRecordingService.js
状態: ⚡ 設計完了・更新待ち
| メソッド名 | 変更内容 | 影響範囲 |
|---|---|---|
| processRecording() | Transcript優先処理を追加 | 高 |
| extractRecordingFiles() | TRANSCRIPTファイル種別追加 | 中 |
| selectProcessingPath() | 処理パス選択ロジック(新規) | 新規 |
説明: フォールバック専用として維持される音声処理サービス
実装場所: 1.src/services/audioSummaryService.js
状態: ⚠️ フォールバック専用へ移行
| 測定項目 | v1.0(音声処理) | v2.0(Transcript API) | 改善率 |
|---|---|---|---|
| 30分会議の処理時間 | 5-10分 | 30秒-1分 | 90%削減 |
| 60分会議の処理時間 | 17分で途切れ | 1-2分(完全対応) | ∞ |
| Gemini API使用量 | 音声+要約 | 要約のみ | 80%削減 |
| 処理成功率 | 85%(タイムアウトあり) | 99% | 14%向上 |
| 文字起こし精度 | Gemini依存 | Zoom高精度 | 向上 |
TranscriptServiceを新規実装し、既存処理と並行動作可能な状態を構築
10%のトラフィックで新処理を検証、段階的に増加
Transcript APIを主要処理パスとして確立
| リスク | 影響度 | 対策 |
|---|---|---|
| Transcriptが利用不可 | 中 | 音声処理へ自動フォールバック |
| VTT解析エラー | 低 | エラーハンドリングとフォールバック |
| 文字コード問題 | 低 | UTF-8強制、文字コード検出 |
| API仕様変更 | 中 | バージョン固定、変更監視 |
| カテゴリ | v1.0 | v2.0 | 変更点 |
|---|---|---|---|
| 文字起こし | Gemini AI | Zoom Transcript API | 新規追加 |
| 要約生成 | Gemini 2.5 Pro | Gemini 2.5 Flash | 軽量化 |
| データ形式 | M4A/MP3音声 | VTTテキスト | 形式変更 |
| 処理パイプライン | シーケンシャル | 分岐処理 | 最適化 |