AISHA

AI TELEPHONE SYSTEM

AI電話システム
「ポポ」の仕組み

最新のAIとクラウド技術をつなぎ、
「声」でやり取りする新しい体験を。

複雑な技術を、シンプルで温かみのある
インターフェースに包んでお届けします。

Popo Body Popo Eyes
MECHANISM

AI電話システム「ポポ」の仕組み

このシステムは、ユーザーが電話をかけると、AIキャラクター「ポポ」が応答する仕組みです。 Google Cloudの最新技術とTwilioを組み合わせ、 全体の「司令塔」となるCloud Run Functionsが各サービスをオーケストレーション(指揮)しています。

👤
ユーザー
① 電話/音声 ⑨ 音声再生
Twilio界 [電話の入出力]
📞
Twilio
音声認識 & 再生
② テキスト化 ⑧ 再生指示
Google Cloud界 [処理基盤]
⚙️
Cloud Run
Functions
【司令塔】
③ 依頼 ④ 返答
🧠
Gemini
【頭脳】
⑤ 合成
🗣️
TTS
【発話】
⑥ 保存
📦
GCS
【保管】
⑦ 再生URL発行

⚙️Cloud Run Functions

オーケストレーション(指揮)を担当。Twilioから来たテキストを受け取り、「どう返事するか」をGeminiに聞き、「どう喋るか」をTTSに依頼し、最後にTwilioへ音声を渡す、全体の進行役です。

🧠Vertex AI Gemini

ポポの頭脳です。ユーザーの言葉(テキスト)に対して、キャラクターの性格や文脈を踏まえた自然な返答を考え出します。

🗣️Text-to-Speech

Geminiが考えた文章を、実際に聞こえる「人の声(のような音声)」に変換します。Googleの高品質な音声合成技術を使用しています。

📞Twilio

電話回線とインターネットをつなぐゲートウェイ。電話の音声をAIが理解できるテキストに変換(音声認識)し、逆にAIが作った音声を電話の向こうのユーザーに再生します。

AI活用の相談をする

「ポポ」のようなAI電話システムから、
業務効率化のためのAI導入まで。
まずは人間のスタッフが丁寧にお話を伺います。

お問い合わせはこちら