Realtime Voice + AI Companion

三方语音通话 Demo 控制台

用一个简单网页把房间、ASR 会话、字幕流和 AI 插话都串起来,方便测试阶段联调。

当前推荐路径

由于微信小程序测试号拿不到 `live-pusher / live-player`,这一版默认按“微信内 H5 + 火山 Web SDK”来试。先验证微信浏览器兼容性、RTC Token 和 Web SDK,再决定后面是否继续收拢语音链路。

服务状态 检测中
AI Provider -
RTC Provider -
ASR Provider -
AI 模型 -
豆包地址 -
MiniMax 地址 -
veRTC AppID -
ASR WS 路径 -

微信内 H5 试验面板

先用这块快速判断当前手机微信环境是否具备最小 RTC 试验条件。

运行环境 检测中
HTTPS / SecureContext 检测中
麦克风采集 检测中
AudioContext 检测中
SpeechRecognition 检测中
veRTC Web SDK 检测中
试验顺序

1. 先在手机微信中打开这个页面。2. 看上面的兼容性检查有没有全绿。3. 再获取 RTC Token。4. 最后尝试加入 RTC 通话。如果 HTTPS 或麦克风检测失败,先不要继续测 RTC。

开发调试 API Key 设置

未加载
已保存豆包 Key-
已保存 MiniMax Key-
已保存 veRTC AppKey-
已保存 Volc AK-
已保存 Volc SK-
已保存 Volc ASR Token-
已保存 Volc ASR API Key-
.env 路径-

密码框留空表示不修改当前已保存的 Key。保存后会同步写入项目根目录下的 `.env`。

ASR Provider 配置

未加载

房间控制

未入房
推荐流程

先点“一键开始通话”,接通后你就可以直接在 RTC 里说话。页面上的字幕和 AI 插话目前还需要额外开启“AI 监听”。

房间状态 -
AI 状态 -
成员 -
RTC 通话 未加入

房间消息

这里会实时显示房间里的转写内容和 AI 回复。

AI 监听 / 字幕

未创建会话
当前工作方式

现在 RTC 通话和字幕链路是分开的。进入 RTC 后你可以直接和对端聊天;如果希望页面显示文字、触发 AI 插话,还需要开启下面的“AI 监听”。

A AI 监听 待命
B AI 监听 待命

这里当前仍然走浏览器语音识别,再把最终文本送入 AI 链路;还不是火山实时 ASR,所以 RTC 里直接说话不会自动在页面上出字幕。

A Session -
B Session -

声音模型配置

未加载

实时事件流