应用中心
AI 同声传译
实时语音翻译和文字翻译,支持多语言互译,让跨语言沟通零障碍。
- 实时语音翻译
- 文字翻译
- 多语言支持
- 配置导入导出
演讲同传
全屏演讲模式,大字体字幕显示,支持多语言翻译,适合会议和演讲场景。
- 全屏大字体显示
- 实时双语字幕
- 画中画悬浮窗
- 字幕导出功能
AI 实时对话
多轮实时语音对话,支持自定义 LLM、TTS、STT 配置,打造专属 AI 助手。
- 多轮对话
- 实时字幕
- 对话历史
- 5 标签页配置
语音合成 TTS
支持文本转语音、SSE 流式合成、声音克隆,提供完整的 TTS 解决方案。
- 文本转语音
- SSE 流式合成
- 声音克隆
- 历史记录管理
声音克隆推荐
独立的声音克隆工具,支持浏览器录音和文件上传,一键试听克隆效果。
- 文件上传 / 浏览器录音
- 试听功能(TTS 合成)
- 克隆历史管理
- VoiceID 一键复制
声纹识别对话
基于声纹识别的实时对话,支持声纹注册和匹配,提供身份认证功能。
- 声纹注册
- 实时匹配
- 身份认证
- 对话历史
AI 故事坊新增
AI 生成故事、混元配图、TTS 配音,一键导出带字幕的视频,让创作更简单。
- LLM 生成故事文本
- 混元文生图配图
- TTS 批量配音
- 视频自动合成导出
配音工作台
分段配音编辑器,支持批量 TTS 合成和音频自动合并,适用于视频配音等场景。
- 多段落管理
- 批量 TTS 合成
- 音频自动合并
- 一键导出 WAV
LLM Agent 构建器新增
填写需求自动生成多文件项目代码,支持 OpenAI 兼容接口,默认直接调用。
- 快速模板与选项
- 多文件结果浏览
- 复制/下载便捷操作
- 本地配置持久化
IM 聊天示例实验
接入腾讯云即时通信 TIM Web SDK,支持在浏览器内生成 UserSig 并完成 C2C 文本聊天。
- 浏览器端 UserSig 生成
- 登录/退出管理
- C2C / 群聊消息收发
- 本地配置持久化
听众模式
加入房间只听不说,实时接收同声传译内容,无需推流,无需麦克风权限。
- 房间号加入
- 实时字幕接收
- 多语言翻译显示
- 无需配置密钥
核心特性
纯前端架构
无需后端服务器,所有代码都在单个 HTML 文件中
安全可靠
配置本地存储,支持导入导出,可选密钥脱敏
实时响应
基于 TRTC WebRTC 技术,毫秒级延迟
现代 UI
支持深色/浅色主题,响应式设计