首页
搜索...
⌘
K
切换主题
Elliot Yang 的动态
动态详情
返回列表
E
Elliot Yang
2026-03-18 10:25
公开
维度
传统 NLP 辅助 TTS
大模型 (LLM) 驱动 TTS
核心逻辑
基于规则或小型模型预测发音
基于概率预测语音 Token
情感表现
刻板、预设的情感模板
自然、随文意变化的细腻情感
上下文感知
仅限于句子内部
能跨段落感知语境和角色性格
处理复杂文本
容易在多音字上出错
容错率极高,能模仿口语碎碎念
#技术
#人工智能
#大语言模型
#TTS
#语音合成
#自然语言处理
#多模态
#生成式AI
浏览:
44
点赞:
0