NLU是语音助手的“大脑”。详解口语语言理解(SLU)的两大核心任务——意图识别和槽位填充,生成式统一方法,以及零样本SLU的最新进展。
对话系统与 NLU
意图识别、对话状态跟踪、多轮对话管理、话轮转换、情感识别与指代消解
文章列表
- 21
- 22多轮对话需要追踪状态。详解对话状态跟踪(DST)方法,从传统本体驱动到基于LLM的状态追踪,以及注意力上下文传递在端到端口语理解中的应用。
- 23对话管理决定助手的“智慧”。对比传统基于规则的对话管理、状态机方法,以及LLM-as-DM的新范式。详解对话策略学习、响应生成和对话流控制。
- 24自然对话需要流畅的话轮切换。详解JAL-Turn(联合声学-语言话轮转换)、TurnGuide(动态话轮级引导)、语义感知中断检测等前沿工作,以及如何实现自然的打断和回恢复。
- 25同样的话,不同的语气含义完全不同。详解语音情感特征提取、多尺度情感建模、真实场景下的情感识别挑战,以及情感信息如何增强对话系统的响应质量。
- 26口语对话大量使用代词和省略。详解共指消解、对话历史建模、注意力上下文传递方法,以及语音对话中特有的指代消解挑战(没有文字可以回看)。
- 27不是所有语言都有充足数据。详解跨语言迁移学习、内部-外部知识蒸馏(I2KD-SLU)、提示学习方法,以及如何在小语种和专业领域实现可用的语音NLU。
- 28如何评判一个语音对话系统好不好?详解自动评估指标(WER、对话成功率、实体F1)与人工评估方法,全双工对话的特殊评测维度,以及构建可复现评测体系的实践。