开发实战

全栈架构设计、Pipecat/LiveKit框架、RAG+语音、工具调用、流式全链路与边缘部署

文章列表

29
语音助手全栈架构设计：从零搭建完整系统
第 29 期 2026-04-05 · 13 分钟阅读实战
动手搭建第一个完整语音助手。详解系统架构选型（级联vs端到端）、ASR+LLM+TTS技术栈组合、音频流处理、WebSocket通信，以及从原型到生产的架构演进。
30
Pipecat 与 LiveKit Agents：开源语音 AI 框架实战
第 30 期 2026-04-05 · 15 分钟阅读实战
不需要从零开始。详解Pipecat（灵活的语音AI流水线框架）和LiveKit Agents（实时多模态Agent框架），对比选型，并通过完整示例演示如何快速搭建可用的语音Agent。
31
RAG + 语音：让助手拥有知识库
第 31 期 2026-04-05 · 7 分钟阅读实战
语音助手需要专业知识。详解Stream RAG（端到端语音对话中的流式检索增强）、语音查询到检索的完整链路，以及如何在实时对话中无缝融入知识库检索。
32
语音 Agent 工具调用：让助手帮你执行操作
第 32 期 2026-04-05 · 9 分钟阅读实战
语音助手不只是聊天。详解Function Calling + 语音的集成方案、流式工具使用（Web搜索、API调用），以及多轮工具交互的对话管理策略。
33
流式语音对话全链路工程：实时 ASR→LLM→TTS
第 33 期 2026-04-05 · 10 分钟阅读实战
生产级语音助手的核心挑战。详解端到端延迟优化的每个环节：流式ASR partial结果、LLM流式生成、TTS流式合成、音频流传输，以及如何将总延迟控制在500ms以内。
34
语音助手边缘部署：从云端到树莓派
第 34 期 2026-04-05 · 8 分钟阅读实战
隐私和延迟推动语音AI走向边缘。详解whisper.cpp边缘推理、4-bit量化方案、Moonshine嵌入式ASR，以及树莓派等资源受限设备上的语音助手部署实践。