三周质量改进计划 — 实际进度 (4/13 更新)
目标:5月4日开始自生成内容正式上线 现实:代码已基本就绪,但托管层断裂,无线上可达的音频
一句话自画像
代码完成了90%,线上可达性完成了0%。
EP037-EP052 全部有本地音频和视频,10个平台发布器代码写好了,RSS feed 是 iTunes 合规的—— 但音频文件不在任何线上服务器,两个域名(lingzu.ai / guangda88.github.io)全部 404。 用户拿到 RSS feed 订阅后,什么都听不到。
Week 1: TTS音频质量 — ✅ 基本完成
| 任务 | 状态 | 说明 |
|---|---|---|
| Fish S2 TTS引擎切换 | ✅ | fish_audio provider 已集成 |
| .env配置更新 | ✅ | FISH_AUDIO_* 全部配置 |
| TTS对比测试 | ✅ | Fish S2 vs Edge vs CosyVoice 已对比 |
| 情感感知TTS | ✅ | EmotionAwareAudioSynthesizer + 7种情感映射 |
| EP052完整音频 | ✅ | 13段 Fish Audio + 6段 Edge TTS (混合) |
| 多音字修正 | ⚠️ 部分 | 未做专门词典,但 pinyin 注音已集成 |
遗留:EP052 的 6段 Edge TTS (seg 011/013/015/016/018) 应在 GPU 可用时重做
Week 2: 视频质量 — ✅ 基本完成
| 任务 | 状态 | 说明 |
|---|---|---|
| PPT图片生成 | ✅ | PPTGenerator 支持多种 slide 布局 |
| PPT排版 | ✅ | 16:9, 标题/内容/引用多种模板 |
| 视频合成 | ✅ | VideoComposer + SmartVideoComposer (beat-sync) |
| EP037-EP051视频 | ✅ | 全部有 _final.mp4 |
| EP052视频 | ✅ | 有 slides + audio,可合成 |
| 代码质量 | ✅ | video.py 0 ruff warnings |
遗留:无 AI 图片生成(DALL-E/Stable Diffusion 未集成),PPT 使用文字+渐变
Week 3: 多平台 & 英文 — ✅ 代码完成,❌ 线上断裂
| 任务 | 状态 | 说明 |
|---|---|---|
| 7个中文平台发布器 | ✅ | 代码完整(WeChat/B站/喜马/小宇宙/抖音/快手/小红书) |
| 3个英文平台发布器 | ✅ | YouTube/Spotify/Apple Podcasts |
| YouTube OAuth2 命令 | ✅ | setup-platform-auth youtube 完整流程 |
| RSS feed (中文) | ✅ | 16集 (EP037-EP052),iTunes 合规,XML 已验证 |
| RSS feed (英文) | ✅ | 16集 (EP037-EP052),iTunes 合规,XML 已验证 |
| Playwright Chromium | ✅ | 已安装,已验证可用 |
| 音频在线托管 | ❌ | lingzu.ai DNS 不解析,GitHub Pages 404 |
| 平台 OAuth 认证 | ❌ | 没有真实 token,10个平台全是 stub |
| 英文音频 | ❌ | 未生成英文 TTS |
真实阻塞项
🔴 P0: 音频无法在线访问
lingzu.ai— DNS 不解析(域名可能未注册/未配置)guangda88.github.io/lingtongask— 404(gh-pages 分支不存在)- 解法: 执行
bash scripts/deploy_pages_compressed.sh,然后 push gh-pages 分支 - 需要: 用户执行
git push
🟡 P1: 平台认证
- 10个平台全部是 stub 模式(无真实 token)
- Spotify/Apple Podcasts 只需提交 RSS URL(一次性)
- YouTube 需要完成 OAuth2 流程
- 中文平台需要各自的 OAuth token 或扫码登录
🟢 P2: EP052 音质提升
- 6段 Edge TTS 待用 Fish Audio 重做(需 GPU)
- 预计 GPU 时间 25分钟,费用 ¥0.55
Launch Day: 5月4日 上线前必做
最低可行上线(MVP)
- [ ] 执行
deploy_pages_compressed.sh→ push gh-pages - [ ] 验证
https://guangda88.github.io/lingtongask/feed.xml可访问 - [ ] 验证至少3个音频文件 200 OK
- [ ] 提交 RSS feed 到 Apple Podcasts + Spotify(一次性)
- [ ] 提交 RSS feed 到小宇宙(一次性)
完整上线
- [ ] 完成至少1个中文平台 OAuth(建议 B站 或 微信)
- [ ] 完成 YouTube OAuth2
- [ ] EP052 Edge TTS 段落重做(GPU)
- [ ] 首集 EP053 生产
代码质量现状
| 模块 | ruff warnings | 状态 |
|---|---|---|
src/ (全部) |
0 | ✅ 干净 |
scripts/ |
~30 | 待清理 |
mcp_server/ |
~6 | 待清理 |
技术资产盘点
- EP037-EP051: 15集,Edge TTS 音频 + H.265 视频,全部本地可用
- EP052: 1集,Fish Audio 混合音频,最新质量标杆
- RSS feed: 中英文各16集,iTunes 合规
- MCP Server: 7个工具(情感分析、TTS、内容生成、质量检查、语音注册)
- 10个平台发布器: 代码完整,待认证
- 部署脚本:
deploy_pages_compressed.sh一键生成 gh-pages 分支 - GPU 部署脚本:
gpu_deploy_and_start.sh一键启动 Fish Speech API