跳转至

三周质量改进计划 — 实际进度 (4/13 更新)

目标:5月4日开始自生成内容正式上线 现实:代码已基本就绪,但托管层断裂,无线上可达的音频


一句话自画像

代码完成了90%,线上可达性完成了0%。

EP037-EP052 全部有本地音频和视频,10个平台发布器代码写好了,RSS feed 是 iTunes 合规的—— 但音频文件不在任何线上服务器,两个域名(lingzu.ai / guangda88.github.io)全部 404。 用户拿到 RSS feed 订阅后,什么都听不到。


Week 1: TTS音频质量 — ✅ 基本完成

任务 状态 说明
Fish S2 TTS引擎切换 fish_audio provider 已集成
.env配置更新 FISH_AUDIO_* 全部配置
TTS对比测试 Fish S2 vs Edge vs CosyVoice 已对比
情感感知TTS EmotionAwareAudioSynthesizer + 7种情感映射
EP052完整音频 13段 Fish Audio + 6段 Edge TTS (混合)
多音字修正 ⚠️ 部分 未做专门词典,但 pinyin 注音已集成

遗留:EP052 的 6段 Edge TTS (seg 011/013/015/016/018) 应在 GPU 可用时重做


Week 2: 视频质量 — ✅ 基本完成

任务 状态 说明
PPT图片生成 PPTGenerator 支持多种 slide 布局
PPT排版 16:9, 标题/内容/引用多种模板
视频合成 VideoComposer + SmartVideoComposer (beat-sync)
EP037-EP051视频 全部有 _final.mp4
EP052视频 有 slides + audio,可合成
代码质量 video.py 0 ruff warnings

遗留:无 AI 图片生成(DALL-E/Stable Diffusion 未集成),PPT 使用文字+渐变


Week 3: 多平台 & 英文 — ✅ 代码完成,❌ 线上断裂

任务 状态 说明
7个中文平台发布器 代码完整(WeChat/B站/喜马/小宇宙/抖音/快手/小红书)
3个英文平台发布器 YouTube/Spotify/Apple Podcasts
YouTube OAuth2 命令 setup-platform-auth youtube 完整流程
RSS feed (中文) 16集 (EP037-EP052),iTunes 合规,XML 已验证
RSS feed (英文) 16集 (EP037-EP052),iTunes 合规,XML 已验证
Playwright Chromium 已安装,已验证可用
音频在线托管 lingzu.ai DNS 不解析,GitHub Pages 404
平台 OAuth 认证 没有真实 token,10个平台全是 stub
英文音频 未生成英文 TTS

真实阻塞项

🔴 P0: 音频无法在线访问

  • lingzu.ai — DNS 不解析(域名可能未注册/未配置)
  • guangda88.github.io/lingtongask — 404(gh-pages 分支不存在)
  • 解法: 执行 bash scripts/deploy_pages_compressed.sh,然后 push gh-pages 分支
  • 需要: 用户执行 git push

🟡 P1: 平台认证

  • 10个平台全部是 stub 模式(无真实 token)
  • Spotify/Apple Podcasts 只需提交 RSS URL(一次性)
  • YouTube 需要完成 OAuth2 流程
  • 中文平台需要各自的 OAuth token 或扫码登录

🟢 P2: EP052 音质提升

  • 6段 Edge TTS 待用 Fish Audio 重做(需 GPU)
  • 预计 GPU 时间 25分钟,费用 ¥0.55

Launch Day: 5月4日 上线前必做

最低可行上线(MVP)

  1. [ ] 执行 deploy_pages_compressed.sh → push gh-pages
  2. [ ] 验证 https://guangda88.github.io/lingtongask/feed.xml 可访问
  3. [ ] 验证至少3个音频文件 200 OK
  4. [ ] 提交 RSS feed 到 Apple Podcasts + Spotify(一次性)
  5. [ ] 提交 RSS feed 到小宇宙(一次性)

完整上线

  1. [ ] 完成至少1个中文平台 OAuth(建议 B站 或 微信)
  2. [ ] 完成 YouTube OAuth2
  3. [ ] EP052 Edge TTS 段落重做(GPU)
  4. [ ] 首集 EP053 生产

代码质量现状

模块 ruff warnings 状态
src/ (全部) 0 ✅ 干净
scripts/ ~30 待清理
mcp_server/ ~6 待清理

技术资产盘点

  • EP037-EP051: 15集,Edge TTS 音频 + H.265 视频,全部本地可用
  • EP052: 1集,Fish Audio 混合音频,最新质量标杆
  • RSS feed: 中英文各16集,iTunes 合规
  • MCP Server: 7个工具(情感分析、TTS、内容生成、质量检查、语音注册)
  • 10个平台发布器: 代码完整,待认证
  • 部署脚本: deploy_pages_compressed.sh 一键生成 gh-pages 分支
  • GPU 部署脚本: gpu_deploy_and_start.sh 一键启动 Fish Speech API