问题修复报告
报告时间: $(date '+%Y-%m-%d %H:%M:%S')
✅ 已修复的问题
1. tcm-xinference 容器持续重启
问题描述: tcm-xinference 容器持续重启,无法正常运行
原因分析:
- 容器启动命令错误:/bin/bash
- /bin/bash 是交互式 shell,没有输入时立即退出
- 导致容器退出,触发重启策略
修复方案:
1. 停止并删除错误的容器
2. 使用正确的启动命令重新创建容器
3. 正确的启动命令: xinference-local --host 0.0.0.0 --port 9997
修复结果: - ✅ 容器正常运行 - ✅ 端口 9997 和 9998 监听中 - ✅ 服务可访问
2. jdxb 服务
问题描述: jdxb 服务启动不成功
原因分析: - 容器不存在或未启动 - 需要重新拉取镜像并运行
修复方案: 1. 检查镜像是否存在 2. 使用正确配置启动容器 3. 使用 host 网络模式
修复结果: - ✅ 容器正常运行 - ✅ 内部进程正常 - ✅ 端口 9118 监听中
3. VNC 服务
问题描述: VNC 服务未启动
原因分析: - VNC 服务器已经运行,但需要验证 - 端口监听需要确认
修复方案: 1. 检查 VNC 进程状态 2. 验证端口监听状态 3. 确认服务可访问
修复结果: - ✅ VNC 服务正常运行 - ✅ 端口 5901 监听中 - ✅ 可通过 192.168.2.1:5901 访问
❌ 未修复的问题
1. 100.66.1.X 网段不通
问题描述: 无法连接到 100.66.1.7 (远程备份服务器)
原因分析:
1. VPN 配置文件不存在:/etc/wireguard/wg0.conf
2. 没有配置到 100.66.1.0/24 的静态路由
3. 可能的防火墙阻止
建议修复: 1. 配置 WireGuard VPN 2. 添加静态路由 3. 检查防火墙规则
2. 10.113.22.X 网段不通
问题描述: 无法连接到 10.113.22.1 (同网段主机)
原因分析: 1. 10.113.22.1 主机可能不存在 2. 10.113.22.1 主机可能已关闭 3. 可能的交换机/路由器配置问题
建议修复: 1. 扫描 10.113.22.X 网段,查找在线主机 2. 检查交换机/路由器配置 3. 检查防火墙规则
3. SSH 端口 2222 未监听
问题描述: SSH 服务未监听端口 2222
原因分析: 1. SSH 服务可能未配置监听 2222 端口 2. SSH 服务可能未启动
建议修复: 1. 检查 SSH 服务状态 2. 配置 SSH 服务监听 2222 端口 3. 重启 SSH 服务
4. zhinengAI01 的 VNC 服务未启动
问题描述: zhinengAI01 的 VNC 服务未启动
原因分析: 1. 无法连接到 zhinengAI01 2. zhinengAI01 的 IP 地址未知 3. 网络连接问题
建议修复: 1. 确定 zhinengAI01 的 IP 地址 2. 检查网络连接 3. SSH 连接到 zhinengAI01 并启动 VNC 服务
📊 服务状态汇总
Docker 容器
| 容器名称 | 状态 | 端口 |
|---|---|---|
| tcm-xinference | ✅ 正常 | 9997, 9998 |
| owjdxb | ✅ 正常 | - |
| tcm-backend | ✅ 正常 | 8000 |
| tcm-frontend | ✅ 正常 | 3000 |
| tcm-milvus | ✅ 正常 | 19530, 19531 |
| tcm-redis | ✅ 正常 | 6379 |
| tcm-elasticsearch | ✅ 正常 | 9200, 9300 |
| tcm-postgres | ✅ 正常 | 5432 |
系统服务
| 服务名称 | 状态 | 端口 | 访问地址 |
|---|---|---|---|
| VNC 服务 | ✅ 正常 | 5901 | 192.168.2.1:5901 |
| jdxb 服务 | ✅ 正常 | 9118 | 192.168.2.1:9118 |
| Prometheus | ✅ 正常 | 9090 | 192.168.2.1:9090 |
| Grafana | ✅ 正常 | 3000 | 192.168.2.1:3000 |
网络连接
| 目标 | 状态 | 延迟 |
|---|---|---|
| 192.168.2.1 (本机) | ✅ 通 | 0.031ms |
| 192.168.31.88 (zhiengNAS) | ✅ 通 | 0.324ms |
| 100.66.1.7 (远程备份) | ❌ 不通 | - |
| 10.113.22.1 (同网段) | ❌ 不通 | - |
| 10.113.22.99 (本机) | ✅ 通 | 0.029ms |
🚀 下一步行动
立即执行
- 配置 WireGuard VPN
- 创建
/etc/wireguard/wg0.conf配置文件 - 启动 VPN:
sudo wg-quick up wg0 -
设置开机自启动:
sudo systemctl enable wg-quick@wg0 -
添加静态路由
-
扫描 10.113.22.X 网段
短期目标
- 修复 100.66.1.X 网段连接
- 修复 10.113.22.X 网段连接
- 配置 SSH 服务监听 2222 端口
- 启动 zhinengAI01 的 VNC 服务
长期目标
- 配置 VPN 自动启动
- 配置静态路由永久生效
- 设置网络连接监控和告警
- 定期检查和维护
报告生成者: AI Server
报告日期: $(date '+%Y-%m-%d %H:%M:%S')
下次检查: 建议定期检查服务状态和网络连接
感谢使用智能知识库系统!