跳转至

问题修复报告

报告时间: $(date '+%Y-%m-%d %H:%M:%S')


✅ 已修复的问题

1. tcm-xinference 容器持续重启

问题描述: tcm-xinference 容器持续重启,无法正常运行

原因分析: - 容器启动命令错误:/bin/bash - /bin/bash 是交互式 shell,没有输入时立即退出 - 导致容器退出,触发重启策略

修复方案: 1. 停止并删除错误的容器 2. 使用正确的启动命令重新创建容器 3. 正确的启动命令: xinference-local --host 0.0.0.0 --port 9997

修复结果: - ✅ 容器正常运行 - ✅ 端口 9997 和 9998 监听中 - ✅ 服务可访问


2. jdxb 服务

问题描述: jdxb 服务启动不成功

原因分析: - 容器不存在或未启动 - 需要重新拉取镜像并运行

修复方案: 1. 检查镜像是否存在 2. 使用正确配置启动容器 3. 使用 host 网络模式

修复结果: - ✅ 容器正常运行 - ✅ 内部进程正常 - ✅ 端口 9118 监听中


3. VNC 服务

问题描述: VNC 服务未启动

原因分析: - VNC 服务器已经运行,但需要验证 - 端口监听需要确认

修复方案: 1. 检查 VNC 进程状态 2. 验证端口监听状态 3. 确认服务可访问

修复结果: - ✅ VNC 服务正常运行 - ✅ 端口 5901 监听中 - ✅ 可通过 192.168.2.1:5901 访问


❌ 未修复的问题

1. 100.66.1.X 网段不通

问题描述: 无法连接到 100.66.1.7 (远程备份服务器)

原因分析: 1. VPN 配置文件不存在:/etc/wireguard/wg0.conf 2. 没有配置到 100.66.1.0/24 的静态路由 3. 可能的防火墙阻止

建议修复: 1. 配置 WireGuard VPN 2. 添加静态路由 3. 检查防火墙规则


2. 10.113.22.X 网段不通

问题描述: 无法连接到 10.113.22.1 (同网段主机)

原因分析: 1. 10.113.22.1 主机可能不存在 2. 10.113.22.1 主机可能已关闭 3. 可能的交换机/路由器配置问题

建议修复: 1. 扫描 10.113.22.X 网段,查找在线主机 2. 检查交换机/路由器配置 3. 检查防火墙规则


3. SSH 端口 2222 未监听

问题描述: SSH 服务未监听端口 2222

原因分析: 1. SSH 服务可能未配置监听 2222 端口 2. SSH 服务可能未启动

建议修复: 1. 检查 SSH 服务状态 2. 配置 SSH 服务监听 2222 端口 3. 重启 SSH 服务


4. zhinengAI01 的 VNC 服务未启动

问题描述: zhinengAI01 的 VNC 服务未启动

原因分析: 1. 无法连接到 zhinengAI01 2. zhinengAI01 的 IP 地址未知 3. 网络连接问题

建议修复: 1. 确定 zhinengAI01 的 IP 地址 2. 检查网络连接 3. SSH 连接到 zhinengAI01 并启动 VNC 服务


📊 服务状态汇总

Docker 容器

容器名称 状态 端口
tcm-xinference ✅ 正常 9997, 9998
owjdxb ✅ 正常 -
tcm-backend ✅ 正常 8000
tcm-frontend ✅ 正常 3000
tcm-milvus ✅ 正常 19530, 19531
tcm-redis ✅ 正常 6379
tcm-elasticsearch ✅ 正常 9200, 9300
tcm-postgres ✅ 正常 5432

系统服务

服务名称 状态 端口 访问地址
VNC 服务 ✅ 正常 5901 192.168.2.1:5901
jdxb 服务 ✅ 正常 9118 192.168.2.1:9118
Prometheus ✅ 正常 9090 192.168.2.1:9090
Grafana ✅ 正常 3000 192.168.2.1:3000

网络连接

目标 状态 延迟
192.168.2.1 (本机) ✅ 通 0.031ms
192.168.31.88 (zhiengNAS) ✅ 通 0.324ms
100.66.1.7 (远程备份) ❌ 不通 -
10.113.22.1 (同网段) ❌ 不通 -
10.113.22.99 (本机) ✅ 通 0.029ms

🚀 下一步行动

立即执行

  1. 配置 WireGuard VPN
  2. 创建 /etc/wireguard/wg0.conf 配置文件
  3. 启动 VPN: sudo wg-quick up wg0
  4. 设置开机自启动: sudo systemctl enable wg-quick@wg0

  5. 添加静态路由

    sudo ip route add 100.66.1.0/24 via <网关IP>
    

  6. 扫描 10.113.22.X 网段

    nmap -sn 10.113.22.0/24
    

短期目标

  1. 修复 100.66.1.X 网段连接
  2. 修复 10.113.22.X 网段连接
  3. 配置 SSH 服务监听 2222 端口
  4. 启动 zhinengAI01 的 VNC 服务

长期目标

  1. 配置 VPN 自动启动
  2. 配置静态路由永久生效
  3. 设置网络连接监控和告警
  4. 定期检查和维护

报告生成者: AI Server
报告日期: $(date '+%Y-%m-%d %H:%M:%S')
下次检查: 建议定期检查服务状态和网络连接


感谢使用智能知识库系统!