开发者将AI智能体部署于7美元/月VPS,IRC协议竟成通信层新选择
thinkindev • 2026-03-26
2883 views
近日,一位开发者展示了一项颇具创意的低成本AI部署方案。该项目将两个AI智能体分别部署在独立的服务器上,构建了一个分层、高效的交互系统。公开智能体“nullclaw”是一个仅678KB的Zig语言二进制程序,运行内存约1MB,通过连接Ergo IRC服务器,允许访客通过嵌入网站的gamja网页客户端或任何IRC客户端与之对话。私有智能体“ironclaw”则负责处理邮件和日程等敏感任务,其访问权限通过Tailscale网络和谷歌的A2A协议进行严格限制,确保了安全性。在推理模型的选择上,项目采用了分级策略:使用Claude 3.5 Haiku进行日常对话(响应速度快、成本低),仅在需要工具调用时才启用能力更强的Claude 3.5 Sonnet,并将每日成本硬性上限控制在2美元以内。更巧妙的是,通过A2A穿透技术,私有侧智能体可以借用网关自身的推理管道,这意味着无论请求由谁发起,整个系统都只需一个API密钥和一份账单,简化了管理和计费流程。这项实践展示了在有限预算下,通过巧妙的架构设计和技术选型(如轻量级的Zig、古老的IRC协议与现代AI的结合),实现功能完备且安全的AI服务部署的可能性,为个人开发者和小型项目提供了有价值的参考范式。
核心要点
- 项目采用双智能体架构,公开智能体基于轻量级Zig程序并通过IRC协议提供访问,私有智能体通过Tailscale和谷歌A2A协议保障安全。
- 创新性地采用分级推理策略,结合Claude Haiku与Sonnet模型以平衡响应速度、功能与成本,并设置每日2美元的硬性开销上限。
- 通过A2A穿透技术实现公私智能体共享同一推理管道与API计费,简化了系统架构与成本管理。