漫话开发者 - UWL.ME Mobile

马斯克旗下人工智能公司xAI推出的Grok聊天机器人近日迎来重要升级,新增了视觉识别能力。这一功能允许iOS用户上传图片或通过摄像头捕捉画面,随后向Grok提问关于所看到内容的问题。该功能与OpenAI的ChatGPT和谷歌的Gemini中的视觉交互功能类似,标志着多模态AI技术的进一步普及。视觉识别能力的加入使Grok从纯文本对话系统升级为能理解并分析视觉信息的智能助手,在医疗诊断、教育辅助、工业检测等领域具有广阔应用前景。xAI此举也反映出AI行业向多模态发展的明显趋势,未来人机交互方式将更加自然直观。目前该功能仅限iOS用户使用,预计后续将拓展至其他平台。

核心要点

  • Grok聊天机器人新增视觉识别功能,支持iOS用户通过图片提问
  • 功能对标ChatGPT和Gemini,实现多模态AI交互
  • 标志xAI进入视觉理解领域,拓展AI应用场景

Read more >