近日,OpenAI和谷歌正密切竞争,力求成为推出下一代大型语言模型“多模态”的领先者。这些多模态模型能够同时处理图像和文本,为用户提供了更多跨领域的智能应用。
尽管OpenAI在今年3月份推出GPT-4时展示了多模态功能的预览,但除了为盲人或视力低下人士开发技术的Be My Eyes公司外,其他公司并未提供这些功能。目前,OpenAI计划在更广泛的范围内推出名为GPT-Vision的多模态功能,以加速技术的普及与应用。
扫一扫
在手机上阅读
您还没有登录,登录后您可以:
首次使用?从这里 注册