BuboGPT

12个月前发布 0 0

文本、图像和音频等多模式输入,具有将其对视觉对象的响应作为基础的独特能力。

收录时间:
2024-07-08

BuboGPT是一种先进的大型语言模型(LLM),它结合了文本、图像和音频等多模式输入,具有将其对视觉对象的响应作为基础的独特能力。无论是对齐还是未对齐,它在理解任意图像和音频数据方面都表现出卓越的聊天能力。

    相关导航