面显示使用识图模式开始对话,输入框旁出现图片上传按钮。 从实测情况来看,目前开放的主要是图片理解能力,即看图、读图、分析图,涵盖视觉问答、图片理解和截图分析等场景,尚未看到图像生成、视频理解或跨模态生成能力上线。 这意味着现阶段识图模式更接近视觉语言模型(VLM)的范畴,而非完整的多模态生成工具。 &n
相关搜索
当前文章:http://n2m.qiaobensai.cn/jsf/2q2.htm
发布时间:02:16:49