4月29日,DeepSeek的核心多模态技术负责人陈小康在X上发了一张图片,右边是DeepSeek的图标,左边是鲸鱼的眼睛上被戴了一个眼罩。并配文,“现在我们看见你了。”


并且他还在随后回复说,已经有些网页端和APP端用户能使用多模态功能了。


随后有网友分享链接,他在和DeepSeek的对话中插入图片,DeepSeek可以精准地识别图中的元素,包括人物、背景、动作、颜色。虽然不能从链接中查看图片,但是能看到文件的类型是PNG图片。

截至目前,DeepSeek尚未在官网、Hugging Face或GitHub发布新的多模态模型权重、技术报告或正式公告。

值得注意的是,陈小康昨日曾发布同一张图片,配文为"马上我们就能看到你",该帖今日已被删除。