使用双视觉编码融合图像风格类型,使图像作为条件输入;