Dify 1.4.0 多模态来了,所想即所得

🚀Dify v1.4.0 两个新功能
🌙 黑暗模式

推出了主题切换器,可以轻松切换亮色和暗色模式,非常适合深夜编程。点击头像体验!

🖼️ 多模态 LLM 输出

支持多模态输出,允许 LLM 在 LLMNode 中同时处理文本和图像。

升级前 vs 升级后 的对比图

dify升级换图标了

两个案例如下

多模态工作流示例

名称:多模态助手
整体工作流:1.开始 – 2.LLM节点(选gemini-2.0-flash-exp)-- 3.结束
功能:开启”文件上传“,支持文件类型选择”图片“


:模型只能选 gemini-2.0-flash-exp,详见https://github.com/langgenius/dify/pull/17372

配置Gemini

大家手里如果没有gemini的api,可以使用这个API平台Let's API练手,支持github登录,签到有福利(但不多,仅供测试)。
https://api.aigc369.com/register?aff=5rkG

如何使用 gemini-2.0-flash-exp
1、添加令牌 API-KEY
2、在Cherry Studio中测试 API-KEY(这步可选)

3、在dify的模型供应商中配置 gemini-2.0-flash-exp

写在最后

可是我用dify v1.2.0,LLM选 gemini-2.0 flash exp 也能多模态输入输出呀,更新了个寂寞。。。

测试图片如下
模特
房子
参考:dify v1.4.0官方更新日志

Logo

电影级数字人,免显卡端渲染SDK,十行代码即可调用,工业级demo免费开源下载!

更多推荐