Midjourney:先贩卖想象力,再贩卖精度
作者 吴洋洋
发表于 2024年1月
Midjourney创始人David Holz。

时隔9个月,Midjourney在2023年圣诞节前推出了第六代文生图模型MidjourneyV6。相较于上一代产品,新版本可以生成分辨率更高的图像,像素达到2048×2048,用户可以在生成的图像中看清人皮肤上的细纹和汗毛,其他动物的毛发、各种场景的光影细节,也都与高清相机拍摄出来的差不多—区别在于Midjourney的图是通过AI模型生成的,用户只需要像聊天一样在对话框中输入几句图像描述,几秒种后,对话另一端的AI就会生成一幅相应的图像。

市面上的文生图模型和产品已有很多,单国内就有百度的文心一格、阿里云的通义万相、腾讯的混元,国外就更多了,Stability、Google旗下的Imagen2、OpenAI旗下的DALL·E3、Adobe旗下的Firefly……但最受设计师欢迎的还是Midjourney。

因想象力走红

如果说MidjourneyV6售卖的是工业级的逼真,最初版本的Midjourney售卖的其实是想象力。

在诸多文生图AI软件中,Midjourney最先成为“网红”。初代产品发布不到一个月,用Midjourney生成的图片便登上了一个艺术博览会。2022年8月,在美国科罗拉多州举办的艺术博览会上,39岁的游戏设计师杰森·艾伦用Midjourney生成了一张图,经过Photoshop加工之后,这幅名为《太空歌剧院》的作品战胜人类画手,摘得展会数字艺术类别的冠军。

当时的Midjourney擅长模仿艺术家,它学习过莫奈的《睡莲》、达利的《记忆的永恒》,知道如何扮演不同风格的画家。此外,它还擅长创建漂浮在太空中的古代城市,或是一个虚构的星球景观。

大卫·霍尔兹(DavidHolz)是Midjourney的创始人,他一直试图让Midjourney变成一个更独特的产品。2023年7月,在MidjourneyV5中,会员用户可以使用更新的“weird”模式生成各种搞怪、有趣甚至诡异的表情包。比如你可以让马斯克穿上粉红色的裙子,也可以让雪人变成雪怪。

图像设计工具领域的老牌公司Adobe一直在更新技术,以避免被生成式AI时代抛弃。2023年8月,它在Photoshop中推出了一个叫“生成式填充”(GenerativeFill)的功能,用户可以通过输入文本在图片中添加或删除对象、生成背景,也可以扩展图像。

本文刊登于《第一财经杂志》2024年1期
龙源期刊网正版版权
更多文章来自
订阅