不,这还没有结束:人工智能工具处理图像的能力在继续增长。最新的例子目前还只是一篇研究论文,但非常令人印象深刻,它允许用户简单地拖动图片的元素来改变其外观。
从表面上看,这听起来并不太令人兴奋,但是看看下面的例子,就可以了解这个系统可以做什么。
你不仅可以改变汽车的尺寸,或者通过简单的点击和拖动操作将微笑变成皱眉,还可以像旋转3D模型一样旋转图片的主体——例如,改变某人面对的方向。其中一个演示甚至显示,用户只需点击几下鼠标,就可以调整湖面的反射和山脉的高度。
以下是对不同主题的概述:
下面是对景观处理的仔细观察:
只是为了好玩,和狮子开玩笑:
这些视频来自,尽管由于Twitter发送给该网站的流量,该网站已经崩溃(Twitter在突出有趣的人工智能论文方面做得非常出色,如果你感兴趣的话,值得关注)。你也可以在arXiv上阅读研究论文。
正如团队负责人所指出的那样,这项工作真正有趣的地方不一定是图像处理本身,而是用户界面。我们已经能够使用像gan这样的人工智能工具来生成逼真的图像一段时间了,但大多数方法缺乏灵活性和准确性。你可以告诉人工智能图像生成器“拍摄一只狮子在大草原上踱步的照片”,你会得到一张,但它可能不是你想要或需要的确切姿势。
这个名为DragGAN的模型为这个问题提供了一个明确的解决方案。界面与传统的图像扭曲完全相同,但不是简单地涂抹和模糊现有的像素,模型生成新的主题。正如研究人员所写的那样:“我们的方法可以使闭塞的内容产生幻觉,就像狮子嘴里的牙齿一样,也可以随着物体的刚性而变形,就像马腿的弯曲一样。”
显然,现在这只是一个演示,完全评估技术是不可能的。(例如,最后的图像有多逼真?基于现有的低分辨率视频,很难说。)但这是另一个让图像处理更容易获得的例子。