新的人工智能研究可以让你在几秒钟内点击和拖动图像来操作它们_商业

不，这还没有结束:人工智能工具处理图像的能力在继续增长。最新的例子目前还只是一篇研究论文，但非常令人印象深刻，它允许用户简单地拖动图片的元素来改变其外观。

从表面上看，这听起来并不太令人兴奋，但是看看下面的例子，就可以了解这个系统可以做什么。

你不仅可以改变汽车的尺寸，或者通过简单的点击和拖动操作将微笑变成皱眉，还可以像旋转3D模型一样旋转图片的主体——例如，改变某人面对的方向。其中一个演示甚至显示，用户只需点击几下鼠标，就可以调整湖面的反射和山脉的高度。

以下是对不同主题的概述:

下面是对景观处理的仔细观察:

只是为了好玩，和狮子开玩笑:

这些视频来自，尽管由于Twitter发送给该网站的流量，该网站已经崩溃(Twitter在突出有趣的人工智能论文方面做得非常出色，如果你感兴趣的话，值得关注)。你也可以在arXiv上阅读研究论文。

正如团队负责人所指出的那样，这项工作真正有趣的地方不一定是图像处理本身，而是用户界面。我们已经能够使用像gan这样的人工智能工具来生成逼真的图像一段时间了，但大多数方法缺乏灵活性和准确性。你可以告诉人工智能图像生成器“拍摄一只狮子在大草原上踱步的照片”，你会得到一张，但它可能不是你想要或需要的确切姿势。

这个名为DragGAN的模型为这个问题提供了一个明确的解决方案。界面与传统的图像扭曲完全相同，但不是简单地涂抹和模糊现有的像素，模型生成新的主题。正如研究人员所写的那样:“我们的方法可以使闭塞的内容产生幻觉，就像狮子嘴里的牙齿一样，也可以随着物体的刚性而变形，就像马腿的弯曲一样。”

显然，现在这只是一个演示，完全评估技术是不可能的。(例如，最后的图像有多逼真?基于现有的低分辨率视频，很难说。)但这是另一个让图像处理更容易获得的例子。