首页 / 商业 / 正文

新的人工智能研究可以让你在几秒钟内点击和拖动图像来操作它们

放大字体  缩小字体 来源:小编 2024-05-04 19:24  浏览次数:98 来源:http://www.fstts.cn/    

不,这还没有结束:人工智能工具处理图像的能力在继续增长。最新的例子目前还只是一篇研究论文,但非常令人印象深刻,它允许用户简单地拖动图片的元素来改变其外观。

从表面上看,这听起来并不太令人兴奋,但是看看下面的例子,就可以了解这个系统可以做什么。

你不仅可以改变汽车的尺寸,或者通过简单的点击和拖动操作将微笑变成皱眉,还可以像旋转3D模型一样旋转图片的主体——例如,改变某人面对的方向。其中一个演示甚至显示,用户只需点击几下鼠标,就可以调整湖面的反射和山脉的高度。

以下是对不同主题的概述:

下面是对景观处理的仔细观察:

只是为了好玩,和狮子开玩笑:

这些视频来自,尽管由于Twitter发送给该网站的流量,该网站已经崩溃(Twitter在突出有趣的人工智能论文方面做得非常出色,如果你感兴趣的话,值得关注)。你也可以在arXiv上阅读研究论文。

正如团队负责人所指出的那样,这项工作真正有趣的地方不一定是图像处理本身,而是用户界面。我们已经能够使用像gan这样的人工智能工具来生成逼真的图像一段时间了,但大多数方法缺乏灵活性和准确性。你可以告诉人工智能图像生成器“拍摄一只狮子在大草原上踱步的照片”,你会得到一张,但它可能不是你想要或需要的确切姿势。

这个名为DragGAN的模型为这个问题提供了一个明确的解决方案。界面与传统的图像扭曲完全相同,但不是简单地涂抹和模糊现有的像素,模型生成新的主题。正如研究人员所写的那样:“我们的方法可以使闭塞的内容产生幻觉,就像狮子嘴里的牙齿一样,也可以随着物体的刚性而变形,就像马腿的弯曲一样。”

显然,现在这只是一个演示,完全评估技术是不可能的。(例如,最后的图像有多逼真?基于现有的低分辨率视频,很难说。)但这是另一个让图像处理更容易获得的例子。

声明:本站信息均由用户注册后自行发布,本站不承担任何法律责任。如有侵权请告知,立即做删除处理。
违法不良信息举报邮箱:rally510@qq.com