英伟达的新AI吃字吐出照片感觉边缘神奇
NVIDIA 拥有生成艺术系统,该系统使用 AI 将文字转化为视觉上壮观的艺术作品。这不是第一次假设甚至产生这种概念。然而,这是我们第一次看到这样一个系统以如此惊人的速度和精度工作。
你可以看一看 OpenAI,看看一个名为 DALLE 的项目。这是一个基于 GPT-3 的图像生成项目,你可以在康奈尔大学学习。您可以开始使用Deep Dream Generator对样式进行疯狂的解释,或者了解我们今天正在研究的 NVIDIA 研究项目的一些来源——请参阅论文生成对抗网络以了解 GAN!
NVIDIA 项目 GauGAN2 建立在该公司的研究人员使用NVIDIA Canvas创建的基础之上。该应用程序——目前处于 Beta 模式——与第一个 GauGAN 模型配合使用。有了可供您使用的人工智能,任何人都可以通过输入生成相对逼真的艺术作品,而这只不过是制作手指画所需的输入。
借助 GauGAN2,NVIDIA 研究人员通过简单的输入和对所述输入的人工智能解释扩展了可能性。该模型使用各种草图(大约 1000 万张高质量风景图像)作为其视觉知识库,并利用该库来确定您的文字在艺术作品中的含义。
GauGAN2 中的一个单一 GAN 框架包括多种模式。NVIDIA 指向文本、语义分割、草图和样式。下面您将在一个界面中看到这个新的文本输入元素的演示,该界面本质上是 NVIDIA Canvas 的扩展。
示范远没有它所代表的重要。智能手机现在可以神奇地擦除照片中的元素。如果您使用的是像Google 相册这样的系统,那么人工智能已经在您的生活中,并且随着您向其提供更多由手机拍摄的图像而变得更加智能。
下一波浪潮来了,NVIDIA 的演示向我们展示了机器如何不仅知道如何识别照片中的元素,还知道如何根据所提供的图像知识生成图像。NVIDIA 在这里有一个模型,它有效地向我们展示了图形处理能力和正确的代码集可以生成我们人类解释为现实的令人震惊的可靠表示。
免责声明:本站发布的教育资讯(图片、视频和文字)以本站原创、转载和分享为主,文章观点不代表本网站立场。
如果本文侵犯了您的权益,请联系底部站长邮箱进行举报反馈,一经查实,我们将在第一时间处理,感谢您对本站的关注!
新励学网教育平台
海量全面 · 详细解读 · 快捷可靠
累积科普文章数:18,862,126篇