生成式人工智能是一个新的流行语,以其新颖的应用而出现,如DeepFake和ChatGPT。生成式人工智能利用人工智能和机器学习算法,使机器能够根据其训练数据生成人工内容,如文本、图像、音频和视频内容。
生成式人工智能面临某些挑战,涉及数据隐私、用于欺诈或犯罪行为以及幻觉。
在这篇文章中,我们将探讨什么是生成式人工智能,它是如何工作的,优点、缺点和应用,以及充分利用它的潜力所需采取的步骤。
什么是生成式人工智能?
生成式人工智能是通过利用现有文本、音频文件或图像来创造新内容的技术。通过生成式人工智能,计算机检测与输入有关的基本模式并产生类似的内容。
有各种技术,如:
Transformers:如GPT-4、LaMDA、Wu-Dao和ChatGPT模仿认知注意力,并对输入数据部分的重要性进行不同的测量。它们被训练来理解语言或图像,学习一些分类任务,并从大量数据集中生成文本或图像。
生成式对抗网络(GANs):GANs是两个神经网络:一个生成器和一个鉴别器,它们相互对立,以找到两个网络之间的平衡:
- 生成器网络负责生成新的数据或类似于源数据的内容。
- 鉴别器网络负责区分源数据和生成的数据,以识别更接近原始数据的内容。
变量自动编码器:
- 编码器将输入编码为压缩代码,而解码器则从该代码中重现初始信息。
- 如果选择和训练正确,这种压缩的表示法可以将输入的数据分布存储在一个小得多的维度上。
生成式人工智能的应用有哪些?
内容生成
文本生成:生成式人工智能工具可以创建文本输出并与用户进行对话。ChatGPT是一个对话式生成型AI工具的例子。
从种子图像生成人脸、物体和场景的照片:生成式人工智能可以产生真实外观的照片。
名人头像AI生成
文本到图像:它可以从对简单物体如鸟和花的文字描述中产生逼真的照片。DALL-E是一个流行的文本到图像的翻译工具。
StackGAN:利用堆叠生成对抗网络从文本到照片的逼真图像合成
其他内容的生成:生成式人工智能也可以被用来
- 当通过3D打印、CRISPR和其他技术进行操作时,从头开始渲染物品。
- 编写软件代码。
图像到图像的转换
图像到图像的转换:将一个图像翻译成另一个图像。例子包括
- 黑白照片到彩色照片
- 白天的照片转换为夜晚的照片
白天转黑夜
- 照片转特定艺术风格绘画
将照片转为艺术画作
- 卫星照片转为谷歌地图视图
卫星照片转为谷歌地图视图
- 语义图像到真实照片:将输入的语义图像或草图转换为照片的现实图像。
右边是语义图像,左边是原始图像
从草图到现实图像
- 脸部正视图生成:它从不同角度拍摄的照片中生成正面的照片,用于人脸验证或人脸识别系统。
左边是轮廓图,中间是合成图,右边是真实正面图。
- 照片到表情符号:将真实照片改成表情符号或小卡通脸。
一个具体的照片到表情符号和卡通脸的例子
- 脸部老化:从一张年轻的脸部照片生成老版的脸。
脸部老化的例子
与视频有关的应用
视频到视频的转换(例如,电影修复):它可以通过将老图像和老电影提升到4K及以上的水平来改善它们。例如,它可以生成每秒60帧而不是23帧或更少,消除噪音,并增加色彩。
原文地址:https://www.wbolt.com/generative-ai.html