什么是生成式人工智能?

每个人都听说过 ChatGPT,但底层技术呢?

what-is-generative-ai-question-chatgpt-smartphone-screen-feature
ChatGPT、Bing AIGoogle Bard 是消费者人工智能领域最知名的一些名字。这三款产品都有一个共同点——都是生成式人工智能产品。

但究竟什么是生成式 AI,是什么激发了最近对这个复兴的 AI 领域的迷恋?

什么是生成式人工智能?

生成式 AI 是“生成式人工智能”的缩写,是一种可以按需生成独特或原创内容(如文本、音频、视频或图像)的 AI 系统。与一些为数据分类或分析等任务设计的传统人工智能系统不同,生成式人工智能模型更关注根据给定的指令产生新颖或创造性的输出。

虽然生成式人工智能看起来像是一项新技术,但它实际上已经存在了几十年。至少早在 1960 年代就已经出现了几次迭代和形式。人工智能是一个广阔的领域,生成式人工智能只是其中的一小部分。

使用诸如 ChatGPT 或 Google 的 Bard AI 之类的生成式 AI 工具最令人着迷的方面之一是这些工具能够生成符合您的请求的内容。你要求 ChatGPT 写一首威廉莎士比亚风格的诗,你会得到与莎士比亚作品惊人相似的东西。你要求它以唐纳德特朗普的风格发表演讲,你会得到一些令人印象深刻的模仿美国前总统语气的东西。那么,这怎么可能呢?生成式 AI 是如何实现如此引人入胜的壮举的?

生成式 AI 的工作原理

生成式 AI 模型的工作机制涉及各种深度学习技术和算法的复杂相互作用。生成模型如何工作的具体细节取决于它的目标和底层架构。例如,用于生成音频片段的生成模型与用于生成视频或文本的模型具有不同的工作机制。

然而,就其核心而言,大多数(如果不是全部)生成模型在其基础级别上的工作方式相似。他们从大量数据中学习,捕获数据的模式和样式,然后使用这些捕获的模式来重现类似于他们在训练数据中学到的内容的样本。

您可以将生成式 AI 工具视为音乐作曲家。想象一下,这位音乐作曲家听过无数歌曲,研究过许多音乐流派的和声、旋律、节奏和结构。换句话说,这位作曲家对音乐流派有着广泛的了解。有了这些知识,作曲家就可以根据所学知识创作出原创或独特的音乐。

因此,如果他们对流行音乐了解很多,您可以让他们创作一首流行歌曲,他们这样做不会有问题。然后,创作的音乐将表达作曲家根据他们所学的知识对流行音乐应该是什么样子的理解。同样,生成式 AI 的产物是 AI 模型对从其训练数据中学习到的基本概念的理解的一种表达。

因此,如果你想创建一个生成汽车图片的生成式 AI 模型,你必须为模型提供一个庞大的汽车图像数据集。要创建令人印象深刻的模型,您需要为其提供您能想到的尽可能多的汽车品牌和型号的图片。通过足够的训练,该算法将了解每个汽车品牌或型号的外观,我们将能够根据需要创建几乎所有您能想到的汽车的图像。

目前有数百种生成式 AI 模型正在开发中或已经部署在消费者 AI 市场中。您应该知道的一些流行的包括:

1. 生成式预训练变压器(GPT)

chatgpt-4-answer-question-on-number-of-data-points-june-2023
GPT 由 OpenAI 开发,是生成式 AI 领域中最知名的名称之一。它的受欢迎程度取决于其作为对话式 AI 模型的有效性以及使用 GPT 作为其基础技术的 ChatGPT 聊天机器人的病毒式成功。它是一种大型语言模型,旨在在出现提示时生成类似人类的文本。作为任何生成式 AI 模型的典型特征,GPT 模型的所有迭代都在大量不同的文本数据上进行了训练。

2. 路径语言模型(PaLM)

PaLM 是 Google 的一种实验性大型语言模型,是一种强大的生成式 AI 模型,能够执行大量任务,例如创意写作、代码生成、语言翻译和许多其他基于文本的自然语言任务。与 GPT 一样,PaLM 是在来自网络上广泛来源的大量文本数据集上进行训练的。它是为谷歌的 Bard AI 提供支持的 AI 模型。

3. 音乐语言模型(MusicLM)

MusicLM 是谷歌的另一个生成式人工智能模型。它旨在从简单的文本提示生成“高保真”音乐。该生成模型接受了数千小时各种流派音乐的训练,可以通过使用对您需要的音乐的简单描述作为输入来创作独特的音乐。如果您想知道它有多好,请查看我们对 MusicLM 模型的评论。

4. 达尔-E

DALL-E 是 OpenAI 的 AI 图像生成模型,旨在根据文本提示创建多种风格的独特图像。它是 GPT 模型的多模态实现,对来自互联网上各种来源的大量文本图像对进行了训练。

除了生成式 AI 模型,您还会发现生成式 AI 产品,例如 Midjourney、DALL-E 图像生成器、Stable Diffusion 图像生成器、Hugging Chat,以及其他一些由生成式 AI 模型提供支持的令人印象深刻的 AI 产品。

为什么生成式 AI 会爆炸式流行?

2022 年 11 月 30 日,OpenAI 首席执行官 Sam Altman 在一条推文中宣布推出 ChatGPT。尽管是 OpenAI 的首席执行官,但奥特曼在更大的互联网社区中相对不为人知,他的推文几乎没有大张旗鼓。

五天后,ChatGPT 聚集了第一批 100 万用户;它以任何应用程序都闻所未闻的速度做到了这一点。它又聚集了数百万,最终使 ChatGPT 成为有史以来增长最快的应用程序。虽然 ChatGPT 不是第一个生成 AI 产品,但它进入 AI 产品领域使生成 AI 比之前的任何其他技术产品都更容易进入公众意识。

虽然 ChatGPT 一直是推动围绕生成式 AI 大肆宣传的矛尖,但它并不是孤军奋战。2022 年将成为生成式 AI 工具成为主流的一年。从对话式 AI 聊天机器人到代码和艺术生成器,2022 年下半年是多种具有大众吸引力和日常实用性的 AI 工具首次投放市场。伴随这些工具而来的是其底层技术——生成式 AI 的普及。

Bing AI、谷歌的 Bard、DALL-E、ChatGPT 和 Midjourney 等生成式 AI 工具已经无缝地融入了我们的日常生活,不断向我们展示它们非凡的创造。无论是 ChatGPT 制作的引人入胜的文章,还是 Midjourney 制作的栩栩如生的惊人图像,生成式 AI 已成为无处不在的伙伴,日复一日地陪伴着我们。这就是最近流行的生成式人工智能的起源。

拥抱生成式人工智能

生成式 AI 工具的流行并非一时兴起。与最近流行起来并随着时间消退的一些技术趋势不同,生成式人工智能是一种具有实际实用价值的技术。随着这种复兴的技术利基市场几乎渗透到我们数字生活的方方面面,我们最好找到充分利用技术的方法,而不是对它感到困惑。

原创文章,作者:网贝WebBay,如若转载,请注明出处:https://www.webbay.cn/what-is-generative-ai

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

error: Content is protected !!