您是否在想, 人工智能能否在没有任何数据的情况下自主学习?” 为了获得最详细且合理的答案,让我们与INVIAI一起深入探讨这个话题。

首先,重要的是要理解,数据是所有现代机器学习人工智能模型的核心要素。人工智能无法在没有输入数据的情况下“建立”知识。

例如,在监督学习中,人工智能通过人类标注的大量数据集(图像、文本、音频等)来识别模式。

即使在无监督学习中,人工智能仍然需要原始的、未标注的数据,自主发现数据中的隐藏结构或模式。

因此,无论采用何种方法,人工智能都必须通过数据“滋养”——无论是标注数据、自标注数据(自监督)还是来自真实环境的数据。没有任何输入数据,系统无法学习任何新内容。

常见的人工智能学习方法

如今,人工智能模型主要通过以下几种方式学习:

  • 监督学习:

人工智能从大量标注数据中学习。例如,为了识别图像中的猫,需要成千上万张标注为“猫”或“非猫”的照片进行训练。这种方法效果显著,但需要大量标注工作。

  • 无监督学习:

人工智能获得未标注的原始数据,并在其中寻找模式或聚类。例如,聚类算法将具有相似特征的数据集分组。这种方法使人工智能能够“自我学习”数据,发现模式而无需人工指导。

  • 自监督学习:

这是一种用于大型神经网络和大型语言模型(LLM)的变体,模型通过自身生成数据标签(例如预测句子中的下一个词或重建缺失部分),然后从中学习。这种方法使人工智能能够利用海量文本或图像数据集,而无需人工标注。

  • 强化学习(RL):

人工智能(称为智能体)不依赖静态数据,而是与环境交互,并根据奖励信号进行学习。维基百科定义强化学习为:“强化学习是通过告知软件智能体其行为结果,教会其如何在环境中行动的过程。”

换句话说,人工智能采取行动,观察结果(如奖励或惩罚),并调整策略以提升表现。

例如,DeepMind的AlphaZero并非由人类教授国际象棋,而是通过与自身对弈数百万局,通过胜利信号发现新策略,无需依赖预先提供的专家数据集。

  • 联邦学习:

对于敏感数据,如个人医疗影像,联邦学习允许多个设备(或组织)协同训练共享模型,而无需共享原始数据

谷歌解释说,在联邦学习中,全球模型被发送到每个设备,在本地数据上进行训练,只有模型更新被返回——原始数据永远不会离开设备。

这样,模型可以从多个地点的数据中学习,而无需集中数据。但人工智能仍然需要每个设备上的本地数据来学习。

  • 零样本学习:

这是人工智能在没有具体示例的情况下推断新概念的能力。IBM定义零样本学习为:“人工智能模型被训练以识别或分类其从未见过示例的对象或概念的情况。”

零样本学习依赖于先前获得的广泛知识。例如,许多大型语言模型(如GPT)在海量文本语料库上进行预训练。得益于这些先验知识,它们即使没有明确示例,也能推理新概念。

虽然看似人工智能可以“无数据学习”,但实际上大型语言模型仍依赖庞大的初始数据集来构建基础语言能力。

总结来说,所有这些方法都表明,人工智能无论以何种形式,都无法脱离数据学习。人工智能可能减少对人工标注数据的依赖,或通过经验学习,但绝不可能凭空学习。

流行的人工智能学习方法

前沿趋势:从“经验”而非静态数据中学习

研究人员正在探索让人工智能减少对人类提供数据依赖的方法。例如,DeepMind最近提出了“流”模型,在“基于经验的人工智能”时代,人工智能主要通过自身与世界的交互学习,而非依赖人类设计的问题和任务。

VentureBeat引用了DeepMind的研究:“我们可以通过让智能体持续从自身经验中学习——即智能体在与环境交互时生成的数据……经验将成为主要的提升手段,超越当前人类提供数据的规模。”

换句话说,未来人工智能将通过实验、观察和调整行动,自行生成数据——类似于人类从现实经验中学习的方式。

一个具体例子是绝对零推理器(AZR)模型。AZR完全通过自我对弈训练,无需人类输入。它自行生成问题(如代码片段或数学题),解决问题,并利用结果(通过代码执行或环境反馈)作为奖励信号进行学习。

令人惊讶的是,尽管未使用外部训练数据,AZR在数学和编程任务中表现卓越,甚至超越了使用数万个标注示例训练的模型。这证明人工智能可以通过不断提出和解决挑战,自主生成“数据集”

除了AZR,许多其他研究也在探索人工智能的自主学习。智能体系统可以与软件和虚拟世界(工具、网站、模拟游戏)交互,积累经验数据。

人工智能可以被设计成设定自己的目标和奖励,类似于人类养成习惯。虽然仍处于研究阶段,但这些观点强化了一个事实:没有任何人工智能能真正脱离数据学习——只是“数据”来源变成了人工智能自身的经验。

>>> 了解更多:

使用人工智能需要懂编程吗?

人工智能像人类一样思考吗?

前沿趋势 - 从“经验”而非静态数据中学习


简而言之,当今的人工智能仍然需要某种形式的数据来学习。不存在真正的“无数据人工智能”。

相反,人工智能可以减少对人类提供数据的依赖,通过使用未标注数据(无监督学习)、从环境反馈中学习(强化学习),甚至自行创造挑战(如AZR模型)。

许多专家认为,未来人工智能将越来越多地通过自身收集的经验学习,使经验成为帮助其提升的主要“数据”。

但无论如何,事实依然是:人工智能无法凭空学习;“数据”来源可以更为复杂(如环境信号、奖励),但机器学习和提升始终需要某种形式的输入。

外部参考资料
本文参考了以下外部资料: