网络知识 娱乐 BLOOM 是十年来最重要的人工智能模型

BLOOM 是十年来最重要的人工智能模型

▲点击上方头像关注我们

您可能想知道这样一个大胆的标题是否属实,答案是肯定的。让我解释一下为什么。

GPT-3 于 2020 年问世,开辟了一条整个 AI 行业自此以来一直在关注和关注的新道路。科技公司一再制造更好、更大的模型,一个接一个。但是,尽管他们已经投入了数百万美元来完成这项任务,但他们都没有从根本上改变两年前 GPT-3 制定的领先范式或游戏规则

Gopher、Chinchilla 和 PaLM(可以说是当前大型语言模型的头部选手)明显优于 GPT-3,但它们本质上更多的是相同的东西。Chinchilla 已经证明了略有不同的缩放定律的成功,但它仍然是一个大型的基于 Transformer 的模型,它像其他模型一样使用大量数据和计算。

DALL·E2、Imagen 和 Parti,虽然它们的工作不同——文本到图像的模型在转换器之外添加了技术——但它们几乎基于相同的趋势。即使是稍微偏离 GPT-3 的 Flamingo 和 Gato,它们也只是对应用于新任务的相同想法的重新组合。

但是,最重要的是,所有这些人工智能模型都源于私营科技公司的巨大资源,这是共同的因素。使它们属于同一个包的不仅仅是它们的技术规格。这是因为少数富有的营利性研究实验室对它们施加了绝对的控制。

这即将改变。

BLOOM(BigScience Language Open-science Open-access Multilingual)是独一无二的,不是因为它在架构上与 GPT-3 不同——它实际上是上述所有模型中最相似的,也是一个具有 176B 参数的基于转换器的模型(GPT-3 有 175B )——但因为它是人工智能社会政治范式转变的起点,它将定义该领域的未来几年——并将打破大型技术对大型语言模型 (LLM) 研究和开发的束缚。

公平地说,Meta、Google 和 OpenAI 最近开源了一些基于变压器的大型模型(分别为 OPT、Switch Transformers 和 VPT)。是因为他们突然对开源产生了欣赏吗?我敢肯定,这些公司的大多数工程师和研究人员一直都拥有它。他们知道开源的价值,因为他们每天都使用建立在开源基础上的库和工具。但这些公司,作为没有道德的赚钱实体,不会轻易屈服于更广泛的人工智能社区的偏好。

如果不是因为一些机构和研究实验室已经开始向这个方向施加巨大的压力,这些公司就不会开源他们的模型

BigScience、Hugging Face、EleutherAI 和其他公司不喜欢大科技对该领域所做的事情。垄断一项可以(并且希望能够)使很多人受益的技术在道德上是不正确的。但他们不能简单地要求谷歌或 OpenAI 分享他们的研究并期望得到积极的回应。这就是为什么他们决定建立和资助自己的项目——并向想要探索其奇迹的研究人员免费开放。最先进的人工智能不再是为财力雄厚的大公司保留的。

▲BLOOM还使用了13种编程语言,可以说主流的编程语言基本全用了

BLOOM 是这些努力的结晶。经过从 2021 年 1 月开始的一年多的集体工作,以及在 Jean Zay 的法国公共超级计算机上进行了 3 个多月的培训,BLOOM 终于准备就绪。这是 BigScience 研究研讨会的成果,该研讨会由来自世界各地的 1000 多名研究人员组成,并依靠 250 多家机构的合作和支持,包括 Hugging Face、IDRIS、GENCI 和蒙特利尔人工智能伦理研究所等。

他们的共同点是,他们认为技术,尤其是人工智能,应该是开放的、多样化的、包容的、负责任的和可访问的,以造福人类。他们令人印象深刻的集体努力和他们在人工智能行业中的独特立场只能与他们对作为人工智能模型设计基础的社会、文化、政治和环境背景的关注相媲美——特别是 BLOOM——以及数据选择、管理和治理。

BigScience 的成员发布了一份道德章程,确立了他们在开发和部署这些技术方面所坚持的价值观。他们将这些分为两类——内在的,“有价值的,作为目的”,外在的,“有价值的手段”。我将通过引用章程来总结这些价值观,因为我认为它们中的每一个对于理解 BigScience 和 BLOOM 的空前重要性都至关重要。

内在价值:

  • 包容性:“平等获得 BigScience 的文物不仅是不歧视,还有归属感”;
  • 多样性:“……超过 900 名研究人员和社区……来自 50 个国家,涵盖 20 多种语言……”;
  • 再现性:“…… BigScience 旨在确保研究实验和科学结论的再现……”;
  • 开放性:“……来自世界各地的人工智能相关研究人员可以贡献并加入该计划……[和]结果……将在开放的基础上共享……”;
  • 责任:“每个贡献者对其在 BigScience 项目中的工作负有个人和集体[社会和环境]责任……”。

外在价值:

  • 可访问性:“作为实现开放的一种手段。BigScience 尽最大努力使我们的研究和技术成果易于解释并向更广泛的公众解释……”;
  • 透明度:“作为实现可重复性的一种手段。BigScience 的工作在各种会议、网络研讨会、学术研究和科普活动中得到积极推广,以便其他人可以看到我们的工作……”;
  • 跨学科性:“作为实现包容性的一种手段。我们不断在计算机科学、语言学、法律、社会学、哲学和其他相关学科之间架起桥梁,以便在开发 BigScience 产品时采用整体方法。”;
  • 多种语言:“作为实现多样性的一种手段。通过拥有一个从概念上就多语言的系统,其直接目标是覆盖世界上 20 种最常用的语言……”。

毫无疑问,BigScience 和 BLOOM 是消除大型科技公司在过去十年中在人工智能领域竖立的所有障碍的最引人注目的尝试。以及构建造福所有人的人工智能(尤其是法学硕士)的最真诚和诚实的承诺。

如果您想了解有关 BigScience 研究内容的更多信息可以通过 Hugging Face 访问 BLOOM。

正如我在一开始提到的,BLOOM 并不是第一个如此规模的开源语言模型。Meta、Google 和其他公司已经开源了一些模型。但是,正如预期的那样,这些并不是这些公司所能提供的最好的。赚钱是他们的主要目标,因此分享他们最先进的研究并不在桌面上。这正是为什么通过这些战略性公关举措表明他们有意参与开放科学是不够的。

BigScience 和 BLOOM 是一组公司无法通过定义代表的道德价值观的体现。无论哪种情况,可见的结果都是开源的 LLM。然而,指导 BigScience 的隐藏且极其必要的基础强调了这些集体倡议与强大的大科技之间不可调和的差异。

在环境的逼迫下勉强采用开源实践与因为坚信是正确的方法而这样做并不是一回事。BigScience 成员坚信我们应该使 AI 民主化,并致力于通过开放访问和结果或通过解决道德问题来造福最多的人,这正是 BLOOM 的独特之处。这也是它——可以说,我承认——成为十年来最重要的人工智能模型的原因。

BLOOM 是一个处于激进变革边缘的领域的先锋。这是超越当前研究趋势的运动旗帜。这是人工智能新时代的到来,它不仅将推动该领域更快地向前发展,而且会迫使那些宁愿继续前进的人接受现在管理该领域的新规则。

这不是开源第一次赢得隐私和控制权。我们在计算机、操作系统、浏览器和搜索引擎中有示例。最近的历史充满了那些想为自己保留利益的人和那些代表其他人战斗并获胜的人之间的冲突。开源和开放科学是技术的终极阶段。我们即将进入人工智能的新时代。

全网平台ID:「觉醒元宇宙AI」