非凡视野｜Mistral AI 联创CEO谈AI和大模型的未来

来源：米兰体育手机版更新时间：2024-10-08 22:14:01点击次数：589次

估值：2023年10月筹集了3.85亿欧元后，Mistral AI 的估值超过20亿欧元。到20

估值：2023年10月筹集了3.85亿欧元后，Mistral AI 的估值超过20亿欧元。到2024年6月，经过新一轮6亿欧元的融资，其估值飙升至58亿欧元。

Mistral AI 旨在通过专注于开源模型来民主化人工智能技术的获取。这种方法将公司定位为专有人工智能解决方案的替代品，强调透明度和社区参与。

Mixtral 8x7B：一个稀疏混合专家模型，使用更大的参数池以提高性能。

Mistral Large：于2024年2月推出，该模型旨在用于高级推理和指令跟随任务。它支持包括英语、法语、西班牙语、德语和意大利语在内的多种语言，并可在 Microsoft Azure 等平台上使用。

Mistral Large 2：于2024年7月发布，它具有1230亿参数和128k上下文窗口，使其成为市场上最先进的模型之一。

2024 年 5 月 22 日，Mistral AI 联合发起人兼首席执行官 Arthur Mensch 在巴黎举行的 Vivatech 技术初创企业和创新博览会上参加辩论。

Julien de Rosa—AFP（法新社）/Getty Images

阿瑟·孟什（Arthur Mensch）是Mistral AI的联合发起人兼首席执行官。Mistral AI成立于2023年5月，由孟什与Guillaume Lample和Timothée Lacroix共同创立。孟什毕业于法国综合理工学院（École Polytechnique）和巴黎电信学院（Télécom Paris），并在巴黎萨克雷大学获得了数学、视觉与学习硕士学位。他在法国国家信息与自动化研究所（Inria）完成了关于功能性脑成像的机器学习博士研究（2015-2018年），随后在巴黎高等师范学院（ENS Ulm）进行应用数学博士后研究。

在创立Mistral AI之前，阿瑟·孟什在DeepMind担任研究科学家，主要研究语言模型。他在DeepMind的经历极大地影响了他创建Mistral AI的理念和方法。在他的领导下，Mistral AI迅速崭露头角，以其开源模型和强大的团队著称。

今年6月，Mistral表示，该公司在一轮融资中筹集了6.45亿美元，据报道，该公司的估值超过60亿美元。

说明：《时代》杂志在 5 月份与 Mensch 进行了交谈，讨论了吸引稀缺的 AI 人才、Mistral 计划如何盈利以及欧洲 AI 生态系统中缺少什么。非凡产研对访谈内容精华进行了编译。

过去一年，总部在巴黎的 Mistral AI 作为 “2024 年最具影响力的《 TIME》100 公司”之一，迅速崛起成为欧洲本土人工智能领域的领军企业，受到了法国总统埃马纽埃尔·马克龙（Emmanuel Macron）的称赞。这家初创公司目前已经推出了六款人工智能语言模型，它们能够回答问题、生成代码以及进行基本的推理。

在六月份，Mistral AI表示它在一轮融资中筹集了6.45亿美元，据报道这使得公司的估值超过60亿美元。在

这之前的二月份，一份公告表明，Mistral AI与微软达成了一项协议，将其模型提供给这家美国科技巨头的客户，以换取访问微软计算资源的权限。

Mistral AI 的联合发起人兼首席执行官 Arthur Mensch 在有关欧盟标志性人工智能法规的辩论中一直直言不讳，

他认为立法者应该专注于规范他人怎么样去使用像 Mistral 这样的通用AI模型，而不是规范这些模型本身。

他还反对限制人工智能开发者自由分享他们的创作。他说：“我看不到开源模型与任何风险相关联，我只看到好处。”

Q：Mistral AI 的首席商务官 Florian Bressand 几个月前在 CNBC 的一次访谈中透露，曾经参与开发 Llama 项目的团队中超过半数的成员现已加盟 Mistral AI。你们是如何成功吸引这些才华横溢的研究人员，让他们离开 Meta 这样资源丰富的大公司，转而加入 Mistral AI 的呢？

起初，我们仅聘请了我们的朋友。我们之所以能够这样做，是因为我们在该领域做出了一些有意义的贡献，所以人们明白与我们合作是有趣的。后来，从去年12月开始，我们开始聘请我们不太熟悉的人。

我们与许多科学家进行过交流，出于与我们类似的原因，他们喜欢过去那种自由流通沟通和信息的方式。

Q：全球能够训练像Mistral这样的AI系统的专家并不多。尽管我知道法国的AI领域发展得非常繁荣，但你觉得自身是否已经成功地吸引了一批懂得怎么样才能做到这一点的人才——甚至有可能已经囊括了所有这样的人才？

Arthur：并非所有的专家都加入了我们。我们有些朋友还在谷歌、OpenAI工作，还有一些留在了Meta。但可以肯定的是，我们成功吸引了大约15位精通训练这些模型的人才。要准确估计这个领域内专家的总数总是很具挑战性，不过我认为我们可能已汇聚了当时全球懂得怎么样处理这类事务的人才中的大约10%。

我们主要将资金用于提升计算能力。与软件行业相比，AI行业在结构上不一样，尤其是在初期有必要进行大量投资，以确保科学团队能够顺利开展工作，开发出处于技术最前沿的模型。目前，我们仍在使用最初的计算资源，但很快我们将能利用去年12月筹集的资金所获得的更强大的计算能力。

其他几乎所有基础模型公司的高管都谈到了他们预计在未来几年将在计算上投入1000亿美元。你是否有类似的预期？

我们已经展示了，在过去12个月里，我们的支出略高于2500万欧元，这使我们也可以达到目前的地位，我们的业务遍布全球，我们的模型在性能和效率方面都处于行业领头羊。我们的信念是，我们也可以以更高的资本效率运作。虽然我们正在构建的技术其实就是资本密集型的，但凭借优秀的创意，我们大家可以以低于竞争对手的成本实现目标。我们在2023至2024年间已经证实了这一点，并且我们预期在2024至2025年间这一优势将继续存在。虽然我们的支出将会增加，但我们的开支仍然只会占到竞争对手支出的一小部分。

当然还没有。我们一定要进行的投资是相当可观的。我们所做的投资与我们获得的收入实际上并非完全无关，不像其他一些公司那样。因此，（Mistral是盈利的）这样的一种情况并不存在，但也不指望一个成立12个月的初创公司就能盈利。

我们正在开发一个开发者平台，该平台赋予开发者能力去定制AI模型，开发独具特色的AI应用。

这些应用完全由开发者掌控，他们能够根据自己的需求，在任何地方部署这些技术，而不必依赖于公共云服务，这样的灵活性远远超出了他们目前使用封闭且不透明的API所能实现的。

此外，我们还很注重提升模型的效率，致力于增强模型的推理能力，同时力求使模型运行更快、成本更低。

我们正在打造的是这样的产品：一个由我们自行托管的开发者平台，通过API和托管服务向用户交付，同时我们也为客户提供完整的技术部署，让他们可以完全掌控技术。咱们提供软件访问权限后，就从整个使用循环中退出，这样客户就能够对他们应用中使用的数据拥有完全的主权控制。

Q：可以说，您的计划是创建性能几乎与竞争对手相匹敌的人工智能模型，但以更低的成本提供给您和您的客户，并且更开放地共享这些技术吗？还是说，您希望在技术能力上与竞争对手的最先进模型，也就是“前沿模型”相媲美？

Arthur：我们确实打算在技术前沿领域展开竞争。目前性能饱和的现象让我们有机会迎头赶上，我们计划继续这种追赶，并最终达到与竞争对手同等的竞争力。然而，我们实际上采用的是一种独特的商业模式，这种模式是其他公司所不具备的。我们在分享、定制和部署我们的技术方面更为开放，即使在那些我们没办法持续控制的地方也是如此。

我们致力于站在技术最前沿与对手进行竞争。性能饱和现象（saturation of performance）已经让我们有机会缩小差距，我们将继续这种追赶，并且最终达到与竞争对手一样的竞争力。但我们的商业模式是独一无二的。我们更倾向于在无法持续控制的环境中，开放地分享、定制和部署我们的技术。

Q：最近，Mistral将一些最先进的模型转为了通过API提供给合作伙伴，而不是最初那样完全开放。这种转变背后的原因是什么呢？

Arthur：实际上，这并不是一个全新的改变。我们始终计划在开源领域保持领先的模型，同时提供一些只可以通过付费服务访问的高级特性。我们的初衷未曾改变。

我们的产品中有很大一部分是开源的，这使得开发者能够自由采纳这项技术，并基于它构建他们所需的任何应用。随着开发进程的深入，当他们准备将构建的工作负载投入生产环境，或者希望逐步提升应用的性能、效率，降低维护成本时，他们能够转向我们的平台，利用我们优化过的模型来增强性能和推理速度。

我们始终将开源作为我们的核心路径。开源对我们来说至关重要。我们在开源的基础上构建了开发者平台，这自然会涉及商业化，因为我们应该一个可行的商业模式。但我们期望为使用我们开源模型的开发者提供额外的价值。

Q：你经常争辩说，欧洲不能依赖美国的人工智能公司，需要一个本土的人工智能冠军。Mistral是欧洲最著名的人工智能公司之一，但与美国的“超大型企业”Microsoft建立了合作伙伴关系，以获得其所需的计算能力。Mistral在计算方面对Microsoft的依赖是否限制了其扮演欧洲主权AI冠军角色的能力？

Arthur：我们有四家云服务提供商。我们在设计上就是云中立的，这从第一天起就是我们的战略。我们的模型能够最终靠Microsoft Azure获得，也能够最终靠[Amazon Web Services]和[Google Cloud Platform]获得。个人会使用这三者作为云服务提供商。我们还使用不相同的云服务提供商——特别是CoreWeave——进行训练。我们已建立了自己的技术栈和分销渠道，以构建我们大家都认为客户所需的独立性。

对我们的客户而言，这一点至关重要，因为他们中的一些是来自欧洲，他们盼望对自己所使用的云基础设施拥有某些特定的程度的控制权。目前，虽然已有一些可用的资源，我们的平台也已经在欧洲进行了部署，但仍然有提升的空间。这不仅仅是欧洲单方面能够决定的事情。这需要整个生态系统认识到存在的需求，并加以解决。我们期望在不久的将来能够与一些欧洲的云服务提供商建立合作伙伴关系。

Q：塞德里克·奥（Cedric O），法国前数字事务国务部长，也是你们的联合发起人之一，警告说欧盟人工智能法案可能会“杀死”

。该法案已获通过，但针对通用AI模型的行为准则尚未制定。那么，这些准则应该是怎样的呢？

我们已经对我们怎么样去使用模型、如何评估模型进行了记录，这慢慢的变成了前沿模型的一个要求。

关于训练数据集的透明度，还有一些讨论有必要进行，这是我们很希望可以实现的，但同时也需要与商业机密相权衡。我们的很多知识产权也体现在我们处理和选择数据的方式上。这同样也是其他人的知识产权。

作为一家小公司，我们对我们的知识产权很看重，因为这是我们所拥有的一切。因此，从这个方面来看，我们有信心能找到一种让各方都能接受的解决方案。

我们已被邀请参与技术规范的制定，并提供我们的意见。我们还期望，欧洲应该在完全独立的情况下做出选择，以促进ECO的发展，并确保任何一个人都能满意。

Q：竞争对手的高管们经常谈论人工智能将如何在接下来的五年或十年内改变世界，以及他们担心的事情，他们都以为由于开发更强大的AI系统可能会发生的各种变革性事情。您对AI如何改变世界有何预测？

我们创造了一种强大的技术，但我认为人们往往假设这种强大的技术能解决所有问题。在Mistral，我们很专注于确保我们的技术带来生产力的提升，为特定的垂直领域带来推理能力，从而带来社会效益。

人类一直在创造的一切都是工具，而我们现在引入了一种全新的工具，它带来了新的抽象能力。从某一种意义上说，你可以将其视为一种更为抽象的编程语言。自我们开始用计算机能够理解的语言进行编程以来，已逝去了50年。如今，我们也可以通过英语、法语或任何语言与机器对话来创造系统。这为开发者和其他人带来了一种新的思考和操作方式，这显然将改变我们未来十年的工作方式。

我相信，如果我们也可以正确地做事，并确保这项工具能够被每个人所掌握——这也正是我们创建Mistral的原因——我们就能保证它为每个人的生活带来改善，无论是在全世界内，还是在社会经济地位的各个层面。

对我们而言，达成这一愿景的首要步骤是在医疗、教育等关键领域推广极具创新性的应用。至关重要的一点是，我们一定要确保技术不仅易于人们获取，而且人们也接受了适当的培训，能够熟练运用这些技术。为此，我们致力于以一种比传统方式更为开放的姿态来分享技术，以此加速技术普及的进程。然而，这还远远不足，政治决策者们也应当担起责任，制定并实施一系列赋能计划，旨在提高全球尚未连通互联网地区的网络覆盖。我相信，我们正在开发的生成性人工智能技术，将在推动人们接触并利用这一变革性工具方面发挥重要作用。

Q：在未来，您能否设想出某种情境，我们开发了一个人工智能模型，或者正在开发中，却意外发现了某些特殊功能？是否有可能我们决定不将这个模型开源，而是选择通过API来限制访问，甚至完全不公开部署？

Arthur：至少在目前和可预见的未来，我们没这样的计划。我们所构建的模型功能都是可预见和可控的。我们坚信，开源是集体管理和利用软件的最佳途径，这一点在网络安全和操作系统领域已得到了验证。因此，目前最安全的技术往往也是开源技术。

在某种程度上，人工智能并没改变软件的本质，而是为咱们提供了不必进一步探索底层细节就能创建和使用软件的方法。因此，我并不认为开源模型会带来风险，反而只看到了它的好处。这是一个中性的工具，能够适用于各种目的。我们不会因为C语言可以被用来编写恶意软件就禁止它，同样，我们发布的模型也是如此。因此，确保市场上应用程序的质量至关重要，但这并不代表监管技术本身，而是要监管技术的使用方法。