IOSG|同质化 AI 基础设施的出路在哪儿?
本研究旨在探讨对开发者而言哪些人工智能领域最为重要,以及在 Web3 和人工智能领域哪些可能是爆发的下一个机遇。
在分享新的研究观点之前,首先很高兴我们参与了 RedPill 总计500万美元的第一轮融资,也非常激动,期待接下来能够和 RedPill 共同成长!
TL;DR
随着Web3 与 AI 的结合成为加密货币界的瞩目话题,加密世界的AI 基础设施构建兴旺起来,但实际利用 AI 或为 AI 构建的应用程序并不多,AI基础设施的同质化问题逐渐显现。近期我们参与的RedPill的第一轮融资,引发了一些更深入的理解。
-
构建 AI Dapp 的主要工具包括去中心化 OpenAI 访问、GPU 网络、推理网络和代理网络。
-
之所以说 GPU 网络比 “比特币挖矿时期” 还要热门,是因为:AI 市场更大,并且增长快速且稳定;AI 每天支持数以百万计的应用程序;AI 需要多样化的 GPU 型号和服务器位置;技术比过往更成熟;面向的客户群也更广。
-
推理网络和代理网络有相似的基础设施,但关注点不同。推理网络主要供有经验的开发者部署自己的模型,而运行非 LLM 模型并不一定需要 GPU。代理网络则更专注于 LLM,开发者无需自带模型,而是更注重提示工程和如何将不同的代理联结起来。代理网络总是需要高性能的 GPU。
-
AI 基础设施项目承诺巨大,仍在不断推出新功能。
-
多数原生加密项目仍处于测试网阶段,稳定性差,配置复杂,功能受限,还需要时间来证明其安全性和隐私性。
-
假设 AI Dapp 成为大趋势,还有许多未开发的领域,如监控、与 RAG 相关的基础设施、Web3 原生模型、内置加密原生 API 和数据的去中心化代理、评估网络等。
-
垂直整合是一个显著趋势。基础设施项目试图提供一站式服务,简化 AI Dapp 开发者的工作。
-
未来将是混合型的。部分推理在前端进行,而部分在链上计算,这样做可以考虑到成本和可验证性因素。
Source: IOSG
引言
-
Web3 与 AI 的结合是当前加密领域中最受瞩目的话题之一。才华横溢的开发者正在为加密世界构建 AI 基础设施,致力于将智能带入智能合约。构建 AI dApp 是极其复杂的任务,开发者需要处理的范围包括数据、模型、计算力、操作、部署和与区块链的整合。针对这些需求,Web3 创始人已经开发出许多初步的解决方案,如 GPU 网络、社区数据标注、社区训练的模型、可验证的 AI 推理与训练以及代理商店。
-
而在这兴旺的基础设施背景下,实际利用 AI 或为 AI 构建的应用程序并不多。开发者在查找 AI dApp 开发教程时,发现这些与原生加密 AI 基础设施相关的教程并不多,大多数教程仅涉及在前端调用 OpenAI API。
Source: IOSG Ventures
-
当前的应用未能充分发挥区块链的去中心化和可验证功能,但这种状况很快将会改变。现在,大多数专注于加密领域的人工智能基础设施已经启动了测试网络,并计划在未来 6 个月内正式运行。
-
本研究将详细介绍加密领域人工智能基础设施中可用的主要工具。让我们准备迎接加密世界的 GPT-3.5 时刻吧!
1. RedPill:为 OpenAI 提供去中心化授权
前文所提到的我们参投的RedPill是一个很好的引入点。
OpenAI 拥有几种世界级强大的模型,如 GPT-4-vision、GPT-4-turbo 和 GPT-4o,是构建先进人工智能 Dapp 的优选。
开发者可以通过预言机或前端接口调用 OpenAI API 以将其集成到 dApp 中。
RedPill 将不同开发者的 OpenAI API 整合在一个接口下,为全球用户提供快速、经济且可验证的人工智能服务,从而实现了对顶尖人工智能模型资源的民主化。RedPill 的路由算法会将开发者的请求定向到单一贡献者处。API 请求将通过其分发网络执行,从而绕过任何来自 OpenAI 的可能限制,解决了加密开发者面临的一些常见问题,如:
-
限制 TPM(每分钟代币):新账户对代币的使用有限,无法满足热门且依赖 AI 的 dApp 的需求。
-
访问限制:一些模型对新账户或某些国家的访问设置了限制。
通过使用相同的请求代码但更换主机名,开发者能以低廉的成本、高扩展性和无限制的方式访问 OpenAI 模型。
2. GPU 网络
除了使用 OpenAI 的 API,许多开发人员还会选择自行在家中托管模型。他们可以依托去中心化 GPU 网络,如 io.net、Aethir、Akash 等流行的网络,自行建立 GPU 集群并部署及运行各种强大的内部或开源模型。
这样的去中心化 GPU 网络,能够借助个人或小型数据中心的计算力,提供灵活的配置、更多的服务器位置选择以及更低的成本,让开发人员可以在有限的预算内轻松进行 AI 相关的试验。然而,由于去中心化的性质,此类 GPU 网络在功能性、可用性和数据隐私方面还存在一定的局限。
过去几个月,GPU 的需求火爆,超过了之前的比特币挖矿热潮。此现象的原因包括:
-
目标客户增多,GPU 网络现在服务于 AI 开发者,他们的数量不仅庞大而且更为忠实,不会受到加密货币价格波动的影响。
-
相比挖矿专用设备,去中心化 GPU 提供了更多的型号和规格,更能满趡iez要求。尤其是大型模型处理需要更高的 VRAM,而小型任务则有更适合的 GPU 可选。同时,去中心化 GPU 能够近距离服务终端用户,降低延迟。
-
技术日趋成熟,GPU 网络依赖高速区块链如 Solana 结算、Docker 虚拟化技术和 Ray 计算集群等。
-
在投资回报方面,AI 市场正在扩张,新应用和模型的开发机会多,H100 模型的预期回报率为 60-70%,而比特币挖矿则更为复杂,赢家通吃,产量有限。
-
比特币挖矿企业如 Iris Energy、Core Scientific 和 Bitdeer 也开始支持 GPU 网络,提供 AI 服务,并积极购买专为 AI 设计的 GPU,如 H100。
推荐:对于不太重视 SLA 的 Web2 开发者,io.net 提供了简洁易用的体验,是个性价比很高的选择。
3. 推理网络
这是加密原生 AI 基础设施的核心。它将在未来支持数十亿次 AI 推理操作。许多 AI layer1 或 layer2 为开发者提供了在链上原生调用 AI 推理的能力。市场领导者包括 Ritual、Valence 和 Fetch.ai。
这些网络在以下方面存在差异:
-
性能(延迟、计算时间)
-
支持的模型
-
可验证性
-
价格(链上消耗成本、推理成本)
-
开发体验
3.1 目标
理想的情况是,开发者可以在任何地方,通过任何形式的证明,轻松地访问自定义的 AI 推理服务,整合过程中几乎没有任何阻碍。
推理网络提供了开发者所需的全部基础支持,包括按需生成和验证证明、进行推理计算、推理数据的中继和验证、提供 Web2 和 Web3 的接口、一键式模型部署、系统监测、跨链操作、同步集成及定时执行等功能。
Source: IOSG Ventures
借助这些功能,开发者可以将推理服务无缝集成到他们现有的智能合约中。例如,在构建 DeFi 交易机器人时,这些机器人会利用机器学习模型寻找特定交易对的买卖时机,并在基础交易平台上执行相应的交易策略。
在完全理想的状态下,所有的基础结构都是云托管的。开发者只需将他们的交易策略模型以通用格式如 torch 上传,推理网络就会存储并为 Web2 和 Web3 查询提供模型。
所有模型部署步骤完成后,开发者可以直接通过 Web3 API 或智能合约调用模型推理。推理网络将持续执行这些交易策略,并将结果反馈给基础智能合约。如果开发者管理的社区资金量很大,还需要提供推理结果的验证。一旦收到推理结果,智能合约就会根据这些结果进行交易。
Source: IOSG Ventures
3.1.1 异步与同步
从理论上讲,异步执行的推理操作可以带来更好的性能表现;然而,这种方式在开发体验上可能让人感到不便。
在采用异步方式时,开发者需要先将任务提交到推理网络的智在合约中。当推理任务完成后,推理网络的智能合约会将结果返回。在这种编程模式下,逻辑被分为推理调用和推理结果处理两个部分。
Source: IOSG Ventures
如果开发者有嵌套的推理调用和大量的控制逻辑,情况会变得更糟。
Source: IOSG Ventures
异步编程模式使得它难以与现有的智能合约集成。这需要开发者编写大量额外的代码,并进行错误处理和管理依赖关系。
相对地,同步编程对于开发者来说更加直观,但它在响应时间和区块链设计上引入了问题。例如,如果输入数据是区块时间或者价格这种快速变动的数据,那么在推理完成后数据已不再新鲜,这可能会导致在特定情况下智能合约的执行需要回滚。想象一下,你用一个过时的价格来做交易。
Source: IOSG Ventures
大部分 AI 基础架构采用异步处理,但 Valence 正在尝试解决这些问题。
3.2 现实情况
实际上,许多新的推理网络还在测试阶段,如 Ritual 网络。根据他们的公开文件,这些网络目前的功能较为有限(诸如验证、证明等功能还未上线)。他们目前没有提供一个云基础设施以支持链上 AI 计算,而是提供了一个框架,用于自我托管 AI 计算并将结果传递至链上。
这是一个运行 AIGC NFT 的体系结构。扩散模型生成 NFT 并上传至 Arweave。推理网络会用这个 Arweave 地址在链上铸造该 NFT。
Source: IOSG Ventures
这个过程非常复杂,开发者需要自己部署和维护大多数基础设施,如配有定制服务逻辑的 Ritual 节点、Stable Diffusion 节点及 NFT 智能合约。
推荐:目前的推理网络在整合和部署自定义模型方面相当复杂,且在这一阶段大多数网络还不支持验证功能。将 AI 技术应用到前端会为开发者提供一个相对简单的选择。如果你非常需要验证功能,ZKML 提供商 Giza 是个不错的选择。
4. 代理网络
代理网络让用户能轻松自定义代理。这样的网络由能自主执行任务、相互交云以及与区块链网络交互的实体或智能合约组成,这一切无需人工直接干预。它主要针对 LLM 技术。例如,它可以提供一个深入了解以太坊的 GPT 聊天机器人。这种聊天机器人目前的工具较为有限,开发者还不能在此基础上开发复杂的应用。
Source: IOSG Ventures
但是将来,代理网络将提供更多的工具给代理使用,不仅仅是知识,还包括调用外部 API、执行特定任务的能力等。开发者将能够将多个代理连接起来构建工作流。例如,编写 Solidity 智能合约会涉及多个专门的代理,包括协议设计代理、Solidity 开发代理、代码安全审查代理以及 Solidity 部署代理。
Source: IOSG Ventures
我们通过使用提示和场景来协调这些代理的合作。
一些代理网络的例子包括 Flock.ai、Myshell、Theoriq。
推荐:当今大部分代理的功能都相对有限。对于特定用例,Web2 代理能够更好的服务,并且拥有成熟的编排工具,例如 Langchain、Llamaindex。
5. 代理网络与推理网络的差异
代理网络更侧重于 LLM,提供了如 Langchain 这样的工具来整合多个代理。通常情况下,开发者无需亲自开发机器学习模型,代理网络已经将模型开发和部署的过程简化。他们只需要链接必要的代理和工具即可。大多数情况下,最终用户将直接使用这些代理。
推理网络则是代理网络的基础设施支撑。它提供给开发者较低层次的接入权限。正常情况下,终端用户不直接使用推理网络。开发者需要部署自己的模型,这不仅限于 LLM,并且他们可以通过链下或链上接入点使用它们。
代理网络和推理网络并非完全独立的产品。我们已经开始看到一些竖向整合的产品。他们因为这两种功能依赖相似的基础设施,所以同时提供代理和推理能力。
6. 新的机会之地
除了模型推理、训练和代理网络外,web3 领域还有很多值得探索的新领域:
-
数据集:如何将区块链数据转变为机器学习可用的数据集?机器学习开发者需要的是更为具体和专题化的数据。例如,Giza 提供了一些高品质的、关于 DeFi 的数据集,专门用于机器学习训练。理想的数据应不仅仅是简单的表格数据,还应该包括能够描述区块链世界交互的图形数据。目前,我们在这方面还有不足。目前有些项目正通过奖励个人创建新数据集来解决这一问题,比如 Bagel 和 Sahara,它们承诺保护个人数据的隐私。
-
模型存储:一些模型体积庞大,如何存储、分发及版本控制这些模型是关键,这关系到链上机器学习的性能和成本。在这一领域,Filecoin, AR 和 0g 等先锋性项目已经取得了进展。
-
模型训练:分布式且可验的模型训练是个难题。Gensyn, Bittensor, Flock 和 Allora 等已有显著进展。
-
监控:由于模型推理在链上与链下都有发生,我们需要新的基础设施来帮助 web3 开发者追踪模型的使用状况,及时发现可能存在的问题和偏差。有了合适的监控工具,web3 的机器学习开发者可以及时调整,不断优化模型精确度。
-
RAG 基础设施:分布式 RAG 需要全新的基础设施环境,对存储、嵌入计算和向量数据库有较高的需求,同时要确保数据的隐私安全。这与目前的 Web3 AI 基础设施大不相同,后者大多依赖第三方来完成 RAG,例如 Firstbatch 和 Bagel。
-
专为 Web3 定制的模型:并不是所有模型都适合 Web3 情景。大多数情况下,需要对模型进行重新训练,以适应价格预测、推荐等具体应用。随着 AI 基础设施的繁荣发展,未来我们期望有更多 web3 本地模型来服务于 AI 应用。比如 Pond 正在开发区块链 GNN,用于价格预测、推荐、欺诈侦测和反洗钱等多种场景。
-
评估网络:在缺乏人类反馈的情况下评估代理是不容易的。随着代理创建工具的普及,市场上将会出现无数的代理。这就需要有一个系统来展示这些代理的能力,并帮助用户判断在特定情况下哪个代理的表现最佳。例如,Neuronets 是这个领域的一个参与者。
-
共识机制:对于 AI 任务,PoS 不一定是最佳选择。计算复杂性、验证的困难和确定性的缺失是 PoS 面临的主要挑战。Bittensor 创造了一种新的智慧型共识机制,奖励网络中为机器学习模型和输出做出贡献的节点。
7. 未来展望
我们目前观察到了垂直整合的发展趋势。通过构建一个基础的计算层,网络能够为多种机器学习任务提供支持,包括训练、推理及代理网络服务。这种模式意在为 Web3 的机器学习开发者们提供全方位的一站式解决方案。
目前,链上推理尽管成本高昂且速度较慢,但它提供了出色的可验证性及与后端系统(例如智能合约)的无缝集成。我认为未来将走向混合应用的道路。一部分推理处理将在前端或链下进行,而那些关键的、决策性的推理则会在链上完成。这种模式已经在移动设备上得到了应用。通过利用移动设备的本质特点,它能够在本地快速运行小型模型,并将更复杂的任务迁移到云端,利用较大的 LLM 处理。