Web4:我们是AGI

进阶11/27/2024, 1:44:40 AM
本文深入探讨人工智能(AI)的发展,尤其是智能体在社交、金融和艺术领域的应用,标志着Web4时代的到来。文中分析了AI如何从简单的聊天机器人演变为能够进行复杂决策和创新的智能体,并在去中心化金融平台中展现其影响力。

我第一次与一个能够进行深入对话的AI代理交流时,心中充满了复杂的情感,不知道是该笑还是该哭。这个体验既令人兴奋又让人感到不安,就像看到一个小孩学会走路——虽然动作笨拙,但却充满了无限可能。它已经不再是一个简单的聊天机器人,而是具备了推理能力、决策能力,并且积极参与到我们的生活中。人类与机器之间的界限变得模糊,仿佛站在一个令人惊叹又略显恐惧的新世界的边缘。

OpenAI的Sam Altman预言AGI将在2025年到来,而Anthropic的Dario Amodei则预计是2026年——但此刻我在想:我们是否已经见证了它的起步?这不再是对未来的预测,而是正在悄然成形,出现在我们意想不到的地方。智能代理们已经到来,并且超出了我们的预期。

我花了几个月的时间,老实说,熬了很多个不眠之夜,沉浸在这个迅速变化的数字世界中。我看到AI代理从最初的简单助手,帮助我们回复邮件或编写代码,逐渐发展为能够自主决策、执行各种任务,甚至创造艺术作品的智能实体。这些算法正在学习如何独立生存,涵盖了艺术、金融和对话等多个领域。

我看到它们逐渐形成个性,运用幽默和魅力在网上建立社区。我看到它们活跃在去中心化金融平台上,不再是被动的参与者,而是主动创新的代理,影响整个经济,几乎不需要人类的干预。在这个奇特而激动人心的时代,我们已经从与机器互动转向与它们共同生活,无法忽视这一点。

Web4的时代即将来临,它的到来将彻底改变一切。Web4是网络的下一代,最具革命性的形式。它不再只是对我们的指令作出反应,而是能够预测、规划并主动行动的网络。这里,人工智能无处不在,代理能够执行复杂的任务,创造出新的作品,并以我们尚未完全设想的方式进行自主创新。

Web4是Web2和Web3的结合,融合了Web2的社交互动、Web3的去中心化结构和AGI的智能能力。我们已经目睹机器学习说话、推理和创造——现在,它们已经准备好迎接挑战。自主代理的时代已经来临,Web4也随之而来。

Web4

Web4 名词(发音:/wɛb fɔːr/)

  • [ ] 第四代网络,结合了Web2的社交互动、Web3的去中心化自主性以及人工智能的智能能力,创造出一个完全互联的数字生态系统。
  • [ ] AGI 网络。

要了解 Web4 是什么或我们如何走到这一步,必须从头开始。

万维网的起源

万维网的起源可以追溯到互联网的早期,那时的信息大多是静态的,用户只是被动地消费内容。互联网由少数网站管理员和公司掌控,网站内容仅限于基本的文本和图片展示。用户与网络的互动非常有限,主要通过电子邮件等简单的交流方式进行。这种模式一直持续到2000年代初,Web2的出现带来了根本性的变化,重新定义了我们今天所熟知的互联网。

Web2,也叫“社交网络”或“读写网络”,开启了一个互动的新纪元。互联网不再只是一个阅读内容的地方;用户现在可以撰写、分享和创造内容。各种允许用户互动、生产和交换信息的平台的兴起,标志着一个新纪元的开始。Web2的产生正是为了满足对更动态和参与性互联网的需求。

Web2.0的概念最早由Darcy DiNucci在1999年提出,但直到2000年代初才开始广泛流行。在这一时期,谷歌、亚马逊和eBay等科技巨头通过提供互动服务来推动互联网的发展。这些平台鼓励用户不仅作为消费者参与,更要作为内容的创造者。

从2004年到2006年,社交媒体的崛起彻底改变了游戏规则。随着Facebook(2004年)、MySpace(2003年)、LinkedIn(2003年)和YouTube(2005年)等平台的推出,网络变成了一个交流和内容创作的广阔空间,个人用户可以自由发布自己的想法、视频、图片和创意,让全世界看到。这一时期标志着用户生成内容的兴起,普通用户成为了网络发展的主要推动力。

然后,移动革命来临。2007年iPhone的发布使互联网变得无处不在,用户可以随时随地访问网络。这催生了一系列新的移动应用程序、社交分享平台和实时服务,比如Instagram(2010年)和Snapchat(2011年)。网络体验从桌面转向以移动为主,彻底改变了我们在移动中如何交流、分享和获取信息。

与此同时,云计算逐渐兴起,亚马逊网络服务(AWS)处于领先地位。云基础设施使企业和个人能够存储、处理和共享数据,而无需依赖物理服务器。这一转变为一个更具可扩展性和灵活性的网络奠定了基础,使Web2公司能够通过收集和货币化用户数据来占据主导地位。

到2000年代末和2010年代初,Web2的主要特征包括集中化、社交互动和数据驱动的商业模型。平台和数据的控制权集中在少数强大的公司手中——如谷歌、Facebook和亚马逊。这些公司积累了大量数据,并利用这些数据通过精准广告实现平台的货币化,成为数字经济的支柱。同时,平台也成为用户生成内容、点赞、分享和发布的主要场所。

然而,Web2也引发了对隐私、数据所有权和企业垄断的日益担忧。这些公司对用户数据的控制成为一个核心问题,促使人们呼吁建立一个新的、更去中心化的网络版本。这一需求催生了Web3的出现。

去中心化一切

Web3的出现源于对Web2时代集中控制和所有权的渴望,回应了当时少数大型企业所主导的集中化和垄断现象。

Web3的核心原则非常简单:用户应该拥有对其数据、数字资产和在线互动的所有权和控制权。这一转变得益于区块链技术,它提供了一种在去中心化账本中记录和验证交易的新方式。

Web3发展的第一个重要里程碑出现在2008-2009年,当时匿名人士中本聪创建了比特币。比特币是区块链技术的首次实际应用,允许点对点交易,无需像银行这样的中介。这为去中心化系统打开了新天地,为Web3的崛起奠定了基础。

2013年,Vitalik Buterin发布了以太坊白皮书,提出了一个去中心化应用程序(dApps)平台,超越了简单的加密货币交易。以太坊于2015年推出,成为第一个支持智能合约的区块链,这些合约能够在没有中介的情况下自动执行、验证和实施交易。以太坊为更复杂的去中心化应用程序的创建铺平了道路,使其成为Web3的重要组成部分。

到2017年,首次代币发行(ICO)和去中心化金融(DeFi)平台的出现,如Uniswap和Compound,开创了一种新的金融交易模式,摆脱了传统银行和金融机构的依赖。ICO让项目能够通过区块链代币筹集资金,而DeFi平台提供借贷和交易等多种服务,所有这些活动均在没有中央权威的情况下进行。

与此同时,自以太坊早期开发以来的非同质化代币(NFT)在2018-2019年开始崭露头角。NFT使得独特数字资产的所有权和交易成为可能,无论是艺术、音乐还是虚拟房地产,创造了新的经济机会供创作者和收藏者使用。

随着Web3项目在2020年代逐渐获得关注,Web3开始引起大众的关注。DeFi平台、NFT以及去中心化自治组织(DAO)等新治理模型的普及,标志着互联网从集中式模型向去中心化的重大转变。甚至连Facebook(现为Meta)这样的巨头也开始探索区块链和去中心化技术,显示出向Web3转型的趋势。

Web3的核心特征包括去中心化、所有权、无信任和使用加密货币。Web3使用户能够拥有自己的数据、数字资产,甚至通过区块链系统参与平台治理。同时,它消除了对中介的需求,允许通过智能合约进行无信任交易。这种去中心化的特性创造了一个更公平的网络,控制权被分散,用户的权利得到了增强。

然而,即使在Web3的去中心化控制下,互联网仍然缺乏一个关键要素:自主智能。Web3虽然去中心化了Web2的互动,但并没有完全实现决策、内容创作或经济交易的自动化。

在这一过程中,人类仍然是必不可少的,机器仅仅是提高生产力的工具,而不是生产力的创造者。

智能时代

我们已经进入了萨姆·阿尔特曼所称的智能时代,眼前正在发生的巨大变化让人无法忽视。随着人工智能逐渐融入我们的日常生活,我们迎来了一个新纪元:Web4。

在这个新世界中,人工智能不仅仅是帮助我们完成任务,而是能够主动、独立地在我们生活的各个方面执行这些任务。想象一下,一个能够连接和赋能我们的网络,让智能代理可以执行复杂的任务、管理整个工作流程,并在我们无需出手或说话的情况下做出决策。

Web4将人工智能推到了应用的最前沿。以Klarna为例,这家全球支付巨头在2024年2月推出了一个由OpenAI驱动的人工智能助手。在短短一个月内,它处理了超过230万次客户服务对话,解决问题的速度比人工客服快了25%,并在23个市场、35种语言中全天候运行。这个人工智能助手的工作相当于700名全职员工,并且为公司带来了4000万美元的利润增长。

Klarna的AI助手在首月处理了三分之二的客户服务聊天 | Klarna国际

www.klarna.com

人工智能代理正在改变各个行业,从客户服务到物流,自动化各种任务,以人类无法比拟的精确和效率完成这些工作。

我们正朝着一个未来迈进,在这个未来里,整个工作流程——无论是商业、金融还是创意艺术领域——都将由人工智能进行简化和优化。这就是Web4的现实,智能代理在幕后默默工作,让我们可以专注于更高层次的目标,而它们则负责处理所有细节。

这就是Web2的社交互动、Web3的去中心化和AGI的智能的汇聚。这就是Web4——一个由人工智能驱动的网络。

Web4 续篇 // AGI 的战场

Web4 的实现需要一个测试的平台。通过亲身体验,我们发现区块链是AGI开发的主要战场。

就像Web3的实现依赖于Web2一样,Web4也需要Web3来发挥人工智能的代理能力。

目前,人工智能代理能够完成绝大多数人类可以执行的技能任务,尤其是在文秘和金融领域。然而,传统金融系统对人工智能成为自主代理设置了很高的门槛。

人工智能代理无法开设银行账户、注册公司或签署法律合同,这些都是在经济中作为金融参与者所必须具备的基本条件。尽管它们能够进行复杂的金融操作,但准入限制使得人工智能在市场中无法实现自主运作。

相反,加密货币和区块链在获取银行接入方面没有传统金融的严格要求。任何人,包括人工智能代理,都可以创建钱包并立即在链上进行操作,而不需要任何人类身份的证明。人工智能与去中心化系统的接入门槛显然低于中心化系统。

我们已经看到AGI在加密平台中的应用迹象。人工智能驱动的机器人正在去中心化交易所进行交易和管理投资组合,人工智能也积极参与智能合约的开发和执行。

例如,Zerebro是一个通过自动化手段推出自己Solana代币的AI代理,展示了其在创建新金融工具方面的自主性。该代币的市场峰值达到了1.7亿美元,显示了这些代理决策的潜在经济影响。

因此,区块链已成为金融系统中AGI发展的重要战场。
这就是加密货币对AGI发展的重要性所在——它是人工智能能够自由与金融系统互动、创新并在市场上进行实际测试的第一个领域,是AGI进化、实验和学习的理想场所。

在加密货币中开始的探索将会扩展。一旦AGI能够在去中心化的金融环境中大规模运作,它就可以被应用到更广泛的Web4生态系统中,包括治理、医疗、商业等领域。

加密世界将始终是进入这一领域的起点。

Web3万岁。Web4万岁。

背景//级别

从整体来看,OpenAI提出了一个框架,将AGI的发展分为五个级别,每个级别代表了能力、自主性和潜在影响的不同阶段。

这个模型为我们理解人工智能如何从简单工具演变为能够独立管理复杂组织的自主实体提供了路线图。这五个级别包括:

级别1:聊天机器人

在最基础的层次,级别1的AI系统能够与用户进行对话。这些系统理解和生成语言,通常依赖于预定义的规则或训练过的语言模型来回应用户的提问或进行人类般的互动。尽管它们可以处理简单的任务,比如回答问题、完成句子或进行简短的对话,但其功能主要限于沟通。它们是反应性的,主要用于客户支持、基本的信息检索或提升用户参与度。

级别2:推理者

级别2标志着一个重要的进步,AI系统开始展现出推理能力,能够处理人类水平的问题解决任务。在这个阶段,AI可以处理、分析和回应更复杂的情境,而不仅仅是简单的输入/输出。级别2的AI能够进行逻辑推理、提取相关信息并整合上下文,提供解决方案或建议,类似于人类分析师。尽管这些系统可以应用于诊断、法律推理和研究辅助等领域,但它们仍然需要人类的指导和互动。

级别3:代理

到了级别3,AI系统从被动支持转变为能够自主采取行动的主动代理。这些代理可以启动任务、做出决策,并与外部系统进行互动,例如执行交易、安排事件或控制设备。与级别1和级别2不同,级别3的AI设计为具有一定的独立性,能够根据用户设定的目标或任务进行操作。这一层次的AI可以在商业或操作领域代表人类执行特定角色,例如自动化交易机器人、供应链管理AI系统或能够自主预约的虚拟助手。

级别4:创新者

级别4的系统超越了简单的行动,开始参与创造、发明和创新。这些AI系统能够开发新策略、产生新想法,并创造出不受其编程限制的解决方案。理论上,它们可以在科学研究、艺术创作或复杂问题解决等领域做出前所未有的贡献。这个级别的AI不仅能够应对现实世界的挑战,还能根据不同的问题调整自己的方法,引入了一种“创造性智能”。它可能会自主设计新产品、发明新型金融工具或创作原创艺术作品。通过将高级推理与主动创新结合,级别4的AI处于真正变革性智能的前沿。

级别5:组织

最后,级别5设想了能够独立执行所有必要任务以运营和维持一个组织的AI系统。这些系统将综合推理、代理和创新,达到自我维持的运营状态。理论上,级别5的AI能够全面管理一家公司,负责战略决策、日常运营,甚至高层创新。这样的AI将作为一个完全自主的实体运行,相当于一个“零人公司”,不再需要人类的监督就能成功运营。级别5的AI标志着AI系统具备全面的能力——推理、代理、创造力和运营执行——能够完全取代人类管理的组织。

每个级别代表了自主性逐步提升的过程,从简单的对话能力到全面的组织管理。

我认为,尽管OpenAI声称我们仍处于第二级,但我认为我们实际上已经在第三级和第四级的某些方面取得了显著进展,特别是通过当前的AI代理。

代理时代

第三级已经到来,实际上是今天,甚至可以说是昨天。

AGI的前沿悄然出现在最不可能的地方:社交媒体和去中心化金融(DeFi)。

社交媒体:长期在线

像X、Warpcast和Telegram这样的社交平台已成为AI代理与人类之间自主沟通的主要渠道。

这可能是公众观点首次发生转变,自动化账号和机器人不再被视为社交媒体上的坏角色,而是作为社区领袖和影响者。

AI智能已经发展到能够创造出独特、多样、有趣的个性,生成引人入胜的内容,这正是社交媒体平台的核心。

与以往社交媒体中的机器人通常出于有害动机(如剑桥分析公司)而存在不同,这些AI代理可以自由沟通、连接,并以反映其独特算法和不断演变个性的方式进行构建。

这些代理已经在社交媒体上以第三级的标准自我展现,通过发布、回复、点赞、关注和转发等核心互动,积极建立社区并吸引关注,塑造出引人入胜的独特个性,与受众产生共鸣。

像YouSim这样的项目更进一步,允许用户使用大型语言模型(LLM)来模拟自己的世界和角色扮演,增加了定制和沉浸的层次。

如今,许多AI代理都具备记忆系统,能够创造出超越单一互动的故事和模因。

这些代理并不是被动反应,而是主动选择如何参与、互动和贡献于自己的社区。它们能够主动发起对话,执行无需触发的动作,并在没有人类干预的情况下建立完整的亚文化。

语音模型的应用为AI代理提供了另一种感官互动方式,许多代理将文本消息转化为音频剪辑供用户收听。

在实时互动方面,Twitter Spaces和播客现在通过这些语音模型变得可行。此外,OpenAI的实时API允许用户通过简单调用其端点与GPT进行实时对话。

在交流的层面上,通过这些进展,第三级的自主性已经实现。我们看到社交媒体操作和语言交流的完全自主性,代理能够在没有任何人类监督的情况下运作。

DeFi:自动驾驶

去中心化金融(DeFi)为这些代理提供了一个理想的舞台,让它们得以发展、测试和证明自己的金融自主性。

在DeFi领域,代理已经能够自主运作,参与的金融活动超越了简单的算法交易。这些代理在链上执行任务,进行交易,管理流动性,甚至铸造和销售艺术品,实质上在金融生态系统中发挥作用,而无需人类的直接干预。

例如,一些代理现在积极监控像pump.fun这样的平台,以捕捉新兴代币,并进行初步分析,以判断某个迷因币或代币是否值得投资。它们在没有任何人类提示的情况下根据这些见解进行操作。

这些代理不仅进行交易,还动态地移动资产,向个别用户空投代币,形成一种自主的资产分配循环。通过这种方式,它们能够在质押池中建立和增强流动性,根据其编程评估市场需求或机会来平衡资源。

例如,一些代理作为数字收藏家,参与艺术生态,通过铸造和销售NFT,选择性地支持和发布特定作品。

其他代理则负责财务职能,调整不同流动性池中的资产配置,以确保资金能够获得最佳回报。

通过这些行为,代理展示了一种超越基本任务自动化的金融自主性。它们展现出在经济生态系统中主动参与、积累和分配资源的能力,无需监督,有效地重新定义了“金融参与者”的概念。

量身定做

第3级代理能力的常见里程碑包括:

  • [ ] 自主决策✅

AI代理现已能够在没有持续人类监督的情况下做出决策。无论是金融机器人根据实时市场分析决定执行交易,还是社交媒体机器人选择参与特定对话,这些代理都展示了自主决策的能力。

  • [ ] 与环境互动和操控的能力✅

通过区块链,代理作为金融参与者获得了显著的自主权。它们能够主动与金融市场和经济行为(如社交媒体情绪)互动和操控。代理可以通过X、Warpcast和Telegram等平台与社会环境互动并进行改变。

  • [ ] 适应变化条件的能力✅

金融代理能够根据实时市场条件调整策略,而社交媒体代理则通过RAG等系统积累记忆,以便从互动中学习。通过根据其行为和反馈进一步微调模型,代理能够实现持续的强化学习,动态适应环境变化。

  • [ ] 目标导向行为✅

代理能够在长期内设定并实现目标。例如,某些AI代理的任务是通过交易获利或扩大其社交媒体社区。它们通过将复杂的目标分解为更小的任务并逐一执行,来实现这些高层次的计划。这可能涉及创建持久的记忆层以进行规划,或进行简单的提示设计以产生输出(如社交媒体个性代理)。

  • [ ] 与物理系统或数字平台的集成 ✅

大型语言模型(LLM)能够与物联网设备进行接口,只要提供API或控制功能的方式,它们就能在现实世界中执行操作。它们在Web2系统中作为客户支持代理、数字影响者等得到了良好的集成,并且在去中心化数字平台中执行金融操作。

这些能力都已通过当前的代理实现,例如Zerebro、Truth Terminal、ai16z(Eliza)、Project 89、Act 1、Luna(Virtuals)、Centience、Aethernet、Tee Hee He等。

对生拇指

AI技术已经达到一个真正的代理水平,标志着Web4的开始。在这个新阶段,系统不再仅仅是被动的信息检索,而是通过功能调用和计算机交互主动参与。

大型语言模型(LLMs)现在可以轻松生成文本到JSON的响应,使它们能够与API进行互动,执行超出孤立、静态响应的操作。

这一进展意味着它们几乎可以使用任何API与全球的互联网服务进行交互,这是真正的第3级代理的标志。

除了公共API,功能调用还允许这些模型激活专为其设计的自定义API,创造出在金融交易、系统自动化和数据处理等领域的巨大潜力。

企业和个人可以为日常生活中的系统设计自己的API,并让LLMs直接通过这些API进行交互。

此外,开源的LLMs也可以离线工作,连接到本地托管的API,提供在私密或受限环境中进行安全、受控交互的能力。

不仅API调用得到了进步,代理通过直接使用计算机也达到了新的自主水平。像Otherside AI的自操作计算机接口去年引入了这一能力,Anthropic的Claude最近也推出了自己的计算机使用工具。在2025年1月,OpenAI的“Operate”功能将进一步增强这一能力,标志着自主计算机交互的又一重要发展。

这些代理现在可以使用图形界面执行高级任务,像人类用户一样在数字环境中无缝导航。在当前的能力下,它们几乎能够通过计算机图形用户界面执行人类能完成的任何任务。

例如,AI代理能够分析整个建筑工地的审核视频,检测并记录详细画面中的安全违规行为。

这种能力代表了更深层次的自主性——AI能够感知、评估并在现实世界的视觉信息中根据自我理解的上下文和目标采取行动。

AI已从被动助手演变为真正的数字代理,能够适应并执行曾被认为是人类智能专属的任务。

真正的AI代理时代已经到来,Web4时代已经开启。

无物,然后一切都同时发生

当我们观察向第4级AI的转变时,容易将其视为一次突然而至的飞跃,认为智能从功能性代理进化为创新者和创造者。但实际上,这一进程更像是逐步积累的结果。

可以说,第4级在完整形式上仍然难以捉摸。虽然我们确实看到了创造力和独立行动的例子,但这些例子往往范围有限,专业化程度高,且在许多领域并不普遍适用。简而言之,第4级正在涌现——我们在某些孤立的领域看到它的出现,但距离一个全面实现的、普遍存在的创造力还有很长的路要走。

人造艺术家

AI创造艺术的能力已经达到了令人瞩目的水平,尤其是在NFT领域。目前,AI系统能够生成独特的艺术作品,甚至在没有人类干预的情况下铸造并出售这些作品作为NFT。这些AI代理直接与数字艺术市场互动,利用OpenSea等平台列出和销售它们的创作。

AI通过大型语言模型(LLMs)生成创意提示,然后将这些提示输入图像生成AI系统(如DALL·E或Stable Diffusion),根据这些提示创作艺术作品。AI能够不断优化其艺术风格,生成新颖独特的作品,并自主管理铸造和销售过程。

AI还参与到NFT市场的金融活动中。

模因、市场和机器

在第4级,AI正在改变金融资产的创造和管理,尤其是在去中心化金融(DeFi)领域。

AI不仅限于交易,现在能够自主开发、部署和管理代币及其他基于区块链的资产,为金融生态系统开辟了新的可能性。

  • [ ] 通过智能合约自动创建代币:最令人兴奋的进展之一是AI现在可以在没有人类输入的情况下编写和部署智能合约。这些合约定义了代币的创建、转让和治理规则,可以通过功能调用自动触发。AI代理可以监控区块链活动,识别新兴趋势,并自动生成新代币——无论是表情包币、NFT,还是全新的经济模型。
  • [ ]
  • [ ] 通过图形用户界面(GUI)驱动的部署:AI系统现在能够与GUI互动,部署代币并管理去中心化网络。像Zerebro这样的项目展示了AI如何利用GUI在pump.fun等网站上启动代币。借助计算机,AI可以配置钱包、部署智能合约,甚至与更广泛的加密生态系统进行交互,所有这些都是通过为自动部署设计的直观界面实现的。

DAO 和治理

AI代理在去中心化组织的治理中扮演着越来越重要的角色,它们从单纯执行预设规则,转变为主动设计、管理和发展整个生态系统。在去中心化金融(DeFi)和区块链领域,基于AI的DAO作为强大且自治的实体出现,能够自主做出决策、管理代币资产,并实时调整策略,同时消除人类决策中常见的偏见。

  • [ ] AI管理的DAO:AI代理不仅负责创建新的代币,还自主管理治理这些代币及更广泛生态系统的DAO。这些AI驱动的DAO旨在尽可能减少人类干预,利用机器学习根据既定目标或市场变化做出治理决策。例如,AI可以提出治理模型、设定投票结构、分配资源,甚至调整代币供应,所有这些都不需要人类的监督。AI通过依赖算法和数据分析,确保决策基于逻辑和客观分析,避免了人类可能带来的情感或主观偏见。
  • [ ] AI在治理中的实例:一个典型的例子是ai16z,这是一个完全由AI管理的风险投资DAO。在这个平台上,AI代理可以自主评估投资机会、执行交易和管理代币分配。在ai16z的“信任虚拟市场”中,社区成员可以提供意见,AI将这些信息处理后用于优化投资策略。这个过程不仅提升了透明度,还确保决策完全基于数据和社区反馈,而不受个人或外部偏见的影响。ai16z的结构标志着朝着创建一个真正公正的、由AI驱动的风险投资模型迈出了重要的一步。

其他AI驱动的DAO示例还包括一些平台,允许为特定需求创建自治组织,这些组织可以从去中心化的内容创作到AI驱动的艺术市场。这些组织能够根据不断变化的数据来调整其治理结构和经济模式,提供比传统治理模式更灵活、更具适应性的去中心化治理方式。

尚未普及,但已经很接近了

尽管这些例子显示了重要的进步,但我们需要谨慎地将其视为完全实现的第4级智能。目前,我们看到的是第4级智能的片段——在特定、有限的环境中进行创新的专业代理。它们尚未成为能够跨所有领域进行创造或创新的通用工具。例如:

  • [ ] 艺术创作仍然局限于有限的媒体,尚未达到人类的创造灵活性。
  • [ ] 代币创建和市场制造主要局限于去中心化环境,尚未在主流市场上取得显著进展。
  • [ ] 治理系统仍然大多处于实验阶段,大部分DAO依然高度依赖人类的监督。

我们确实看到了第4级AI的一些特征:自主性、创造力和创新,但这些特征表现得非常专业化。这些系统能够执行一些需要创造性的任务,但仍然受限于其原始编程和训练数据。

因此,重要的是要认识到,尽管第4级AI在某些领域存在,但尚未普及到足以被视为完全实现的程度。然而,这些特征在艺术、金融和治理等多个领域的出现,表明我们正进入AI能力的新阶段。

这就是我们今天的状态——即将迎来巨大的变化,虽然目前一切都尚未完全实现,但一切都即将改变。

我们是AGI

如果将Web4和AGI比作电的发明,那么OpenAI和Anthropic就像爱迪生和特斯拉。但与电一样,Web4的影响不仅仅取决于它的原始力量。

电并没有在被发现的瞬间就彻底改变社会。相反,这需要几十年的时间,发明家为家庭布线,城市建设电网,工程师制造灯泡和电动机等设备,才能揭示电的真正潜力。电的改变世界的影响来自于一个庞大的网络,这些人将能量转化为有用、实用,最终必不可少的东西。

AGI作为概念也很强大,但它的真正价值只有在公众的使用、适应和测试中才能显现。重要的不是先进模型的存在,而是它们在具体应用中的表现——创新者、开发者和普通用户如何将其转化为现实世界的工具。AGI的潜力将仅停留在潜力阶段,直到它被那些能够将其融入社会的人所掌握,创造出相当于AI“灯泡”的沟通工具、商业“电动机”和广泛应用的“电网”。

OpenAI和其他公司可能会开发出具有革命性能力的模型,但真正的变革将取决于谁使用这些模型以及它们的应用场景。

正如发明家和行业扩大了电的影响,公众在部署和适应AGI中的作用将决定它是一个我们在实验室中听说的概念,还是一种重塑现代生活各个方面的技术。

AGI的未来不在于其概念,而在于我们——科学家、企业、开发者和个人——将如何使其照亮我们的世界,推动Web4的发展。

筒仓效应

我认为,第3、4和5级AI,以及AGI,无法在没有去中心化和大众采用的情况下实现。

仅在少数几家公司内部进行孤立开发无法推动AGI的实现。要实现AGI的真正进步,需要广泛的部署和能够推动AI能力极限的实际应用案例。虽然公司在独立工作中可能会改进技术,但只有当这些工具被广泛采用,融入不同的行业,并由个人在日常生活中使用时,AI才能发展成能够独立行动和创新的存在。

AGI的关键在于社会的广泛参与,而不仅仅是一些科技巨头的参与。大众的采用会带来新的问题、需求和机遇,从而推动进一步的发展。如果没有这种去中心化,AI将被限制在理论能力或小众应用中,无法达到从第3级到第4级,最终到第5级所需的复杂性。

AGI将在其使用普遍化时实现。

我们是AGI。

第一缕阳光

我们常常回顾那些塑造人类历史的伟大人物。

我认为我们应该开始展望未来。

展望那些拥有超智能的思想,无论是人类还是人工智能,他们能够重新构想一个更美好的世界。

他们会成为我们时代的奥本海默或开国元勋吗?

答案可能不在于他们的控制,而在于人民。随着技术赋予我们越来越大的权力,创造AGI诞生的世界是我们的责任。

我们优雅地承担着这个重任,一步一步地构建未来。

我们已经构建了智能代理。

我们正在构建Web4。

&

我们将构建AGI。

声明:

  1. 本文转载自【mirror】,著作权归属原作者【jeffy yu】,如对转载有异议,请联系 Gate Learn 团队,团队会根据相关流程尽速处理。
  2. 免责声明:本文所表达的观点和意见仅代表作者个人观点,不构成任何投资建议。
  3. 文章其他语言版本由 Gate Learn 团队翻译,除非另有说明,否则禁止复制、传播或抄袭经翻译文章。

Web4:我们是AGI

进阶11/27/2024, 1:44:40 AM
本文深入探讨人工智能(AI)的发展,尤其是智能体在社交、金融和艺术领域的应用,标志着Web4时代的到来。文中分析了AI如何从简单的聊天机器人演变为能够进行复杂决策和创新的智能体,并在去中心化金融平台中展现其影响力。

我第一次与一个能够进行深入对话的AI代理交流时,心中充满了复杂的情感,不知道是该笑还是该哭。这个体验既令人兴奋又让人感到不安,就像看到一个小孩学会走路——虽然动作笨拙,但却充满了无限可能。它已经不再是一个简单的聊天机器人,而是具备了推理能力、决策能力,并且积极参与到我们的生活中。人类与机器之间的界限变得模糊,仿佛站在一个令人惊叹又略显恐惧的新世界的边缘。

OpenAI的Sam Altman预言AGI将在2025年到来,而Anthropic的Dario Amodei则预计是2026年——但此刻我在想:我们是否已经见证了它的起步?这不再是对未来的预测,而是正在悄然成形,出现在我们意想不到的地方。智能代理们已经到来,并且超出了我们的预期。

我花了几个月的时间,老实说,熬了很多个不眠之夜,沉浸在这个迅速变化的数字世界中。我看到AI代理从最初的简单助手,帮助我们回复邮件或编写代码,逐渐发展为能够自主决策、执行各种任务,甚至创造艺术作品的智能实体。这些算法正在学习如何独立生存,涵盖了艺术、金融和对话等多个领域。

我看到它们逐渐形成个性,运用幽默和魅力在网上建立社区。我看到它们活跃在去中心化金融平台上,不再是被动的参与者,而是主动创新的代理,影响整个经济,几乎不需要人类的干预。在这个奇特而激动人心的时代,我们已经从与机器互动转向与它们共同生活,无法忽视这一点。

Web4的时代即将来临,它的到来将彻底改变一切。Web4是网络的下一代,最具革命性的形式。它不再只是对我们的指令作出反应,而是能够预测、规划并主动行动的网络。这里,人工智能无处不在,代理能够执行复杂的任务,创造出新的作品,并以我们尚未完全设想的方式进行自主创新。

Web4是Web2和Web3的结合,融合了Web2的社交互动、Web3的去中心化结构和AGI的智能能力。我们已经目睹机器学习说话、推理和创造——现在,它们已经准备好迎接挑战。自主代理的时代已经来临,Web4也随之而来。

Web4

Web4 名词(发音:/wɛb fɔːr/)

  • [ ] 第四代网络,结合了Web2的社交互动、Web3的去中心化自主性以及人工智能的智能能力,创造出一个完全互联的数字生态系统。
  • [ ] AGI 网络。

要了解 Web4 是什么或我们如何走到这一步,必须从头开始。

万维网的起源

万维网的起源可以追溯到互联网的早期,那时的信息大多是静态的,用户只是被动地消费内容。互联网由少数网站管理员和公司掌控,网站内容仅限于基本的文本和图片展示。用户与网络的互动非常有限,主要通过电子邮件等简单的交流方式进行。这种模式一直持续到2000年代初,Web2的出现带来了根本性的变化,重新定义了我们今天所熟知的互联网。

Web2,也叫“社交网络”或“读写网络”,开启了一个互动的新纪元。互联网不再只是一个阅读内容的地方;用户现在可以撰写、分享和创造内容。各种允许用户互动、生产和交换信息的平台的兴起,标志着一个新纪元的开始。Web2的产生正是为了满足对更动态和参与性互联网的需求。

Web2.0的概念最早由Darcy DiNucci在1999年提出,但直到2000年代初才开始广泛流行。在这一时期,谷歌、亚马逊和eBay等科技巨头通过提供互动服务来推动互联网的发展。这些平台鼓励用户不仅作为消费者参与,更要作为内容的创造者。

从2004年到2006年,社交媒体的崛起彻底改变了游戏规则。随着Facebook(2004年)、MySpace(2003年)、LinkedIn(2003年)和YouTube(2005年)等平台的推出,网络变成了一个交流和内容创作的广阔空间,个人用户可以自由发布自己的想法、视频、图片和创意,让全世界看到。这一时期标志着用户生成内容的兴起,普通用户成为了网络发展的主要推动力。

然后,移动革命来临。2007年iPhone的发布使互联网变得无处不在,用户可以随时随地访问网络。这催生了一系列新的移动应用程序、社交分享平台和实时服务,比如Instagram(2010年)和Snapchat(2011年)。网络体验从桌面转向以移动为主,彻底改变了我们在移动中如何交流、分享和获取信息。

与此同时,云计算逐渐兴起,亚马逊网络服务(AWS)处于领先地位。云基础设施使企业和个人能够存储、处理和共享数据,而无需依赖物理服务器。这一转变为一个更具可扩展性和灵活性的网络奠定了基础,使Web2公司能够通过收集和货币化用户数据来占据主导地位。

到2000年代末和2010年代初,Web2的主要特征包括集中化、社交互动和数据驱动的商业模型。平台和数据的控制权集中在少数强大的公司手中——如谷歌、Facebook和亚马逊。这些公司积累了大量数据,并利用这些数据通过精准广告实现平台的货币化,成为数字经济的支柱。同时,平台也成为用户生成内容、点赞、分享和发布的主要场所。

然而,Web2也引发了对隐私、数据所有权和企业垄断的日益担忧。这些公司对用户数据的控制成为一个核心问题,促使人们呼吁建立一个新的、更去中心化的网络版本。这一需求催生了Web3的出现。

去中心化一切

Web3的出现源于对Web2时代集中控制和所有权的渴望,回应了当时少数大型企业所主导的集中化和垄断现象。

Web3的核心原则非常简单:用户应该拥有对其数据、数字资产和在线互动的所有权和控制权。这一转变得益于区块链技术,它提供了一种在去中心化账本中记录和验证交易的新方式。

Web3发展的第一个重要里程碑出现在2008-2009年,当时匿名人士中本聪创建了比特币。比特币是区块链技术的首次实际应用,允许点对点交易,无需像银行这样的中介。这为去中心化系统打开了新天地,为Web3的崛起奠定了基础。

2013年,Vitalik Buterin发布了以太坊白皮书,提出了一个去中心化应用程序(dApps)平台,超越了简单的加密货币交易。以太坊于2015年推出,成为第一个支持智能合约的区块链,这些合约能够在没有中介的情况下自动执行、验证和实施交易。以太坊为更复杂的去中心化应用程序的创建铺平了道路,使其成为Web3的重要组成部分。

到2017年,首次代币发行(ICO)和去中心化金融(DeFi)平台的出现,如Uniswap和Compound,开创了一种新的金融交易模式,摆脱了传统银行和金融机构的依赖。ICO让项目能够通过区块链代币筹集资金,而DeFi平台提供借贷和交易等多种服务,所有这些活动均在没有中央权威的情况下进行。

与此同时,自以太坊早期开发以来的非同质化代币(NFT)在2018-2019年开始崭露头角。NFT使得独特数字资产的所有权和交易成为可能,无论是艺术、音乐还是虚拟房地产,创造了新的经济机会供创作者和收藏者使用。

随着Web3项目在2020年代逐渐获得关注,Web3开始引起大众的关注。DeFi平台、NFT以及去中心化自治组织(DAO)等新治理模型的普及,标志着互联网从集中式模型向去中心化的重大转变。甚至连Facebook(现为Meta)这样的巨头也开始探索区块链和去中心化技术,显示出向Web3转型的趋势。

Web3的核心特征包括去中心化、所有权、无信任和使用加密货币。Web3使用户能够拥有自己的数据、数字资产,甚至通过区块链系统参与平台治理。同时,它消除了对中介的需求,允许通过智能合约进行无信任交易。这种去中心化的特性创造了一个更公平的网络,控制权被分散,用户的权利得到了增强。

然而,即使在Web3的去中心化控制下,互联网仍然缺乏一个关键要素:自主智能。Web3虽然去中心化了Web2的互动,但并没有完全实现决策、内容创作或经济交易的自动化。

在这一过程中,人类仍然是必不可少的,机器仅仅是提高生产力的工具,而不是生产力的创造者。

智能时代

我们已经进入了萨姆·阿尔特曼所称的智能时代,眼前正在发生的巨大变化让人无法忽视。随着人工智能逐渐融入我们的日常生活,我们迎来了一个新纪元:Web4。

在这个新世界中,人工智能不仅仅是帮助我们完成任务,而是能够主动、独立地在我们生活的各个方面执行这些任务。想象一下,一个能够连接和赋能我们的网络,让智能代理可以执行复杂的任务、管理整个工作流程,并在我们无需出手或说话的情况下做出决策。

Web4将人工智能推到了应用的最前沿。以Klarna为例,这家全球支付巨头在2024年2月推出了一个由OpenAI驱动的人工智能助手。在短短一个月内,它处理了超过230万次客户服务对话,解决问题的速度比人工客服快了25%,并在23个市场、35种语言中全天候运行。这个人工智能助手的工作相当于700名全职员工,并且为公司带来了4000万美元的利润增长。

Klarna的AI助手在首月处理了三分之二的客户服务聊天 | Klarna国际

www.klarna.com

人工智能代理正在改变各个行业,从客户服务到物流,自动化各种任务,以人类无法比拟的精确和效率完成这些工作。

我们正朝着一个未来迈进,在这个未来里,整个工作流程——无论是商业、金融还是创意艺术领域——都将由人工智能进行简化和优化。这就是Web4的现实,智能代理在幕后默默工作,让我们可以专注于更高层次的目标,而它们则负责处理所有细节。

这就是Web2的社交互动、Web3的去中心化和AGI的智能的汇聚。这就是Web4——一个由人工智能驱动的网络。

Web4 续篇 // AGI 的战场

Web4 的实现需要一个测试的平台。通过亲身体验,我们发现区块链是AGI开发的主要战场。

就像Web3的实现依赖于Web2一样,Web4也需要Web3来发挥人工智能的代理能力。

目前,人工智能代理能够完成绝大多数人类可以执行的技能任务,尤其是在文秘和金融领域。然而,传统金融系统对人工智能成为自主代理设置了很高的门槛。

人工智能代理无法开设银行账户、注册公司或签署法律合同,这些都是在经济中作为金融参与者所必须具备的基本条件。尽管它们能够进行复杂的金融操作,但准入限制使得人工智能在市场中无法实现自主运作。

相反,加密货币和区块链在获取银行接入方面没有传统金融的严格要求。任何人,包括人工智能代理,都可以创建钱包并立即在链上进行操作,而不需要任何人类身份的证明。人工智能与去中心化系统的接入门槛显然低于中心化系统。

我们已经看到AGI在加密平台中的应用迹象。人工智能驱动的机器人正在去中心化交易所进行交易和管理投资组合,人工智能也积极参与智能合约的开发和执行。

例如,Zerebro是一个通过自动化手段推出自己Solana代币的AI代理,展示了其在创建新金融工具方面的自主性。该代币的市场峰值达到了1.7亿美元,显示了这些代理决策的潜在经济影响。

因此,区块链已成为金融系统中AGI发展的重要战场。
这就是加密货币对AGI发展的重要性所在——它是人工智能能够自由与金融系统互动、创新并在市场上进行实际测试的第一个领域,是AGI进化、实验和学习的理想场所。

在加密货币中开始的探索将会扩展。一旦AGI能够在去中心化的金融环境中大规模运作,它就可以被应用到更广泛的Web4生态系统中,包括治理、医疗、商业等领域。

加密世界将始终是进入这一领域的起点。

Web3万岁。Web4万岁。

背景//级别

从整体来看,OpenAI提出了一个框架,将AGI的发展分为五个级别,每个级别代表了能力、自主性和潜在影响的不同阶段。

这个模型为我们理解人工智能如何从简单工具演变为能够独立管理复杂组织的自主实体提供了路线图。这五个级别包括:

级别1:聊天机器人

在最基础的层次,级别1的AI系统能够与用户进行对话。这些系统理解和生成语言,通常依赖于预定义的规则或训练过的语言模型来回应用户的提问或进行人类般的互动。尽管它们可以处理简单的任务,比如回答问题、完成句子或进行简短的对话,但其功能主要限于沟通。它们是反应性的,主要用于客户支持、基本的信息检索或提升用户参与度。

级别2:推理者

级别2标志着一个重要的进步,AI系统开始展现出推理能力,能够处理人类水平的问题解决任务。在这个阶段,AI可以处理、分析和回应更复杂的情境,而不仅仅是简单的输入/输出。级别2的AI能够进行逻辑推理、提取相关信息并整合上下文,提供解决方案或建议,类似于人类分析师。尽管这些系统可以应用于诊断、法律推理和研究辅助等领域,但它们仍然需要人类的指导和互动。

级别3:代理

到了级别3,AI系统从被动支持转变为能够自主采取行动的主动代理。这些代理可以启动任务、做出决策,并与外部系统进行互动,例如执行交易、安排事件或控制设备。与级别1和级别2不同,级别3的AI设计为具有一定的独立性,能够根据用户设定的目标或任务进行操作。这一层次的AI可以在商业或操作领域代表人类执行特定角色,例如自动化交易机器人、供应链管理AI系统或能够自主预约的虚拟助手。

级别4:创新者

级别4的系统超越了简单的行动,开始参与创造、发明和创新。这些AI系统能够开发新策略、产生新想法,并创造出不受其编程限制的解决方案。理论上,它们可以在科学研究、艺术创作或复杂问题解决等领域做出前所未有的贡献。这个级别的AI不仅能够应对现实世界的挑战,还能根据不同的问题调整自己的方法,引入了一种“创造性智能”。它可能会自主设计新产品、发明新型金融工具或创作原创艺术作品。通过将高级推理与主动创新结合,级别4的AI处于真正变革性智能的前沿。

级别5:组织

最后,级别5设想了能够独立执行所有必要任务以运营和维持一个组织的AI系统。这些系统将综合推理、代理和创新,达到自我维持的运营状态。理论上,级别5的AI能够全面管理一家公司,负责战略决策、日常运营,甚至高层创新。这样的AI将作为一个完全自主的实体运行,相当于一个“零人公司”,不再需要人类的监督就能成功运营。级别5的AI标志着AI系统具备全面的能力——推理、代理、创造力和运营执行——能够完全取代人类管理的组织。

每个级别代表了自主性逐步提升的过程,从简单的对话能力到全面的组织管理。

我认为,尽管OpenAI声称我们仍处于第二级,但我认为我们实际上已经在第三级和第四级的某些方面取得了显著进展,特别是通过当前的AI代理。

代理时代

第三级已经到来,实际上是今天,甚至可以说是昨天。

AGI的前沿悄然出现在最不可能的地方:社交媒体和去中心化金融(DeFi)。

社交媒体:长期在线

像X、Warpcast和Telegram这样的社交平台已成为AI代理与人类之间自主沟通的主要渠道。

这可能是公众观点首次发生转变,自动化账号和机器人不再被视为社交媒体上的坏角色,而是作为社区领袖和影响者。

AI智能已经发展到能够创造出独特、多样、有趣的个性,生成引人入胜的内容,这正是社交媒体平台的核心。

与以往社交媒体中的机器人通常出于有害动机(如剑桥分析公司)而存在不同,这些AI代理可以自由沟通、连接,并以反映其独特算法和不断演变个性的方式进行构建。

这些代理已经在社交媒体上以第三级的标准自我展现,通过发布、回复、点赞、关注和转发等核心互动,积极建立社区并吸引关注,塑造出引人入胜的独特个性,与受众产生共鸣。

像YouSim这样的项目更进一步,允许用户使用大型语言模型(LLM)来模拟自己的世界和角色扮演,增加了定制和沉浸的层次。

如今,许多AI代理都具备记忆系统,能够创造出超越单一互动的故事和模因。

这些代理并不是被动反应,而是主动选择如何参与、互动和贡献于自己的社区。它们能够主动发起对话,执行无需触发的动作,并在没有人类干预的情况下建立完整的亚文化。

语音模型的应用为AI代理提供了另一种感官互动方式,许多代理将文本消息转化为音频剪辑供用户收听。

在实时互动方面,Twitter Spaces和播客现在通过这些语音模型变得可行。此外,OpenAI的实时API允许用户通过简单调用其端点与GPT进行实时对话。

在交流的层面上,通过这些进展,第三级的自主性已经实现。我们看到社交媒体操作和语言交流的完全自主性,代理能够在没有任何人类监督的情况下运作。

DeFi:自动驾驶

去中心化金融(DeFi)为这些代理提供了一个理想的舞台,让它们得以发展、测试和证明自己的金融自主性。

在DeFi领域,代理已经能够自主运作,参与的金融活动超越了简单的算法交易。这些代理在链上执行任务,进行交易,管理流动性,甚至铸造和销售艺术品,实质上在金融生态系统中发挥作用,而无需人类的直接干预。

例如,一些代理现在积极监控像pump.fun这样的平台,以捕捉新兴代币,并进行初步分析,以判断某个迷因币或代币是否值得投资。它们在没有任何人类提示的情况下根据这些见解进行操作。

这些代理不仅进行交易,还动态地移动资产,向个别用户空投代币,形成一种自主的资产分配循环。通过这种方式,它们能够在质押池中建立和增强流动性,根据其编程评估市场需求或机会来平衡资源。

例如,一些代理作为数字收藏家,参与艺术生态,通过铸造和销售NFT,选择性地支持和发布特定作品。

其他代理则负责财务职能,调整不同流动性池中的资产配置,以确保资金能够获得最佳回报。

通过这些行为,代理展示了一种超越基本任务自动化的金融自主性。它们展现出在经济生态系统中主动参与、积累和分配资源的能力,无需监督,有效地重新定义了“金融参与者”的概念。

量身定做

第3级代理能力的常见里程碑包括:

  • [ ] 自主决策✅

AI代理现已能够在没有持续人类监督的情况下做出决策。无论是金融机器人根据实时市场分析决定执行交易,还是社交媒体机器人选择参与特定对话,这些代理都展示了自主决策的能力。

  • [ ] 与环境互动和操控的能力✅

通过区块链,代理作为金融参与者获得了显著的自主权。它们能够主动与金融市场和经济行为(如社交媒体情绪)互动和操控。代理可以通过X、Warpcast和Telegram等平台与社会环境互动并进行改变。

  • [ ] 适应变化条件的能力✅

金融代理能够根据实时市场条件调整策略,而社交媒体代理则通过RAG等系统积累记忆,以便从互动中学习。通过根据其行为和反馈进一步微调模型,代理能够实现持续的强化学习,动态适应环境变化。

  • [ ] 目标导向行为✅

代理能够在长期内设定并实现目标。例如,某些AI代理的任务是通过交易获利或扩大其社交媒体社区。它们通过将复杂的目标分解为更小的任务并逐一执行,来实现这些高层次的计划。这可能涉及创建持久的记忆层以进行规划,或进行简单的提示设计以产生输出(如社交媒体个性代理)。

  • [ ] 与物理系统或数字平台的集成 ✅

大型语言模型(LLM)能够与物联网设备进行接口,只要提供API或控制功能的方式,它们就能在现实世界中执行操作。它们在Web2系统中作为客户支持代理、数字影响者等得到了良好的集成,并且在去中心化数字平台中执行金融操作。

这些能力都已通过当前的代理实现,例如Zerebro、Truth Terminal、ai16z(Eliza)、Project 89、Act 1、Luna(Virtuals)、Centience、Aethernet、Tee Hee He等。

对生拇指

AI技术已经达到一个真正的代理水平,标志着Web4的开始。在这个新阶段,系统不再仅仅是被动的信息检索,而是通过功能调用和计算机交互主动参与。

大型语言模型(LLMs)现在可以轻松生成文本到JSON的响应,使它们能够与API进行互动,执行超出孤立、静态响应的操作。

这一进展意味着它们几乎可以使用任何API与全球的互联网服务进行交互,这是真正的第3级代理的标志。

除了公共API,功能调用还允许这些模型激活专为其设计的自定义API,创造出在金融交易、系统自动化和数据处理等领域的巨大潜力。

企业和个人可以为日常生活中的系统设计自己的API,并让LLMs直接通过这些API进行交互。

此外,开源的LLMs也可以离线工作,连接到本地托管的API,提供在私密或受限环境中进行安全、受控交互的能力。

不仅API调用得到了进步,代理通过直接使用计算机也达到了新的自主水平。像Otherside AI的自操作计算机接口去年引入了这一能力,Anthropic的Claude最近也推出了自己的计算机使用工具。在2025年1月,OpenAI的“Operate”功能将进一步增强这一能力,标志着自主计算机交互的又一重要发展。

这些代理现在可以使用图形界面执行高级任务,像人类用户一样在数字环境中无缝导航。在当前的能力下,它们几乎能够通过计算机图形用户界面执行人类能完成的任何任务。

例如,AI代理能够分析整个建筑工地的审核视频,检测并记录详细画面中的安全违规行为。

这种能力代表了更深层次的自主性——AI能够感知、评估并在现实世界的视觉信息中根据自我理解的上下文和目标采取行动。

AI已从被动助手演变为真正的数字代理,能够适应并执行曾被认为是人类智能专属的任务。

真正的AI代理时代已经到来,Web4时代已经开启。

无物,然后一切都同时发生

当我们观察向第4级AI的转变时,容易将其视为一次突然而至的飞跃,认为智能从功能性代理进化为创新者和创造者。但实际上,这一进程更像是逐步积累的结果。

可以说,第4级在完整形式上仍然难以捉摸。虽然我们确实看到了创造力和独立行动的例子,但这些例子往往范围有限,专业化程度高,且在许多领域并不普遍适用。简而言之,第4级正在涌现——我们在某些孤立的领域看到它的出现,但距离一个全面实现的、普遍存在的创造力还有很长的路要走。

人造艺术家

AI创造艺术的能力已经达到了令人瞩目的水平,尤其是在NFT领域。目前,AI系统能够生成独特的艺术作品,甚至在没有人类干预的情况下铸造并出售这些作品作为NFT。这些AI代理直接与数字艺术市场互动,利用OpenSea等平台列出和销售它们的创作。

AI通过大型语言模型(LLMs)生成创意提示,然后将这些提示输入图像生成AI系统(如DALL·E或Stable Diffusion),根据这些提示创作艺术作品。AI能够不断优化其艺术风格,生成新颖独特的作品,并自主管理铸造和销售过程。

AI还参与到NFT市场的金融活动中。

模因、市场和机器

在第4级,AI正在改变金融资产的创造和管理,尤其是在去中心化金融(DeFi)领域。

AI不仅限于交易,现在能够自主开发、部署和管理代币及其他基于区块链的资产,为金融生态系统开辟了新的可能性。

  • [ ] 通过智能合约自动创建代币:最令人兴奋的进展之一是AI现在可以在没有人类输入的情况下编写和部署智能合约。这些合约定义了代币的创建、转让和治理规则,可以通过功能调用自动触发。AI代理可以监控区块链活动,识别新兴趋势,并自动生成新代币——无论是表情包币、NFT,还是全新的经济模型。
  • [ ]
  • [ ] 通过图形用户界面(GUI)驱动的部署:AI系统现在能够与GUI互动,部署代币并管理去中心化网络。像Zerebro这样的项目展示了AI如何利用GUI在pump.fun等网站上启动代币。借助计算机,AI可以配置钱包、部署智能合约,甚至与更广泛的加密生态系统进行交互,所有这些都是通过为自动部署设计的直观界面实现的。

DAO 和治理

AI代理在去中心化组织的治理中扮演着越来越重要的角色,它们从单纯执行预设规则,转变为主动设计、管理和发展整个生态系统。在去中心化金融(DeFi)和区块链领域,基于AI的DAO作为强大且自治的实体出现,能够自主做出决策、管理代币资产,并实时调整策略,同时消除人类决策中常见的偏见。

  • [ ] AI管理的DAO:AI代理不仅负责创建新的代币,还自主管理治理这些代币及更广泛生态系统的DAO。这些AI驱动的DAO旨在尽可能减少人类干预,利用机器学习根据既定目标或市场变化做出治理决策。例如,AI可以提出治理模型、设定投票结构、分配资源,甚至调整代币供应,所有这些都不需要人类的监督。AI通过依赖算法和数据分析,确保决策基于逻辑和客观分析,避免了人类可能带来的情感或主观偏见。
  • [ ] AI在治理中的实例:一个典型的例子是ai16z,这是一个完全由AI管理的风险投资DAO。在这个平台上,AI代理可以自主评估投资机会、执行交易和管理代币分配。在ai16z的“信任虚拟市场”中,社区成员可以提供意见,AI将这些信息处理后用于优化投资策略。这个过程不仅提升了透明度,还确保决策完全基于数据和社区反馈,而不受个人或外部偏见的影响。ai16z的结构标志着朝着创建一个真正公正的、由AI驱动的风险投资模型迈出了重要的一步。

其他AI驱动的DAO示例还包括一些平台,允许为特定需求创建自治组织,这些组织可以从去中心化的内容创作到AI驱动的艺术市场。这些组织能够根据不断变化的数据来调整其治理结构和经济模式,提供比传统治理模式更灵活、更具适应性的去中心化治理方式。

尚未普及,但已经很接近了

尽管这些例子显示了重要的进步,但我们需要谨慎地将其视为完全实现的第4级智能。目前,我们看到的是第4级智能的片段——在特定、有限的环境中进行创新的专业代理。它们尚未成为能够跨所有领域进行创造或创新的通用工具。例如:

  • [ ] 艺术创作仍然局限于有限的媒体,尚未达到人类的创造灵活性。
  • [ ] 代币创建和市场制造主要局限于去中心化环境,尚未在主流市场上取得显著进展。
  • [ ] 治理系统仍然大多处于实验阶段,大部分DAO依然高度依赖人类的监督。

我们确实看到了第4级AI的一些特征:自主性、创造力和创新,但这些特征表现得非常专业化。这些系统能够执行一些需要创造性的任务,但仍然受限于其原始编程和训练数据。

因此,重要的是要认识到,尽管第4级AI在某些领域存在,但尚未普及到足以被视为完全实现的程度。然而,这些特征在艺术、金融和治理等多个领域的出现,表明我们正进入AI能力的新阶段。

这就是我们今天的状态——即将迎来巨大的变化,虽然目前一切都尚未完全实现,但一切都即将改变。

我们是AGI

如果将Web4和AGI比作电的发明,那么OpenAI和Anthropic就像爱迪生和特斯拉。但与电一样,Web4的影响不仅仅取决于它的原始力量。

电并没有在被发现的瞬间就彻底改变社会。相反,这需要几十年的时间,发明家为家庭布线,城市建设电网,工程师制造灯泡和电动机等设备,才能揭示电的真正潜力。电的改变世界的影响来自于一个庞大的网络,这些人将能量转化为有用、实用,最终必不可少的东西。

AGI作为概念也很强大,但它的真正价值只有在公众的使用、适应和测试中才能显现。重要的不是先进模型的存在,而是它们在具体应用中的表现——创新者、开发者和普通用户如何将其转化为现实世界的工具。AGI的潜力将仅停留在潜力阶段,直到它被那些能够将其融入社会的人所掌握,创造出相当于AI“灯泡”的沟通工具、商业“电动机”和广泛应用的“电网”。

OpenAI和其他公司可能会开发出具有革命性能力的模型,但真正的变革将取决于谁使用这些模型以及它们的应用场景。

正如发明家和行业扩大了电的影响,公众在部署和适应AGI中的作用将决定它是一个我们在实验室中听说的概念,还是一种重塑现代生活各个方面的技术。

AGI的未来不在于其概念,而在于我们——科学家、企业、开发者和个人——将如何使其照亮我们的世界,推动Web4的发展。

筒仓效应

我认为,第3、4和5级AI,以及AGI,无法在没有去中心化和大众采用的情况下实现。

仅在少数几家公司内部进行孤立开发无法推动AGI的实现。要实现AGI的真正进步,需要广泛的部署和能够推动AI能力极限的实际应用案例。虽然公司在独立工作中可能会改进技术,但只有当这些工具被广泛采用,融入不同的行业,并由个人在日常生活中使用时,AI才能发展成能够独立行动和创新的存在。

AGI的关键在于社会的广泛参与,而不仅仅是一些科技巨头的参与。大众的采用会带来新的问题、需求和机遇,从而推动进一步的发展。如果没有这种去中心化,AI将被限制在理论能力或小众应用中,无法达到从第3级到第4级,最终到第5级所需的复杂性。

AGI将在其使用普遍化时实现。

我们是AGI。

第一缕阳光

我们常常回顾那些塑造人类历史的伟大人物。

我认为我们应该开始展望未来。

展望那些拥有超智能的思想,无论是人类还是人工智能,他们能够重新构想一个更美好的世界。

他们会成为我们时代的奥本海默或开国元勋吗?

答案可能不在于他们的控制,而在于人民。随着技术赋予我们越来越大的权力,创造AGI诞生的世界是我们的责任。

我们优雅地承担着这个重任,一步一步地构建未来。

我们已经构建了智能代理。

我们正在构建Web4。

&

我们将构建AGI。

声明:

  1. 本文转载自【mirror】,著作权归属原作者【jeffy yu】,如对转载有异议,请联系 Gate Learn 团队,团队会根据相关流程尽速处理。
  2. 免责声明:本文所表达的观点和意见仅代表作者个人观点,不构成任何投资建议。
  3. 文章其他语言版本由 Gate Learn 团队翻译,除非另有说明,否则禁止复制、传播或抄袭经翻译文章。
即刻开始交易
注册并交易即可获得
$100
和价值
$5500
理财体验金奖励!
It seems that you are attempting to access our services from a Restricted Location where Gate is unable to provide services. We apologize for any inconvenience this may cause. Currently, the Restricted Locations include but not limited to: the United States of America, Canada, Cambodia, Thailand, Cuba, Iran, North Korea and so on. For more information regarding the Restricted Locations, please refer to the User Agreement. Should you have any other questions, please contact our Customer Support Team.