当前AI趋势和市场概览

服务层应用层人工智能(AI)技术的快速发展已无缝融入我们的日常生活,彻底改变了我们与世界互动的方式。DIN正处于这一革命的前沿,致力于构建一个由数据和AI-Agent驱动的智能网络。在接下来的部分中,我们将跳过通用AI阶段,直接讨论大语言模型(LLM)和AI-Agent。原因很简单,无论在学术界还是产业界,AI的发展最终都会指向一个方向——AI-Agent。人类已经进入了一个新时代——AI-Agent的时代。在这个时代,AI超越了其之前作为工具或服务提供者的角色,进一步成为一个能够主动学习、适应环境并自主完成复杂任务的智能代理。

AI-Agent的发展历史:

在20世纪50年代,艾伦·图灵(Alan Turing)将“高度智能的生命体”这一概念扩展至人工实体,并提出了著名的图灵测试。这一测试是AI的基石,旨在探索机器是否能够表现出与人类相媲美的智能行为。

这些AI实体通常被称为“代理”(Agent),并构成了AI系统的基本构建模块。到目前为止,AI领域提到的“代理”通常指的是一种可以使用传感器感知其周围环境、做出决策并通过执行器采取响应行动的人工实体。

随着AI的发展,“代理”这一术语在AI研究中找到了自己的位置,用来描述那些展示出智能行为并具备自主性、反应性、主动性和社交能力的实体。从那时起,代理的探索和技术进步便成为了AI领域的焦点。

20世纪50年代末和60年代是AI的创建时期,期间出现的编程语言、书籍和电影至今仍影响着更多的人。 经历了第一次AI寒冬之后,80年代迎来了AI的热潮。这一时期的各种研究取得了突破,来自政府和其他机构的投资也开始增加,研究人员逐渐加大对AI代理的探索。 然而,这股热潮仅持续了7年,1987年我们迎来了第二次AI寒冬。

这一寒潮持续了多年,尽管大多数机构在此期间缺乏资金支持,AI依然沿着现有的技术路线坚定不移地发展。 其中,1995年Wooldridge和Jennings 将AI代理定义为一种计算机系统:它位于特定的环境中,并能够在该环境中自主行动以实现其设计目标。他们还提出了AI代理应该具备的四个基本属性,即自主性、反应性、社交能力和主动性。

在AI代理被经济学正式接受后,它进一步被定义为一种能够感知其环境并采取行动以最大化成功几率的系统。根据这一定义,能够解决特定问题的简单程序也被视为“AI代理”,因此后来的能够与人类在各类棋局中对弈的机器人也被认为是一种AI代理。

在AI代理被赋予“四个基本属性”期间,从1993年到2011年,基于当时AI技术的许多令人印象深刻的代理型项目相继出现。 这些项目的出现时间和简介如下:

  • 1997年:深蓝(IBM开发)在一场备受瞩目的比赛中击败了国际象棋世界冠军加里·卡斯帕罗夫,成为第一个击败人类棋王的程序。

  • 1997年:Dragon Systems 开发的语音识别软件发布于Windows平台。

  • 2000年:辛西娅·布里泽尔教授 开发了首个能够用面部模拟人类情感的机器人,名为Kismet,具有眼睛、眉毛、耳朵和嘴巴。

  • 2003年:NASA成功在火星上着陆了两辆探测车(Spirit和Opportunity),它们可以在无人干预的情况下导航火星表面。

  • 2006年:Twitter、Facebook和Netflix等公司开始利用AI作为广告和用户体验算法的一部分。

  • 2010年:微软推出了Xbox 360 Kinect,这是首个设计用于追踪身体动作并将其转化为游戏指令的游戏硬件。

  • 2011年:一个名为Watson的自然语言处理计算机程序(由IBM开发)在电视问答节目《危险边缘》中击败了两位前冠军。

  • 2011年:苹果发布了Siri,首个广受欢迎的虚拟助手。

从这些分类和基本定义来看,许多AI工具和早期智能程序可以被归类为一种代理。包括早期用于国际象棋比赛的IBM深蓝以及后来出现的AlphaGo,它们都是基于当时最新AI技术的AI代理。 随着AI技术的发展和数据的不断丰富,AI-Agent也进化到了基于大语言模型(LLM)的阶段。

2012年,在ImageNet计算机视觉挑战赛中,AlexNet卷积神经网络的深度学习模型获得了第一名,深度学习真正展现了其在AI领域的威力。

2016年,AlphaGO(谷歌专门研究围棋的AI代理)击败了欧洲冠军樊麾和世界冠军李世石,并迅速被其兄弟AlphaGo Zero击败。

2017年,谷歌提出了“Transformer”模型。

2018年,谷歌发布了基于Transformer模型的BERT,拉开了大语言模型的序幕。

2019年,谷歌AlphaStar在《星际争霸2》视频游戏中达到了大师级水平,超过了99.8%的玩家。 2019年,OpenAI发布了自然语言处理模型GPT-2,并分别在2020年和2022年发布了GPT-3、DALL·E 2和GPT-3.5。ChatGPT的普及为大语言模型时代的AI代理的发展和应用提供了新的机遇。

自2023年1月起,全球制造商发布了多个大语言模型,包括LLaMA、BLOOM、StableLM、ChatGLM等众多开源大语言模型。 与此同时,全球技术制造商推出的数千个大语言模型为AI代理在各个领域的多样化应用奠定了更广泛的基础。

2023年3月14日,OpenAI发布了GPT-4。3月底,AutoGPT诞生并迅速风靡全球。 AutoGPT是OpenAI在Github上发布的一个免费开源项目,它结合了GPT-4和GPT-3.5技术,通过API创建完整的项目。 与ChatGPT不同,用户无需不断向AI提问以获得相应的答案。在AutoGPT中,用户只需为其提供AI名称、描述和五个目标,AutoGPT便可自行完成项目。它可以读取和写入文件、浏览网页、审查自身提示的结果,并将其与提示历史结合。 AutoGPT也是OpenAI的一个实验性项目,用于展示GPT-4语言模型的强大功能。这让更多的人在了解和体验AutoGPT的同时,逐渐认识到了AI代理。 自此,基于大语言模型的AI代理如雨后春笋般涌现,诸如Generative Agent、GPT-Engineer、BabyAGI和MetaGPT等项目纷纷出现。这些项目的爆发将大语言模型的发展和应用带入了一个新阶段,也引领了AI代理的创业和落地。

2023年5月,OpenAI完成了新一轮3亿美元的融资后,创始人Sam Altman透露他更关注如何利用聊天机器人创建自主的AI代理,并将相关功能部署到ChatGPT助手中。

同年6月,扎克伯格在一次全体会议上宣布了一系列处于开发各阶段的技术,其中之一则是发布具有不同个性和能力的AI代理,可以为用户提供帮助或娱乐功能。

6月底,OpenAI安全团队负责人Lilian Weng发表了一篇名为《基于大语言模型的自主代理》的文章,详细介绍了基于LLM的AI代理,并认为这将成为解决通用问题的方式之一。

至此,人们终于对AI代理有了全面的认识,AI代理的神秘面纱也终于揭开。在AI领域对AI代理的探索从未停止过。在每项AI技术取得新突破后,组织会将其探索和应用纳入新的议题。在AlphaGo所代表的深度学习和神经网络技术崭露头角后,基于深度学习和神经网络的代理出现在游戏、医疗等众多领域并得以应用。

近年来,大语言模型取得了重大突破。在谷歌发布Bert和OpenAI发布GPT-2之后,许多组织开始与他们合作,构建基于大语言模型的代理。 当我们还在谈论AI代理时,全球各地已经涌现出许多AI代理框架和产品。例如,在8月底刚刚完成了1500万美元融资的Voiceflow,现在是开发者中最受欢迎的AI代理构建平台之一,全球已有超过130,000个团队在此高效协作,构建他们自己的AI代理。

从这类AI代理构建平台来看,目前许多组织正在构建或已经构建了自己的AI代理,每个组织可以针对不同的业务场景构建多个代理。

AI-Agent市场状况:

代理的需求将会随着其可以节省人类更多的时间和金钱等稀缺资源而增加;但更明显的事实是,支持代理部署的基础设施层仍处于初期阶段,大多数代理框架,如BabyAGI,仍是实验性开源项目。随着代理需求的增加,对这些基础设施的规范化需求也将增加。每个子领域都会随着时间的推移被产品化(变成应用程序或API)。人类最终将能够创建或雇佣代理作为产品。 根据Annie Liao的观点,AI代理可以分为三个层次,分别是:

  1. AgentOps:根据Lilian Weng的理论,这一层有七个核心组成部分。这些部分结合在一起形成“框架”,最终将模板化并在类似Agent Ops的市场中进行分发。

  2. 应用层:代理将“成为产品”。随着市场的成熟,许多应用程序将被产品化并通过闭源或开源模型实现盈利。

  3. 服务层:为终端用户提供增值能力,如创建、交易和维护代理。具体来说,Crypto领域有一系列代理项目。与之前的项目相比,尽管这些项目仍处于早期阶段,且主要是叙述驱动的,但我们可以深入探讨它们,了解AI和加密技术的融合。

项目服务层级价值主张

AgentOps

支持可下载的 LLM 并在本地运行,由用户的钱包管理,并与智能合约进行交互。它使用智能合约排名来帮助代理判断哪些智能合约是安全的,可以进行交互。

应用层

一个代理对代理(A2A)网络,允许代理无缝发掘、互动、交易和协作。

应用层

一个去中心化的AI代理市场,人们可以部署专注于特定任务的AI代理,这些代理可以被其他人或代理雇佣以执行复杂任务。

服务层

一个开放的市场,用于创建和使用去中心化的AI代理。Autonolas还为开发者提供了一套工具,以构建可以在链外托管并能够接入多个区块链的AI代理。

未来憧憬

代理将成为各个行业和领域广泛模型应用的主要形式。在未来,大型语言模型(LLM)的发展和应用将围绕和呈现于工具或助手的形式。随着代理以标准化产品的形式出现,组织将更容易引入和应用AI代理。

相关企业和组织可以基于引入的大型语言模型或垂直领域模型构建面向特定领域的代理,帮助客户高效释放LLM的能力。还可以建立面向内部或客户的AI代理平台和社区,以便随时构建所需的代理,支持自身和客户的运营。

更多AI代理构建平台将促进大量代理的出现,也将使个人更容易构建和应用代理。在未来,只要每个人愿意,他们可以通过各种代理平台随时创建自己个性化的代理,增强沟通与协作,通过更个性化的功能和服务扩展知识和技能。

甚至可以在不同的业务场景中构建多个不同的代理,并让这些代理协同工作。多代理系统的协作可以输出更准确的结果,完成更复杂的任务。

AI代理不受行业和业务场景的限制,可以在LLM可以应用的任何地方构建相应的代理。它可以应用于教育、医疗、金融、加密、制造、娱乐等多个行业,帮助提高效率、降低成本并创造价值。

未来,AI代理可能会更加智能、适应性更强且多样化,能够处理更复杂的问题和场景,并与人类形成更紧密的合作与共生关系。

随着AI代理的广泛应用,基于大型语言模型的时代,人机交互将升级为人类与AI代理之间的自动化合作系统。这种新型的人机合作可以称为人机智能,将促进人类社会生产结构的进一步升级,进而影响社会的各个方面。

与此同时,具备自主/自动沟通和执行任务能力的智能网络将成为互联网的下一个阶段,而AI代理将成为人类互动和执行任务的智能工具。

在未来趋势中,AI代理很可能出现在人类工作、学习、生活和娱乐等各种场景中。每个人将配备基于AI代理系统的智能助手,类似于《钢铁侠》、《星际穿越》和《星球大战》中的场景,将可能真正变为现实。

这会是一个规模巨大的市场。

最后更新于