微软utoen多个智能体协作,编码速度提升倍,碾压(已k星)

发布仅2周,微软、PSU和华盛顿大学等团队开发的智能体AutoGen瞬间登顶GitHub热榜,狂揽10k星。这是一个让LLM智能体相互聊天,进而解决任务的框架,可定制、可对话,并允许人类无缝参与。

现在,你只需要几行代码,就能完成非常复杂的任务。

对此,研究人员还发布了一份关于AutoGen的43页技术报告。

接下来,一起来看看这个爆火项目背后的技术吧。

动嘴做任务

若想使用,首先得安装AutoGen。需要Python版本>=3.8版本,只需一步,非常简单。

然后,就能上手用了。

比如,我想要一个股价可视化图,首先自定义一个「编码智能体」,能够下载数据并绘制图表。

然后,自定一个「user proxy agents」,去做跑代码、获取结果等任务。

最后一步,给定明确任务——绘制一份Meta和微软当前YTD股价图。

然后,两个智能体便开始对话,忙着去做表了。

当然了,不仅2个智能体,你还可以添加更多AI帮你干活,比如再自定义一个「产品经理」,让它去脑暴想法。

然后,使用它们一起查找最近一篇GPT-4的研究,以及关于其在软件中的应用。

接下来,3个智能体就开始「密谋」了。

以上的演示,仅是一个前菜。

根据技术报告,给出了通过AutoGen6个应用的构建,可以解决数学问题,检索增强型聊天、ALF聊天、多智能体编码、动态群组聊天、国际象棋对弈。

在自主解决数学问题上,研究人员通过AutoGen与AutoGPT、ChatGPT+Plugin、ChatGPT+Code Interpreter等进行了定性和定量评估。

通过在对MATH数据集中的2个数学问题评估中,每个LLM系统都在每个问题上测试了3次,只有AutoGen的胜率最高。

AutoGen框架

AutoGen背后的基本理念是,创建智能体,即由LLM(如GPT-4)驱动的编程模块。

这些智能体通过自然语言交互,以完成各种任务。

智能体可以通过提示工程,和外部工具对进行定制和增强,使其能够检索信息或执行代码。

借助AutoGen,开发人员可以创建一个「智能体生态系统」,这些智能体可以专门从事不同的任务并相互协作。

这一生态系统的一个简化视图是,将每个智能体视为一个单独的ChatGPT会话,并有独特的系统指令。

例如,一个智能体可以作为编程助手,根据用户请求生成Python代码。另一个智能体可以是代码审查员,负责获取Python代码片段并排除故障。

第一个智能体的响应可以作为输入,传递给第二个智能体。

其中一些智能体甚至可以访问外部工具,这相当于ChatGPT插件,如Code Interpreter或Wolfram Alpha。

AutoGen在这里的作用就是,为创建这些智能体并使它们能够自动交互提供了必要工具。

上图中,说明了如何使用AutoGen对多智能体对话进行编程。

最上面的子图展示了AutoGen提供的内置智能体,有统一的对话界面,并且可以自定义。

中间的子图展示了使用AutoGen开发具有自定义回复功能的「双智能体系统」的示例。底部的子图展示了程序执行期间,「双智能体系统」产生的自动智能体聊天。

另外,多智能体应用可以是完全自主的,但也可以通过「user proxy agents」进行调节。

「user proxy agents」允许用户介入AI智能体之间的对话,来监督和控制他们的过程。在某种程度上,人类用户变成了监督多个人工智能团队的团队领导者。

user agents适用于智能体框架必须做出敏感决策,并需要用户确认的应用程序,比如购买或发送电子邮件。

当智能体开始向错误的方向发展时,用户还可以帮其指引方向。例如,用户可以从最初的应用程序构想开始,在智能体的帮助下,在开始编写代码时逐步完善构想,添加或修改功能。

AutoGen的模块化架构,还允许开发人员创建可重复使用的通用组件,这些组件可以组合在一起,快速构建自定义应用程序。

有了多个AutoGen智能体,就可以协作完成复杂的任务。

假如你需要编写特定任务的代码,直接交给「编码助理智能体」。

对于用多个智能体编码的整个流程框架如下。

它可以生成并返回代码,然后user agents可以使用代码执行模块对代码进行验证。

然后,两个人工智能智能体可以一起排除代码故障,并生成最终的可执行版本,人类用户可以在任何时候打断或提供反馈。

这种协作方法可以显著提高效率。微软称,AutoGen可以将编码速度提高多达4倍。

此外,AutoGen还支持更复杂的场景和架构,比如LLM智能体的分层排列。

再比如,「群组聊天管理智能体」可以控制多个人类用户和LLM智能体之间的对话,并根据一系列规则在它们之间传递信息。

最后,研究人员还拿当前流行的智能体进行了对比,AutoGen的优势在于能够构建基础设施,允许灵活的对话模式,能够执行LLM生成的代码。

甚至,还可以让人工参与系统的执行过程。

项目作者

除了创建AutoGen开源库,他也创建了一个用于自动机器学习和调整的快速库FLAML,在微软内外被广泛使用,例如在Azure、Microsoft 365、Microsoft Fabric和Visual Studio中。

他曾在伊利诺伊大学香槟分校(UIUC)计算机科学系取得了博士学位,并在2015年获得SIGKDD数据科学/数据挖掘博士论文奖。

他曾在清华获得计算机科学学士学位。

网友上手体验

有网友通过AutoGen创建了一个「博客写作智能体」,并且还没有超过GPT4的最大/最小token限制。

它们大部分时间都在闲逛,聊着计划......AGI成真。

还有网友创建了一个「人工智能治疗师智能体」与人工智能角色的对话,所有脚本均由AI编辑生成。

为了验证概念,还有人用AutoGen创建了一个自我改进的智能体——AgentXP。

「它让我看到,很快它们就会自己编写。在它开始让我的电脑震动之前,已经自主运行了10次卷积代码。输出结果远远超出了我的预期。」

使用AutoGen智能体自动生成并运行代码,以创建细胞原子缩时摄影。

THE END
0.美国知名画家控诉苹果在营销活动中抄袭其卡通人物形象国际象棋冠军用iPod touch作弊 格鲁吉亚象棋冠军尼加利泽(Gaioz Nigalidze)参加国际象棋公开赛时,因作弊而被逐出比赛,并被禁止再参赛。事情的经由是:尼加利泽在一盘棋局期中连上几次洗手间,且每次都去同一间厕所,这引起了亚美尼亚对手彼得罗相(Tigran Petrosian)的猜疑。赛事官方随后检查厕所并发现马桶后有一个厕纸包裹jvzq<84f0{uvvq3ep1zfeqdhqe{t1;5372:0v;5372:28h;7:3?327mvon
1.Win10系统怎么添加国际象棋游戏?windows10Windows系列操作系统3、输入关键词:国际象棋→在弹出来的界面中点击免费下载(不知道是不是需要有偿使用?) 4、确实需要Microsoft账户才能下载。 5、那就使用一下Microsoft账户吧!如果嫌太麻烦,可以不输入密码→下一步。 6、请稍后,微软官网验证…… 7、正在运行……。 8、原来上面下载的是国际象棋游戏(全英文的游戏),需要下载安装的jvzquC41yy}/lk:30pku1xx1ykt2289345860qyon
2.2005年04月18日滚动新闻滚动新闻中心[综合] 世界国际象棋女子明星赛诸宸让出头把交椅 22:32 [体育] 世界国象女子明星赛爆冷门 诸宸失手让出头把交椅 22:32 [生活] 另类古巴 22:31 [文学] 林达:科尔曼报告使美国公共教育向黑人倾斜 22:31 [体育] 视频-新浪专访鲁能备战亚冠 周海滨秀出华丽脚法 22:31 [综合] 山东旅游局长李德明表示:山东专项旅游丰富多彩 22:31jvzquC41pg}t0|npc0ipo7hp1qre39521pkxu:522a812>563:4tj}rn
3.新闻中心[体育] 图文:国际象棋特级大师邀请赛 卜祥志王玥战平 (07/09 19:41) [体育] 图文:俄罗斯加时84-77胜澳大利亚 俄准备反击 (07/09 19:41) [体育] 图文:俄罗斯加时84-77胜澳大利亚 (07/09 19:40) [国内] 地方政协主席座谈会北京政协副主席黄以云发言 (07/09 19:37) [国内] 地方政协主席座谈会上海市政jvzquC41pg}t0|tjw0ipo87227682B4uetumnwjyu3:49=;8644tj}rn
4.ChatGPT教你5分钟解锁国际象棋技能chatgpt学会下棋文章介绍了如何让6岁的孩子在一年内从零基础学习国际象棋,包括理解规则、基本策略、实战练习和逐步提升战术。推荐了适合的教材、网站和对弈方式。 国际象棋是一种很好玩的棋类游戏,走法和规则与中国象棋有所区别。如果想要快速入门,可以把ChatGPT当做私人教练,提出这些问题: jvzquC41dnuh0lxfp0tfv8FKIEZskkj1ctzjeuj1fgzbkux135999>874
5.电脑是如何下棋的:关乎智力的高级挑战人工智能弈棋计算机深蓝1996年,许峰雄博士(右,现为微软亚洲研究院高级研究员)代表“深蓝”与卡死佩罗夫对弈。 本文转自《科学世界》 原作者:黄铂钧(微软亚洲研究院) 你喜欢下棋吗?有没有和计算机下过?现在,弈棋计算机的棋艺日益高强。让我们通过分析以围棋和国际象棋为代表的弈棋计算机,对人工智能的研究有一个更为深入的理解。 jvzquC41vgii0|npc0ipo7hp1f532:9/2933:8624;?649>790yivvq
6.理论测试:CPUZ国际象棋笔记本评测CPU-Z的测试项目对多线程优化是非常到位的,可以看到即使i3 7350K超频过了5GHz,还是不能再在多核中逆转四代高频i5,只是小幅度超越了节能版的六代i5。单线程方面,没有悬念,i3 7350K吊打全场,相信即使拿来i7 7700K,不开盖也是战不过的。 国际象棋测试成绩 jvzquC41pd4{qu3eqo4dp8;491<39@:270nuou
7.乐气+国际象棋大乱斗乐气,水晶般清晰的视觉效果让您大饱眼福。与您的环境互动并找到到达终点……广场的方法。你准备好成为国际象棋冠军了吗?选择您的英雄并在国王游戏中挑战其他玩家。 版本:发行版本 捆绑包 ※ 游戏本体和游戏图像的版权归游戏制作方所属 购买地址 微软商店 jvzquC41kpjjgwtxc0ipo8lcog5sgt~/rn{t/kwcyn3djnxu
8.国际象棋人机大战十周年坎贝尔回忆深蓝点点滴滴综合体育新浪体育讯 1988年,卡耐基-梅隆大学的高材生许峰雄制造出了国际象棋电脑“深思”(Deep Thought),并一举战胜了世界名将丹麦棋手本特-拉尔森。一年之后,博士毕业的许封雄受聘于IBM,并在大学同学莫里-坎贝尔和乔-赫内的帮助下于1995年研制出了电脑“深蓝”(Deep Blue)。1996年2月,“深蓝”以2比4输给当时的国际象棋世界jvzquC41urusv|3ukpg/exr0ep5hq8722931866913?2:;>:99>70|mvon
9.【2025珍藏版】大模型学习全攻略:从入门到精通,超级详细,一篇就够了这就像是在下国际象棋,模型需要决定在众多可能的移动中选择哪一步。 最简单的解码策略是贪婪搜索,即总是选择概率最高的token。然而,这种方法经常导致输出单调重复。因此,研究者提出了各种改进的策略。 束搜索(Beam Search)是一种常用的策略,它在每一步保留k个最可能的候选序列。虽然束搜索能够产生相对高质量的输出jvzquC41dnuh0lxfp0tfv8Ytd4622:81ctzjeuj1fgzbkux1377779999
10.超玥国象平台官方版app2025免费下载安装最新版技巧攻略 全部平台 历史版本 标签:学习 介绍 超玥国象,一般又称超玥国际象棋app,超越国象app。 超玥国象是一款专业的国际象棋训练学习平台。通过app能全面学习国际象棋规则、策略和技巧。给用户提供了自己的棋谱本,并能与其他用户分享。用户可以随时记录比赛进展,以便进行回放和分析。 开发者:开发者平台备案号:浙jvzquC41o0rjs~hp0eun1xx1cpjsqri1tl5:9@>;87767@750ysm