大模型进终端边缘风口别错过!

加入星计划,您可以享受以下权益:

产业图谱

在软件框架方面,芯原提供了全面的Acuity工具、库和软件堆栈,为开发者提供了便捷的开发环境。同时,芯原还积极探索边缘与云协同计算的模式,通过Project Open Se Cura项目,实现了大模型和轻量大模型在边缘设备上的高效运行。值得一提的是,芯原的技术还被应用于谷歌眼镜等先进设备中,实现了极低功耗、常开和环境计算等功能。

此外,随着大语言模型在云端和移动设备上的广泛应用,芯原的技术也在这一领域发挥了重要作用。大语言模型的主要组件可以利用芯原的技术实现捕捉、信号和感知信息的评估和融合,进一步提升了模型的性能和准确性。

目前,芯原正在与谷歌等合作伙伴共同探索边缘与云协同计算的可能性,以实现大模型的轻量化和高效运行。

除了语言模型,端侧还需要视觉模型、语音模型等,以满足图像生成、PPT改动和美图等多样化需求。为此,芯原推出了专门针对端侧的NPU VIP9X00和AI-GPU IP。

查凯南表示,芯原的NPU架构支持32位浮点运算,能够执行大量复杂的通用计算任务,从而满足多样化的AI应用需求。在软件生态方面,芯原NPU兼容OpenCL等通用标准,为开发者提供了广阔的开发环境和灵活性。

此外,芯原还对通用的矩阵运算(如GEMM/GEMV)以及Transformer中所需的大量卷积运算进行了优化。这些优化措施直接提升了Transformer相关网络的性能,实现了高达10倍的性能提升。具体来说,在一个具备40-48TOPS算力的AI PC平台上,可以实现每秒处理20个Token的卓越性能。

转向云端,超级大模型成为主角,这些模型规模超过70B,甚至可能涉及数万张显卡的计算能力。这类模型必须支持多任务处理(Multi Serving)。查凯南认为,自然语言的一个显著优势是能够让端侧模型和语音端模型通过自然语言进行交互,而非传统的计算机数据交互。当手机和云端能够通过自然语言交互时,将彻底改变应用场景和智能效果。

为了解决端侧和云端的不同需求,查凯南进一步探讨了两者对NPU的特定要求。端侧更注重低功耗和优良的PPA(性能、功耗、面积)平衡。性能固然重要,但功耗和面积对于端侧IP来说更为关键。端侧NPU主要用于推理任务,并需要一定的浮点运算能力,同时关注低比特量化和压缩技术。

相比之下,云端NPU则强调高性能和高TOPS(每秒万亿次操作)能力,以支持推理和训练任务。这不仅涉及单卡推理训练,还包括分布式推理训练和多卡多机能力。因此,云端NPU更需要通用的GPGPU编程模型、高配比的浮点与定点算力,以及对高精度的支持。同时,接入大型生态系统也是云端NPU的重要需求。

在软件栈的更深层次,芯原提供了一系列通用的加速库,包括算子加速库和运算图加速库,以及多核间通讯库。这些库能够显著提高AI运算的效率和性能。同时,底层支持标准的OpenCL、OpenVX等接口,确保了与各种硬件和编辑器的兼容性。

在AI工具链上,针对推理任务,芯原自研了推理Toolkit,该工具链可以直接导入所有类型的框架模型。它内部嵌入了量化功能,能够直接生成易于部署的二进制文件。此外,芯原还研发了适用于大语言模型的vLLM,并在云端提供了出色的支持。

在训练端,特别是对于云端GPU训练,芯原选择了接入Torch Dynamo Plugin来支持PyTorch,以及Transformer XLA Backend来支持Transformer模型。这些选择都是为了确保开发者能够高效地进行模型训练。

张晓东首先引用了物理学家费曼的名言:“微积分是上帝的语言。”然而,他幽默地指出,如今“上帝的语言”似乎已变成了“图灵机”。他提到,图灵作为计算机科学和人工智能的奠基人,其贡献是不可估量的。整个计算机科学都建立在“丘奇-图灵论题”这一核心基石之上,即图灵机是最广义的计算装置。

在解释ChatGPT工作原理时,张晓东提到了1956年达特茅斯会议上的一个关键观点:学习可以看作是图灵机的求逆过程。他解释说,这实际上就是寻找一个能够生成特定输出的机器,即我们现在所说的生成式AI。此外,他还提到了所罗门诺夫在1964年的研究,该研究证明了所有学习问题都等价于归纳法,且与图灵机求逆等价于下一个Token预测。

一个有意思的对比是谷歌和OpenAI在Transformer技术上的应用。张晓东指出,虽然谷歌最早发明了Transformer,但最终是OpenAI通过GPT系列模型取得了显著成功。这背后的原理和对技术的深入理解是成功的关键。

回顾人工智能的三大发展路线:逻辑主义、联结派以及从细胞自动机到强化学习的演进,张晓东特别指出,强化学习可以用所罗门归纳来解释,这一领域的突破已经催生了如AlphaGo这样的杰出成果。随着技术的迅猛发展,大语言模型的进化速度已经达到了“周”级别,每隔几周就会有新的技术突破问世。

在探讨大语言模型的发展趋势时,张晓东提到了当前科技界的一些热议话题,包括OpenAI团队的变动以及训练大型模型所需的巨大成本。他特别强调了能耗问题,指出随着模型规模的扩大,训练所需的能耗也在急剧增加。然而,他也表示,根据Koomey定律,随着技术的进步,同等算力所需的能耗将会逐年下降,这为未来的大型模型训练提供了一线希望。

没有人怀疑,1956年达特茅斯会议提出的问题至今仍然有着深刻的启示,人工智能领域的发展将在未来见证更多激动人心的技术突破。

传统成像过程仅针对特定谱段进行感知,随后需要大量计算来修正和处理这些感知到的能量信号。这主要是因为成像系统面临多重挑战,包括成像光学系统的局限性、器件物理特性的限制,以及人眼视觉感知的非线性等。传统ISP系统采用“分治法”来处理这些问题,即将各种图像畸变分类,然后逐一设计算法进行校正,最后组合起来解决问题。

电子科技大学教授顾舒航指出,随着计算资源的日益丰富,工程界或许可以寻求更加数据驱动的方法。在过去,当计算资源有限时,人工智能算法可能并不如传统的手工设计方法有效。但现在,随着计算能力的提升,机器学习的方法有可能达到甚至超越传统方法的效果。因此,在计算资源更加充裕的今天,可以考虑采用新的策略来优化ISP系统。这一观点为AI-ISP技术的发展提供了新的思路。

AI-ISP的实现涉及5个关键技术:

l领域特定架构(DSA):在构建AI-ISP的硬件架构时,既可以考虑与传统ISP架构的一致性,以优化内存使用和处理效率;同时,也可以借鉴传统方法的丰富经验,特别是那些反映物理事实的经验,来完善AI-ISP的设计;

l硬件感知算法设计:这一技术旨在确保算法与硬件的紧密集成,从而实现更高效的图像处理;

l数据工程与无监督训练:利用数据工程方法来处理大规模图像数据,并结合无监督训练技术,使网络能够自我学习和优化;

l神经网络优化与量化技术:通过对神经网络的优化和量化,可以在保持性能的同时降低计算复杂性和资源消耗;

l可控神经网络:这种网络能够实时反映成像环境的变化,并根据用户的影像需求进行调整,从而实现更加个性化和灵活的图像处理。

尽管取得了不错的进展,但AI-ISP还有需要不断优化和升级。顾舒航表示,他的团队正在几个方向深化研究:

激进的量化策略:他们正探索以最小的介入实现更好的数据质量,从而提升整体性能。如果其ISP得以成功实施,它可以与各种上游任务相结合,为压缩、传输和存储带来革新。

顾舒航认为,在自动驾驶等场景中,生成式模型的应用将更具潜力。例如,道路两侧的建筑物数据可以完全通过生成式模型来填补,从而大幅降低数据流通路的需求,为下游处理减少存储压力,进而降低成本。

AI-ISP技术已经在图像处理领域展现出巨大的潜力和应用价值。通过不断优化关键技术和探索新的应用场景,AI-ISP将在未来发挥更加重要的作用。

袁帝文表示,空间计算技术的核心在于对环境的感知。物理世界是三维的、充满多模态信息,因此需要多模态算法的支持。同时,与物理世界的交互也必须是3D的。这种交互不仅仅局限于人与机器之间,更包括机器协助我们完成各种实际任务,如抓取鸡蛋、收拾碗盘或折叠衣物。在这里,3D技术显得尤为重要,而空间计算技术也需要与大模型AI技术紧密结合,二者协同作用,共同推动具身智能的进步。

袁帝文指出,大模型的发展不仅推动了PC和手机行业的进步,更为机器人技术带来了革新。机器人作为一个综合性的终端,不仅需要具备PC和手机的基本功能,还要能够感知和适应物理世界。这就要求机器人必须具备多模态大模型的支撑,以应对不同场景的适应性需求。

神顶科技是亚洲第一家量产的具身智能3D空间计算芯片提供商,据袁帝文介绍,该公司研发的3D空间计算芯片能够支持不同的应用场景,并根据实际需求灵活采用不同的传感器组合,确保机器人在各种环境下都能保持出色的感知能力。该芯片还支持低成本传感器,有效减少对高性能传感器的依赖,从而大幅降低系统成本,为更广泛的机器人应用铺平了道路。

值得一提的是,该芯片还支持异构传感器融合,能够轻松解决raw data的融合问题。这一功能使得机器人能够更准确地感知和理解周围环境,为后续的决策和行动提供坚实的数据基础。

除了上述特性,神顶科技的3D空间计算芯片还提供了丰富的功能,包括三维重建、深度估计以及感知融合等。这些功能不仅支持不同的3D感知技术和空间定位技术,还是多传感器融合这一3D空间计算基石得以实现的关键。

机器人正逐渐从数字世界走向物理世界,而这一过程离不开高效、精准的感知和计算能力。最近,业内频频提及“物理AI”的概念。袁帝文强调,在当今这个物理AI逐渐崭露头角的时代,神顶科技的3D空间计算芯片与NPU的紧密协作显得尤为重要。神顶科技正积极与合作伙伴如芯原等携手合作,共同迎接物理AI带来的挑战。

面对数据中心对算力的不断增长需求,芯原提出了创新的Chiplet互联方案。通过设计支持4-6路接口的芯片,能够将4颗以上的芯片拼接在一起,从而大幅提升算力。同时,针对大面积芯片的设计挑战,芯原已经接近了掩膜极限的解决方案,通过Chiplet技术突破物理限制。

THE END
0.信息与艺术系举办第一届“前沿杯”机器人挑战赛表彰大会孙权首先介绍了此次比赛的详细情况,第一届“前沿杯”机器人挑战赛是结合当代智能制造企业发展趋势而设定的选拔类赛事,要求参赛选手通过操作ABB机械手臂和可编程逻辑控制器完成指定任务。此项赛事为后期参与其他各类赛项搭建比赛梯队,奠定了人员基础。此次比赛促进了同学们专业知识学习和工程实践能力的提升。 jvzq<84yyy4bju~z{0kew7hp1z~zu8nphq523>>159680qyo
1.人工智能教育领域范文在教育领域, 人工智能应用也取得了重大突破, 比如2017年高考期间, 机器人艾达挑战高考数学, 10分钟就答完, 获得134分, 激发了教育领域对人工智能的巨大热情, 同时也引发了人们对教育的忧虑与反思[2]。2017年7月国务院印发了《新一代人工智能发展规划》, 提出人工智能产业竞争力在2030年要达到国际领先水平。目前jvzquC41yy}/i€~qq0ipo8mcqyko1:=;2:9/j}rn
2.新成果!人工智能市级科技重大专项再添佳绩然而,柔软材料在赋予了机器人大变形和交互安全能力的同时,严重限制了机器人的能量输出,这主要是由于小尺寸和低刚度材料难以存储或释放能量造成的,也一定程度是磁控设备难以产生持续时间长、强度高的可编程磁场导致的,是微型磁控机器人的本征缺陷。因此,目前的微型磁控机器人的输出能量很难满足对机器人性能要求较高的jvzquC41utobu7yqpipj0niw0et0gm49f1i29A7:c4;869:1rcmf0qyo
3.济南市教育资源公共服务平台附表7:“FLL青少年机器人挑战项目”(组队)报名表 一、活动主题 济南市学生信息素养提升实践活动(原“济南市中小学电脑制作活动及济南市中小学机器人竞赛活动”)坚持以“实践、探索、创新”为主题,以与时俱进的活动项目为核心,通过丰富多样的组织形式,坚持把立德树人和“五育”并举贯彻落实到活动内容中,引导师生充分jvzquC41ufrth3lpfph0ls1kpjfz7ujrAx>rxwvcn5dqwygpv5wkn|(kfC25A8567
4.合肥一中学子在合肥市机器人竞赛中斩获多项冠军2023年7月15-16日,由合肥市科学技术协会、合肥市教育局主办的合肥市第15届青少年机器人竞赛在合肥新站区成功举办。本次市赛共有来自全市200多所学校的666支代表队,2100名中小学生参加市级决赛。合肥一中机器人队在VEX机器人工程挑战赛、C类可编程控制的空中飞行器、机甲大师青少年挑战赛和RIC创新挑战赛中,不负众望jvzq<84yyy4ih‚0pgz0f‚~f1f{z8}y|n53;9:9:0nuou
5.机器人爱好者(第1辑)Servo的内容主题范围很广,从可编程逻辑,到步进马达基础、无线电通信基础、机器人基础知识、自助操作、闭环系统、语音识别、视觉添加等,到产品和图书评论,构建自己的Bot和系统项目等等。诸如DARPA、机器人世界杯足球赛、FIRST、ComBots、水下机器人挑战赛等等活动的报道。 jvzquC41yy}/gyzdkv4dqv4dqqqEg}fknuEjfFS583;1
6.什么是机器人仿真?机器人仿真 目录 ROS 用于 MATLAB 和 Simulink 与各种外部仿真器的协同仿真。 继续探索此主题 基于模型的设计和自动代码生成(1:03:24) 资源 通过文档、示例、视频等拓展您的知识。jvzquC41yy8/ojyjyqxlu7hp1fotex{gt{5sqktv/uonwufvkqt/j}rn
7.日本2014机器人发展白皮书介绍(上)在本书中,机器人学的历史发展将是最重要的一部分。从工程学的角度普遍认为,自动化和机构学是机器人学的起源。下面包含了几个关键的发展: ·1778年蒸汽发动机转速控制(瓦特) ·1948年 N.Wiener“控制论” ·1954年 G.Devol“可编程传输机” ·1958年 Shannon和Minsky的机器人 jvzquC41yy}/txgqv/iikwf0eqs0pn|u14626:6125527<820jznn
8.「上海英语」2023STEM家庭机器人冬令营(5天)DiscoveryEducation小营员们将模拟人脑逆向工程,推动思考智能机器设计;批判性地辩论人脑与科技,进一步了解人脑突触扩展与受损重建系统。此外我们将还原真实科技场景,引导营员们应用专业规则及术语,建立机器工程与现实世界的联系,打造出拥有独特技能的家庭机器人! 可持续发展背景 美国国家工程院宏大挑战项目号召工程师和学生对人脑进行逆向工程jvzquC41yy}/nnycqj{p0lto1vgou~t1mgiigwl143;60qyon
9.我国机器人安全挑战与对策:从网络安全到人机协作两年后,美国“机床与铸造公司”(AMF)生产了另一-种可编程工业机器人Versatran。 ·20世纪70年代机器人技术发展成为专门学科,称之为机器人学(Robotics)。 机器人产业得到蓬勃发展,机器人的应用领域进一步扩大, 不同的应用场所,各种坐标系统、各种结构的机器人相继出现,大规模集成电路和计算机技术飞跃发展使机器人的控制jvzquC41dnuh0lxfp0tfv8vsa6:3998531gsvrhng1jfvjnnu1732>7484;
10.科普:什么是机器人?工程原理和应用综合指南(1)行业动态工业机器人是自动化、可编程的机器,旨在以高精度和高速度执行重复性任务。这些机器专为工业应用而设计,通常具有高有效载荷、工作范围和精度能力。工业机器人在设计时考虑到了耐用性和可重复性,因此能够在充满挑战的条件下蓬勃发展。工业机器人的一个关键方面是它们能够采用先进的控制系统、传感器集成和复杂的编程,以自主jvzquC41yy}/hxwmnkluujkgv{4dqv3ep1tfy|4fgvgjn87245691:=;:0nuou
11.易语言静态编译器VS2015探讨其优势与应用场景可编程机器人|探索未来智能时代的创新应用与挑战 随着科技的不断进步,机器人技术正朝着更加智能化和可编程化的方向发展。可编程机器人,不仅具备高度的自主性,还能根据不同需求进行程序化操作,广泛应用于各行各业,推动着产业变革和技术进步。 可编程机器人的最大特点之一是其灵活性。用户可以通过编程修改机器人的行为jvzquC41dnuh0lxfp0tfv8wzdgoea:>61cxuklqg1fkucrqu13;55>:573
12.机械智能机器人可动结构实验室该机器人通过结构设计克服了薄膜各向同性和随机弯曲的问题,直线运动速度达到0.714 BL/s,将恒定湿度驱动的机器人速度提高了两个数量级,高于已报道的变湿度响应机器人,同时能够负载自身重量的100%,并且实现了运动轨迹的可编程设计。 轨迹可编程机器人Hydrollbotjvzq<84oqvopp|ytwezvtnx0vl{/gmz0ep5dj8wguggseq2Tqduuklx0jvsm
13.机器人流程自动化的十大好处鉴于机器人流程自动化(RPA)提供的可扩展、高度灵活的自动化功能,与缺乏此类系统的竞争对手相比,任何部署它的企业都将具有可观的性能优势。 机器人流程自动化(RPA)能够快速准确地执行各种关键的基本任务,从而使企业变得更加敏捷,并且更有能力完成具有挑战性的任务。 jvzquC41yy}/7:hvq0ipo8ftvkimg8;378750qyon