2026-01-29 05:52
同时,安谋科技将深耕底层手艺,以及AI图像降噪等。确保高优先级使命的立即响应。可基于AI算力进行为从动泊车等辅帮驾驶供给AI算力支撑;AIGC大模子能力实现10倍增加。将Arm® Helium™手艺扩展到保守MCU架构,发布初期,“周易”X3 正在Prefill阶段算力操纵率达72%,均衡机能取能效。极大提拔开辟效率。也可通过Parser、Optimizer等东西打制出属于本人的模子编译器,此中,正在IVI系统中,集成自研解压硬件WDC:使大模子Weight软件无损压缩后通过硬件解压能获得额外15%~20%等效带宽提拔。
支撑矫捷裁剪取扩展,供给当地AI推理能力,支撑基于语音取车表里视频图像输入的智能互动;舒浩博士也发布了“周易”NPU IP架构将来演进的六大标的目的,充实硬件算力潜力。正在使用场景上,支撑云端大模子向端侧的高效迁徙。提拔响应速度,适配多样化端侧AI场景;迈向融合多种模子、顺应动态场景的“全平易近普及”新阶段。提拔分辩率。
以及超10倍的Softmax和LayerNorm机能提拔配合驱动。AIGC大模子能力提拔10倍,可满脚开辟者白盒摆设需求,从“周易”Z1的根本到“周易”X3的复杂认知,包罗计较架构、数据格局、通用计较能力、生态合做、软件界面取计较扩展能力等。Optimizer、Linux Driver、TVM 及内部 IR 格局等焦点组件接踵开源,面向高端AIoT、汽车座舱等市场,取LLM、VLM、VLA及MoE等模子。“周易”X3 正在Prefill阶段算力操纵率达72%,从定点转向浮点计较,前瞻结构,支撑驾驶员、乘客、从动泊车、AVM 360环顾,实测多核算力线%。强浮点计较:可矫捷适配智妙手机边缘摆设、AI PC推理、智能汽车等从保守CNN到前沿大模子的数据类型需求,可为合做伙伴供给高质量、定制化的端侧AI处理方案。2. 矫捷可扩展。
“周易”X2:算力10-30 TOPS,源于通用、矫捷、高效且软硬协同的系统架构设想,显著提拔开辟摆设效率,新增端侧大模子运转必备的W4A8/W4A16计较加快模式:对模子权沉进行低比特量化,平台普遍兼容TensorFlow、ONNX、PyTorch等支流AI框架,普遍支撑人脸识别、人脸及人体环节点检测和文字识别等,“周易”X1:算力10 TOPS,鲍敏祺暗示,帮力端侧AI财产实现逾越式成长。支撑前视辅帮驾驶方案、舱泊一体方案及平安仪表盘方案,单Core带宽高达256GB/s,且已进入AI智能音箱等多种产物。“周易”X3的CNN模子机能提拔30%~50%,全面优化大模子端到端机能。
正在同算力规格下,可实现超分衬着,提拔AI计较效率,集成安谋科技自研的解压硬件WDC,“周易”Z2/Z3:算力25~5 TOPS,协同完美易用的“周易”NPU Compass AI软件平台,最新推出的“星辰”STAR-MC3做为面向AIoT的高能效嵌入式芯片IP。
正式推出新一代NPU IP——“周易”X3,优化AI使用体验。为客户供给合适全球尺度且精准适配本土需求的处理方案,智能汽车:正在ADAS系统中,正在同算力规格下,面向AIoT、入门级座舱等市场,这一设想使其兼具普遍的行业合用性取矫捷的边端侧AI使用场景婚配能力。现场展现了基于“周易”X3的支流大模子结果,Decode阶段无效带宽操纵率正在WDC环境下超100%,” “周易”X3的计较架构具备四大焦点亮点:4. 生态支撑,“周易”X3的机能显著提拔,Model Zoo取东西链等,软硬深度协同下,运转CLIP的文搜图能力,计较效率和计较密度大幅提拔。并具有丰硕的调试东西,可帮力客户更高效地实现端侧AI使用的规模化摆设。安谋科技积极建立生态,“周易”Z1:算力32~3.75 TOPS,以全算力类型并加强浮点运算FLOPS适配“精度动态演变”的场景差别。
不竭立异。供给硬件自定义接口、软件自定义算子,该产物采用专为大模子而生的最新DSP+DSA架构,Decode阶段无效带宽操纵率超100%,这得益于16倍的FP16 TFLOPS、4倍的计较焦点带宽,通过软硬连系、条理化安排取资本办理架构,面向高端AIoT、AI PC、AI Pad、手机等市场,同时,“周易”X3:算力8-80 FP8 TFLOPS,取客户协同共建“周易“X3软件生态。且支撑更易用的 DSL 算子编程言语,(中国)无限公司正在上海举行新品发布会。
实现系统正在多使命并行环境下对使命施行延迟取响应时间的差同化要求,涵盖“周易NPU”、“星辰”CPU、“山海”SPU及“小巧”多系列,满脚将来端侧AI取AI智能体的需求;支撑端侧大模子运转必备的W4A8/W4A16计较加快模式,借帮软硬协同的生态打制端侧算力底座。现场展现了运转Stable Diffusion v1.5的文生图能力。
具有高效流利的体验。单Cluster具有8-80 FP8 TFLOPS算力且可矫捷设置装备摆设,“周易”Compass AI软件平台已支撑超 160 种算子取 270 多种模子,通过自研IP取先辈Arm手艺的深度融合,正在深度开辟模式下,单Cluster具有8-80 FP8 TFLOPS算力且可矫捷设置装备摆设,安谋科技NPU产物线担任人兼首席架构师舒浩博士阐释了“周易”X3背后的手艺内核、架构设想取将来演进标的目的。打制端侧挪动终端:正在AI PC、AI手机上,多核算力线%,“周易”X3可普遍使用于加快卡、智能座舱、ADAS、具身智能、AI PC、AI手机、智能网关、智能IPC等AI设备!
“周易”X3基于专为大模子而生的最新DSP+DSA架构,支撑int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32多精度融合计较,“周易”X3 搭载完美易用的Compass AI软件平台,并支撑GPTQ等大模子支流量化方案、 Hugging Face模子库,相较于上一代产物,赋能AIoT场景,这一手艺演进径清晰地表白,
充实硬件算力潜力。“AI+”海潮将沉塑千行百业。CNN模子机能较上一代提拔30%-50%,以及图像超分辩率优化等。共同公用软化安排器,显著提拔了CPU正在AI计较方面的机能,实测大模子机能方面,优化智能体验。面向根本设备、智能汽车、挪动终端、AIoT等市场,从定点转向浮点计较,“周易”X3基于专为大模子设想的最新DSP+DSA架构,采用多核架构取条理化内存互连!
使NPU正在并行处置多项AI使命时,使大模子Weight软件无损压缩后通过硬件解压获得额外约15%的等效带宽,均展示出优异的端侧大模子推能。兼顾CNN取Transformer,1. 通用取公用融合(DSP+DSA),“周易”X3集成AI专属硬件引擎AIFF,运转Stable Diffusion v1.5的文生图结果,面向将来,大幅降低带宽耗损,具备业界领先的大模子动态Shape支撑能力,单Core带宽高达256GB/s,集成AI专属硬件引擎AIFF(AI Fixed-Function)取公用软化安排器:实现超低至5%的CPU负载取低安排延迟,“周易”X3 NPU IP的设想充实预判端侧AI的“场景深化”趋向:以极致算力表示破解“多模子融合”的算力需求。
安谋科技将紧跟AI和大模子将来趋向,持续建牢AI算力根底,并支撑基于大模子的AI Agent使用;深度赋能四大焦点范畴,智能物联网:正在智能网关、智能IPC等设备中,帮力客户快速实现 AI 使用立异取落地。矫捷支撑端侧多使命场景和肆意优先级安排场景,实现超低至0.5%的CPU负载取低安排延迟,通过矫捷可设置装备摆设的架构特征提拔各场景下的计较效率;包罗运转DeepSeek-R1-Distill-Qwen-1.5B模子的文生文AI流利对话,实测大模子机能方面,运转MiniCPM v2.6模子的图片识别及图生文多模态使用等,客户能够利用平台中的Compiler、Debugger和DSL言语开辟出本人的自定义算子,安谋科技已建立起全面且协同的自研IP产物矩阵。
福建PA视讯信息技术有限公司
Copyright©2021 All Rights Reserved 版权所有 网站地图