详情

首页手游攻略 赋能轻量级Agent:瑞芯微重磅发布RK182X SDK 1.0.4版本

赋能轻量级Agent:瑞芯微重磅发布RK182X SDK 1.0.4版本

佚名 2026-06-30 08:24:00

6月12日,国内端侧AI芯片龙头企业瑞芯微在官方微信宣布,正式发布RK182X SDK 1.0.4版本,这个版本将为轻量级Agent全栈赋能,加速端侧AI量产。

瑞芯微之所以在RK3588之外,还要专门开发RK182X协处理器,主要是为了突破传统SoC(系统级芯片)在端侧运行大模型时面临的物理瓶颈。RK182X本身就是一颗内置了多核高算力NPU(峰值算力达20 TOPS)的AI推理芯片。瑞芯微给客户提供的选项是:当客户现有产品需要增加AI能力时,通过与主处理器的协同工作,来满足AI算力的升级需求,大大节省时间成本和研发周期。

根据瑞芯微的实测数据显示,RK182X运行Qwen2.5-3B模型的输出速度突破百Token,是市场对标产品的3倍。RK182X运行Qwen3-VL-2B模型输出速率近百Tokens。

近日,瑞芯微发布的2026年第一季度财报显示,2026年第一季度,瑞芯微依托RK3588等主力AIoT SoC平台及RK182X协处理器系列,实现营收12.05亿元,同比增长36.22%;净利润3.29亿元,同比增长57.15%,毛利率达43.04%。

瑞芯微强调,2026年第一季度,在终端市场受到存储价格高涨的冲击下,AIoT市场延续增长态势,端侧AI深入千行百业,重塑产品体验的趋势日益显著。财报中也重点披露,瑞芯微于 2025 年 7 月正式发布协处理器 RK182X 系列,9 月迅速发布SDK,快速导入十几个行业、数百家客户,首批客户已进入产品发布、量产阶段,应用于各产品线的旗舰产品,导入速度超出预期。

6月12日发布的最新RK182X SDK 1.0.4版本,有以下三大亮点:

1、量产级工具链,从开发到运维全闭环

▸ 批量烧录+自动化测试→产线一站搞定

▸ KV Cache导入导出→预计算上下文,首包加速

▸ 运维闭环:OTA 远程升级 + 设备状态监控

▸ 模型加密:保护企业自研算法IP

▸ LoRA微调:私有数据微调,无需全量重训

瑞芯微表示该版本已通过严苛测试,支持 7×24 小时连续稳定运行。

2、Agent 能力大幅跃升

谷歌最新开源模型Gemma4,在指令遵循、工具调用等 Agent 核心能力上实现大幅提升,是端侧 Agent 落地的首选基座;瑞芯微自研 KV Cache 压缩技术,上下文长度翻倍!Qwen3-4B 最高支持 37K token,让 Agent 记住更长的对话和任务指令

3、全模态模型体系,端侧 AI 完整链路

端侧 AI 不只是"跑大模型",而是要形成「听→看→想→做」的完整链路:

音频入口:Qwen3 ASR/TTS、VITS...让设备能听会说 ;视觉入口:PaddleOCR、SigLIP、DINOv2、Yolo 系列、Depth-Anything,让设备能看懂;Agent 决策:Qwen 全系列、GLM Edge、Gemma4、InternVL3,从理解到执行;模型全景:覆盖LLM(0.5B~8B)、VLM、Omni全模态、ViT/CNN等8大类40+ 款模型。

相关资讯
点击查看更多
游戏推荐
推荐专题
热门阅读
推荐下载