1月5日,北京智源人工智能研究院(以下简称“智源研究院”)在“2026北京人工智能创新高地建设推进会”上发布面向多种AI芯片的系统软件栈——众智FlagOS 1.6,并同步启动生态建设系列行动,与多家重点企业达成生态合作,并与合作方共同启动FlagOS开放计算全球大赛。

智源研究院副院长兼总工程师林咏华表示,FlagOS 1.6推动AI系统软件迈入“一次开发、跨芯片运行、多框架支持”的新阶段,使开发者能够更专注于模型与应用创新。通过统一框架插件、算子自动生成、编译器新语言扩展和FlagOS具身智能框架(FlagOS-Robo)等关键突破,FlagOS正在整合算力与开源生态,加速AI从实验室走向规模化应用。

FlagOS 1.6能够为开发者提供更易适配、更高性能、更快迭代的一体化工具链,同时支持具身智能模型研发,推动AI开发模式从“适配硬件”转向“模型创新”。
框架FlagScale v1.0版本通过多芯片统一插件方式,对框架/算法包实现非侵入式修改,极大地降低了适配成本,助力大模型Day0支持,保持用户使用习惯,无缝获得跨芯一致性结果。该框架为各AI软硬件厂商提供了统一、标准化的接入机制,有效解决了以往生态分散、版本不一的困境。
全球首个支持多种AI芯片的Triton算子自动生成平台KernelGen 1.0突破传统copilot仅生成代码、不保证效果的局限,实现从需求理解、算子生成、正确性验证、及加速比评测的全生命周期自动化。开发者一次描述即可完成生成与评测,全流程仅需2分钟,50%生成算子在同等算力下性能达到或超过CUDA原生算子。基于FlagOS技术栈,KernelGen已支持英伟达、摩尔线程、华为、海光、天数等多种芯片,可实现跨芯片生成与多端验证,显著降低算子适配与优化成本,加速算子生态的规模化共建。在KernelGen的辅助下,FlagGems总规模扩容至363个高质量算子,涵盖正式发布的230个算子及首批机器自动生成的133个算子。FlagGems作为全球最大的Triton算子库,其中82%以上的Triton算子与CUDA原生算子性能平齐或超过,并已支持10多种AI芯片。
编译器FlagTree v0.4升级推出算子开发语言TLE(Triton Language Extension)预览版,通过分层设计在易用性与极致手写优化之间取得平衡,覆盖从初级到高级不同程度开发者的多样化需求。以中级开发者使用的基础原语扩展为例,关键算子性能提升超过10%;在多芯片高效运行时,已支持英伟达、华为昇腾、摩尔线程和天数等平台,关键算子性能可进一步提升20%以上,大幅降低了多芯片适配与算子优化的技术门槛。


