智源研究院发布众智FlagOS 1.6

日期：2026-01-06 来源：信息处

　　1月5日，北京智源人工智能研究院（以下简称“智源研究院”）在“2026北京人工智能创新高地建设推进会”上发布面向多种AI芯片的系统软件栈——众智FlagOS 1.6，并同步启动生态建设系列行动，与多家重点企业达成生态合作，并与合作方共同启动FlagOS开放计算全球大赛。

　　智源研究院副院长兼总工程师林咏华表示，FlagOS 1.6推动AI系统软件迈入“一次开发、跨芯片运行、多框架支持”的新阶段，使开发者能够更专注于模型与应用创新。通过统一框架插件、算子自动生成、编译器新语言扩展和FlagOS具身智能框架（FlagOS-Robo）等关键突破，FlagOS正在整合算力与开源生态，加速AI从实验室走向规模化应用。

　　FlagOS 1.6能够为开发者提供更易适配、更高性能、更快迭代的一体化工具链，同时支持具身智能模型研发，推动AI开发模式从“适配硬件”转向“模型创新”。
　　框架FlagScale v1.0版本通过多芯片统一插件方式，对框架/算法包实现非侵入式修改，极大地降低了适配成本，助力大模型Day0支持，保持用户使用习惯，无缝获得跨芯一致性结果。该框架为各AI软硬件厂商提供了统一、标准化的接入机制，有效解决了以往生态分散、版本不一的困境。
　　全球首个支持多种AI芯片的Triton算子自动生成平台KernelGen 1.0突破传统copilot仅生成代码、不保证效果的局限，实现从需求理解、算子生成、正确性验证、及加速比评测的全生命周期自动化。开发者一次描述即可完成生成与评测，全流程仅需2分钟，50%生成算子在同等算力下性能达到或超过CUDA原生算子。基于FlagOS技术栈，KernelGen已支持英伟达、摩尔线程、华为、海光、天数等多种芯片，可实现跨芯片生成与多端验证，显著降低算子适配与优化成本，加速算子生态的规模化共建。在KernelGen的辅助下，FlagGems总规模扩容至363个高质量算子，涵盖正式发布的230个算子及首批机器自动生成的133个算子。FlagGems作为全球最大的Triton算子库，其中82%以上的Triton算子与CUDA原生算子性能平齐或超过，并已支持10多种AI芯片。
　　编译器FlagTree v0.4升级推出算子开发语言TLE（Triton Language Extension）预览版，通过分层设计在易用性与极致手写优化之间取得平衡，覆盖从初级到高级不同程度开发者的多样化需求。以中级开发者使用的基础原语扩展为例，关键算子性能提升超过10%；在多芯片高效运行时，已支持英伟达、华为昇腾、摩尔线程和天数等平台，关键算子性能可进一步提升20%以上，大幅降低了多芯片适配与算子优化的技术门槛。

【打印本页】【关闭窗口】