当具有不同起源和层次的开发人员加入时,一系列科学研究理论将向工业应用开放,当独立的创新能力成为行业的共识时,开放和协调的多样化的生态系统将蓬勃发展。由Zhang Hefei的编辑撰写|林菲菲(Shen Feifei)开发人员长期以来遭受了“封闭的生态”。随着主要建模行业的发展迅速,一些制造商继续在墙壁内建立“封闭的游戏”,似乎可以改善用户体验,但正在建立高障碍,以调整技术,数据和生态学,不断提高创新的阈值并为开发人员提供无形的代表。同时,开放和封闭的动作也达到了高潮。在2025年的Ascend Kunpeng开发人员会议上,Cann宣布了向外界的一组新数据,这是ASCE不平等的计算机架构,肯定了深入的开放。超过30个互联网合作伙伴,运营商,芬兰CE和其他领域已经开发了260多个高性能运营商,从而显着提高了商业场景中大型模型的性能。我找到了三个不同开发人员故事的答案。 01。促进生态学的需求:Iflytek将商业问题转变为生态能力,证明了开放生态的价值和场景的实施始终是最直观的指标。创新最前沿的业务开发商发挥了不可或缺的作用。他们从开放的生态学中吸取营养,并通过实践经验不断重返生态学。通过将生态学的深刻融合并将其与现场结合在一起,Ascen Cann Ecology的能力增长和产生了自我。其中包括Iflytek。 Iflytek副总裁兼AI工程总裁Pan Qinghua,Iflytek副总裁兼工程总裁Pan Qinghua收集了Iflyt的详细合作EK和Ascend平台分为四个阶段。第一阶段是试图使用它。在2023年中国超杆量表小组的成熟解决方案的情况下,Iflytek和Asce创建了第一个具有独立创新的中国超级量表集群。第二阶段真的很方便。从2023年到2024年,Iflytek训练有素的Spark大型型号,具有上层 - UP -Scale组,仅在行业中表现出色。它已经增加了30%至90%,确保独立和创新的计算机功率可以完全支持大型模型的研究和开发,并达到世界上的关键水平。第三阶段是知道如何使用它。 2024年,研究Teamiflytek和ASTEC协作行动在ASTEC平台上进行了长期稳定的培训。中断点训练的恢复时间已从30分钟的工业的平均值减少到不到五分钟。第四阶段是使用它Ell。 Iflytek于2025年3月在基于ASTEC计算机功率的MOE模型的平行节点进行了很好的推断,从而占据了领先地位,这使得性能提高了三倍。其中,Cann将在框架AI和Ascend硬件作为AI的基本软件平台之间建造一座桥梁,并将完全启动处理器。极端性能的关键。为了回应MoE大型训练阶段的“瓶颈”问题,Iflytek和Ascend又一次合作。至于运营商,两个政党开发并共同优化了超过50个运营商,而Iflytek则独立开发了10个以上的个性化主要运营商。这包括针对MOE的特定关键操作员的优化。这将计算效率提高了15%以上。加速一些融合操作员,以达到5%的终点增加。为了响应不容忽视的沟通问题,iflytek和Asdand团队使用各种隐藏通信技术将端到端的通信压缩到不到20%,并重复了Moe Big Model的训练性能,从而释放了更多的计算,带宽和通信到上升。 Ascend Cann还可以在三个维度上加速创新:计算,内存和通信,包括超级操作员,多个方向映射技术和NPUDDirect通信算法。确切地说,Iflytek代表了中国公司合作与创新的群体肖像。类似的“开发人员”包括20多家主要公司,包括Zhipu,Bondedance,Wall Surface Intelligence,Ant Financial和Meituan。 02。使用技术来建立扎实的生态学:他们使用工程创新来重建性能限制。大型模型的应用是一个系统项目,工程创新价值不能低估。从单个卡到组,操作员到编程,通信范例和内存DEsign,所有性能跳跃都来自技术水平的最终抛光。 AI模型是“无形的技能”,AI模型可以不断地,不断地运行,并朝着任何现实世界的现场发展。在上升的CANN生态系统中,在“努力工作”方面擅长的技术团队,例如软件和硬件之间的协作,调整系统和重组合作的机制,利用工程创新和生态发展。例如,Tsinghua AI Unicorn Wuwenxinqiong基于深度Cann优化创新,有效地减少了计算机功率资源的消耗,以推断大型模型。 2025年是AI应用程序大规模实施的第一年。当出现对计算机电源推理的需求时,计算机电源成本的控制是实施大型模型的关键。为了解决这个问题,wuwenxinqiong和asten在大型组的部署中详细介绍了模型推断。实施了这项创新。通过新的计算和通信重叠范式,尤其优化了多个硬件通信的语义,从而提高了单个操作员的性能高达20%,从而降低了计算机资源消耗的有效性。例如,基于Ascend Cann的AI Infra业务团队Qingmao Intelligent创建了一个全球优化解决方案,从单卡绩效到多个卡组。重点是许多公司的绩效发布问题,Qingmao Intelligent通过基于CANN的特殊优化大大提高了Ascend Duo卡的推理性能,这使Deo Cards可以执行Big Model的完整血液版本。同时,它是为单个卡性能的完整链接解决方案而创建的,多牌群集编程提供了独立的高质量创新选项foR AIGC,自动驾驶和其他场景。例如,Tsinghua大学的Jitor团队根据大型Avant -Garde模型的Cann生态系统建立了联合国独立和创新的推理框架。 DePseek R1成为“圆圈之外的圆圈”后,Tsinghua大学的地图团队迅速收集了脊柱和适应解决方案的分析,并与A Asteng R&D团队合作,三个月后建立了一个特定的Moe操作员系统,数十个建筑迭代和数百个功能。 INT4量化技术,MLA矩阵的吸收,多维混合并行性和其他技术用于实现双重性能和记忆进展。这是仅有的800 ASTENG 800服务器首次具有完整的R1 DepSeek R1型号。有许多技术团队要处理。作为生态系统的技术点,在舞台中心找不到它们,而是使用代码行diteración进行大规模的规模。 CRES基于模型应用的土地可扩展的技术基础。从任何改进到推理绩效,再到降低部署成本,这些工程创新不仅重建了模型能力的限制,而且还不断扩大Ecosnd Cann生态系统的价值,这使AI可以真正进入行业并迈向现实。 03。用爱来打开生态。两位教授将ASCE的一组开发商的繁荣描绘成一个开放的生态系统。开发商的实力不仅可以满足,而且还利用生态系统来增强封闭的业务循环,以形成连续创新的冲动。这需要提及第三种开发人员。他们从开放的生态学中吸取营养,并通过实践经验不断重返生态学。通过将生态学的深刻融合并将其与场景结合结合,生态学上升具有成长和产生自我的能力。与所有参与爱情的开发人员密不可分。它们不是“最佳光”,但它们是阐明中国未来的许多火花。它们可能不是众所周知,但一直在关键的工程节点中静静地工作。尽管我们无法详细讲述6,000名开发人员的故事,但我们可以看到他们两位老师的肖像。首先是中国技术研究所的教授统治。中国技术大学计算机科学与工程学院教授兼博士主任。当卢(Lu Lu)在2022年与Ascend Cann联系时,Lu Lu教授感叹道:“它不够友好,使用更不舒服。”但是,与纯粹的抱怨不同,Lu教授的Teamlu在学习了Ascend软件和硬件系统后开始逐渐优化。结果,运营商的产率从50%增加到100%,在某些情况下增加了2个00%至500%。作为开源和开放的忠实拥护者,Rule教授并没有停止优化性能。它通过开源项目拥有更多的信息,我们将帮助开发人员降低阈值,并帮助他们减少时间并减少代码以实现更大的性能。最后,它与Astheng Catlass操作员模板库具有不可解决的链接。正如卢教授在2025年Kunpeng Ascendeloper会议上的演讲中所说的那样,与外国竞争对手相比,Catlass模板图书馆的Precision FP32达到了2个。加速效率的78倍,BF16为1.23次,FP16为1.17次,INT8为1.21次。它还确定将在下面进行更多的迭代,并计划开发MOE计算机能源,合并计算能力和卷积运营商。第二个是西北理工大学的Xu Tao教授。这个故事始于2020年。西北多利技术大学成为第一所参加的大学“摘要项目”。 Xu Tao教授迅速认识到合作的价值。过去,深度学习课程一直处于“纸上说话”的困境,学生只能想象一个理论上的公式。随着Ascend平台和资源组的引入,学生可以真正实现“使用手和大脑的使用”建模,调整,实现参数和云中的其他过程。 Xu Tao教授迅速成立了一组项目,以与学生一起改善所有运营商。同时,他活跃于ASND社区的大学挑战,社区论坛,传教士和其他活动。在解决实际问题的过程中,学生系统地获得了从算法设计到硬件适应的完整链技巧。它始于两个月前的Gitee社区,罐头运营商的联合建设工作是中国ASCE开发人员的第一个联合建筑平台。之中Xu Tao教授的团队独立发展,并贡献了近30个高性能运营商,而Ascend Cannse平台上的多个基本支持者已成为中国最早提供的大学团队之一。它也是第一个完成罐头运营商仓库中运营商融合的开发团队。 Lu和Xu Tao团队的效率并不比运营商的开发高两倍,而是一个平台,使他们成为发展的交流体验,积累最佳实践,合作和协作。每次使用,重写或进食操作员时,都将单个力量转化为集体势能,并将工具的价值转化为生态共鸣。生态不仅是一堆技术,而且是一群人选择聚集的途径。 04。最终,从在开源社区运作的第一条线开发人员到加深基础优化的工程团队,到领导Comp探索技术极限的竞技,Ascend Cann已成为具有最快技术迭代的中国开发人员生态系统中最活跃的创新平台。当具有不同起源和层次的开发人员加入时,当一系列科学研究理论打开了工业应用时,当全部堆的独立创新能力成为行业的共识时,多样化,开放和协调的Kang生态系统会产生繁荣的花朵,从而导致AI开发范围的变化,并支持中国关键的速度速度的重要速度。