满足多种行业场景中心推理需求新一代兆瀚AI推理

 行业动态     |      2025-09-08 03:05

  9月6日,2025世界智能产业博览会期间,“100+首发成果”相继发布。其中,系统股份有限公司、重庆科学城芯鸿数智科技有限公司联合举行兆瀚昇腾AI服务器新品发布暨大模型一体机全新升级活动,推出新一代AI推理服务器。

  当前,大模型时代正从“百模大战”迈向高价值应用落地,进入“推理元年”。从2020到2025年,各类大模型如Chat天富注册GPT、文心一言、通义千问、LLaMA等纷纷涌现,推动AI从技术探索走向规模化应用。

  在芯鸿数智高级解决方案专家常勇看来,一旦AI应用突破孵化拐点,用户规模将呈指数级增长,推理算力需求甚至会出现百倍以上的爆发。芯鸿数智联合母公司,共同打造“兆瀚”智算品牌,此次推出的新一代AI推理服务器——兆瀚RA2300-C AI推理服务器,搭载2个业界首款支持双线程的全新鲲鹏处理器,单机支持2到6张Atlas 300I Duo加速卡,最大算力可达1680TOPS INT8,将带来不错的推理性能。

  “该服务器可轻松运行CV/NLP传统小模型以及DeepSeek、Qwen、Llama等AI大模型,满足AI交通、AI政务、AI考试、AI质检等各行业场景中心推理需求,超高性能且安全可靠。”常勇说。

  不仅如此,随着兆瀚RA2300-C AI推理服务器的发布,兆瀚旗下的AI大模型一体机也将迎来全新升级。该一体机可预装众多大模型,如DeepSeek V3/R1、Qwen等。在行业应用方面,它能结合行业业务需求,搭载行业AI应用,解决特定行业业务需求,还支持应用扩展,以适应企业不同时期的AI需求,可广泛应用于数字政府、运营商、大教育、工业、交通等多个领域。