H20 AI服务器
-
H20 AI服务器和一体机
微云智算一体机搭载自研企业级AI大模型开发平台 ,预置DeepSeek 、 Qwen 、 Llama3等大模型、采用软硬件一体化设计,提供“算力+平台+服务”的一站式解决方案,为用户提供快速交付、开箱即用、极致性能、安全高效的全栈 大模型微调推理的开发能力, 加快DeepSeek等大模型在各行业的应用落地速度。

软硬融合 算力高效
l 集成全新一代AI算力平台,具备卓越的算力性能和极致的弹性架构,支持低延时 RDMA网络(X400支持)和高性能并行存储。
l 通过分布式并行加速、混合精度计算、模型优化技术,提升模型的训练和推理 速度,实现应用高并发高能效处理、业务快速上线的需求。
l 支持单节点8卡全互连,单机最高算力2.3PFLOPS(FP8),最大显存容量1128GB,单机最高支持千亿级参数模型高效微调和模型部署。
开箱即用 功能全面
l 软硬一体化交付,模型服务开箱即用,无需二次硬件适配,降低使用门槛。
l 预置DeepSeek、Yuan2.0-M32、Baichuan2-7B、ChatGLM3-6B、Qwen1.5-7B、Llama3\GLM4等国内外主流模型,预置DEMO应用样例。
l 提供高效、易用、安全的大模型训推开发工具,支持数据处理、模型微调、知识库构建、模型增强插件等能力,提供对话式UI、API及SDK等便捷的集成方式,支持灵活的二次开发和敏捷部署。
多模管理 灵活适配
l 内置10+计算框架(MegtronLM、DeepSpeed、Pytorch、Transformer、Llamafactory、 Fastchat等),广泛支持主流基础大模型结构,支持与用户自研模型的灵活适配和对接。
l 内置多种微调能力,如监督微调、直接偏好优化、人类反馈强化学习等。
l 专为大模型训练与微调优化的分布式任务构建优化、断点续训能力,支持按需弹性扩缩容。
本地部署 安全可靠
l 提供本地专属大模型解决方案,企业数据不出域,杜绝数据泄露风险。
l 全链路的企业数据防护能力:分级分类权限访问控制,文件级别的数据加密、私有数据的高可用存储、数据备份恢复机制。
l 多级过滤和审核体系,对用户输入、模型输出进行快速、准确审核,保障生成内容的安全性与隐私性。