算力全开,硬战稳胜
W638可以支持本地算力调度,高阶大模型亦可在本地流畅运行,从而实现零Token消费。同时,它也将您“养”AI助手的成本,压缩为一次性的硬件消费,让无穷无尽的Token付费成为过去式。在高阶模型的支持下,智能体也能更“聪明”:
强悍GPU算力:
W638支持高达2070 TFLOPS 的 FP4 稀疏算力,算力是市面上主流桌面级 AI 超算设备的两倍以上,在处理大模型推理、视觉语言模型(VLM)等计算密集型任务时,具备更强的吞吐能力。
这一性能在实测中优势尽显:W638 搭载 Jetson AGX Thor 模组,基于 vLLM 推理框架运行代码生成模型时,吞吐达 42.3 token/s;在涵盖代码生成、日志解析、长时记忆回溯等任务的 Agent 能力评测中,准确率高达 100%。可见,无论是高并发推理还是多步智能决策,W638 均展现出强大的端侧 AI 执行力。
主流大模型支持:
单机可运行70B-200B大模型,全面支持Dense模型及MOE(Mixture of Experts)架构,满足前沿AI应用对模型规模的需求,支持一键部署Gemma4、Nemotron、Qwen3.5等主流模型。
从智微实验室测试结果中可见,在T5000模组与2TB SSD配置下,W638运行Qwen-30B-A3B模型时,可达到90.7 token/s的惊人速度,实现高效的AI推理。
高速统一内存:
配备128GB统一内存,由CPU与GPU共享,带宽达到 273GB/s,实现更快速的数据交换与协同运算。这让W638即使面对千亿参数级别的大模型,也能实现流畅加载与实时响应。
海量本地存储:
内置2TB NVMe SSD,可完整容纳大规模知识库与AI模型,确保数据快速读取与稳定运行。
可控的AI助手,可视的安装捷径
W638预装NVIDIA NemoClaw或JWiClaw,其中NVIDIA NemoClaw是开源企业级 AI 智能体安全运行平台,专为OpenClaw这样的AI助手增加隐私与安全控制。
JWiClaw则是智微智能面向AI应用打造的智能助手,它通过一个个可视化界面,让大模型部署、Skills安装等高门槛的龙虾安装步骤,变成即使是无技术基础的人,动动鼠标就能完成。
另外,基于强大的本地算力,无需调用云端API,用户的数据可以不走出设备,从信息源头层面保障用户隐私安全。
火力全开,冷静依旧
智微将具身智能控制器的散热设计经验迁移到W638,在风冷散热方案+多孔蜂窝结构下,实现气流高效引导。这让W638在超紧凑机身内,即使满载运行140W功耗,CPU、GPU与关键元器件的温度,都在安全阈值内。
同时,其散热风扇转速亦较低,实现小体积下,产品既能保持高性能持续运行,又能维持低噪音
六边战甲,“小”有蜂格
产品采用蜂窝造型设计,这种六边形密铺结构,因能兼顾力学稳定、散热隔音、轻质高强等优势,是自然界与工程界公认的优质结构。
另外,机身在硬朗线条的利落勾勒下,尽显现代感和工业之美。同时,它机身轻小,可以给用户带来极简桌面。
W638还拥五色外观可选,让您的桌面风景,更懂您的审美。
丰富接口,潜力无限
W638配备双万兆网口,传大文件、读写 NAS、互传 4K/8K 视频素材无需久等。
另外,产品还标配了Wi-Fi 6 +蓝牙,让无线连接又快又稳,外设配对也方便;4个USB 3.2高速接口,能同时支持插移动硬盘、U 盘、键鼠、扩展坞,不用来回插拔。
显示输出上,它拥有双 HDMI 2.1 接口,轻松实现双屏扩展或快速切换显示屏幕,办公、调试、演示都更灵活。
多场景适配,制胜AI时代
强大的配置,让W638适用于极客、创意内容工作室等大模型深度用户,以及AI智能体高频使用场景:
在 AI 智能体时代,智能体的普及亟需一个能够满足成本可控、高实时性运行、高安全、应用门槛低的AI硬件入口。智微智能AI Mini工作站W638正是为此而生,希望能助您获得最可靠的AI伙伴!


