驾驭京东云的全球最大规模Docker集群、最大规模Kubernetes集群,如同要让大象学会跳舞,以庞大身躯跳出轻盈优雅的舞步。
容器编排、负载均衡、集群扩缩容......当资源调度的各项内容被冠以“超大规模集群”后,简单的调度分配资源算法已经无法满足复杂的调度需求,阿基米德调度系统应运而生。
01撬动数据中心的支点
在行业首个混合云操作系统云舰中,阿基米德作为核心调度系统,是资源交付的基石,负责整个京东数据中心的资源调度,是撬动整个数据中心的支点。
举例最直观的的感知:京东的电商场景中,购物车、订单、详情等,涉及到的每一台容器分布,包括容器编排、单机计算资源、内存资源,均由阿基米德分配和调度,特别是618、11.11的超大流量场景下,少数容器编排错误都有可能给业务带来致命影响,调度器需负责把控峰值时每一台容器计算的质量,其重要性可想而知。
经历京东体系复杂场景的多年磨练,阿基米德可实现最优的集群全局调度、最优的一次作业调度,不仅能确保全局资源编排和成本最优、资源运行最稳定,还能在集群内选择最合适的宿主机,以最佳的资源使用、最少的相互干扰(如 CPU 分布、IO 争抢),来运行提交的计算作业。
2025-03-20 11:48
2025-03-20 11:47
2025-03-19 10:40
2025-03-19 10:39
2025-03-19 10:37
2025-03-18 10:04
2025-03-17 11:18
2025-03-17 11:17
2025-03-14 20:56
2025-03-14 20:54