Golang实现K8s自定义调度器的秘诀 分享调度算法与资源优化策略

自定义k8s调度器的关键在于理解调度流程并用go实现过滤和评分算法。1. 理解k8s调度流程:包括预选、优选和绑定三个阶段,自定义逻辑需插入这些阶段;2. 选择扩展点:推荐使用scheduler framework,提供更细粒度控制;3. 使用client-go和informer/lister与k8s交互并高效获取集群状态;4. 实现filterplugin和scoreplugin接口,完成节点筛选与打分;5. 构建独立调度器二进制文件并注册到k8s。自定义调度器适用于特殊硬件调度、资源优化、多租户隔离等场景,核心组件包括client-go、informer、lister及插件接口,开发流程涵盖策略定义、模块创建、插件实现、注册与部署。设计高效算法需结合资源适配性、亲和性、数据本地性、成本等多维度指标,并动态调整权重以优化资源利用率。

Golang实现K8s自定义调度器的秘诀 分享调度算法与资源优化策略

想用Golang打造K8s自定义调度器?其实没那么玄乎,关键是摸透K8s调度框架的门道,然后用Go语言把那些预选、优选的逻辑写得既高效又聪明,这样才能真正玩转资源分配,让集群跑得更顺畅。自定义调度器,说白了,就是K8s提供的一个扩展点,让你能根据自己的业务需求,来决定Pod应该落在哪个节点上,而不是完全依赖K8s自带的默认调度器。秘诀嘛,就在于理解K8s的调度流程,并用Go实现你独有的过滤(Filter)和评分(Score)算法,从而实现极致的资源优化。

Golang实现K8s自定义调度器的秘诀 分享调度算法与资源优化策略

解决方案

要用Golang实现一个K8s自定义调度器,核心思路是利用K8s提供的调度器框架(Scheduler Framework)或者更早期的调度器扩展(Scheduler Extender)机制。在我看来,现在更推荐使用调度器框架,因为它提供了更细粒度的控制和更强大的扩展能力。

具体来说,你需要做几件事:

立即学习“go语言免费学习笔记(深入)”;

Golang实现K8s自定义调度器的秘诀 分享调度算法与资源优化策略

理解K8s调度流程: K8s默认调度器的工作流程大致是:首先,预选(Predicates)阶段,过滤掉不符合条件的节点,比如资源不足、亲和性不匹配的节点;接着是优选(Priorities)阶段,对通过预选的节点进行打分,选出分数最高的节点;最后是绑定(Bind)阶段,将Pod分配到选定的节点上。自定义调度器就是要在这些阶段插入我们自己的逻辑。

选择合适的扩展点:

Golang实现K8s自定义调度器的秘诀 分享调度算法与资源优化策略Scheduler Extender (较旧): 这种方式通过HTTP/HTTPS回调,将调度请求发送给外部服务进行预选、优选或绑定。好处是可以用任何语言实现,但性能开销相对大,且与K8s内部调度逻辑耦合度较低。Scheduler Framework (推荐): 这是K8s 1.15+引入的,它将调度器内部的各个阶段抽象为一系列“插件(Plugins)”,比如FilterScorePreBind等。我们只需要实现这些插件接口,然后注册到调度器框架中,就能与K8s原生调度器无缝集成。用Go语言实现自定义调度器,通常就是基于这个框架。

使用Golang编写核心逻辑:

client-go 这是K8s官方提供的Go客户端库,用于与K8s API服务器交互,比如获取Pod、Node信息,更新Pod状态等。informerlister 为了高效地获取K8s集群的实时状态,你需要使用informer来监听资源变化(如Pod、Node的增删改),并用lister来缓存这些资源,避免频繁地查询API服务器。这是构建高性能调度器的基石。实现FilterPluginScorePlugin 这是自定义调度器的核心。FilterPlugin负责实现预选逻辑,决定一个节点是否适合运行某个Pod。ScorePlugin负责实现优选逻辑,给符合条件的节点打分,分数越高越优先。注册你的调度器: 你可以构建一个独立的调度器二进制文件,它会启动一个调度器实例,并加载你实现的插件。在Pod的spec.schedulerName字段中指定你的调度器名称,K8s就会将该Pod调度请求发送给你的调度器处理。

说实话,这套框架的灵活度非常高,几乎可以满足所有你能想到的调度场景。关键在于如何把你的业务逻辑巧妙地转换成过滤和打分的算法。

为什么我们需要自定义K8s调度器?

你可能会问,K8s自带的默认调度器不是挺好用吗?干嘛还要折腾自定义?嗯,这个问题问得好,在我看来,主要有几个场景是默认调度器力所不及,或者说,它无法完全满足我们对资源精细化控制的需求。

首先,最常见的就是特殊硬件的调度。比如,你的应用需要用到GPU、FPGA或者特定的AI加速芯片。K8s默认调度器可不知道这些东西,它只知道CPU、内存。这时候,我们就需要自定义调度器,去检查节点上是否有这些特殊硬件,并且确保Pod能正确地使用它们。我之前就遇到过一个场景,需要把特定的AI训练任务调度到带有特定型号GPU的节点上,并且要保证每个GPU只跑一个任务,默认调度器就完全搞不定。

其次,是高级的资源优化策略。K8s默认调度器虽然有“最少请求(LeastRequested)”或“最平衡(BalancedResource)”之类的策略,但这些是通用的。如果你想实现更激进的“装箱(Bin-Packing)”策略,尽可能把Pod塞满少数节点,以释放更多空闲节点来关机省钱;或者反过来,你想实现“分散(Spread)”策略,让Pod尽量分散到不同节点、可用区,提高容灾能力,这些都需要更细致的算法。特别是对于一些有严格SLA要求的服务,你可能需要根据业务优先级、成本预算来动态调整调度策略,这已经超出了默认调度器的范畴。

再来,多租户环境下的资源隔离与公平性。在共享集群中,不同的团队或用户可能对资源有不同的期望。你可能希望某个高优先级团队的Pod能优先调度,或者确保所有团队都能获得“公平”的资源份额,避免某个“大户”霸占资源。自定义调度器可以让你引入配额管理、优先级队列、甚至基于信用点数的调度机制,实现真正的资源公平分配。

还有一些比较小众但很重要的场景,比如数据本地性调度,让Pod尽量调度到与它所需数据更近的节点上,减少网络延迟;或者许可证管理,确保某些受限软件的Pod只调度到有足够许可证的节点上。这些都是默认调度器无法直接提供的能力。所以,自定义调度器并非是“炫技”,而是解决实际生产问题的“利器”。

Golang自定义调度器的核心组件与开发流程是怎样的?

用Golang来写K8s自定义调度器,核心就是围绕k8s.io/kubernetes/pkg/scheduler/framework这个包来展开。这套框架设计得非常精巧,它把调度过程拆解成了一系列可插拔的插件。

核心组件:

client-goinformer/lister 这是基础中的基础。你的调度器需要知道集群里有哪些Pod、哪些Node,它们的状态如何。client-go负责和K8s API Server通信,而informerlister则提供了一个高效、低延迟的本地缓存机制。informer会监听K8s资源的事件(创建、更新、删除),并把最新的状态同步到lister提供的本地缓存中。这样,你的调度器在做决策时,就不用每次都去查询API Server,大大提高了性能。

// 简化的 informer 和 lister 示例factory := informers.NewSharedInformerFactory(kubeClient, 0) // 0 表示不重新同步podInformer := factory.Core().V1().Pods().Informer()nodeLister := factory.Core().V1().Nodes().Lister()// 启动 informerstopCh := make(chan struct{})factory.Start(stopCh)factory.WaitForCacheSync(stopCh)

Plugin 接口: 这是调度器框架中所有插件需要实现的通用接口。

type Plugin interface {    Name() string}

你自定义的Filter、Score等都必须实现这个Name()方法,返回你的插件名称。

FilterPlugin 接口: 这是实现预选逻辑的关键。它有一个Filter方法,接收一个Pod和一个NodeInfo,返回这个节点是否适合该Pod,以及一个状态(比如错误信息)。

type FilterPlugin interface {    Plugin    Filter(ctx context.Context, state *CycleState, pod *v1.Pod, nodeInfo *NodeInfo) *Status}

比如,你要检查节点上是否有某个自定义标签,就可以在这里实现。

ScorePlugin 接口: 这是实现优选逻辑的关键。它有一个Score方法,接收一个Pod和一个NodeName,返回一个分数。分数越高,表示该节点越适合这个Pod。

type ScorePlugin interface {    Plugin    Score(ctx context.Context, state *CycleState, p *v1.Pod, nodeName string) (int64, *Status)}

这里你可以根据节点负载、剩余资源、亲和性等多种因素来打分。

调度器主循环: 你的自定义调度器本质上也是一个Go程序,它会启动一个调度器实例,监听K8s中那些schedulerName设置为你自定义调度器名称的Pod。当发现有这样的Pod时,它就会调用你注册的Filter和Score插件,执行调度逻辑,然后通过client-go将Pod绑定到选定的节点上。

开发流程:

定义你的调度策略: 明确你的调度器要解决什么问题,是资源利用率、成本优化、还是特殊硬件调度?这决定了你的Filter和Score算法。

创建你的Go模块: 初始化一个新的Go模块,引入k8s.io/kubernetes(或者更精确的k8s.io/kube-scheduler)和k8s.io/client-go等依赖。

实现自定义插件:

创建一个结构体,比如MyCustomSchedulerPlugin

让这个结构体实现framework.FilterPlugin和/或framework.ScorePlugin接口。

FilterScore方法中编写你的核心调度算法。

举个Filter插件的例子,检查节点是否有特定标签:

package mypluginimport (    "context"    v1 "k8s.io/api/core/v1"    "k8s.io/kubernetes/pkg/scheduler/framework")const (    Name = "MyCustomLabelFilter"    RequiredLabel = "my.domain/special-node")type MyCustomLabelFilter struct{}func (pl *MyCustomLabelFilter) Name() string {    return Name}// Filter 检查节点是否有 RequiredLabelfunc (pl *MyCustomLabelFilter) Filter(ctx context.Context, state *framework.CycleState, pod *v1.Pod, nodeInfo *framework.NodeInfo) *framework.Status {    if _, ok := nodeInfo.Node().Labels[RequiredLabel]; !ok {        return framework.NewStatus(framework.UnschedulableAndUnresolvable, "node does not have required label")    }    return framework.NewStatus(framework.Success)}// New 创建一个新的 MyCustomLabelFilter 插件实例func New(args runtime.Object, handle framework.Handle) (framework.Plugin, error) {    return &MyCustomLabelFilter{}, nil}

注册插件到调度器工厂: 你需要编写一个main函数,通过framework.NewFramework来构建调度器框架实例,并把你实现的插件注册进去。

配置你的调度器: 创建一个policy.config文件,告诉K8s调度器你的插件名称和启用顺序。

编译和部署: 将你的Go程序编译成二进制文件,并部署到K8s集群中,通常以Deployment的形式运行。别忘了给你的Deployment配置ServiceAccount和RBAC权限,让它能够操作Pod和Node资源。

整个过程下来,你会发现,虽然看起来步骤不少,但K8s调度器框架的模块化设计,让我们可以非常专注于核心调度算法的实现,而不用过多地操心K8s内部的复杂机制。

如何设计高效的调度算法来优化资源利用率?

设计高效的调度算法,这可真是个艺术活儿,也是自定义调度器的核心价值所在。它不单单是把Pod扔到某个节点上,更是要让整个集群的资源利用率达到最优,同时兼顾性能、成本和业务需求。

核心思想:过滤(Filter)与评分(Score)的艺术

我们前面提到了FilterScore。它们就像是两道关卡:Filter是粗筛,快速排除不符合基本条件的节点;Score是精筛,在通过初筛的节点中,根据更复杂的指标进行打分,选出“最佳”的那个。

精妙的过滤(Predicates/Filter):

资源适配性: 最基本的当然是检查节点的CPU、内存、存储等资源是否满足Pod的需求。但更高级的过滤,可以检查是否有特定的GPU型号、FPGA,甚至是不是在某个物理机架上。比如说,你的Pod需要一个NVIDIA A100 GPU,你就可以在Filter里检查node.Labels或者node.Status.Capacity有没有对应的信息。亲和性与反亲和性: K8s自带的节点亲和性和反亲和性已经很强大,但如果你有更复杂的业务逻辑,比如某些Pod必须和另一些Pod在同一个物理服务器上(数据本地性),或者绝不能在同一个服务器上(高可用),你可以在Filter中实现自定义的PodAffinityPodAntiAffinity逻辑,甚至扩展到跨集群的亲和性判断。自定义条件: 比如,你有一些“维护中”的节点,或者“已达到最大租户数”的节点,这些都可以通过自定义标签或注解在Filter阶段直接排除掉。我之前就写过一个Filter,专门用来检查节点是否属于某个特定的“集群池”,不符合的直接踢掉。

智能的评分(Priorities/Score):

资源均衡与集中:“最少请求”: 倾向于将Pod调度到那些资源使用率最低的节点上。这有助于将工作负载分散到整个集群,避免少数节点过载,提高整体稳定性。“最多请求”(Bin-Packing): 倾向于将Pod调度到那些资源使用率相对较高的节点上,尽可能将节点“填满”。这样可以腾出更多的空闲节点,方便关机省电,或者为未来更大的工作负载预留空间。这两种策略各有优劣,取决于你的业务目标是追求稳定性还是资源成本。“平衡资源”: 综合考虑CPU和内存的利用率,力求让节点在这两种资源上的使用率都相对均衡,避免出现“CPU利用率很高但内存空闲”或反之的情况。数据本地性: 如果你的Pod需要访问大量数据,那么把它调度到数据所在的节点或离数据源最近的节点,可以显著减少网络延迟,提高性能。你可以根据存储卷的拓扑信息(如PV的nodeAffinity)来打分。镜像本地性: 如果节点上已经缓存了Pod所需的容器镜像,那么调度到这个节点可以省去镜像下载的时间,加速Pod启动。这在CI/CD场景下特别有用。成本优化: 如果你的集群是混合了不同计费模式(如按需实例、竞价实例)的节点,你可以给竞价实例更高的分数,优先使用它们来降低成本,同时配合Pod中断处理机制。业务优先级与QoS: 对于不同业务线或不同服务等级的Pod,可以赋予不同的优先级。高优先级的Pod可以优先获得资源,甚至可以抢占低优先级的Pod(这涉及到调度器框架中的Preemption插件,比较复杂)。

一些设计上的思考点:

指标的选择: 你需要什么指标来指导调度?是CPU利用率、内存使用率、还是自定义的带宽、IOPS?这些指标如何获取?(通常通过Prometheus等监控系统拉取,或者直接从NodeStatus中获取)。权重的分配: 在Score阶段,你可能有多个打分维度。比如,节点剩余资源、镜像本地性、成本,它们各自的权重是多少?是资源利用率最重要,还是成本最重要?这需要根据你的业务优先级来调整。动态调整: 优秀的调度算法不应该是一成不变的。它可能需要根据集群的整体负载、业务高峰期、甚至外部市场价格(

以上就是Golang实现K8s自定义调度器的秘诀 分享调度算法与资源优化策略的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1392913.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月15日 10:45:44
下一篇 2025年12月15日 10:45:57

相关推荐

  • CSS mask属性无法获取图片:为什么我的图片不见了?

    CSS mask属性无法获取图片 在使用CSS mask属性时,可能会遇到无法获取指定照片的情况。这个问题通常表现为: 网络面板中没有请求图片:尽管CSS代码中指定了图片地址,但网络面板中却找不到图片的请求记录。 问题原因: 此问题的可能原因是浏览器的兼容性问题。某些较旧版本的浏览器可能不支持CSS…

    2025年12月24日
    900
  • Uniapp 中如何不拉伸不裁剪地展示图片?

    灵活展示图片:如何不拉伸不裁剪 在界面设计中,常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。 对于不同尺寸的图片,可以采用以下处理方式: 极端宽高比:撑满屏幕宽度或高度,再等比缩放居中。非极端宽高比:居中显示,若能撑满则撑满。 然而,如果需要不拉伸不…

    2025年12月24日
    400
  • 如何让小说网站控制台显示乱码,同时网页内容正常显示?

    如何在不影响用户界面的情况下实现控制台乱码? 当在小说网站上下载小说时,大家可能会遇到一个问题:网站上的文本在网页内正常显示,但是在控制台中却是乱码。如何实现此类操作,从而在不影响用户界面(UI)的情况下保持控制台乱码呢? 答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体,并通过在客户端…

    2025年12月24日
    800
  • 如何在地图上轻松创建气泡信息框?

    地图上气泡信息框的巧妙生成 地图上气泡信息框是一种常用的交互功能,它简便易用,能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。 利用地图库的原生功能 大多数地图库,如高德地图,都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现: 高德地图 JS API 参考文…

    2025年12月24日
    400
  • 如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画?

    如何实现元素scrollleft变化时的平滑动画效果? 在许多网页应用中,滚动容器的水平滚动条(scrollleft)需要频繁使用。为了让滚动动作更加自然,你希望给scrollleft的变化添加动画效果。 解决方案:scroll-behavior 属性 要实现scrollleft变化时的平滑动画效果…

    2025年12月24日
    000
  • 如何为滚动元素添加平滑过渡,使滚动条滑动时更自然流畅?

    给滚动元素平滑过渡 如何在滚动条属性(scrollleft)发生改变时为元素添加平滑的过渡效果? 解决方案:scroll-behavior 属性 为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码: click the button to slide right!…

    2025年12月24日
    500
  • 为什么设置 `overflow: hidden` 会导致 `inline-block` 元素错位?

    overflow 导致 inline-block 元素错位解析 当多个 inline-block 元素并列排列时,可能会出现错位显示的问题。这通常是由于其中一个元素设置了 overflow 属性引起的。 问题现象 在不设置 overflow 属性时,元素按预期显示在同一水平线上: 不设置 overf…

    2025年12月24日 好文分享
    400
  • 网页使用本地字体:为什么 CSS 代码中明明指定了“荆南麦圆体”,页面却仍然显示“微软雅黑”?

    网页中使用本地字体 本文将解答如何将本地安装字体应用到网页中,避免使用 src 属性直接引入字体文件。 问题: 想要在网页上使用已安装的“荆南麦圆体”字体,但 css 代码中将其置于第一位的“font-family”属性,页面仍显示“微软雅黑”字体。 立即学习“前端免费学习笔记(深入)”; 答案: …

    2025年12月24日
    000
  • 如何选择元素个数不固定的指定类名子元素?

    灵活选择元素个数不固定的指定类名子元素 在网页布局中,有时需要选择特定类名的子元素,但这些元素的数量并不固定。例如,下面这段 html 代码中,activebar 和 item 元素的数量均不固定: *n *n 如果需要选择第一个 item元素,可以使用 css 选择器 :nth-child()。该…

    2025年12月24日
    200
  • 使用 SVG 如何实现自定义宽度、间距和半径的虚线边框?

    使用 svg 实现自定义虚线边框 如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片,但是这种方法存在引入外部资源、性能低下的缺点。 为了避免上述问题,可以使用 svg(可缩放矢量图形)来创建纯代码实现。一种方…

    2025年12月24日
    100
  • 如何让“元素跟随文本高度,而不是撑高父容器?

    如何让 元素跟随文本高度,而不是撑高父容器 在页面布局中,经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中,父容器被较高的图片撑开,而文本的高度没有被考虑。本问答将提供纯css解决方案,让图片跟随文本高度,确保父容器的高度不会被图片影响。 解决方法 为了解决这个问题,需要将图片从文档流中脱离…

    2025年12月24日
    000
  • 为什么我的特定 DIV 在 Edge 浏览器中无法显示?

    特定 DIV 无法显示:用户代理样式表的困扰 当你在 Edge 浏览器中打开项目中的某个 div 时,却发现它无法正常显示,仔细检查样式后,发现是由用户代理样式表中的 display none 引起的。但你疑问的是,为什么会出现这样的样式表,而且只针对特定的 div? 背后的原因 用户代理样式表是由…

    2025年12月24日
    200
  • inline-block元素错位了,是为什么?

    inline-block元素错位背后的原因 inline-block元素是一种特殊类型的块级元素,它可以与其他元素行内排列。但是,在某些情况下,inline-block元素可能会出现错位显示的问题。 错位的原因 当inline-block元素设置了overflow:hidden属性时,它会影响元素的…

    2025年12月24日
    000
  • 为什么 CSS mask 属性未请求指定图片?

    解决 css mask 属性未请求图片的问题 在使用 css mask 属性时,指定了图片地址,但网络面板显示未请求获取该图片,这可能是由于浏览器兼容性问题造成的。 问题 如下代码所示: 立即学习“前端免费学习笔记(深入)”; icon [data-icon=”cloud”] { –icon-cl…

    2025年12月24日
    200
  • 为什么使用 inline-block 元素时会错位?

    inline-block 元素错位成因剖析 在使用 inline-block 元素时,可能会遇到它们错位显示的问题。如代码 demo 所示,当设置了 overflow 属性时,a 标签就会错位下沉,而未设置时却不会。 问题根源: overflow:hidden 属性影响了 inline-block …

    2025年12月24日
    000
  • 如何利用 CSS 选中激活标签并影响相邻元素的样式?

    如何利用 css 选中激活标签并影响相邻元素? 为了实现激活标签影响相邻元素的样式需求,可以通过 :has 选择器来实现。以下是如何具体操作: 对于激活标签相邻后的元素,可以在 css 中使用以下代码进行设置: li:has(+li.active) { border-radius: 0 0 10px…

    2025年12月24日
    100
  • 为什么我的 CSS 元素放大效果无法正常生效?

    css 设置元素放大效果的疑问解答 原提问者在尝试给元素添加 10em 字体大小和过渡效果后,未能在进入页面时看到放大效果。探究发现,原提问者将 CSS 代码直接写在页面中,导致放大效果无法触发。 解决办法如下: 将 CSS 样式写在一个单独的文件中,并使用 标签引入该样式文件。这个操作与原提问者观…

    2025年12月24日
    000
  • 如何模拟Windows 10 设置界面中的鼠标悬浮放大效果?

    win10设置界面的鼠标移动显示周边的样式(探照灯效果)的实现方式 在windows设置界面的鼠标悬浮效果中,光标周围会显示一个放大区域。在前端开发中,可以通过多种方式实现类似的效果。 使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

    2025年12月24日
    200
  • 为什么我的 em 和 transition 设置后元素没有放大?

    元素设置 em 和 transition 后不放大 一个 youtube 视频中展示了设置 em 和 transition 的元素在页面加载后会放大,但同样的代码在提问者电脑上没有达到预期效果。 可能原因: 问题在于 css 代码的位置。在视频中,css 被放置在单独的文件中并通过 link 标签引…

    2025年12月24日
    100
  • 为什么我的 Safari 自定义样式表在百度页面上失效了?

    为什么在 Safari 中自定义样式表未能正常工作? 在 Safari 的偏好设置中设置自定义样式表后,您对其进行测试却发现效果不同。在您自己的网页中,样式有效,而在百度页面中却失效。 造成这种情况的原因是,第一个访问的项目使用了文件协议,可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

    2025年12月24日
    000

发表回复

登录后才能评论
关注微信