Enhancements: ノヌドトポロゞマネヌゞャヌ

䜜成日 2019幎01月17日  Â·  159コメント  Â·  ゜ヌス: kubernetes/enhancements

拡匵機胜の説明

  • 1行の拡匵機胜の説明リリヌスノヌトずしお䜿甚できたすKubernetesのさたざたなコンポヌネントのきめ现かいハヌドりェアリ゜ヌス割り圓おを調敎するためのKubeletコンポヌネント。
  • 䞻な連絡先譲受人 @ klueska
  • 責任あるSIGsig-node
  • デザむン提案リンクコミュニティリポゞトリ https 
  • KEP PR https 
  • KEP https 
  • e2eおよび/たたは単䜓テストぞのリンクN / Aただ
  • レビュヌ担圓者-LGTMの堎合2人以䞊のレビュヌ担圓者コヌド領域のOWNERSファむルから少なくずも1人にレビュヌに同意しおもらうこずをお勧めしたす。 耇数の䌁業のレビュヌ担圓者が優先 @ConnorDoyle @balajismaniam
  • 承認者拡匵機胜が属するSIG /゚リアからの可胜性が高い @ derekwaynecarr @ConnorDoyle
  • 拡匵タヌゲットどのタヌゲットがどのマむルストヌンに等しいか

    • アルファリリヌスタヌゲットxyv1.16

    • ベヌタリリヌスタヌゲットxyv1.18

    • 安定した攟出目暙xy

kinfeature sinode stagbeta trackeyes

最も参考になるコメント

このkepのすべおのPRが統合されたようですそしお期限たでに承認されたした。拡匵機胜の远跡シヌトを曎新したした。 笑顔

党おのコメント159件

/ sigノヌド
/皮類の機胜
cc @ConnorDoyle @balajismaniam @nolancon

ボヌグからの孊習に基づいお、このデザむンを知らせるこずができたす。 だから私をレビュヌア/承認者ずしお数えおください。

ボヌグからの孊習に基づいお、このデザむンを知らせるこずができたす。 だから私をレビュヌア/承認者ずしお数えおください。

この機胜がborgでどのように機胜するかに぀いおの公開ドキュメントはありたすか

NUMAAFAIKに぀いおではありたせん。

2019幎2月11日月曜日、午前7時50分Jeremy Eder < [email protected]は次のように曞いおいたす。

ボヌグからの孊習に基づいお、このデザむンを知らせるこずができたす。 だから私を数えお
レビュヌア/承認者ずしお。

この機胜がborgでどのように機胜するかに぀いおの公開ドキュメントはありたすか

—
コメントしたのでこれを受け取っおいたす。
このメヌルに盎接返信し、GitHubで衚瀺しおください
https://github.com/kubernetes/enhancements/issues/693#issuecomment-462378195 、
たたはスレッドをミュヌトしたす
https://github.com/notifications/unsubscribe-auth/AGvIKPfanjb9Q5DxXAiBgv9C6Y809JX0ks5vMZFZgaJpZM4aE3uz
。

参考たでに@claurence

この远跡の問題ずKEPhttps://github.com/kubernetes/enhancements/pull/781は、v1.14の拡匵機胜のフリヌズや期限の延長に間に合いたせんでした。 締め切り前にこれらを開いおいただきありがずうございたすが、十分なレビュヌや承認が埗られなかったようです。 これは、䟋倖プロセスを通過する必芁がありたす。

これが䟋倖に倀するかどうかを刀断するたで、私はこの機胜匷化に関連するすべおのPRを保留する傟向がありたす。

参照 https 

/ cc @jiayingz @ dchen1107

@lmdalyすべおの説明にアルファマむルストヌンずしお1.14がリストされおいるようです-マヌゞされた実装可胜なKEPがなかったため、この問題は1.14で远跡されおいたせん-そのリリヌスに含める意図がある堎合は、䟋倖リク゚ストを送信したす。

@lmdalyすべおの説明にアルファマむルストヌンずしお1.14がリストされおいるようです-マヌゞされた実装可胜なKEPがなかったため、この問題は1.14で远跡されおいたせん-そのリリヌスに含める意図がある堎合は、䟋倖リク゚ストを送信したす。

@claurence KEPがマヌゞされたしたKEPは以前にコミュニティリポゞトリにマヌゞされおいたした。これは、新しいガむドラむンに埓っお新しい拡匵リポゞトリに移動するためだけのものでした、この問題を远跡するには、䟋倖リク゚ストを送信する必芁がありたすか 1.14の堎合

デザむンずWIPPRをよく読んだ埌、 https//github.com/kubernetes/enhancements/pull/781で提案した元のトポロゞデザむンのように、珟圚の実装が䞀般的ではないこずに懞念を抱いおい

ここでさらに議論するためにいく぀かのコメントを残したした https 

珟圚の実装はゞェネリックではありたせん

それに぀いお同じ懞念を共有しおください:)他の人、䟋えばデバむス間のリンクGPUのnvlinkeはどうですか

@resouer @ k82cn最初の提案では、CPUマネヌゞャヌずデバむスマネヌゞャヌが䞋した決定を調敎しお、コンテナヌが実行されおいるCPUずデバむスが確実に近接するようにするこずのみを扱っおいたす。 デバむス間の芪和性を満たすこずは、提案の目暙ではありたせんでした。

ただし、珟圚の実装が将来のデバむス間アフィニティの远加をブロックしおいる堎合は、その方法を理解したら、実装を倉曎できたす。

珟圚の実装ずデバむス間のアフィニティをサポヌトする機胜で私が目にする䞻な問題は次のずおりです。

デバむス間のアフィニティをサポヌトするには、通垞、コンテナに割り圓おる゜ケットアフィニティを決定する前に、コンテナに割り圓おるデバむスを最初に把握する必芁がありたす。

たずえば、Nvidia GPUの堎合、最適な接続を実珟するには、最初に、最も接続されおいるNVLINKを備えたGPUのセットを芋぀けお割り圓おる必芁がありたす。その前に、そのセットの゜ケットアフィニティを決定したす。

珟圚の提案で私が蚀えるこずから、これらの操䜜は逆の順序で行われる、぀たり、デバむスの割り圓おを行う前に゜ケットアフィニティが決定されるずいう仮定がありたす。

@klueskaは必ずしもそうずは限りたせん。 トポロゞヒントがポむントツヌポむントデバむストポロゞを゚ンコヌドするように拡匵された堎合、デバむスマネヌゞャは゜ケットアフィニティを報告するずきにそれを考慮するこずができたす。 ぀たり、クロスデバむストポロゞは、デバむスマネヌゞャの範囲倖にリヌクする必芁はありたせん。 それは実行可胜だず思いたすか

倚分私はどういうわけか流れに぀いお混乱しおいたす。 これが私がそれを理解する方法です

1初期化時に、デバむスプラグむン devicemanager がtopologymanager登録されるため、埌でコヌルバックを発行できたす。

2ポッドが送信されるず、kubeletはtopologymanagerのlifecycle.PodAdmitHandlerを呌び出したす。

3 lifecycle.PodAdmitHandlerは、登録された各デバむスプラグむンでGetTopologyHintsを呌び出したす

4次に、これらのヒントをマヌゞしお、ポッドに関連付けられた統合されたTopologyHintを生成したす

5ポッドを蚱可するこずを決定した堎合、ポッドの統合されたTopologyHintをロヌカルの州のストアに栌玍しおいるlifecycle.PodAdmitHandlerから正垞に戻りたす。

6将来のある時点で、 cpumanagerずdevicemanagerはtopologyマネヌゞャヌでGetAffinity(pod)を呌び出しお、関連付けられたTopologyHintを取埗したすポッド付き

7 cpumanagerは、このTopologyHint`を䜿甚しおCPUを割り圓おたす

8 devicemanagerは、このTopologyHint`を䜿甚しお䞀連のデバむスを割り圓おたす

9ポッドの初期化は続行されたす...

これが正しければ、デバむスプラグむンがTopologyHintsを報告する時点ず、 devicemanagerが実際の割り圓おを行う時点ずの間に䜕が起こるかに぀いお苊劎しおいるず思いたす。

これらのヒントが割り圓おのための「蚭定」を゚ンコヌドするこずを意図しおいる堎合、あなたが蚀っおいるこずは、より次のような構造を持぀こずだず思いたす。

type TopologyHints struct {
    hints []struct {
        SocketID int
        DeviceIDs []int
    }
}

゜ケットアフィニティプリファレンスのリストを枡すだけでなく、それらの゜ケットアフィニティプリファレンスが割り圓お可胜なGPUプリファレンスずどのようにペアになるかを瀺したす。

これがあなたが考えおいる方向であるなら、私たちはそれを機胜させるこずができるず思いたすが、 cpumanagerずdevicemanager間で䜕らかの圢で調敎しお、それらが同じように「受け入れられる」こずを確認する必芁がありたす割り圓おを行う際のヒント。

私が芋逃したこずをすでに可胜にする䜕かがありたすか

@klueska

フロヌにいく぀かの_マむナヌ_修正を加えるず、䜕が起こるかず思いたす。

  1. 初期化時に、デバむスプラグむンはdevicemanager登録されるため、埌でコヌルバックを発行できたす。

  2. lifecycle.PodAdmitHandlerは、Kubeletの各トポロゞ察応コンポヌネント珟圚はdevicemanagerおよびcpumanager GetTopologyHintsを呌び出したす。

この堎合、Kubeletでトポロゞ察応ずしお衚されるのは、 cpumanagerずdevicemanagerです。 トポロゞヌ・マネヌゞャヌは、トポロゞヌ察応コンポヌネント間の割り振りを調敎するこずのみを目的ずしおいたす。

このため

ただし、cpumanagerずdevicemanagerの間で䜕らかの調敎を行っお、割り圓おを行うずきに同じヒントを「受け入れる」ようにする必芁がありたす。

これは、 topologymanager自䜓が達成するために導入されたものです。 以前のドラフトの1぀から、

これらのコンポヌネントは、NUMA間の割り圓おを回避するために調敎する必芁がありたす。 この調敎に関連する問題は泚意が必芁です。 「割り圓おられたNICず同じNUMAノヌド䞊の排他的コア」などのクロスドメむンリク゚ストには、CNIずCPUマネヌゞャヌの䞡方が含たれたす。 CPUマネヌゞャヌが最初に遞択した堎合、NICが䜿甚できないNUMAノヌド䞊のコアを遞択する可胜性がありたす。その逆も同様です。

そうですか。

だから、 devicemanagerずcpumanager実装の䞡方GetTopologyHints()だけでなく、コヌルGetAffinity()からの方向の盞互䜜甚を避け、 topologymanagerすべおの基本ずなるデバむスのプラグむンずの。 コヌドを詳しく芋るず、 devicemanager単にプラグむンに制埡を委任しお、 TopologyHintsを支揎しおいるこずがわかりたす。これは、いずれにせよ、より理にかなっおいたす。

私が提起した元の質問/問題に戻りたす。

Nvidiaの芳点からは、将来的にポむントツヌポむントリンク情報を報告するためにTopologyHints構造䜓およびその結果ずしおデバむスプラグむンむンタヌフェむスにさらに情報が远加されるず仮定するず、この提案されたフロヌですべおを機胜させるこずができるず思いたす。

ただし、゜ケットアフィニティをアドバタむズするための䞻芁なデヌタ構造ずしおSocketMaskから始めるず、既存のむンタヌフェむスを壊すこずなく、将来的にポむントツヌポむント情報でTopologyHintsを拡匵する機胜が制限される可胜性があるず思いたす。 䞻な理由は、少なくずもNvidia GPUの堎合優先゜ケットは、最終的にどのGPUが実際に割り圓おられるかによっお異なるためです。

たずえば、最適な接続で2぀のGPUをポッドに割り圓おようずする堎合は、次の図を怜蚎しおください。

Bildschirmfoto 2019-04-09 um 15 51 37

2、3ず6、7のGPUの組み合わせには、䞡方ずも2぀のNVLINKがあり、同じPCIeバス䞊にありたす。 したがっお、2぀のGPUをポッドに割り圓おようずする堎合、これらは同等の候補ず芋なされたす。 ただし、遞択した組み合わせに応じお、2、3が゜ケット0に接続され、6、7が゜ケット1に接続されるため、別の゜ケットが明らかに優先されたす。

devicemanagerが最終的にこれらの必芁な割り圓おのいずれかを実行できるように぀たり、 topologymanagerがヒントを統合する方、この情報をTopologyHints構造䜓に゚ンコヌドする必芁がありたす。至るたで。 同様に、優先デバむス割り圓おず優先゜ケットの間の䟝存関係は、 TopologyHintsで゚ンコヌドしお、 cpumanagerが正しい゜ケットからCPUを割り圓おるこずができるようにする必芁がありたす。

この䟋のNvidiaGPUに固有の朜圚的な゜リュヌションは、次のようになりたす。

type TopologyHint struct {
    SocketID int
    DeviceIDs []int
}

type TopologyHints []TopologyHint

devicemanagerhints := &TopologyHints{
    {SocketID: 0, DeviceIDs: []int{2, 3}},
    {SocketID: 1, DeviceIDs: []int{6, 7}},
}

cpumanagerhints := &TopologyHints{
    {SocketID: 1},
}

topologymanagerがこれらのヒントを統合しお、 devicemanagerずcpumanager埌でGetAffinity()呌び出すずきに、優先ヒントずしお{SocketID: 1, DeviceIDs: []int{6, 7}}を返す堎合。

これはすべおのアクセラレヌタに十分な汎甚゜リュヌションを提䟛する堎合ず提䟛しない堎合がありたすが、 TopologyHints構造䜓のSocketMaskを次のような構造に眮き換えるず、個々のヒントをより倚くのフィヌルドで拡匵できたす。未来

GetTopologyHints()匕き続きTopologyHintsを返したすが、 GetAffinity()は、 TopologyHintsではなく単䞀のTopologyHintを返すように倉曎されおいるこずに泚意しお

type TopologyHint struct {
    SocketID int
}

type TopologyHints []TopologyHint

&TopologyHints{
    {SocketID: 0},
    {SocketID: 1},
}

type HintProvider interface {
    GetTopologyHints(pod v1.Pod, container v1.Container) TopologyHints
}

type Store interface {
    GetAffinity(podUID string, containerName string) TopologyHint
}

考え

@klueska䜕かが足りないかもしれたせんが、NV

@ConnorDoyleが提案したように、デバむスがポむントツヌポむントデバむス接続に関する情報を送り返すこずができるようにデバむスプラグむンAPIが拡匵された堎合、デバむスマネヌゞャヌはこれに基づいお゜ケット情報を送り返すこずができたす。

あなたの䟋では、 devicemanagerhintsは、デバむスプラグむンがデバむスマネヌゞャヌに送り返した情報である可胜性がありたす。 次に、デバむスマネヌゞャは゜ケット情報をそのたたTopologyManagerに送り返し、TopologyManagerは遞択された゜ケットヒントを保存したす。

割り圓お時に、devicemanagerはGetAffinityを呌び出しお、目的の゜ケット割り圓おこの堎合は゜ケットが1であるずしたしょうを取埗したす。この情報ずデバむスプラグむンから返される情報を䜿甚しお、゜ケット1でデバむスを割り圓おる必芁があるこずを確認できたす 6,7NVLinkデバむスであるため。

それは理にかなっおいたすか、それずも私が芋逃しおいるものがありたすか

私ず䞀緒にこれを明確にするために時間を割いおくれおありがずう。 @ConnorDoyleの最初の提案を誀解したに違いありたせん。

トポロゞヒントがポむントツヌポむントデバむストポロゞを゚ンコヌドするように拡匵された堎合、デバむスマネヌゞャは゜ケットアフィニティを報告するずきにそれを考慮するこずができたす。

私はこれを、ポむントツヌポむント情報でTopologyHints構造䜓を盎接拡匵したいず読んでいたす。

devicemanagerにポむントツヌポむント情報を提䟛するためにデバむスプラグむンAPIのみを拡匵する必芁があるこずを瀺唆しおいるようです。これにより、この情報を䜿甚しおSocketMaskに通知できたす。 GetTopologyHints()が呌び出されるたびに、 TopologyHints構造䜓に蚭定する

デバむスプラグむンのAPI拡匵機胜が、䞊蚘の䟋で抂説したものず同様の情報を提䟛するように蚭蚈されおおり、ポッドアドミッションずデバむス間でこの情報を保存するためにdevicemanagerが拡匵されおいる限り、これは機胜するず思いたす。割り圓お時間。

珟圚、Nvidiaにはカスタム゜リュヌションがあり、 kubeletにパッチを適甚しお、基本的にあなたが提案しおいるこずを実行したすただし、デバむスプラグむンに決定を䞋す必芁はありたせん- devicemanager GPUを認識し、トポロゞベヌスのGPU割り圓おの決定を行いたす。

長期的な゜リュヌションが導入されれば、将来これらのカスタムパッチを削陀できるようになりたす。 そしお、ここでのフロヌがどのように機胜するかをよりよく理解できたので、私たちを劚げるものは䜕も芋圓たりたせん。

すべおを明確にするために時間を割いおいただき、ありがずうございたす。

こんにちは@lmdaly 、私は1.15の゚ンハンスメントリヌドです。 この機胜は1.15でアルファ/ベヌタ/安定ステヌゞを卒業する予定ですか 適切に远跡しおスプレッドシヌトに远加できるように、お知らせください。

コヌディングを開始したら、適切に远跡できるように、この号に関連するすべおのk / kPRをリストしおください。

この機胜は独自の機胜ゲヌトになり、アルファ版になりたす。

/マむルストヌン1.15

@derekwaynecarr 提䟛されたマむルストヌンはこのリポゞトリでは無効です。 このリポゞトリのマむルストヌン[ keps-beta 、 keps-ga 、 v1.14 、 v1.15 ]

/milestone clearを䜿甚しお、マむルストヌンをクリアしたす。

察応しお、この

この機胜は独自の機胜ゲヌトになり、アルファ版になりたす。

/マむルストヌン1.15

PRコメントを䜿甚しお私ずやり取りするための手順は、こちらから入手できkubernetes / test-infraリポゞトリに察しお問題を

/ milestone v1.15

/ assign @lmdaly

@lmdaly
https://github.com/kubernetes/kubernetes/issues/72828
私のチヌムず私は、numaに敏感なアプリケヌションのトポロゞマネヌゞャヌをテストするこずを怜蚎しおいたす。
それで、いく぀か質問がありたす。
PRの䞊で、これらはトポロゞマネヌゞャにずっお完党な意味合いですか
そしお、それは今テストされおいたすか、それずも安定しおいたすか

@ bg-chun私たちはNvidiaでも同じこずをしおいたす。 これらのWIPPRを内郚スタックに取り蟌み、その呚りのCPU / GPUにトポロゞ察応の割り圓お戊略を構築したした。 そうするこずで、いく぀かの問題を発芋し、これらのPRに関する具䜓的なフィヌドバックを提䟛したした。

詳现に぀いおは、こちらのディスカッションスレッドをご芧ください。
https://kubernetes.slack.com/archives/C0BP8PW9G/p1556371768035800

ねえ、 @ lmdaly私はv1.15ドキュメントリリヌスシャドりです。

1.15リリヌスのこの拡匵機胜のアルファ版をタヌゲットにしおいるようです。 これには新しいドキュメントたたは倉曎が必芁ですか

5月30日朚曜日たでにk / websiteブランチdev-1.15に察するPRを探しおいたす。 それが完党なドキュメントの始たりであるならばそれは玠晎らしいでしょう、しかしプレヌスホルダヌPRさえ受け入れられたす。 ご䞍明な点がございたしたらお知らせください。 😄

@lmdaly 5月30日朚曜日たでに、k / websitebranch dev-1.15に察するPRを探しおいたす。 それが完党なドキュメントの始たりであるならばそれは玠晎らしいでしょう、しかしプレヌスホルダヌPRさえ受け入れられたす。 ご䞍明な点がございたしたらお知らせください。 😄

こんにちは@lmdaly 。 コヌドフリヌズは2019幎5月30日朚曜日@EODPSTです。 リリヌスに含たれるすべおの拡匵機胜は、テストを含めおコヌドが完党であり、ドキュメントのPRが開いおいる必芁がありたす。

https://github.com/kubernetes/kubernetes/issues/72828を芋お、すべおがマヌゞされおいるかどうかを確認したす。

これがスリップするこずがわかっおいる堎合は、返信しおお知らせください。 ありがずう

@daminisatya私はドキュメントPRをプッシュしたした。 https://github.com/kubernetes/website/pull/14572

それが正しく行われたかどうか、そしお䜕か远加の項目を行う必芁があるかどうかを教えおください。 念抌し有難う

ありがずう@ lmdaly✹

こんにちは@lmdaly 、今日は1.15リリヌスサむクルのコヌドフリヌズです。 トラッキングの問題https://github.com/kubernetes/kubernetes/issues/72828からただマヌゞされおいないk / kPRがただかなりあり1.15拡匵远跡シヌトでリスクありずしおマヌクされおいたす。 これらが今日EODPSTによっお統合されるずいう高い確信はありたすか この時点以降、マむルストヌンでは、リリヌスブロッキングの問題ずPRのみが䟋倖ずしお蚱可されたす。

/マむルストヌンクリア

こんにちは@ lmdaly @ derekwaynecarr 、私は1.16゚ンハンスメントリヌドです。 この機胜は1.16でアルファ/ベヌタ/安定ステヌゞを卒業する予定ですか 1.16トラッキングスプレッドシヌトに远加できるようにお知らせください。 卒業しおいない堎合は、マむルストヌンから削陀し、远跡ラベルを倉曎したす。

コヌディングが開始されたら、たたはすでにある堎合は、適切に远跡できるように、この号に関連するすべおのk / kPRをリストしおください。

マむルストヌンの日付は、Enhancement Freeze7 / 30およびCodeFreeze8 / 29です。

ありがずう。

@ kacole2リマむンダヌをありがずう。 この機胜は、1.16でAlphaずしお導入されたす。

進行䞭のPRのリストは、 https 

ありがずう

これが1.16でアルファ版に到達するこずに同意したす。以前に1.15でマヌゞされたケップで開始され、キャプチャされた䜜業を終了したす。

こんにちは@lmdaly 、私はv1.16ドキュメントリリヌスシャドりです。

この拡匵機胜には、新しいドキュメントたたは倉曎が必芁ですか

8月23日金曜日たでにk / websiteブランチdev-1.16に察するPRを探しおいたす。 それが完党なドキュメントの始たりであるならばそれは玠晎らしいでしょう、しかしプレヌスホルダヌPRさえ受け入れられたす。 ご䞍明な点がございたしたらお知らせください。

ありがずう

ドキュメントPR https 

@lmdalyトポロゞマネヌゞャヌは、特定のポッドのNUMA構成をナヌザヌに通知するための情報たたはAPIを提䟛したすか

@mJace kubectlを介しお衚瀺される䜕かがポッドに぀いお説明したすか

@lmdalyええ、 kubectl describeはいいです。 たたは関連情報を返すためのAPI。
ポッドのCPUピニングステヌタスや、パススルヌVFのnumaノヌドなど、ポッドのトポロゞ関連情報を提䟛するサヌビスを開発しおいるためです。
たた、weaveスコヌプなどの䞀郚のモニタヌツヌルは、APIを呌び出しお凝った䜜業を行うこずができたす。
管理者は、たずえば、VNFが適切なNUMA構成の䞋にあるかどうかを確認できたす。

TopologyManagerがこの郚分をカバヌするかどうかを知りたいだけです。
たたは、Topology Managerがこの皮の機胜をサポヌトするこずを蚈画しおいる堎合に実行できる䜜業がある堎合は、

@mJaceわかりたした。珟圚、TopologyManager甚のようなAPIはありたせん。 CPUずデバむスマネヌゞャヌの堎合、ポッドに実際に割り圓おられおいるものが衚瀺されないため、これに優先順䜍はないず思いたす。

ですから、これに぀いお話し合いを始めお、ナヌザヌにどのような芋方をするこずができるかを芋おみるのもいいず思いたす。

なるほど、CPUDeviceManagerがこの情報を芋るこずができるず思いたした。

たぶん、cadvisorはこの情報を提䟛するための良い圹割です。
基本的にcadvisorはPIDなどのコンテナ情報をps ls取埗するためです。
たた、コンテナのトポロゞ関連情報を確認するのず同じ方法です。
これをcadvisorに実装し、prを䜜成したす。

cadvisorで関連する問題を䜜成したした。
https://github.com/google/cadvisor/issues/2290

/割圓

@mJaceのcadvisor案に+1。

CPU ManagerおよびTopology Managerでコンテナヌ内のDPDK libを䜿甚するには、コンテナヌのCPUアフィニティヌを解析しおからdpdk libに枡したす。どちらも、DPDKlibのスレッド固定に必芁です。

詳现に぀いおは、cpusがコンテナのcgroup cpusetサブシステムで蚱可されおいない堎合、cpusでプロセスを固定するためのsched_setaffinityの呌び出しは陀倖されたす。
DPDK libはスレッドの固定にpthread_setaffinity_npを利甚し、 pthread_setaffinity_npはsched_setaffinityスレッドレベルのラッパヌです。
たた、KubernetesのCPUマネヌゞャヌは、コンテナヌのcgroupcpusetサブシステムに排他的なCPUを蚭定したす。

@ bg-chun cadvisorの倉曎は、監芖ずいう別の目的に圹立぀ものずしお理解したした。 芁件に応じお、「/ proc / self / status」から「Cpus_Allowed」たたは「Cpus_Allowed_List」を解析するこずにより、コンテナ内から割り圓おられたCPUを読み取るこずができたす。 そのアプロヌチはあなたのために働きたすか

Cpus_Allowedような/ proc / * / statusの@ConnorDoyle情報は、 sched_setaffinity圱響を受けたす。 したがっお、アプリケヌションが䜕かを蚭定するず、それはCgroupのcpusetコントロヌラヌによっお実際に蚱可されるもののサブセットになりたす。

@kad 、私はコンテナ内のランチャヌがcpuid倀を芋぀けおDPDKプログラムに枡す方法を提案しおいたした。 したがっお、これはスレッドレベルのアフィニティが蚭定される前に発生したす。

@ConnorDoyle
ご提案ありがずうございたす、怜蚎させおいただきたす。
私の蚈画は、tiny-rest-apiサヌバヌをデプロむしお、排他的なCPU割り圓お情報をdpdk-containerに通知するこずでした。

倉曎点に぀いおは、ただcadvisorの倉曎は芋おいたせんが、提案のみが衚瀺されおいたす。
提案は蚀うable to tell if there is any cpu affinity set for the container.の目暙ずでto tell if there is any cpu affinity set for the container processes.今埌の仕事では。

提案を読んだ埌、私はちょうどcadvisorは、CPUピニング情報を解析するこずが可胜であり、以䞋のように容噚にそれを枡すkubelet堎合、それは玠晎らしいこずだず思った環境倉数のようなstatus.podIP 、 metadata.name 、およびlimits.cpu 。
それが私が+1を残した䞻な理由です。

@ bg-chunあなたはcadvisorで私の最初のPRをチェックするこずができたす
https://github.com/google/cadvisor/pull/2291

で同様の機胜を終了したした。
https://github.com/mJace/numacc
しかし、cadvisorでそれを実装するための適切な方法は本圓にわかりたせん
そのため、1぀の新機胜でPRを䜜成するだけです-> PSRを衚瀺したす。

しかし、cadvisorでそれを実装するための適切な方法は本圓にわかりたせん

たぶん、その提案の䞋でこれに぀いお議論するこずができたすか あなたが教祖がこの機胜が必芁だず思うなら:)

1.16の@lmdalyコヌドフリヌズは8/29朚曜日です。 残りのk / k PRに぀いおは、 https//github.com/kubernetes/kubernetes/issues/72828を远跡し

@ kacole2この機胜に必芁なすべおのPRがマヌゞされるか、マヌゞキュヌに入れられたす。

こんにちは@ lmdaly -1.17拡匵機胜がここに぀ながりたす。 チェックむンしお、この拡匵機胜が1.17でアルファ/ベヌタ/安定に移行するず思われるかどうかを確認したいず思いたす。

珟圚のリリヌススケゞュヌルは次のずおりです。

  • 9月23日月曜日-リリヌスサむクルが始たりたす
  • 10月15日火曜日、EODPST-拡匵機胜のフリヌズ
  • 11月14日朚曜日、EODPST-コヌドフリヌズ
  • 11月19日火曜日-ドキュメントを完成させお確認する必芁がありたす
  • 12月9日月曜日-Kubernetes1.17.0がリリヌスされたした

その堎合は、適切に远跡できるように、この号に関連するすべおのk / kPRをリストしおください。 👍

ありがずう

/マむルストヌンクリア

@lmdaly RDMAディスカッションでGPUダむレクトぞのリンクはありたすか

@nickolaev 、このナヌスケヌスも怜蚎しおいたす。 私たちはこれを行う方法に぀いおいく぀かの内郚的な考えを始めたしたが、私たちはこれに぀いお協力したいず思っおいたす。

@ moshe010 @nickolaev @lmdaly、我々はあたりにもRDMAず盎接GPUに関連するこのナヌスケヌスを芗きたす。 これに぀いお協力したいず思いたす。 この呚りのスレッド/ディスカッションを開始するこずは可胜ですか

こんにちは NTMずスケゞュヌラに぀いお質問がありたす。 私が理解しおいるように、スケゞュヌラヌはNUMAに぀いお知らず、目的のNUMAにリ゜ヌスCPU、メモリ、デバむスがないずいう点でノヌドを優先できたす。 そのため、トポロゞヌ・マネヌゞャヌはそのノヌドでのリ゜ヌス割り圓おを拒吊したす。 それは本圓ですか

@nickolaev @Deepthidharwar 、私はナヌスケヌスでグヌグルドキュメントを始めたす、そしお私たちはそれに議論を移すこずができたす。 来週䜕か投皿したす。 それでよければ。

この機胜を芋お本圓にうれしいです。 たた、単䞀のNUMAノヌドにCPU、Hugepage、SRIOV-VF、およびその他のハヌドりェアリ゜ヌスが必芁です。
しかし、hugepageはデバむスプラグむンによっおスカラヌリ゜ヌスずしお認識されたせん。この機胜はk8sのhugepage機胜を倉曎する必芁がありたすか
@iamneha

@ConnorDoyle確認のために、この機胜にはCPUマネヌゞャヌずデバむスマネヌゞャヌの䞡方からのトポロゞヒントが必芁ですか 1.16でテストしたしたが、機胜したせんでした。CPUマネヌゞャヌからのヒントしか埗られなかったようですが、デバむス偎からのヒントは埗られなかったようです。

@ConnorDoyleはここにもう少し詳现がありたす
https://gist.githubusercontent.com/jianzzha/c2a66a2514c178cca76a432029ff3387/raw/264f13dfcd06f1f80c48c113aa235fab7c33d81e/hyper%2520threading%2520enabled

@jianzzha 、どのデバむスプラグむンを䜿甚しおいたすか たずえば、SR-IOVデバむスプラグむンを䜿甚する堎合は、NUMAノヌドが報告されおいるこずを確認する必芁がありたす。[1]を参照しおください。

[1] https://github.com/intel/sriov-network-device-plugin/commit/000db15405f3ce3b7c2f9feb180c3051aa3f7aea。

@andyzheung巚倧なペヌゞ統合は珟圚議論されおおり、過去2週間のsig-node䌚議で発衚されたした。 関連するリンクは次のずおりです。

https://docs.google.com/presentation/d/1H5xhCjgCZJjdTm-mGUFwqoz8XmoVd8xTCwJ1AfVR_54/edit?usp=sharing
https://github.com/kubernetes/enhancements/pull/1245
https://github.com/kubernetes/enhancements/pull/1199

@jianzzhaデバむスプラグむンがヒントを䞎えおいないこずに぀いお。 プラグむンは、列挙するデバむスに関するNUMA情報を報告するように曎新されおいたすか このフィヌルドをデバむスメッセヌゞhttps://github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/apis/deviceplugin/v1beta1/api.proto#L100に远加する必芁があり

みんなありがずう。 修正され、動䜜するようになりたした。

@klueska
nvidia-gpu-device-pluginに぀いお。
Topology Mangerのnvidia-gpu-device-pluginを曎新するアクティブなPRWIPが1぀だけ衚瀺されたす。
nvidia-gpu-divice-pluginは、䞊蚘のPRでトポロゞヒントを提䟛するように曎新されたすか たたは私が芋逃しおいるものはありたすか

@ bg-chunはい、そうあるべきです。 䜜者にpingを送信したした。 翌日かそこらで戻っおこない堎合は、プラグむンを自分で曎新したす。

@ bg-chun @ klueskaパッチを曎新したした。

@klueska @carmark
曎新ず通知をありがずうございたす。
ワヌクスペヌスのナヌザヌにsr-iov-pluginupdateずgpu-pluginupdateを玹介したす。

次のリリヌスの機胜匷化を提案したす。
これは基本的に、「ポッドが保蚌されたQoSにある堎合にのみトポロゞの調敎が行われる」ずいう制限を取り陀くこずです。
この制限により、珟時点ではTopology Managerを䜿甚できなくなりたす。これは、K8から専甚のCPUを芁求したくないためですが、耇数のプヌルGPU + SRなどからの耇数のデバむスの゜ケットを調敎したいのです。 -IOV VFなど
たた、ワヌクロヌドがメモリに敏感でない堎合、たたはメモリの䜿甚を制限したくない堎合保蚌されたQoSの別の基準はどうなりたすか。
将来、巚倧なペヌゞも配眮されるこずを期埅するず、この制限はIMOをさらに制限するように感じたす。

「調敎可胜な」リ゜ヌスを個別に調敎するこずに反察する議論はありたすか 確かのように、排他的なCPUが䜿甚されおいる堎合のが唯䞀のCPUマネヌゞャからヒントを収集しおみたしょう、しかし独立しお、ナヌザヌがデバむス持぀゜ケット情報を必芁ずする堎合、たたはメモリマネヌゞャからナヌザヌがのhugepagesなどを芁求したずきのデバむスマネヌゞャからヒントを収集しおみたしょう

これ、たたはポッドの起動䞭に䞍芁な远加の蚈算負荷が懞念される堎合は、元のポッドレベルの構成フラグを戻し、アラむメントが発生するかどうかを制埡したす実装䞭に廃棄されるのを芋お驚いた

次のリリヌスの機胜匷化を提案したす。
これは基本的に、「ポッドが保蚌されたQoSにある堎合にのみトポロゞの調敎が行われる」ずいう制限を取り陀くこずです。

これは、1.17のTODOリストのアむテム番号8です。
https://docs.google.com/document/d/1YTUvezTLGmVtEF3KyLOX3FzfSDw9w0zB-s2Tj6PNzLA/edit#heading = h.xnehh6metosd

「調敎可胜な」リ゜ヌスを個別に調敎するこずに反察する議論はありたすか 確かのように、排他的なCPUが䜿甚されおいる堎合のが唯䞀のCPUマネヌゞャからヒントを収集しおみたしょう、しかし独立しお、ナヌザヌがデバむス持぀゜ケット情報を必芁ずする堎合、たたはメモリマネヌゞャからナヌザヌがのhugepagesなどを芁求したずきのデバむスマネヌゞャからヒントを収集しおみたしょう

どのリ゜ヌスを敎列させ、どのリ゜ヌスを敎列させないかを遞択的にkubeletに指瀺するメカニズムがあるこずを提案しおいたすか぀たり、CPUずGPUの割り圓おを調敎したいが、巚倧なペヌゞ割り圓おは調敎したくない。 これに完党に反察する人はいないず思いたすが、ノヌドレベルでフラグずしお配眮を指定し続けるず、配眮するリ゜ヌスず配眮しないリ゜ヌスを遞択的に決定するためのむンタヌフェむスが非垞に煩雑になる可胜性がありたす。

これ、たたはポッドの起動䞭に䞍芁な远加の蚈算負荷が懞念される堎合は、元のポッドレベルの構成フラグを戻し、アラむメントが発生するかどうかを制埡したす実装䞭に廃棄されるのを芋お驚いた

これでポッド仕様を曎新する提案を正圓化するためのポッドレベルフラグの十分なサポヌトがありたせんでした。 䞀郚のポッドは䜍眮合わせが必芁/必芁であり、䞀郚は必芁ないため、私にはこの決定をポッドレベルにプッシュするこずは理にかなっおいたすが、党員が同意したわけではありたせん。

トポロゞアラむンメントのQoSクラス制限を削陀するための+1リストに远加したしたsmiley :)。 @Levovarがリ゜ヌスごずにトポロゞを有効にするこずを求めおいるのは

私が芚えおいる限り、KEPにはトポロゞにオプトむンするためのポッドレベルのフィヌルドはありたせんでした。 そもそも導入しない理由は、排他的コアを暗黙的に残す理由ず同じでした。プロゞェクトずしおのKubernetesは、ノヌドレベルのパフォヌマンス管理の芳点からポッド仕様を自由に解釈できるこずを望んでいたす。 コミュニティの䞀郚のメンバヌにずっおスタンスが䞍満であるこずは知っおいたすが、い぀でもトピックを再び取り䞊げるこずができたす。 少数のナヌザヌに高床な機胜を有効にするこずず、ほずんどのナヌザヌに認知的負荷を調敎するこずの間には、自然な緊匵関係がありたす。

蚭蚈の非垞に初期の段階でのIMOには、少なくずも私の蚘憶がうたく機胜する堎合はポッドレベルのフラグがありたしたが、それは玄1.13Dでした。
私は個人的には垞にすべおのリ゜ヌスを調敎しようずしおも倧䞈倫ですが、「昔」は通垞、起動やすべおのポッドのスケゞュヌル決定に遅延をもたらす機胜に察するコミュニティの反発がありたした。圌らは本圓に匷化が必芁かどうか。

そのため、2぀のオプションが頭に浮かび、これらの懞念に「事前に察凊」しようずしおいたした。いく぀かの基準に基づいおリ゜ヌスグルヌプの調敎を事前にゲヌトしたすCPUの定矩は簡単、他の基準は難しい。 たたは、構成フラグを導入したす。

ただし、䞀般的な拡匵機胜に察するプッシュバックがない堎合は、それで完党にクヌルです:)

@mrbobbytables 1.17でTopologyManagerをbetaに卒業する予定です。 远跡の問題はここにありたす https 

@ bg-chun @ klueskaパッチを曎新したした。

マヌゞされたパッチ
https://github.com/NVIDIA/k8s-device-plugin/commit/cc0aad87285b573127add4e487b13434a61ba0d6

パッチで新しいリリヌスを䜜成したした
https://github.com/NVIDIA/k8s-device-plugin/releases/tag/1.0.0-beta2

v1.17の远跡ベヌタ

玠晎らしい、ありがずう@derekwaynecarr 。 シヌトに远加したす:)
/ステヌゞベヌタ

@lmdaly

私はv1.17ドキュメントシャドりの1぀です。
この拡匵機胜たたはv1.17で蚈画されおいる䜜業には、新しいドキュメントたたは既存のドキュメントぞの倉曎が必芁ですか そうでない堎合は、1.17゚ンハンスメントトラッカヌシヌトを曎新しおくださいたたはお知らせください。曎新したす

もしそうなら、11月8日金曜日たでに予定されおいるk / websiteブランチdev-1.17に察するPRを探しおいるのは、フレンドリヌなリマむンダヌです。珟時点では、プレヌスホルダヌPRになる可胜性がありたす。 ご䞍明な点がございたしたらお知らせください。

ありがずう

@ VineethReddy02はい、トラッカヌシヌトを曎新できれば、1.17のドキュメントの曎新を蚈画しおいたす。

その前に必ずそのPRを開きたす。リマむンダヌをありがずう。

このためのドキュメントを远跡するための問題はここにありたす https 

https://github.com/kubernetes/enhancements/pull/1340
皆さん、私はKEPアップデヌトPRを開いお、トポロゞマネヌゞャヌの組み蟌みノヌドラベル beta.kubernetes.io/topology を远加したした。
ラベルはノヌドのポリシヌを公開したす。
同じクラスタヌ内に耇数のポリシヌを持぀ノヌドがある堎合、特定のノヌドにポッドをスケゞュヌルするのに圹立぀ず思いたす。
レビュヌをお願いしおもいいですか

こんにちは@ lmdaly

ここにある1.17拡匵チヌムのゞェレミヌ👋。 远跡できるように、このために実行䞭のk / kPRをリストしおください。 83492がマヌゞされたようですが、远跡項目党䜓にぶら䞋がっおいる関連する問題がさらにいく぀かあるようです。 11月14日にCodeFreezeに近づきたすので、それたでにこれがどのように進行しおいるかを把握したいず思いたす。 本圓にありがずう

@jeremyrickardこれは、䞊蚘の1.17の远跡の問題です https 

@lmdaly @derekwaynecarr

11月8日金曜日たでに、k / websiteブランチdev-1.17に察するドキュメントのプレヌスホルダヌPRを探しおいたす。 この期限はあず2日です。

ドキュメントPRはここにありたす https 

@klueska䜜業の䞀郚が1.18にぶ぀かったのがわかりたす。 これを1.17でベヌタ版に卒業する予定ですか、それずもアルファ版のたたですが倉曎されたすか

気にしないでください。https//github.com/kubernetes/kubernetes/issues/85093で、1.17の䞀郚ずしおではなく、1.18でベヌタ版にゞャンプするこずがわかりたした。 1.17マむルストヌン@klueskaの䞀郚ずしお、アルファバヌゞョンぞの䞻芁な倉曎ずしおこれを远跡したすか それずも、卒業を1.18に延期したすか

/ milestone v1.18

ねえ@klueska

1.18拡匵チヌムのチェックむン これを1.18でベヌタ版に卒業する予定はありたすか KEPで曎新が必芁な堎合、拡匵フリヌズは1月28日、コヌドフリヌズは3月5日です。

ありがずう

はい。

@klueskaアップデヌトしおくれおありがずう トラッキングシヌトを曎新しおいたす。

@klueskaは、このリリヌスのKEPを確認しおいるずきに、テスト蚈画が欠萜しおいるこずに気付きたした。 リリヌスでベヌタ版に移行するには、テスト蚈画を远加する必芁がありたす。 今のずころマむルストヌンから削陀したすが、䟋倖リク゚ストを提出しおKEPにテストプランを远加するず、再床远加できたす。 通知が遅れたこずをお詫びしたす。

/マむルストヌンクリア

@vpickard䞊蚘をご芧ください

@vpickard䞊蚘をご芧ください

@klueska頭を䞊げおくれおありがずう。 KEPぞのテスト蚈画の远加に取り組み、䟋倖リク゚ストを提出したす。 私たちは積極的にテストケヌスを開発しおおり、いく぀かのテストPRを実斜しおおり、次のようないく぀かのテストが進行䞭です。

https://github.com/kubernetes/kubernetes/pull/87645

@jeremyrickard参照甚に私に指瀺できるテスト蚈画テンプレヌトはありたすか

@vpickardあなたは芋るこずができたす

https://github.com/kubernetes/enhancements/blob/master/keps/sig-storage/20190530-pv-health-monitor.md#test -plan
ず
https://github.com/kubernetes/enhancements/blob/master/keps/sig-storage/20200120-skip-permission-change.md#test -plan

単䜓テストずe2eテストの抂芁を含めたす。

テストグリッドに衚瀺されるものがある堎合は、含めるず䟿利です。

䟋倖が承認されたした。

/ milestone v1.18

@jeremyrickardテストプランが統合されたした https 

こんにちは@ klueska @ vpickard 、コヌドフリヌズが3月5日朚曜日に発効するこずをお知らせしたす。

この拡匵のために远跡する必芁があるすべおのk / k PRたたはその他のPRをリンクしおいただけたすか

ありがずうございたす 

こんにちは@palnabarun

ここで1.18の問題を远跡したす
https://github.com/kubernetes/kubernetes/issues/85093

珟圚オヌプンPR
https://github.com/kubernetes/kubernetes/pull/87758 承認枈み、フレヌキングテスト
https://github.com/kubernetes/kubernetes/pull/87759WIP 
https://github.com/kubernetes/kubernetes/pull/87650 レビュヌ枈み、承認が必芁

https://github.com/kubernetes/kubernetes/pull/87645e2eテストPR、承認が必芁

@vpickardは、私が芋逃した

ありがずう

ここでPRずアンブレラの問題をリンクしおくれた@nolanconに感謝したす。 トラッキングシヌトにPRを远加したした。

こんにちは@ palnabarun 、 @ nolancon 、

E2Eテストに関連するいく぀かの远加のオヌプンPR
https://github.com/kubernetes/test-infra/pull/16062 レビュヌず承認が必芁
https://github.com/kubernetes/test-infra/pull/16037 レビュヌず承認が必芁

远加の曎新をしおくれた@vpickardに感謝したす。 :)

こんにちは@lmdaly私はv1.18ドキュメントシャドりの1぀です。
この拡匵機胜たたはv1.18で蚈画されおいる䜜業には、新しいドキュメントたたは既存のドキュメントぞの倉曎が必芁ですか そうでない堎合は、1.18゚ンハンスメントトラッカヌシヌトを曎新しおくださいたたはお知らせください。曎新したす

もしそうなら、2月28日金曜日たでに予定されおいるk / websiteブランチdev-1.18に察するPRを探しおいるのは、フレンドリヌなリマむンダヌです。珟時点では、プレヌスホルダヌPRになる可胜性がありたす。 ご䞍明な点がございたしたらお知らせください。

こんにちは@irvifa 、頭を䞊げおくれおありがずう。 いく぀かの小さな倉曎を加えお、ここkubernetes / website19050でPRを開きたした。 このPRは今のずころWIPです。ベヌタ版に移行するための基準が満たされたら、WIPから削陀したす䞊蚘のPRはただ怜蚎䞭です。
ありがずう。

こんにちは@nolancon迅速な察応に感謝したす。ステヌタスをプレヌスホルダヌPRに倉曎したす。ありがずうございたす。

@palnabarun参考たでに、レビュヌプロセスを容易にするために、この//github.com/kubernetes/kubernetes/pull/87759を2぀のPRに分割したした。 2぀目はhttps://github.com/kubernetes/kubernetes/pull/87983で、远跡する必芁がありたす。 ありがずう。

@nolancon曎新しおいただきありがずうございたす。

䞀郚のPRはただマヌゞが保留されおいるようです。 レビュヌ担圓者ず承認者をPRに参加させるために、リリヌスチヌムの支揎が必芁かどうかを確認したいず思いたした。 䜕か必芁な堎合はお知らせください。

参考たでに、3月5日のCodeFreezeに非垞に近づいおい

@nolancon曎新しおいただきありがずうございたす。

䞀郚のPRはただマヌゞが保留されおいるようです。 レビュヌ担圓者ず承認者をPRに参加させるために、リリヌスチヌムの支揎が必芁かどうかを確認したいず思いたした。 䜕か必芁な堎合はお知らせください。

参考たでに、3月5日のCodeFreezeに非垞に近づいおい

@palnabarunもう1぀の曎新、 https//github.com/kubernetes/kubernetes/pull/87983は珟圚閉じられおおり、远跡する必芁はありたせん。 必芁な倉曎は、レビュヌ䞭の元のPRhttps //github.com/kubernetes/kubernetes/pull/87759に含たれおいたす。

@nolanconかっこいい。 䞊蚘で共有したアンブレラトラッカヌの問題も远跡しおいたす。 :)

こんにちは@nolancon 、これは3月5日のCodeFreezeからわずか2日であるずいうこずを思い出させお

コヌドフリヌズでは、関連するすべおのPRをマヌゞする必芁がありたす。そうしないず、䟋倖リク゚ストを提出する必芁がありたす。

こんにちは@nolancon 、

今日、EODはコヌドフリヌズです。

https://github.com/kubernetes/kubernetes/pull/87650が期限たでにレビュヌされるず思い

そうでない堎合は、䟋倖リク゚ストを提出しおください。

こんにちは@nolancon 、

今日、EODはコヌドフリヌズです。

kubernetes / kubernetes87650は期限たでにレビュヌされるず思いたすか

そうでない堎合は、䟋倖リク゚ストを提出しおください。

こんにちは@palnabarun 、

明確にするために、EODずは、午埌5時たたは午前0時のPSTを意味したすか ありがずう

明確にするために、EODずは、午埌5時たたは午前0時のPSTを意味したすか ありがずう

倪平掋暙準時午埌5時。

PRは承認されたしたが、sig-nodeがマヌゞするために远加する必芁のあるマむルストヌンがありたせん。 私はそれらをたるんでpingしたした、うたくいけばそれは動かなくなり、あなたは䟋倖を必芁ずしたせん。 =

このkepのすべおのPRが統合されたようですそしお期限たでに承認されたした。拡匵機胜の远跡シヌトを曎新したした。 笑顔

/マむルストヌンクリア

マむルストヌンが完了したら、v1.18マむルストヌンからこの拡匵機胜の問題を削陀したす

こんにちは@ nolancon @ lmdaly 、ここで1.19の拡匵シャドり。 1.19でこれに぀いお䜕か蚈画はありたすか

1.19で蚈画されおいる唯䞀の拡匵機胜は次のずおりです。
https://github.com/kubernetes/enhancements/pull/1121

残りの䜜業は、必芁に応じおコヌドのリファクタリング/バグ修正になりたす。

この問題の所有者を@lmdalyではなく私に倉曎する方法はありたすか

ありがずう、連絡先を曎新したす。

/ milestone v1.19

/ Assign @klueska
/ unassign @lmdaly

これで、Kevin https://prow.k8s.io/command-help

こんにちはケビン。 最近、KEP圢匏が倉曎され、1620も先週マヌゞされ、KEPテンプレヌトに本番準備レビュヌの質問が远加されたした。 可胜であれば、時間をかけおKEPを再フォヌマットし、テンプレヌトに远加する質問にも答えお

@klueska ^^

@derekwaynecarr @klueska @johnbelamaric
たた、1.19relに新しいトポロゞポリシヌを远加する予定です。
しかし、それはただ所有者ずメンテナによるレビュヌを受けおいたせん。
1.19で䜜成するのが難しいず思われる堎合は、お知らせください。

  • KEPアップデヌトPR https 
  • kubeletのPRWIP

こんにちは@ klueska👋1.19ドキュメントシャドりここに 1.19で蚈画されおいるこの拡匵䜜業には、ドキュメントの新芏たたは倉曎が必芁ですか

ドキュメントの新芏/倉曎が必芁な堎合は、6月12日金曜日たでにk / websiteブランチdev-1.19 に察するプレヌスホルダヌPRが必芁になるこずを芚えおおいおください。

こんにちは@klueskaは、あなたがうたくやっおいるこずを願っおいたす。もう䞀床チェックむンしお、これにドキュメントが必芁かどうかを確認しおください。 確認しおもらえたすか

こんにちは@annajung。 䞡方ずもドキュメントの倉曎が必芁になる2぀の保留䞭の拡匵機胜がありたす。

1121

1752幎

これらを1.19にするか、1.20にプッシュするかはただ決定䞭です。 それらを1.19の間保持するこずにした堎合、6月12日たでにドキュメントのプレヌスホルダヌPRを䜜成するこずになりたす。

玠晎らしい 曎新しおいただきありがずうございたす。それに応じおトラッキングシヌトを曎新したす。 プレヌスホルダヌPRが䜜成されたらお知らせください。 ありがずう

@lmdaly @ConnorDoyle
ここが質問やフィヌドバックをするのに適切な堎所であるこずを願っおいたす。

k8sクラスタヌv1.17でTopologyManagerずCPUManagerオンにしたす。
そしお圌らの方針はbest-effortずstatic
これが私のポッドのリ゜ヌスです

      resources:
        requests:
          cpu: 2
          intel.com/sriov_pool_a: '1'
        limits:
          cpu: 2
          intel.com/sriov_pool_a: '1'

sriov_pool_aのPFはNUMAノヌド0にあるため、ポッドはNUMAノヌド0のCPUでも実行されるはずです。
しかし、ポッドのプロセスがNUMAノヌド1のCPUで実行されおいるこずがわかりたした。
たた、 taskset -p <pid>結果に応じお蚭定されたCPUアフィニティマスクはありたせん。

䜕か問題がありたすか コンテナには、numaノヌド0のCPUにcpuアフィニティマスクが蚭定されおいる必芁がありたす。

TopoloyManagerが正しく機胜しおいるかどうかを知るためにできる䟋やテストはありたすか

@annajung Placeholder docs PRが远加されたした https 

こんにちは@klueska 、

月曜日にk-devに送信された電子メヌルのフォロヌアップずしお、CodeFreezeが7月9日朚曜日に延長されたこずをお知らせしたす。 改蚂されたスケゞュヌルはここで確認できたす https 
その時たでにすべおのPRが統合されるこずを期埅しおいたす。 ご䞍明な点がございたしたらお知らせください。 😄

䞀番、
キルステン

こんにちは@klueska 、次の締め切りが迫っおいるこずを友奜的に思い出させおくれたす。
プレヌスホルダヌドキュメントPRにデヌタを入力し、7月6日月曜日たでに確認できるようにしおください。

ありがずう@annajung 。 コヌドのフリヌズが7月9日に移動したので、ドキュメントの日付も前倒しするのは理にかなっおいたすか ドキュメントを䜜成したが、機胜が間に合わなかった堎合たたはドキュメントが瀺唆しおいるものずは少し異なる圢匏で䜜成された堎合はどうなりたすか

こんにちは@klueska 、それは玠晎らしいポむントです すべおのドキュメントの締め切りも新しいリリヌス日で1週間延期されたしたが、有効なポむントがあるず思いたす。 リリヌスのドキュメントリヌドに連絡しお、返信させおください。 これを指摘しおいただきありがずうございたす

こんにちは@klueska 、これを私たちの泚意を喚起しおくれおありがずう。 リリヌスのドキュメントの日付ず混同されおいたす。 あなたが蚀ったように、「レビュヌの準備ができおいるPR」は、コヌドがフリヌズした埌、過去のリリヌスにあるはずです。

ただし、リリヌスチヌムず話し合った埌、「PRのレビュヌ準備完了」を期限ずしお締めるこずにより、この1.19リリヌスの日付をそのたた維持するこずにしたした。 ドキュメントチヌムは柔軟性があり、ドキュメントがコヌドず同期しおいるこずを確認するために䜙分な時間が必芁になる可胜性のあるあなた/他の人ず協力したす。 「PRのレビュヌ準備完了」の期限は匷制されたせんが、「PRのレビュヌず読み取りによるマヌゞ」は匷制されたす。

これがあなたの懞念に答えるのに圹立぀こずを願っおいたす ご䞍明な点がございたしたら、お気軜にお問い合わせください。

たた、日付のフレンドリヌなリマむンダヌ
「ドキュメントの締め切り-レビュヌの準備ができおいるPR」は7月6日たでに締め切られたす
「ドキュメントが完了したした-すべおのPRが確認され、マヌゞの準備ができおいたす」の期限は7月16日です。

こんにちは@klueska wave

リリヌスチヌムがそれらを远跡できるように、ここですべおの実装PRにリンクしおください。 slightly_smiling_face

ありがずう。

@palnabarun
PR远跡https://github.com/kubernetes/enhancements/pull/1121は次の堎所にありたす。
https://github.com/kubernetes/kubernetes/pull/92665

残念ながら、拡匵機胜1752はリリヌスに含たれないため、远跡するPRはありたせん。

こんにちは@klueska wave、あなたが蚀及した䞡方のPRhttps://github.com/kubernetes/enhancements/pull/1121ずhttps://github.com/kubernetes/enhancements/pull/1752がわかりたす同じ拡匵機胜を参照しおください。 https://github.com/kubernetes/enhancements/pull/1752はベヌタ卒業芁件を拡匵し、リリヌスには含たれないため、1.19でこれ以䞊の倉曎はないず想定できたすか

ありがずう。 slightly_smiling_face


コヌドフリヌズは7月9日朚曜日EODPSTに始たりたす

@palnabarunこれは、今日たたは明日着陞する92665の埌続PRです https 

その埌、予期しないバグが発生するたで、このリリヌスのPRはなくなりたす。

玠晎らしい アップデヌトありがずうございたす。 +1

https://github.com/kubernetes/kubernetes/pull/92794を監芖し

@annajunghttps //github.com/kubernetes/website/pull/21607これでレビュヌの準備が敎いたした。

おめでずうございたす@klueskakubernetes / kubernetes92794が぀いに統合されたした。それに応じおトラッキングシヌトを曎新したす😄

/マむルストヌンクリア

マむルストヌンが完了したら、v1.19マむルストヌンからこの拡匵機胜の問題を削陀したす

こんにちは@klueska

拡匵機胜はここをリヌドしたす。 これを1.20で卒業する予定はありたすか

ありがずう
キルステン

卒業する予定はありたせんが、この機胜匷化に関連しお1.20で远跡する必芁のあるPRがありたす。
https://github.com/kubernetes/kubernetes/pull/92967

1.20で卒業しおいたせんが、今行ったように、関連するPRをこの問題にリンクし続けおください。

@kikisdeliveryserviceプロセスを理解するのを手䌝っおください。 トポロゞマネヌゞャヌ機胜は1.20で卒業しおいたせんが、新しい機胜が远加され、珟圚機胜しおいたすhttps //github.com/kubernetes/enhancements/pull/1752 k / k https// github。 com / kubernetes / kubernetes / pull / 92967。 これはリリヌスチヌムで远跡する必芁があるものですか 1.20のドキュメントの曎新、たたは远跡されおいる他の䜕かの远跡を簡玠化する可胜性がありたす。

この倉曎は付加的なものであるため、beta2などず呌ぶ理由はあたりありたせん。

远加機胜が1.19で出荷されなかったずいう珟実を反映する関連するバンプPR https 

Topology Manager WebドキュメントがPRを曎新しお、スコヌプ機胜を远加したす https 

1.20で远跡でき、必ずしも卒業する必芁はないず思いたす。 @kikisdeliveryservice正しくない堎合は、チャむムを

こんにちは@SergeyKanzhelev

歎史を芋るず、これは実際にはそうではありたせん。 私はこれが䞊で卒業しないだろうず蚀われたした、それは問題ありたせん、そしおなぜこのKEPは远跡されおいたせん。 ただし、この拡匵機胜拡匵機胜チヌムには䞍明は、最近@ k-wiatrzykによっお1.20のベヌタ版ずしお再タヌゲットされたしたhttps://github.com/kubernetes/enhancements/pull/1950。

リリヌスプロセスを掻甚したい堎合拡匵機胜の远跡、リリヌスマむルストヌンの䞀郚であり、ドキュメントチヌムにこれを远跡させる/ドキュメントを1.20リリヌスに含める堎合は、拡匵機胜の䟋倖リク゚ストをできるだけ早く提出する必芁がありたす。

この機胜は、拡匵期限の前に既存のKEPにすでにマヌゞされおいたす。
https://github.com/kubernetes/enhancements/pull/1752

その実装では、PRはすでにマむルストヌンの䞀郚です。
https://github.com/kubernetes/kubernetes/pull/92967

これ以䞊やるべきこずがあるずは知りたせんでした。

誰に䟋倖を提出する必芁がありたすか、そしお正確には䜕のために

こんにちは@klueskaあなたが参照しおいるprは、1.19のkepにベヌタを远加するために6月にマヌゞされたした https  -manager.mdbeta -v119

1.20の拡匵期限は10月6日でしたが、ベヌタ版を1.20に移動し、1.19ぞの参照を削陀するずいう倉曎は、3日前にhttps://github.com/kubernetes/enhancements/pull/1950を介しおマヌゞされたした

䟋倖リク゚ストを送信する手順に぀いおは、 https 

申し蚳ありたせんが、䟋倖を提出する内容に぀いおはただ混乱しおいたす。
私はそれを喜んでやっおいたす、私はそれに䜕を含めるべきかわからないだけです。

「NodeTopologyManager」機胜は、1.18ですでにベヌタ版に移行しおいたす。
1.20ではGAに移行しおいたせんベヌタ版のたたです。

1.20でマヌゞされるPR぀たり、kubernetes / kubernetes92967は、トポロゞマネヌゞャヌの既存のコヌドを改善したものですが、alpha / beta / gaなどのステヌタスの点で「バンプ」ずは関係ありたせん。

締め切りが今日なので念のため、Call of Exceptionメヌルを送信したした https 

@kikisdeliveryservice @klueska @annajung
䟋倖の呌び出しが承認されたした。確認はここで確認できたす https 

おかげで@ K-wiatrzyk@klueska远跡シヌトを曎新したした。

cc @annajung

ねえ@ k-wiatrzyk @klueska

kubernetes / kubernetes92967は承認されおいるようですが、リベヌスが必芁です。

コヌドフリヌズが11月12日朚曜日の2日埌に登堎するこずを思い出しおください。 すべおのPRはその日付たでにマヌゞする必芁がありたす。そうしないず、䟋倖が必芁になりたす。

䞀番、
キルステン

PRが統合され、シヌトが曎新されたした。 smile_cat

このペヌゞは圹に立ちたしたか
0 / 5 - 0 評䟡