《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 其他 > Linux教學——linux內核調度詳解

Linux教學——linux內核調度詳解

2022-10-26
作者:土豆居士
來源:電子技術應用專欄作家 一口Linux
關鍵詞: Linux 內核調度

  本文檔基于linux3.14 ,,linux內核調度詳解

  1、概述

  1.1,、調度策略

  定義位于

  微信截圖_20221026162057.png

  SCHED_NORMAL:普通的分時進程,,使用的fair_sched_class調度類

  SCHED_FIFO:先進先出的實時進程。當調用程序把CPU分配給進程的時候,,它把該進程描述符保留在運行隊列鏈表的當前位置,。此調度策略的進程一旦使用CPU則一直運行。如果沒有其他可運行的更高優(yōu)先級實時進程,,進程就繼續(xù)使用CPU,,想用多久就用多久,即使還有其他具有相同優(yōu)先級的實時進程處于可運行狀態(tài),。使用的是rt_sched_class調度類,。

  SCHED_RR:時間片輪轉的實時進程。當調度程序把CPU分配給進程的時候,,它把該進程的描述符放在運行隊列鏈表的末尾,。這種策略保證對所有具有相同優(yōu)先級的SCHED_RR實時進程進行公平分配CPU時間,使用的rt_sched_class調度類

  SCHED_BATCH:是SCHED_NORMAL的分化版本,。采用分時策略,,根據(jù)動態(tài)優(yōu)先級,分配CPU資源,。在有實時進程的時候,,實時進程優(yōu)先調度。但針對吞吐量優(yōu)化,,除了不能搶占外與常規(guī)進程一樣,,允許任務運行更長時間,更好使用高速緩存,,適合于成批處理的工作,,使用的fair_shed_class調度類

  SCHED_IDLE:優(yōu)先級最低,在系統(tǒng)空閑時運行,,使用的是idle_sched_class調度類,,給0號進程使用

  SCHED_DEADLINE:新支持的實時進程調度策略,針對突發(fā)型計算,,并且對延遲和完成時間敏感的任務使用,,基于EDF(earliest deadline first),使用的是dl_sched_class調度類,。

  1.2、調度類

  微信截圖_20221026162130.png

微信截圖_20221026162157.png

  Next:指向下一個調度類,用于在函數(shù)pick_next_task,、check_preempt_curr、set_rq_online,、set_rq_offline用于遍歷整個調度類根據(jù)調度類的優(yōu)先級選擇調度類,。優(yōu)先級為stop_sched_class->dl_sched_class->rt_sched_class->fair_sched_class->idle_sc*hed_class

  enqueue_task:將任務加入到調度類中

  dequeue_task:將任務從調度類中移除

  yield_task/ yield_to_task:主動放棄CPU

  check_preempt_curr:檢查當前進程是否可被強占

  pick_next_task:從調度類中選出下一個要運行的進程

  put_prev_task:將進程放回到調度類中

  select_task_rq:為進程選擇一個合適的cpu的運行隊列

  migrate_task_rq:遷移到另外的cpu運行隊列

  pre_schedule:調度以前調用

  post_schedule:通知調度器完成切換

  task_waking、task_woken:用于進程喚醒

  set_cpus_allowed:修改進程cpu親和力affinity

  rq_online:啟動運行隊列

  rq_offline:關閉運行隊列

  set_curr_task:當進程改變調度類或者進程組時被調用

  task_tick:將會引起進程切換,,驅動運行running強占,。由time_tick調用

  task_fork:進程創(chuàng)建時調用,不同調度策略的進程初始化不一樣

  task_dead:進程結束時調用

  switched_from,、switched_to:進程改變調度器時使用

  prio_changed:改變進程優(yōu)先級

  1.3,、調度觸發(fā)

微信截圖_20221026162223.png

  調度的觸發(fā)主要有兩種方式,一種是本地定時中斷觸發(fā)調用scheduler_tick函數(shù),,然后使用當前運行進程的調度類中的task_tick,,另外一種則是主動調用schedule,不管是哪一種最終都會調用到__schedule函數(shù),,該函數(shù)調用pick_netx_task,,通過rq->nr_running ==rq->cfs.h_nr_running判斷出如果當前運行隊列中的進程都在cfs調度器中,則直接調用cfs的調度類(內核代碼里面這一判斷使用了likely說明大部分情況都是滿足該條件的),。如果運行隊列不都在cfs中,,則通過優(yōu)先級stop_sched_class->dl_sched_class->rt_sched_class->fair_sched_class->idle_sched_class遍歷選出下一個需要運行的進程。然后進程任務切換,。

  處于TASK_RUNNING狀態(tài)的進程才會被進程調度器選擇,,其他狀態(tài)不會進入調度器。系統(tǒng)發(fā)生調度的時機如下:

  à調用cond_resched()時

  à顯式調用schedule()時

  à從中斷上下文返回時

  當內核開啟搶占時,,會多出幾個調度時機如下:

  à在系統(tǒng)調用或者中斷上下文中調用preemt_enable()時(多次調用系統(tǒng)只會在最后一次調用時會調度)

  à在中斷上下文中,,從中斷處理函數(shù)返回到可搶占的上下文時

  1.4、__schedule的實現(xiàn)

  分析_schedule的實現(xiàn)有利于理解調度類的實體如果在

  微信截圖_20221026162308.png

微信截圖_20221026162335.png

微信截圖_20221026162401.png

  其中有幾個重要的與調度器密切相關的函數(shù):

  pre_scheduleà prev->sched_class->pre_schedule 在調度以前調用

  put_prev_taskàprev->sched_class->put_prev_task 將前一個進程調度以前放回調度器中

  pick_next_taskà class->pick_next_task從調度器中選出下一個需要運行的進程

  post_scheduleà rq->curr->sched_class->post_scheduleCFS中為NULL

  2,、 CFS調度

  該部分代碼位于linux/kernel/sched/fair.c中

  定義了const struct

  sched_classfair_sched_class,,這個是CFS的調度類定義的對象。其中基本包含了CFS調度的所有實現(xiàn),。

  CFS實現(xiàn)三個調度策略:

  1> SCHED_NORMAL這個調度策略是被常規(guī)任務使用

  2> SCHED_BATCH 這個策略不像常規(guī)的任務那樣頻繁的搶占,,以犧牲交互性為代價下,因而允許任務運行更長的時間以更好的利用緩存,,這種策略適合批處理

  3> SCHED_IDLE 這是nice值甚至比19還弱,,但是為了避免陷入優(yōu)先級導致問題,這個問題將會死鎖這個調度器,,因而這不是一個真正空閑定時調度器

  CFS調度類:

  n enqueue_task(…) 當任務進入runnable狀態(tài),,這個回調將把這個任務的調度實體(entity)放入紅黑樹并且增加nr_running變量的值

  n dequeue_task(…) 當任務不再是runnable狀態(tài),,這個回調將會把這個任務的調度實體從紅黑樹中取出,并且減少nr_running變量的值

  n yield_task(…) 除非compat_yield sysctl是打開的,,這個回調函數(shù)基本上就是一個dequeue后跟一個enqueue,,這那種情況下,他將任務的調度實體放入紅黑樹的最右端

  n check_preempt_curr(…) 這個回調函數(shù)是檢查一個任務進入runnable狀態(tài)是否應該搶占當前運行的任務

  n pick_next_task(…) 這個回調函數(shù)選出下一個最合適運行的任務

  n set_curr_task(…) 當任務改變他的調度類或者改變他的任務組,,將調用該回調函數(shù)

  n task_tick(…) 這個回調函數(shù)大多數(shù)是被time tick調用,。他可能引起進程切換。這就驅動了運行時搶占

  2.1,、調度實體

 微信截圖_20221026162430.png

 微信截圖_20221026162519.png

  其中幾個重要的變量

 微信截圖_20221026162542.png

微信截圖_20221026162606.png

  每一個進程的task_struct中都嵌入了sched_entry對象,,所以進程是可調度的實體,但是可調度的實體不一定是進程,,也可能是進程組,。

  2.2、CFS調度

  Tcik 中斷,,主要會更新調度信息,,然后調整當前進程在紅黑樹中的位置。調整完成以后如果當前進程不再是最左邊的葉子,,就標記為Need_resched標志,,中斷返回時就會調用scheduler()完成切換、否則當前進程繼續(xù)占用CPU,。從這里可以看出CFS拋棄了傳統(tǒng)時間片概念,。Tick中斷只需要更新紅黑樹。

  紅黑樹鍵值即為vruntime,,該值通過調用update_curr函數(shù)進行更新,。這個值為64位的變量,會一直遞增,,__enqueue_entity中會將vruntime作為鍵值將要入隊的實體插入到紅黑樹中,。__pick_first_entity會將紅黑樹中最左側即vruntime最小的實體取出。

  更多信息可以來這里獲取==>>電子技術應用-AET<<

微信圖片_20210517164139.jpg



本站內容除特別聲明的原創(chuàng)文章之外,,轉載內容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章,、圖片,、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者,。如涉及作品內容,、版權和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,,避免給雙方造成不必要的經(jīng)濟損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。