所有優(yōu)秀的計算機科學(xué)學(xué)院都提供了編譯器課程,,但是相對比較少的學(xué)校把它作為本科課程的必修部分,。這篇文章回答了這個問題:為什么需要學(xué)習(xí)編譯器知識?即使你從沒打算過編寫編譯器,。
我寫這篇文章的其中一個原因是,,盡管我在讀本科時很喜歡編譯器課程,,但是我?guī)缀蹩床坏剿膶嶋H作用。大多數(shù)資料看起來要么簡單易懂,,要么很深奧(事實上,,我找到的大部分編譯器資料都是很枯燥的。)無論怎樣,,我用了幾年時間總結(jié)了為什么這類課程會如此有用的實際原因,。原因如下。
分析器和解析器無處不在
嚴(yán)謹(jǐn)?shù)?a class="innerlink" href="http://forexkbc.com/tags/程序員" title="程序員" target="_blank">程序員不得不去了解分析器和解析器,,因為我們不會總是只寫一些小程序,。每次你寫一個可擴展的程序或處理一種新類型的輸入文件,你都需要了解它們(分析器和解析器),。格林斯潘第十定律:
“任何C或Fortran程序復(fù)雜到一定程度之后,,都會包含一個臨時的、只有一半功能的,、不完全符合規(guī)格的、充滿bug的,、運行速度很慢的Common Lisp實現(xiàn),。”
我們花費如此多的時間在這些事情上,,我們可以使用一次性的小技巧來做這些事情的每一個,,或者我們利用60年的理論和實際知識去解決問題,并把它做對,。重要的是:你應(yīng)該什么時候借用已存在的代碼或者使用已存在的工具,?理論知識在什么時候可以提供幫助?哪些語言設(shè)計原則可以運用在我們?nèi)粘J褂玫男≌Z言,?
你能更好地編寫正確的代碼
編譯器應(yīng)該把輸入的語言正確地翻譯成合法的程序,。為了達(dá)到這個目標(biāo),編譯器開發(fā)者必須了解整個輸入語言,,包括一些普通程序員沒見過的罕見問題,。這個理解過程是通往程序語言本質(zhì)的重要一步,,它和我們平時寫代碼時所看到的不一樣。舉個例子,,我在學(xué)習(xí)了順序點(sequence points),,未定義行為(undefined behaviors),和常用的算術(shù)轉(zhuǎn)換的細(xì)節(jié)后,,完全改變了我對C語言的理解,。C編譯器編寫者已經(jīng)掌握這些概念了,但大多數(shù)初級和中級程序員都不知道這些概念,。毫不夸張地說,,一旦你知道語言的本質(zhì),你會以不同地方式和更準(zhǔn)確地思考這個語言,。這適用于任何的語言,,特別是像C和C++這些語義不清晰的語言。
你可以編寫更快的代碼
通過了解編譯器,,你可以很清晰地知道哪些優(yōu)化是編譯器可以優(yōu)化的,,和哪些是編譯器不能進(jìn)行優(yōu)化的,無論他們看起來是多么的合理和簡單,。你將會學(xué)到哪類代碼通常會建造最佳代碼塊,,為什么會這樣和這些代碼做了什么。你會知道為什么一些代碼可以擁有更好的性能,,比如使用一半寄存器組緩存濾波系數(shù)一半寄存器組緩存樣本的FIR濾波器,,它和使用普通優(yōu)化器實現(xiàn)的不一樣。你和你喜歡的編譯器是一個能創(chuàng)建快速代碼的團隊,,你可以使用它高效地工作,,或者使用提前優(yōu)化等無意義的技巧來修改它。
其次,,編譯器后端是與目標(biāo)架構(gòu)密切關(guān)聯(lián)的,,當(dāng)然,現(xiàn)代的架構(gòu)都盡量提供匯編程序員友好的平臺,,而且離著不遠(yuǎn)了,。通過理解編譯器后端和它為什么是這樣產(chǎn)生代碼的,你會對計算機架構(gòu)的操作有更好的理解,。
總結(jié)
編譯器(理論上)有三部分:
1.語言相關(guān)的前端(分析,,類型檢測)
2.與語言和目標(biāo)無關(guān)中端(優(yōu)化))
3.目標(biāo)相關(guān)的后端(生成機器代碼)
在這篇文章里,我已經(jīng)試圖說服你們,,理解編譯器的每一部分都是有價值的–即使你將來不會實現(xiàn)或者修改它們,。