所有優(yōu)秀的計(jì)算機(jī)科學(xué)學(xué)院都提供了編譯器課程,,但是相對(duì)比較少的學(xué)校把它作為本科課程的必修部分,。這篇文章回答了這個(gè)問(wèn)題:為什么需要學(xué)習(xí)這門(mén)課?即使你從沒(méi)打算過(guò)編寫(xiě)編譯器,。
我寫(xiě)這篇文章的其中一個(gè)原因是,,盡管我在讀本科時(shí)很喜歡編譯器課程,但是我?guī)缀蹩床坏剿膶?shí)際作用,。大多數(shù)資料看起來(lái)要么簡(jiǎn)單易懂,,要么很深?yuàn)W(事實(shí)上,我找到的大部分編譯器資料都是很枯燥的,。)無(wú)論怎樣,,我用了幾年時(shí)間總結(jié)了為什么這類(lèi)課程會(huì)如此有用的實(shí)際原因。原因如下,。
分析器和解析器無(wú)處不在
嚴(yán)謹(jǐn)?shù)某绦騿T不得不去了解分析器和解析器,,因?yàn)槲覀儾粫?huì)總是只寫(xiě)一些小程序。每次你寫(xiě)一個(gè)可擴(kuò)展的程序或處理一種新類(lèi)型的輸入文件,,你都需要了解它們(分析器和解析器),。格林斯潘第十定律:
“任何C或Fortran程序復(fù)雜到一定程度之后,都會(huì)包含一個(gè)臨時(shí)的,、只有一半功能的,、不完全符合規(guī)格的,、充滿bug的,、運(yùn)行速度很慢的Common Lisp實(shí)現(xiàn)?!?br/> 我們花費(fèi)如此多的時(shí)間在這些事情上,,我們可以使用一次性的小技巧來(lái)做這些事情的每一個(gè),,或者我們利用60年的理論和實(shí)際知識(shí)去解決問(wèn)題,并把它做對(duì),。重要的是:你應(yīng)該什么時(shí)候借用已存在的代碼或者使用已存在的工具,?理論知識(shí)在什么時(shí)候可以提供幫助?哪些語(yǔ)言設(shè)計(jì)原則可以運(yùn)用在我們?nèi)粘J褂玫男≌Z(yǔ)言,?
你能更好地編寫(xiě)正確的代碼
編譯器應(yīng)該把輸入的語(yǔ)言正確地翻譯成合法的程序,。為了達(dá)到這個(gè)目標(biāo),編譯器開(kāi)發(fā)者必須了解整個(gè)輸入語(yǔ)言,,包括一些普通程序員沒(méi)見(jiàn)過(guò)的罕見(jiàn)問(wèn)題,。這個(gè)理解過(guò)程是通往程序語(yǔ)言本質(zhì)的重要一步,它和我們平時(shí)寫(xiě)代碼時(shí)所看到的不一樣,。舉個(gè)例子,,我在學(xué)習(xí)了順序點(diǎn)(sequence points),未定義行為(undefined behaviors),,和常用的算術(shù)轉(zhuǎn)換的細(xì)節(jié)后,,完全改變了我對(duì)C語(yǔ)言的理解。C編譯器編寫(xiě)者已經(jīng)掌握這些概念了,,但大多數(shù)初級(jí)和中級(jí)程序員都不知道這些概念,。毫不夸張地說(shuō),一旦你知道語(yǔ)言的本質(zhì),,你會(huì)以不同地方式和更準(zhǔn)確地思考這個(gè)語(yǔ)言,。這適用于任何的語(yǔ)言,特別是像C和C++這些語(yǔ)義不清晰的語(yǔ)言,。
你可以編寫(xiě)更快的代碼
通過(guò)了解編譯器,,你可以很清晰地知道哪些優(yōu)化是編譯器可以優(yōu)化的,和哪些是編譯器不能進(jìn)行優(yōu)化的,,無(wú)論他們看起來(lái)是多么的合理和簡(jiǎn)單,。你將會(huì)學(xué)到哪類(lèi)代碼通常會(huì)建造最佳代碼塊,為什么會(huì)這樣和這些代碼做了什么,。你會(huì)知道為什么一些代碼可以擁有更好的性能,,比如使用一半寄存器組緩存濾波系數(shù)一半寄存器組緩存樣本的FIR濾波器,它和使用普通優(yōu)化器實(shí)現(xiàn)的不一樣,。你和你喜歡的編譯器是一個(gè)能創(chuàng)建快速代碼的團(tuán)隊(duì),,你可以使用它高效地工作,或者使用提前優(yōu)化等無(wú)意義的技巧來(lái)修改它,。
其次,,編譯器后端是與目標(biāo)架構(gòu)密切關(guān)聯(lián)的,當(dāng)然,,現(xiàn)代的架構(gòu)都盡量提供匯編程序員友好的平臺(tái),,而且離著不遠(yuǎn)了,。通過(guò)理解編譯器后端和它為什么是這樣產(chǎn)生代碼的,你會(huì)對(duì)計(jì)算機(jī)架構(gòu)的操作有更好的理解,。