爱悠闲 > 编译器是怎么被编译出来的?

编译器是怎么被编译出来的?

分类: 工作记录  |  标签: 编译器,语言,汇编,嵌入式,c,struct  |  作者: mmpire 相关  |  发布日期 : 2014-07-22  |  热度 : 362°

PRECONDITION:Most compilers are written in the language that they accept and compile.
这就是编译器的自举问题(bootstraps),类似于蛋鸡问题。我们要在Y系统上做一个C语言的编译器,假定:X与Y是不同的两种计算机,其指令系统不兼容。考虑以下几种情况:


Case 1: Y上没有C语言编译器,但X系统上有。
      那么我们可以先在X系统上开发一个针对Y系统的C语言交叉编译器。然后用这个交叉编译器重新编译已有的这个C编译器的源代码,就可以得到能在Y系统上运行的C语言编译器了。(交叉编译器:在X系统上运行的编译器,但编译出来的目标代码在Y系统上运行。嵌入式平台上的程序基本都是交叉编译得到的,因为嵌入式平台上很少会有自己的编译器)


Case 2: X,Y上都没有C语言编译器,但有另一种语言的编译器。
    a.我们可以先划出C语言的一个子集,这个子集必须满足两个条件:首先,必须足够简单,简单到可以用另一种语言来编写接受这个子集的编译器;其次,必须足够强大,强大到用这个语言子集就可以编写出接受C语言的编译器。(你一定奇怪为什么一个语言的子集就能写出接收整个语言的编译器,呵呵。我猜是因为一个语言的很多复杂特性都是由简单特性构成的,就像一个struct结构完全可以用几个定义在一起的简单变量代替实现;而且,编译器的实现往往不会用到这个语言的高级特性,需要用的都加到那个子集里就行。)
    b.再用另一种语言编写一个能接受这个C语言子集的编译器,只要保证可以在Y系统上正确运行就行,并不对其效率作要求,因为基本上它只被用一次。
    c.然后,用C语言的子集编写一个在Y系统上的C语言编译器,用上一步得到的编译器编译得到可用的Y系统上的C编译器。
    d.最后,因为这个编译器已经能接受C语言,实际上,自举已经完成,只需要进一步优化完善即可。

Case 3: X,Y上什么编译器也没有,计算机的原始时代。
    大概只能是用汇编吧,汇编语言可没有什么编译器,它用汇编器,代码替换而已:)