📖 编译原理¶

书籍信息

引论¶

整体来看分为两个部分：

具体来看分为多个阶段（Phase）：

词法分析（Lexical Analysis）或扫描（scanning）：字符 -> 词素（lexeme） -> token 序列。

Token 形如：<token-name, attribute>。token-name 是抽象符号，用于语法分析；attribute 指向符号表项，符号表中包含变量名、类型、值等信息。
语法分析（Syntax Analysis）或解析（parsing）：使用抽象符号构建语法树。

语法树的中间节点表示操作，叶子节点表示参数。
语义分析（Semantic Analysis）：使用语法树和符号表进行类型检查（Type Checking），类型信息存储到语法树或符号表中，用于中间代码生成。

类型检查涉及运算符与操作数是否匹配。

部分语言发生强制类型转换（coercion），添加如 inttofloat 的转换节点。
中间代码生成（Intermediate Code Generation）：将语法树转换为中间代码，通常是三地址码（three-address code）。

三地址码的每个指令最多有三个操作数，形式如 x = y op z。
代码优化（Code Optimization）：对中间代码进行优化。

可能有多种目标，如更快的执行速度、更小的代码体积、更少的能耗等。
目标代码生成（Code Generation）：将中间代码转换为目标代码（汇编）。

进行**存储分配决策（storage-allocation decision），例如如何选择寄存器存放变量。

此外是涉及所有阶段的符号表管理（symbol-table management），用于存储变量名、类型、值等信息。

这些阶段不一定各自独立，往往被组成为趟（pass）。

!!! "生词表"

| 单词 | 释义 |
| ---- | ---- |
| lexeme | 词素，组成 token |

Abstract

可以自己写词法分析器，也可以将词法规则输入词法分析器生成器（lexical analyzer generator），生成词法分析器。本书使用 Flex 作为词法分析器生成器。

Flex 编译器将 Flex 语言描述的词法规则转换为 C 语言代码，模拟转换图。

graph TD
A[lex.l] -->|Flex 编译器| B[lex.yy.c]
B -->|C 编译器| C[a.out]
D[输入流] --> C
C --> E[Token 序列]

Flex 语法：

声明
%%
翻译规则 PATTERN { ACTION }
%%
辅助函数