这是本文档旧的修订版！

在ACM上一辈子都用不到的内容

编译的各个阶段

词法分析
语法分析
语义动作
语义分析
帧栈布局
翻译
规范化
指令选择
控制流分析
数据流分析
寄存器分配
代码流出

本文将只涉及前4点的部分内容，作为潜在的可能对竞赛有用的工具

词法分析

单词

单词的类型: ID (标识符), NUM(整数), REAL(小数), IF, COMMA, ….
而注释，预处理命令，宏，空白符不视为单词

词法分析器读入源程序，返回一个单词流，报告每个单词的类型
这些单词中一些（如标识符，数）有语义值，因此词法分析器也会附上这些信息

处理工具

正则表达式

基本部分:

符号: 对于字母 a, 表达式 a 表示字符串 “a” (废话)
可选: 对于表达式 M, N, M|N 表示属于表达式 M 或 N 的字符串
连结: 符号 ·, 表示连起两个字符串 (严格的定义懒得写了)
$\epsilon$: 空串重复： kleene 闭包。 (a|b)* == {“a”, “b”, “aa”, “ab”, “ba”, “bb”, …}

正则表达式还有一些简写，如[] ， ? ， + 等，但是他们并不影响表达式的描述能力

使用正则表达式可以指明语言的单词。对于每种单词，提供一段代码来报告单词的类型(和附加语义)

为了消除二义性，使用了规则最长匹配 和 优先规则。为了压缩篇幅，这里不描述。

CVBB ACM Team

目录

在ACM上一辈子都用不到的内容

编译的各个阶段

词法分析

单词

处理工具

正则表达式

有限状态自动机

CVBB ACM Team

用户工具

站点工具

目录

在ACM上一辈子都用不到的内容

编译的各个阶段

词法分析

单词

处理工具

正则表达式

有限状态自动机

页面工具