【转】手把手带你走进Babel的编译世界

前言

谈及 Babel,必然离不开 AST。有关 AST 这个知识点其实是很重要的,但由于涉及到代码编译阶段,大多情况都是由各个框架内置相关处理,所以作为开发(使用)者本身,往往会忽视这个过程。希望通过这篇文章,带各位同学走进 AST,借助 AST 发挥更多的想象力。

AST 概述

想必大家总是听到 AST 这个概念,那么到底什么是 AST?

AST 全称是是 Abstract Syntax Tree,中文为抽象语法树,将我们所写的代码转换为机器能识别的一种树形结构。其本身是由一堆节点(Node)组成,每个节点都表示源代码中的一种结构。不同结构用类型(Type)来区分,常见的类型有:Identifier(标识符),Expression(表达式),VariableDeclaration(变量定义),FunctionDeclaration(函数定义)等。

AST 结构

随着 JavaScript 的发展,为了统一ECMAScript标准的语法表达。社区中衍生出了ESTree Spec,是目前社区所遵循的一种语法表达标准。

ESTree 提供了例如Identifier、Literal等常见的节点类型。

节点类型

类型 说明
File 文件 (顶层节点包含 Program)
Program 整个程序节点 (包含 body 属性代表程序体)
Directive 指令 (例如 “use strict”)
Comment 代码注释
Statement 语句 (可独立执行的语句)
Literal 字面量 (基本数据类型、复杂数据类型等值类型)
Identifier 标识符 (变量名、属性名、函数名、参数名等)
Declaration 声明 (变量声明、函数声明、Import、Export 声明等)
Specifier 关键字 (ImportSpecifier、ImportDefaultSpecifier、ImportNamespaceSpecifier、ExportSpecifier)
Expression 表达式

公共属性

类型 说明
type AST 节点的类型
start 记录该节点代码字符串起始下标
end 记录该节点代码字符串结束下标
loc 内含 line、column 属性,分别记录开始结束的行列号
leadingComments 开始的注释
innerComments 中间的注释
trailingComments 结尾的注释
extra 额外信息

AST 示例

有的同学可能会问了,这么多类型都需要记住么? 其实并不是,我们可以借助以下两个工具来查询 AST 结构。

结合一个示例,带大家快速了解一下 AST 结构。

1
2
3
4
function test(args) {
const a = 1;
console.log(args);
}

上述代码,声明了一个函数,名为test,有一个形参args

函数体中:

  • 声明了一个const类型变量a,值为 1
  • 执行了一个 console.log 语句

将上述代码粘贴至AST Explorer,结果如图所示:

接下来我们继续分析内部结构,以const a = 1为例:


变量声明在 AST 中对应的就是 type 为VariableDeclaration的节点。该节点包含kinddeclarations两个必须属性,分别代表声明的变量类型和变量内容。

细心的同学可能发现了declarations是一个数组。这是为什么呢?因为变量声明本身支持const a=1,b=2的写法,需要支持多个VariableDeclarator,故此处为数组。

而 type 为VariableDeclarator的节点代表的就是a=1这种声明语句,其中包含idinit属性。

id即为Identifier,其中的name值对应的就是变量名称。

init即为初始值,包含type,value属性。分别表示初始值类型和初始值。此处 type 为NumberLiteral,表明初始值类型为number类型

Babel 概述

Babel 是一个 JavaScript 编译器,在实际开发过程中通常借助Babel来完成相关 AST 的操作。

Babel 工作流程

Babel AST

Babel 解析代码后生成的 AST 是以ESTree作为基础,并略作修改。

官方原文如下:

The Babel parser generates AST according to Babel AST format. It is based on ESTree spec with the following deviations:

  • Literal token is replaced with StringLiteral, NumericLiteral, BigIntLiteral, BooleanLiteral, NullLiteral, RegExpLiteral
  • Property token is replaced with ObjectProperty and ObjectMethod
  • MethodDefinition is replaced with ClassMethod
  • Program and BlockStatement contain additional directives field with Directive and DirectiveLiteral
  • ClassMethod, ObjectProperty, and ObjectMethod value property’s properties in FunctionExpression is coerced/brought into the main method node.
  • ChainExpression is replaced with OptionalMemberExpression and OptionalCallExpression
  • ImportExpression is replaced with a CallExpression whose callee is an Import node.

Babel 核心包

工具包 说明
@babel/core Babel 转码的核心包,包括了整个 babel 工作流(已集成@babel/types)
@babel/parser 解析器,将代码解析为 AST
@babel/traverse 遍历/修改 AST 的工具
@babel/generator 生成器,将 AST 还原成代码
@babel/types 包含手动构建 AST 和检查 AST 节点类型的方法
@babel/template 可将字符串代码片段转换为 AST 节点
1
npm i @babel/parser @babel/traverse @babel/types @babel/generator @babel/template -D

Babel 插件

Babel 插件大致分为两种:语法插件和转换插件。语法插件作用于 @babel/parser,负责将代码解析为抽象语法树(AST)(官方的语法插件以 babel-plugin-syntax 开头);转换插件作用于 @babel/core,负责转换 AST 的形态。绝大多数情况下我们都是在编写转换插件。

Babel 工作依赖插件。插件相当于是指令,来告知 Babel 需要做什么事情。如果没有插件,Babel 将原封不动的输出代码。

Babel 插件本质上就是编写各种 visitor 去访问 AST 上的节点,并进行 traverse。当遇到对应类型的节点,visitor 就会做出相应的处理,从而将原本的代码 transform 成最终的代码。

1
2
3
4
5
6
7
8
9
10
11
12
13
export default function (babel) {
// 即@babel/types,用于生成AST节点
const { types: t } = babel;

return {
name: "ast-transform", // not required
visitor: {
Identifier(path) {
path.node.name = path.node.name.split("").reverse().join("");
},
},
};
}

这是一段AST Explorer上的 transform 模板代码。上述代码的作用即为将输入代码的所有标识符(Identifier)类型的节点名称颠倒

其实编写一个 Babel 插件很简单。我们要做的事情就是回传一个 visitor 对象,定义以Node Type为名称的函数。该函数接收path,state两个参数。

其中path(路径)提供了访问/操作AST 节点的方法。path 本身表示两个节点之间连接的对象。例如path.node可以访问当前节点,path.parent可以访问父节点等。path.remove()可以移除当前节点。具体 API 见下图。其他可见
handlebook

Babel Types

Babel Types 模块是一个用于 AST 节点的 Lodash 式工具库,它包含了构造、验证以及变换 AST 节点的方法。

类型判断

Babel Types 提供了节点类型判断的方法,每一种类型的节点都有相应的判断方法。更多见babel-types API

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import * as types from "@babel/types";

// 是否为标识符类型节点
if (types.isIdentifier(node)) {
// ...
}

// 是否为数字字面量节点
if (types.isNumberLiteral(node)) {
// ...
}

// 是否为表达式语句节点
if (types.isExpressionStatement(node)) {
// ...
}

创建节点

Babel Types 同样提供了各种类型节点的创建方法,详见下属示例。

注: Babel Types 生成的 AST 节点需使用@babel/generator转换后得到相应代码。

1
2
3
4
5
6
7
8
import * as types from "@babel/types";
import generator from "@babel/generator";

const log = (node: types.Node) => {
console.log(generator(node).code);
};

log(types.stringLiteral("Hello World")); // output: Hello World

基本数据类型

1
2
3
4
5
6
7
8
9
10
11
12
13
types.stringLiteral("Hello World"); // string
types.numericLiteral(100); // number
types.booleanLiteral(true); // boolean
types.nullLiteral(); // null
types.identifier(); // undefined
types.regExpLiteral("\\.js?$", "g"); // 正则

"Hello World"
100
true
null
undefined
/\.js?$/g

复杂数据类型

  • 数组
1
2
3
4
5
6
7
8
types.arrayExpression([
types.stringLiteral("Hello World"),
types.numericLiteral(100),
types.booleanLiteral(true),
types.regExpLiteral("\\.js?$", "g"),
]);

["Hello World", 100, true, /\.js?$/g];
  • 对象
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
types.objectExpression([
types.objectProperty(
types.identifier("key"),
types.stringLiteral("HelloWorld")
),
types.objectProperty(
// 字符串类型 key
types.stringLiteral("str"),
types.arrayExpression([])
),
types.objectProperty(
types.memberExpression(
types.identifier("obj"),
types.identifier("propName")
),
types.booleanLiteral(false),
// 计算值 key
true
),
]);

{
key: "HelloWorld",
"str": [],
[obj.propName]: false
}

JSX 节点

创建 JSX AST 节点与创建数据类型节点略有不同,此处整理了一份关系图。

  • JSXElement
1
2
3
4
5
6
7
8
types.jsxElement(
types.jsxOpeningElement(types.jsxIdentifier("Button"), []),
types.jsxClosingElement(types.jsxIdentifier("Button")),
[types.jsxExpressionContainer(types.identifier("props.name"))]
);

<Button>{props.name}</Button>

  • JSXFragment
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
types.jsxFragment(types.jsxOpeningFragment(), types.jsxClosingFragment(), [
types.jsxElement(
types.jsxOpeningElement(types.jsxIdentifier("Button"), []),
types.jsxClosingElement(types.jsxIdentifier("Button")),
[types.jsxExpressionContainer(types.identifier("props.name"))]
),
types.jsxElement(
types.jsxOpeningElement(types.jsxIdentifier("Button"), []),
types.jsxClosingElement(types.jsxIdentifier("Button")),
[types.jsxExpressionContainer(types.identifier("props.age"))]
),
]);

<>
<Button>{props.name}</Button>
<Button>{props.age}</Button>
</>

声明

  • 变量声明 (variableDeclaration)
1
2
3
4
5
6
types.variableDeclaration("const", [
types.variableDeclarator(types.identifier("a"), types.numericLiteral(1)),
]);

const a = 1;

  • 函数声明 (functionDeclaration)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
types.functionDeclaration(
types.identifier("test"),
[types.identifier("params")],
types.blockStatement([
types.variableDeclaration("const", [
types.variableDeclarator(
types.identifier("a"),
types.numericLiteral(1)
),
]),
types.expressionStatement(
types.callExpression(types.identifier("console.log"), [
types.identifier("params"),
])
),
])
);

function test(params) {
const a = 1;
console.log(params);
}

React 函数式组件

综合上述内容,小小实战一下~

我们需要通过 Babel Types 生成button.js代码。乍一看不知从何下手?

1
2
3
4
5
6
7
8
9
10
11
// button.js
import React from "react";
import { Button } from "antd";

export default (props) => {
const handleClick = (ev) => {
console.log(ev);
};
return <Button onClick={handleClick}>{props.name}</Button>;
};

小技巧: 先借助AST Explorer网站,观察 AST 树结构。然后通过 Babel Types 逐层编写代码。事半功倍!

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
types.program([
types.importDeclaration(
[types.importDefaultSpecifier(types.identifier("React"))],
types.stringLiteral("react")
),
types.importDeclaration(
[
types.importSpecifier(
types.identifier("Button"),
types.identifier("Button")
),
],
types.stringLiteral("antd")
),
types.exportDefaultDeclaration(
types.arrowFunctionExpression(
[types.identifier("props")],
types.blockStatement([
types.variableDeclaration("const", [
types.variableDeclarator(
types.identifier("handleClick"),
types.arrowFunctionExpression(
[types.identifier("ev")],
types.blockStatement([
types.expressionStatement(
types.callExpression(types.identifier("console.log"), [
types.identifier("ev"),
])
),
])
)
),
]),
types.returnStatement(
types.jsxElement(
types.jsxOpeningElement(types.jsxIdentifier("Button"), [
types.jsxAttribute(
types.jsxIdentifier("onClick"),
types.jSXExpressionContainer(types.identifier("handleClick"))
),
]),
types.jsxClosingElement(types.jsxIdentifier("Button")),
[types.jsxExpressionContainer(types.identifier("props.name"))],
false
)
),
])
)
),
]);

应用场景

AST 本身应用非常广泛,例如:Babel 插件(ES6 转化 ES5)、构建时压缩代码 、css 预处理器编译、 webpack 插件等等,可以说是无处不在。

如图所示,不难发现,一旦涉及到编译,或者说代码本身的处理,都和 AST 息息相关。下面列举了一些常见应用,让我们看看是如何处理的。

代码转换

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
// ES6 => ES5 let 转 var
export default function (babel) {
const { types: t } = babel;

return {
name: "let-to-var",
visitor: {
VariableDeclaration(path) {
if (path.node.kind === "let") {
path.node.kind = "var";
}
},
},
};
}

babel-plugin-import

在 CommonJS 规范下,当我们需要按需引入antd的时候,通常会借助该插件。

该插件的作用如下:

1
2
3
4
5
6
7
8
// 通过es规范,具名引入Button组件
import { Button } from "antd";
ReactDOM.render(<Button>xxxx</Button>);

// babel编译阶段转化为require实现按需引入
var _button = require("antd/lib/button");
ReactDOM.render(<_button>xxxx</_button>);

简单分析一下,核心处理: 将 import 语句替换为对应的 require 语句。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
export default function (babel) {
const { types: t } = babel;

return {
name: "import-to-require",
visitor: {
ImportDeclaration(path) {
if (path.node.source.value === "antd") {
// var _button = require("antd/lib/button");
const _botton = t.variableDeclaration("var", [
t.variableDeclarator(
t.identifier("_button"),
t.callExpression(t.identifier("require"), [
t.stringLiteral("antd/lib/button"),
])
),
]);
// 替换当前import语句
path.replaceWith(_botton);
}
},
},
};
}

TIPS: 目前 antd 包中已包含esm规范文件,可以依赖 webpack 原生 TreeShaking 实现按需引入。

LowCode 可视化编码

当下LowCode,依旧是前端一大热门领域。目前主流的做法大致下述两种。

  • Schema 驱动
    目前主流做法,将表单或者表格的配置,描述为一份 Schema,可视化设计器基于 Schema 驱动,结合拖拽能力,快速搭建。
  • AST 驱动
    通过CloudIDECodeSandbox等浏览器端在线编译,编码。外加可视化设计器,最终实现可视化编码。

大致流程如上图所示,既然涉及到代码修改,离不开AST的操作,那么又可以发挥 babel 的能力了。

假设设计器的初始代码如下:

1
2
3
4
5
6
import React from "react";

export default () => {
return <Container></Container>;
};

此时我们拖拽了一个Button至设计器中,根据上图的流程,核心的 AST 修改过程如下:

  • 新增 import 声明语句 import { Button } from "antd";
  • 将插入至

话不多说,直接上代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
import traverse from "@babel/traverse";
import generator from "@babel/generator";
import * as parser from "@babel/parser";
import * as t from "@babel/types";

// 源代码
const code = `
import React from "react";

export default () => {
return <Container></Container>;
};
`;

const ast = parser.parse(code, {
sourceType: "module",
plugins: ["jsx"],
});

traverse(ast, {
// 1\. 程序顶层 新增import语句
Program(path) {
path.node.body.unshift(
t.importDeclaration(
// importSpecifier表示具名导入,相应的匿名导入为ImportDefaultSpecifier
// 具名导入对应代码为 import { Button as Button } from 'antd'
// 如果相同会自动合并为 import { Button } from 'antd'
[t.importSpecifier(t.identifier("Button"), t.identifier("Button"))],
t.stringLiteral("antd")
)
);
},
// 访问JSX节点,插入Button
JSXElement(path) {
if (path.node.openingElement.name.name === "Container") {
path.node.children.push(
t.jsxElement(
t.jsxOpeningElement(t.jsxIdentifier("Button"), []),
t.jsxClosingElement(t.jsxIdentifier("Button")),
[t.jsxText("按钮")],
false
)
);
}
},
});

const newCode = generator(ast).code;
console.log(newCode);

结果如下:

1
2
3
4
5
6
7
8
9
10
import { Button } from "antd";
import React from "react";
export default () => {
return (
<Container>
<Button>按钮</Button>
</Container>
);
};

ESLint

自定义 eslint-rule,本质上也是访问 AST 节点,是不是跟 Babel 插件的写法很相似呢?

1
2
3
4
5
6
7
8
9
10
module.exports.rules = {
"var-length": (context) => ({
VariableDeclarator: (node) => {
if (node.id.name.length <= 2) {
context.report(node, "变量名长度需要大于2");
}
},
}),
};

Code2Code

以 Vue To React 为例,大致过程跟ES6 => ES5类似,通过vue-template-compiler编译得到Vue AST => 转换为 React AST => 输出 React 代码

有兴趣的同学可以参考 vue-to-react

其他多端框架:一份代码 => 多端,大体思路一致。

总结

在实际开发中,遇到的情况往往更加复杂,建议大家多番文档,多观察,用心去感受 ~

参考文章

  1. babel-handlebook
  2. @babel/types
  3. 透過製作 Babel-plugin 初訪 AST
  4. @babel/types 深度应用

    原文:https://zhuanlan.zhihu.com/p/486548159