首先实现词法分析将代码转为Token,再通过递归下降解析器构建AST,正确处理运算优先级,最终生成反映表达式结构的抽象语法树。

要实现一个简单的AST(抽象语法树)解析器,我们需要从词法分析(Lexer)开始,接着进行语法分析(Parser),最终生成AST。这个过程是编译原理中的核心部分,适用于构建DSL、模板引擎或简化脚本语言。
词法分析:将代码拆分为 Token
词法分析的目标是把源代码字符串转换成一个个有意义的标记(Token)。比如对于表达式 2 + 3 * 4,我们希望得到类似:
[ { type: ‘number’, value: ‘2’ }, { type: ‘operator’, value: ‘+’ }, { type: ‘number’, value: ‘3’ }, { type: ‘operator’, value: ‘*’ }, { type: ‘number’, value: ‘4’ }]
下面是一个简单的 Lexer 实现:
function tokenize(input) { const tokens = []; let i = 0;while (i < input.length) {let char = input[i];
if (char === '+' || char === '-' || char === '*' || char === '/') { tokens.push({ type: 'operator', value: char }); i++; continue;}if (/d/.test(char)) { let num = ''; while (i < input.length && /d/.test(input[i])) { num += input[i++]; } tokens.push({ type: 'number', value: parseInt(num, 10) }); continue;}if (char === ' ') { i++; continue;}throw new Error(`未知字符: ${char}`);
}
立即学习“Java免费学习笔记(深入)”;
return tokens;}
语法分析:根据 Token 构建 AST
语法分析的任务是根据 Token 流构建出一棵树结构,体现运算的优先级和嵌套关系。我们采用递归下降的方式处理表达式,并优先处理乘除(高优先级),再处理加减(低优先级)。
目标AST结构示例:
{ type: 'BinaryExpression', operator: '+', left: { type: 'NumberLiteral', value: 2 }, right: { type: 'BinaryExpression', operator: '*', left: { type: 'NumberLiteral', value: 3 }, right: { type: 'NumberLiteral', value: 4 } }}
下面是 Parser 的实现:
function parse(tokens) { let current = 0;function walk() {let token = tokens[current];
if (token.type === 'number') { current++; return { type: 'NumberLiteral', value: token.value };}if ( token.type === 'operator' && (token.value === '+' || token.value === '-')) { current++; // 跳过操作符 return { type: 'BinaryExpression', operator: token.value, left: walk(), // 左边可能是更复杂的表达式 right: parseMultiplication() // 右边优先处理乘除 };}throw new Error(`无法解析的 token: ${token.value}`);
}
立即学习“Java免费学习笔记(深入)”;
// 单独处理乘除法,保证优先级更高function parseMultiplication() {let token = tokens[current];
if (token.type === 'number') { current++; return { type: 'NumberLiteral', value: token.value };}if ( token.type === 'operator' && (token.value === '*' || token.value === '/')) { current++; return { type: 'BinaryExpression', operator: token.value, left: parseMultiplication(), right: parseMultiplication() };}throw new Error(`期望一个数字或乘除操作符`);
}
立即学习“Java免费学习笔记(深入)”;
const ast = {type: 'Program',body: []};
while (current
return ast;}
测试整个流程
现在我们可以组合 Lexer 和 Parser 来测试一个简单表达式:
const code = "2 + 3 * 4";const tokens = tokenize(code);const ast = parse(tokens);console.log(JSON.stringify(ast, null, 2));
输出结果会正确反映优先级:
{ "type": "Program", "body": [ { "type": "BinaryExpression", "operator": "+", "left": { "type": "NumberLiteral", "value": 2 }, "right": { "type": "BinaryExpression", "operator": "*", "left": { "type": "NumberLiteral", "value": 3 }, "right": { "type": "NumberLiteral", "value": 4 } } } ]}
扩展思路
这个解析器目前只支持整数和四则运算,但可以继续扩展:
支持括号:遇到 ( 时递归解析内部表达式支持变量和标识符:添加 identifier 类型的 Token加入更多语法结构:如赋值、函数调用等使用 BNF 或工具生成更复杂语法分析器(如 nearley.js)
基本上就这些。通过手动实现 Lexer 和 Parser,你能更深入理解 JavaScript 是如何“读懂”代码的。不复杂但容易忽略细节,比如优先级处理和递归边界。
以上就是使用JavaScript实现一个简单的AST解析器_js编译原理的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1534160.html
微信扫一扫
支付宝扫一扫