如何用JavaScript实现一个简单的解释器?

答案是使用JavaScript实现解释器需经历词法分析、语法分析和求值三个阶段,通过Lexer将代码分解为token,Parser生成AST表达结构,Interpreter遍历AST计算结果。该过程清晰分离各阶段职责,利用AST体现运算优先级与结合性,支持后续扩展变量、控制流等特性,是构建语言处理系统的核心路径。

如何用javascript实现一个简单的解释器?

用JavaScript实现一个简单的解释器,核心思路是把输入的代码字符串一步步地处理,先是分解成一个个有意义的“词”(词法分析),然后根据语言规则把这些词组织成一个结构化的“句子”(语法分析,生成抽象语法树),最后再遍历这个“句子”结构,执行或求值。这听起来有点像把一堆散乱的乐高积木(词法分析)按图纸拼成一个模型(语法分析),然后让模型动起来(求值)。

解决方案

要用JavaScript实现一个简单的解释器,我们通常会遵循经典的解释器架构,主要包括三个阶段:词法分析(Lexing/Tokenizing)、语法分析(Parsing)和求值(Evaluation)。

1. 词法分析器 (Lexer/Tokenizer)

这是解释器的第一步,它的任务是将输入的源代码字符串分解成一系列有意义的“词素”(tokens)。每个token代表源代码中的一个基本单元,比如数字、运算符、括号、标识符等。

// 简单Token类型定义const TokenType = {    NUMBER: 'NUMBER',    PLUS: 'PLUS',    MINUS: 'MINUS',    MULTIPLY: 'MULTIPLY',    DIVIDE: 'DIVIDE',    LPAREN: 'LPAREN',    RPAREN: 'RPAREN',    EOF: 'EOF' // End Of File};class Token {    constructor(type, value) {        this.type = type;        this.value = value;    }    toString() {        return `Token(${this.type}, ${this.value})`;    }}class Lexer {    constructor(text) {        this.text = text;        this.pos = 0;        this.currentChar = this.text[this.pos];    }    advance() {        this.pos++;        this.currentChar = this.text[this.pos];    }    skipWhitespace() {        while (this.currentChar !== undefined && /s/.test(this.currentChar)) {            this.advance();        }    }    number() {        let result = '';        while (this.currentChar !== undefined && /d/.test(this.currentChar)) {            result += this.currentChar;            this.advance();        }        return new Token(TokenType.NUMBER, parseInt(result));    }    getNextToken() {        while (this.currentChar !== undefined) {            if (/s/.test(this.currentChar)) {                this.skipWhitespace();                continue;            }            if (/d/.test(this.currentChar)) {                return this.number();            }            if (this.currentChar === '+') {                this.advance();                return new Token(TokenType.PLUS, '+');            }            if (this.currentChar === '-') {                this.advance();                return new Token(TokenType.MINUS, '-');            }            if (this.currentChar === '*') {                this.advance();                return new Token(TokenType.MULTIPLY, '*');            }            if (this.currentChar === '/') {                this.advance();                return new Token(TokenType.DIVIDE, '/');            }            if (this.currentChar === '(') {                this.advance();                return new Token(TokenType.LPAREN, '(');            }            if (this.currentChar === ')') {                this.advance();                return new Token(TokenType.RPAREN, ')');            }            throw new Error(`Lexer error: Unknown character ${this.currentChar}`);        }        return new Token(TokenType.EOF, null);    }}

2. 语法分析器 (Parser)

语法分析器接收词法分析器生成的token流,并根据语言的语法规则将其组织成一个抽象语法树(AST)。AST是源代码的树状表示,它去除了源代码的表面细节(如空格、括号),只保留了其结构和语义信息。

立即学习“Java免费学习笔记(深入)”;

// AST节点定义class AST { }class BinOp extends AST {    constructor(left, op, right) {        super();        this.left = left;        this.op = op; // Token object        this.right = right;    }}class Num extends AST {    constructor(token) {        super();        this.token = token;        this.value = token.value;    }}class Parser {    constructor(lexer) {        this.lexer = lexer;        this.currentToken = this.lexer.getNextToken();    }    error(message = 'Invalid syntax') {        throw new Error(`Parser error: ${message} at ${this.currentToken.toString()}`);    }    eat(tokenType) {        if (this.currentToken.type === tokenType) {            this.currentToken = this.lexer.getNextToken();        } else {            this.error(`Expected token type ${tokenType}`);        }    }    // factor: NUMBER | LPAREN expr RPAREN    factor() {        const token = this.currentToken;        if (token.type === TokenType.NUMBER) {            this.eat(TokenType.NUMBER);            return new Num(token);        } else if (token.type === TokenType.LPAREN) {            this.eat(TokenType.LPAREN);            const node = this.expr();            this.eat(TokenType.RPAREN);            return node;        }        this.error('Unexpected token in factor');    }    // term: factor ((MUL | DIV) factor)*    term() {        let node = this.factor();        while ([TokenType.MULTIPLY, TokenType.DIVIDE].includes(this.currentToken.type)) {            const token = this.currentToken;            if (token.type === TokenType.MULTIPLY) {                this.eat(TokenType.MULTIPLY);            } else if (token.type === TokenType.DIVIDE) {                this.eat(TokenType.DIVIDE);            }            node = new BinOp(node, token, this.factor());        }        return node;    }    // expr: term ((PLUS | MINUS) term)*    expr() {        let node = this.term();        while ([TokenType.PLUS, TokenType.MINUS].includes(this.currentToken.type)) {            const token = this.currentToken;            if (token.type === TokenType.PLUS) {                this.eat(TokenType.PLUS);            } else if (token.type === TokenType.MINUS) {                this.eat(TokenType.MINUS);            }            node = new BinOp(node, token, this.term());        }        return node;    }    parse() {        const node = this.expr();        if (this.currentToken.type !== TokenType.EOF) {            this.error('Unexpected token at end of expression');        }        return node;    }}

3. 求值器 (Interpreter/Evaluator)

求值器遍历AST,并执行或计算每个节点表示的操作。对于我们这个简单的算术解释器,它会递归地计算表达式的值。

class Interpreter {    constructor(parser) {        this.parser = parser;    }    visit(node) {        if (node instanceof BinOp) {            return this.visitBinOp(node);        }        if (node instanceof Num) {            return this.visitNum(node);        }        throw new Error(`No visit method for ${node.constructor.name}`);    }    visitBinOp(node) {        if (node.op.type === TokenType.PLUS) {            return this.visit(node.left) + this.visit(node.right);        }        if (node.op.type === TokenType.MINUS) {            return this.visit(node.left) - this.visit(node.right);        }        if (node.op.type === TokenType.MULTIPLY) {            return this.visit(node.left) * this.visit(node.right);        }        if (node.op.type === TokenType.DIVIDE) {            const rightValue = this.visit(node.right);            if (rightValue === 0) {                throw new Error("Division by zero!");            }            return this.visit(node.left) / rightValue;        }        throw new Error(`Unknown operator: ${node.op.type}`);    }    visitNum(node) {        return node.value;    }    interpret() {        const tree = this.parser.parse();        return this.visit(tree);    }}// 实际运行function runInterpreter(text) {    try {        const lexer = new Lexer(text);        const parser = new Parser(lexer);        const interpreter = new Interpreter(parser);        const result = interpreter.interpret();        console.log(`Input: "${text}" => Result: ${result}`);        return result;    } catch (e) {        console.error(`Error interpreting "${text}": ${e.message}`);        return null;    }}// 示例runInterpreter("3 + 5 * (10 - 2) / 2"); // 应该输出 23runInterpreter("10 / (2 + 3)"); // 应该输出 2runInterpreter("7 - 3 * 2 + 1"); // 应该输出 2runInterpreter("1 + 2 * (3 - 1)"); // 应该输出 5runInterpreter("10 / 0"); // 应该报错runInterpreter("10 % 3"); // 应该报错

这个简单的解释器实现了基本的四则运算和括号优先级。它展示了从源代码到结果的完整路径,虽然功能有限,但足以说明解释器的工作原理。

为什么我们需要抽象语法树(AST)?它在解释器中有什么作用?

你可能会问,为什么词法分析完直接求值不行,非要多此一举弄个AST?我的经验是,AST是解释器,乃至编译器,处理源代码的核心抽象。它就像一张详细的建筑蓝图,而不是一堆散落的砖头(token)。

首先,AST解决了语法结构和语义表达的问题。词法分析器输出的tokens只是扁平的序列,它们只知道自己是什么类型,但不知道它们之间的关系。比如

1 + 2 * 3

,词法分析器会得到

[NUMBER(1), PLUS, NUMBER(2), MULTIPLY, NUMBER(3)]

。从这个序列里,你很难直接看出来

*

的优先级比

+

高。但如果构建成AST,它会是一个

BinOp(left: Num(1), op: PLUS, right: BinOp(left: Num(2), op: MULTIPLY, right: Num(3)))

这样的树形结构,优先级关系一目了然。AST天然地表达了代码的层级结构和操作顺序。

其次,AST是解耦各个阶段的关键。有了AST,语法分析器和求值器就不用直接打交道了。语法分析器只负责把token流转换成AST,而求值器只负责遍历AST并计算结果。这种分离让每个模块的职责更单一,更易于开发和维护。想象一下,如果后续要添加新的语言特性,比如变量、函数,我们只需要扩展AST节点类型和求值器的

visit

方法,而词法分析器和基本的语法规则可能不需要大改。

再者,AST提供了丰富的语义信息。它不仅仅是结构,还能承载更多的信息。比如,你可以在AST节点上附带类型信息、作用域信息,甚至代码在源文件中的位置信息。这些对于错误报告、静态分析、代码优化等都非常有用。对于一个更复杂的语言,AST是进行类型检查、变量解析、控制流分析等高级操作的基础。没有AST,你很难想象如何有效地进行这些复杂的语义分析。它就是我们理解和操作代码的“语言”。

如何处理运算符优先级和结合性?

处理运算符优先级和结合性是构建语法分析器时的一个经典挑战,也是我个人觉得最能体现解析器设计精妙之处的地方。在我们的简单解释器中,我采用了“操作符优先级爬升”(Operator-Precedence Parsing)的一种简化形式,通过递归下降解析器(Recursive Descent Parser)的结构来隐式地处理。

具体来说,我们定义了不同的解析函数来对应不同的优先级层级:

factor()

: 优先级最高,处理数字和括号表达式。括号会强制其内部表达式先被计算,这自然就提升了括号内内容的优先级。

NUMBER

(例如

5

)

LPAREN expr RPAREN

(例如

(3 + 2)

)

term()

: 处理乘法和除法,它们的优先级高于加减法。

term

函数会首先调用

factor

来获取操作数,然后在一个

while

循环中,只要遇到乘除运算符,就继续获取下一个

factor

并构建

BinOp

节点。这个循环确保了乘除法会“吃掉”尽可能多的

factor

// 伪代码node = factor();while (currentToken is MULTIPLY or DIVIDE) {    op = currentToken;    eat(op.type);    node = new BinOp(node, op, factor()); // 这里的factor()会是下一个操作数}return node;

这里体现了左结合性:

a * b * c

会被解析成

(a * b) * c

。当解析到第二个

*

时,

node

已经是

a * b

的结果,然后它会和

c

结合。

expr()

: 优先级最低,处理加法和减法。它的结构与

term()

类似,但它调用的是

term()

来获取操作数。这意味着在

expr

遇到加减法之前,

term

已经把所有乘除法处理完了。

// 伪代码node = term();while (currentToken is PLUS or MINUS) {    op = currentToken;    eat(op.type);    node = new BinOp(node, op, term()); // 这里的term()会是下一个操作数}return node;

同样,这也处理了加减法的左结合性。

这种分层函数的设计巧妙地利用了函数调用的堆来模拟优先级。高优先级的操作符(如乘除)在低优先级操作符(如加减)的函数被调用之前,就已经被解析并构建到AST的更深层级中。而结合性则通过循环处理同一优先级操作符时,将新的操作数与当前已构建的AST节点结合来自然实现。这种方法对于简单的算术表达式非常有效,但对于更复杂的语法,可能需要更强大的解析技术,比如 Pratt Parser 或者使用解析器生成器。

构建一个简单的解释器时,有哪些常见的挑战和优化方向?

在我看来,构建解释器,即使是简单的,也充满了乐趣和挑战。以下是一些我遇到的常见挑战和一些可以考虑的优化方向:

常见挑战:

错误处理和报告:这是最让我头疼的地方。当用户输入不合法的代码时,解释器应该能给出清晰、有用的错误信息,指出错误发生的位置和原因。比如,是缺少括号?还是使用了未知符号?在我的例子中,错误信息只是简单的

Lexer error

Parser error

,这对于真实世界的应用来说是远远不够的。你需要记录token的位置(行号、列号),并在抛出错误时附带这些信息。语法歧义:随着语言特性的增加,语法规则可能会变得复杂,容易产生歧义。比如,

a - b

是减法,但

a -b

可能是负数

b

的赋值。如何设计无歧义的语法规则,或者如何让解析器在有歧义时做出正确的选择,是很大的挑战。我们这个简单算术解释器在这方面还比较容易,因为语法非常有限。运算符的复杂性:除了优先级和结合性,还有一元运算符(如

-5

)、三元运算符(如

a ? b : c

)等。一元运算符的处理需要特殊的语法规则,通常在

factor

阶段或更早的词法分析阶段就处理掉。性能:对于简单的表达式,性能不是问题。但如果解释器需要处理大量代码,或者代码中包含循环、复杂的数据结构,那么求值阶段的效率就会变得很重要。递归下降解析器虽然直观,但对于非常大的输入,可能会有栈溢出的风险。内存管理:AST可能会变得非常庞大,尤其是在处理大型源文件时。如何有效地构建和管理AST节点,避免内存泄漏,也是一个实际问题。

优化方向:

更健壮的错误恢复:当前的解释器在遇到第一个错误时就会停止。一个更友好的解释器应该尝试从错误中恢复,继续解析和报告后续的错误,这样用户可以一次性看到所有问题。这通常需要解析器具备跳过错误token的能力。支持更多数据类型和操作:比如浮点数、字符串、布尔值。这需要在词法分析器中识别新的字面量,并在求值器中添加相应的操作逻辑。添加变量和赋值:这是任何编程语言都必不可少的功能。你需要一个“符号表”(Symbol Table)或“环境”(Environment)来存储变量名及其对应的值。这会改变求值器的行为,因为它需要查找和更新变量。控制流语句

if/else

while

循环等。这需要引入新的AST节点类型来表示这些结构,并在求值器中实现相应的逻辑,比如条件跳转和循环执行。函数定义与调用:这是语言的另一个核心特性。你需要处理函数参数、函数体、作用域链等。这会显著增加解释器的复杂性,特别是涉及闭包时。优化AST遍历:对于复杂的AST,可以考虑使用迭代器模式而不是纯粹的递归,以避免JavaScript的递归深度限制。即时编译 (JIT):对于性能要求高的场景,可以考虑在解释执行的同时,将部分热点代码编译成机器码或字节码,从而提高执行效率。当然,这已经超出了“简单解释器”的范畴,进入了编译器的领域。

构建解释器是一个迭代的过程,从一个简单的计算器开始,逐步添加新的语言特性,你会发现很多设计模式和计算机科学原理都能在这里找到实际的应用。每解决一个问题,都像是在拼图上放对了一块,非常有成就感。

以上就是如何用JavaScript实现一个简单的解释器?的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1520547.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月20日 13:25:17
下一篇 2025年12月20日 13:25:29

相关推荐

  • CSS mask属性无法获取图片:为什么我的图片不见了?

    CSS mask属性无法获取图片 在使用CSS mask属性时,可能会遇到无法获取指定照片的情况。这个问题通常表现为: 网络面板中没有请求图片:尽管CSS代码中指定了图片地址,但网络面板中却找不到图片的请求记录。 问题原因: 此问题的可能原因是浏览器的兼容性问题。某些较旧版本的浏览器可能不支持CSS…

    2025年12月24日
    900
  • 为什么设置 `overflow: hidden` 会导致 `inline-block` 元素错位?

    overflow 导致 inline-block 元素错位解析 当多个 inline-block 元素并列排列时,可能会出现错位显示的问题。这通常是由于其中一个元素设置了 overflow 属性引起的。 问题现象 在不设置 overflow 属性时,元素按预期显示在同一水平线上: 不设置 overf…

    2025年12月24日 好文分享
    400
  • 网页使用本地字体:为什么 CSS 代码中明明指定了“荆南麦圆体”,页面却仍然显示“微软雅黑”?

    网页中使用本地字体 本文将解答如何将本地安装字体应用到网页中,避免使用 src 属性直接引入字体文件。 问题: 想要在网页上使用已安装的“荆南麦圆体”字体,但 css 代码中将其置于第一位的“font-family”属性,页面仍显示“微软雅黑”字体。 立即学习“前端免费学习笔记(深入)”; 答案: …

    2025年12月24日
    000
  • 为什么我的特定 DIV 在 Edge 浏览器中无法显示?

    特定 DIV 无法显示:用户代理样式表的困扰 当你在 Edge 浏览器中打开项目中的某个 div 时,却发现它无法正常显示,仔细检查样式后,发现是由用户代理样式表中的 display none 引起的。但你疑问的是,为什么会出现这样的样式表,而且只针对特定的 div? 背后的原因 用户代理样式表是由…

    2025年12月24日
    200
  • inline-block元素错位了,是为什么?

    inline-block元素错位背后的原因 inline-block元素是一种特殊类型的块级元素,它可以与其他元素行内排列。但是,在某些情况下,inline-block元素可能会出现错位显示的问题。 错位的原因 当inline-block元素设置了overflow:hidden属性时,它会影响元素的…

    2025年12月24日
    000
  • 为什么 CSS mask 属性未请求指定图片?

    解决 css mask 属性未请求图片的问题 在使用 css mask 属性时,指定了图片地址,但网络面板显示未请求获取该图片,这可能是由于浏览器兼容性问题造成的。 问题 如下代码所示: 立即学习“前端免费学习笔记(深入)”; icon [data-icon=”cloud”] { –icon-cl…

    2025年12月24日
    200
  • 为什么使用 inline-block 元素时会错位?

    inline-block 元素错位成因剖析 在使用 inline-block 元素时,可能会遇到它们错位显示的问题。如代码 demo 所示,当设置了 overflow 属性时,a 标签就会错位下沉,而未设置时却不会。 问题根源: overflow:hidden 属性影响了 inline-block …

    2025年12月24日
    000
  • 为什么我的 CSS 元素放大效果无法正常生效?

    css 设置元素放大效果的疑问解答 原提问者在尝试给元素添加 10em 字体大小和过渡效果后,未能在进入页面时看到放大效果。探究发现,原提问者将 CSS 代码直接写在页面中,导致放大效果无法触发。 解决办法如下: 将 CSS 样式写在一个单独的文件中,并使用 标签引入该样式文件。这个操作与原提问者观…

    2025年12月24日
    000
  • 为什么我的 em 和 transition 设置后元素没有放大?

    元素设置 em 和 transition 后不放大 一个 youtube 视频中展示了设置 em 和 transition 的元素在页面加载后会放大,但同样的代码在提问者电脑上没有达到预期效果。 可能原因: 问题在于 css 代码的位置。在视频中,css 被放置在单独的文件中并通过 link 标签引…

    2025年12月24日
    100
  • 为什么在父元素为inline或inline-block时,子元素设置width: 100%会出现不同的显示效果?

    width:100%在父元素为inline或inline-block下的显示问题 问题提出 当父元素为inline或inline-block时,内部元素设置width:100%会出现不同的显示效果。以代码为例: 测试内容 这是inline-block span 效果1:父元素为inline-bloc…

    2025年12月24日
    400
  • 您不需要 CSS 预处理器

    原生 css 在最近几个月/几年里取得了长足的进步。在这篇文章中,我将回顾人们使用 sass、less 和 stylus 等 css 预处理器的主要原因,并向您展示如何使用原生 css 完成这些相同的事情。 分隔文件 分离文件是人们使用预处理器的主要原因之一。尽管您已经能够将另一个文件导入到 css…

    2025年12月24日
    000
  • React 嵌套组件中,CSS 样式会互相影响吗?

    react 嵌套组件 css 穿透影响 在 react 中,嵌套组件的 css 样式是否会相互影响,取决于采用的 css 解决方案。 传统 css 如果使用传统的 css,在嵌套组件中定义的样式可能会穿透影响到父组件。例如,在给出的代码中: 立即学习“前端免费学习笔记(深入)”; component…

    2025年12月24日
    000
  • React 嵌套组件中父组件 CSS 修饰会影响子组件样式吗?

    对嵌套组件的 CSS 修饰是否影响子组件样式 提问: 在 React 中,如果对嵌套组件 ComponentA 配置 CSS 修饰,是否会影响到其子组件 ComponentB 的样式?ComponentA 是由 HTML 元素(如 div)组成的。 回答: 立即学习“前端免费学习笔记(深入)”; 在…

    2025年12月24日
    000
  • 在 React 项目中实现 CSS 模块

    react 中的 css 模块是一种通过自动生成唯一的类名来确定 css 范围的方法。这可以防止大型应用程序中的类名冲突并允许模块化样式。以下是在 react 项目中使用 css 模块的方法: 1. 设置 默认情况下,react 支持 css 模块。你只需要用扩展名 .module.css 命名你的…

    2025年12月24日
    000
  • action在css中的用法

    CSS 中 action 关键字用于定义鼠标悬停或激活元素时的行为,语法:element:action { style-property: value; }。它可以应用于 :hover 和 :active 伪类,用于创建交互效果,如更改元素外观、显示隐藏元素或启动动画。 action 在 CSS 中…

    2025年12月24日
    000
  • css规则的类型有哪些

    CSS 规则包括:通用规则:选择所有元素类型选择器:根据元素类型选择元素类选择器:根据元素的 class 属性选择元素ID 选择器:根据元素的 id 属性选择元素(唯一)后代选择器:选择特定父元素内的元素子选择器:选择作为特定父元素的直接子元素的元素伪类:基于元素的状态或特性选择元素伪元素:创建元素…

    2025年12月24日
    000
  • 揭秘主流编程语言中的基本数据类型分类

    标题:基本数据类型大揭秘:了解主流编程语言中的分类 正文: 在各种编程语言中,数据类型是非常重要的概念,它定义了可以在程序中使用的不同类型的数据。对于程序员来说,了解主流编程语言中的基本数据类型是建立坚实程序基础的第一步。 目前,大多数主流编程语言都支持一些基本的数据类型,它们在语言之间可能有所差异…

    2025年12月24日
    000
  • 项目实践:如何结合CSS和JavaScript打造优秀网页的经验总结

    项目实践:如何结合CSS和JavaScript打造优秀网页的经验总结 随着互联网的快速发展,网页设计已经成为了各行各业都离不开的一项技能。优秀的网页设计可以给用户留下深刻的印象,提升用户体验,增加用户的黏性和转化率。而要做出优秀的网页设计,除了对美学的理解和创意的运用外,还需要掌握一些基本的技能,如…

    2025年12月24日
    200
  • 学完HTML和CSS之后我应该做什么?

    网页开发是一段漫长的旅程,但是掌握了HTML和CSS技能意味着你已经赢得了一半的战斗。这两种语言对于学习网页开发技能来说非常重要和基础。现在不可或缺的是下一个问题,学完HTML和CSS之后我该做什么呢? 对这些问题的答案可以分为2-3个部分,你可以继续练习你的HTML和CSS编码,然后了解在学习完H…

    2025年12月24日
    000
  • 聊聊怎么利用CSS实现波浪进度条效果

    本篇文章给大家分享css 高阶技巧,介绍一下如何使用css实现波浪进度条效果,希望对大家有所帮助! 本文是 CSS Houdini 之 CSS Painting API 系列第三篇。 现代 CSS 之高阶图片渐隐消失术现代 CSS 高阶技巧,像 Canvas 一样自由绘图构建样式! 在上两篇中,我们…

    2025年12月24日 好文分享
    200

发表回复

登录后才能评论
关注微信