需将HTML解析为JS对象树,可用五种方法:一、DOMParser安全解析字符串;二、递归遍历现有DOM元素;三、innerHTML+临时div兼容旧环境;四、XMLSerializer反向序列化(限XML兼容HTML);五、htmlparser2流式解析大型HTML。

如果您拥有HTML字符串或DOM元素,需要将其结构化为JavaScript对象以便程序化操作,则需将HTML解析为树状对象模型。以下是实现此转换的多种方法:
一、使用DOMParser解析HTML字符串
DOMParser可在不依赖页面上下文的情况下,将HTML字符串安全地解析为Document对象,进而遍历构建自定义JS对象树。
1、创建DOMParser实例:const parser = new DOMParser();
2、调用parseFromString方法,传入HTML字符串与MIME类型:const doc = parser.parseFromString(htmlString, ‘text/html’);
立即学习“Java免费学习笔记(深入)”;
3、获取body子节点并递归遍历其childNodes,提取tagName、attributes、textContent及children属性,组装为嵌套对象。
二、递归遍历现有DOM元素生成对象
针对已挂载或临时创建的Element节点,可通过原生DOM API逐层读取属性与子节点,构造符合需求的对象结构。
1、定义递归函数,接收一个Element参数:function elementToObject(el) { … }
2、初始化对象,包含tagName、id、className等基础属性:const obj = { tagName: el.tagName.toLowerCase(), attributes: {} };
3、遍历el.attributes,将name和value存入obj.attributes对象中。
4、若el.hasChildNodes()为true,则对el.childNodes过滤出Element节点,映射调用elementToObject,结果存入obj.children数组。
三、使用innerHTML配合临时div容器
适用于无法使用DOMParser的旧环境(如部分IE版本),通过临时插入HTML并读取其子节点来构建对象模型。
1、创建临时div元素:const temp = document.createElement(‘div’);
2、设置其innerHTML为待解析的HTML字符串:temp.innerHTML = htmlString;
3、检查temp.firstElementChild是否存在,若存在则以其为根节点启动递归对象构建流程。
四、利用XMLSerializer反向序列化再解析(仅限XML兼容HTML)
当HTML结构严格符合XML语法(如所有标签闭合、属性带引号),可先用XMLSerializer转为字符串,再以XML方式解析,确保节点层级精确还原。
1、创建XMLSerializer实例:const serializer = new XMLSerializer();
2、对目标Element执行serializeToString:const xmlStr = serializer.serializeToString(el);
3、使用DOMParser以’application/xml’类型解析该字符串,获取XMLDocument后按元素节点类型提取数据字段。
五、采用第三方库如htmlparser2进行流式解析
对于大型HTML字符串或需高度可控解析行为的场景,htmlparser2提供事件驱动机制,在start、end、text等钩子中累积构建对象模型,避免完整DOM树内存开销。
1、安装并引入库:const { Parser } = require(‘htmlparser2’);
2、初始化Parser实例,监听onopentag、onclosetag、ontext等事件。
3、在onopentag中推入新对象至栈顶,在ontext中填充当前节点textContent,在onclosetag中弹出并附加到父节点children数组。
以上就是html如何转化成对象_将HTML元素转化为JavaScript对象模型【模型】的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1606573.html
微信扫一扫
支付宝扫一扫