如何过滤网页上可见的HTML节点以提取字体文件

如何过滤网页上可见的html节点以提取字体文件

本文旨在提供一种使用JavaScript过滤网页上可见HTML节点的方法,以便提取网页中实际使用的字体文件。通过结合querySelectorAll、offsetWidth、offsetHeight以及window.getComputedStyle等API,我们可以有效地筛选出在页面上实际呈现的元素,并获取它们使用的字体信息,从而避免提取到未实际显示的字体。

在开发诸如提取网页字体文件的Chrome扩展程序时,一个常见的问题是如何排除那些虽然存在于DOM中,但实际上在页面上不可见的元素。例如,某些网站可能会将字体应用于隐藏的元素或仅在特定条件下显示的元素。为了解决这个问题,我们需要一种方法来过滤出网页上可见的HTML节点。

过滤可见节点

一种有效的方法是利用元素的 offsetWidth 和 offsetHeight 属性。如果一个元素的这两个属性都大于0,则可以认为该元素是可见的。我们可以使用 document.querySelectorAll 获取所有子元素,然后使用 filter 方法来筛选出可见的元素。

以下是示例代码:

立即学习“前端免费学习笔记(深入)”;

var childNodes = [].slice.call(document.body.querySelectorAll("*"));var visibleNodes = childNodes.filter(node => node.offsetWidth > 0 && node.offsetHeight > 0);

这段代码首先使用 document.body.querySelectorAll(“*”) 获取

元素下的所有子元素。然后,使用 [].slice.call 将返回的 NodeList 转换为数组,以便可以使用数组的 filter 方法。filter 方法使用一个回调函数来判断每个元素是否可见,只有 offsetWidth 和 offsetHeight 都大于 0 的元素才会被保留。

注意: 这种方法比简单地检查 display: none 等CSS属性更为可靠,因为它可以考虑到元素因各种原因而不可见的情况,例如被其他元素遮挡或超出视口范围。

获取可见元素的字体

在获得可见节点列表后,我们可以使用 window.getComputedStyle 来获取每个元素的字体信息。

以下是示例代码:

立即学习“前端免费学习笔记(深入)”;

var fontFamilies = visibleNodes.map(node => window.getComputedStyle(node).fontFamily).filter(ff => !!ff);

这段代码使用 map 方法将可见节点数组转换为字体家族数组。然后,使用 filter 方法过滤掉空字符串或 null 值,确保只保留有效的字体家族。

去重字体家族

为了获得唯一的字体家族列表,可以使用 Set 数据结构。

以下是示例代码:

立即学习“前端免费学习笔记(深入)”;

var uniqueFamilies = [...new Set(fontFamilies)];

这段代码使用 Set 数据结构来存储唯一的字体家族,然后使用展开运算符 … 将 Set 转换为数组。

完整示例

以下是一个完整的示例,演示了如何过滤网页上可见的HTML节点并提取唯一的字体家族列表:

var childNodes = [].slice.call(document.body.querySelectorAll("*"));var visibleNodes = childNodes.filter(node => node.offsetWidth > 0 && node.offsetHeight > 0);var fontFamilies = visibleNodes.map(node => window.getComputedStyle(node).fontFamily).filter(ff => !!ff);var uniqueFamilies = [...new Set(fontFamilies)];console.log(uniqueFamilies);

总结

通过结合 querySelectorAll、offsetWidth、offsetHeight 以及 window.getComputedStyle 等API,我们可以有效地过滤出网页上可见的元素,并获取它们使用的字体信息。这种方法可以帮助我们提取网页中实际使用的字体文件,避免提取到未实际显示的字体,从而提高效率和准确性。在实际应用中,可以根据具体需求进行调整和优化。例如,可以根据特定的CSS选择器来筛选元素,或者使用更复杂的算法来判断元素的可见性。

以上就是如何过滤网页上可见的HTML节点以提取字体文件的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1571766.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月22日 14:02:54
下一篇 2025年12月22日 14:03:11

相关推荐

  • HTML表单如何实现暗黑模式?怎样切换表单的配色方案?

    实现html表单暗黑模式的核心是使用css变量结合媒体查询@media (prefers-color-scheme: dark)响应系统偏好,并通过javascript提供手动切换功能,具体做法是在:root中定义亮色模式的颜色变量,在媒体查询中重定义为暗色模式的值,同时为表单元素统一设置基于变量的…

    2025年12月22日
    000
  • HTML如何设置错误样式?error伪类的作用是什么?

    原生html/css中不存在名为:error的伪类,该说法通常是对前端框架或库中自定义状态的误解;2. 表单元素的错误样式主要通过:invalid、:required等标准伪类结合javascript动态添加类名(如is-error)实现;3. 可辅助表单验证的伪类包括:valid、:focus、:…

    2025年12月22日
    000
  • 如何筛选网页上可见的HTML节点并提取字体信息

    筛选网页上可见的HTML节点并提取字体信息 摘要:本文旨在提供一种高效的方法,用于筛选网页上实际可见的HTML节点,并提取这些节点所使用的字体信息。通过结合 querySelectorAll、offsetWidth、offsetHeight 和 getComputedStyle 等技术,可以精准地定…

    2025年12月22日
    000
  • HTML如何制作聊天机器人?对话框怎么设计?

    html负责构建聊天机器人的界面结构,包括消息显示区域和用户输入区域;2. css用于美化界面,通过样式设计消息气泡、滚动行为和输入组件,提升视觉体验;3. javascript实现交互逻辑,监听用户输入与点击事件,动态添加消息并处理机器人回复,赋予界面动态功能;4. 聊天机器人的“智能”能力依赖后…

    2025年12月22日
    000
  • HTML标题标签有哪些?h1到h6标签有什么区别?

    html标题标签从h1到h6的主要区别在于语义层级而非视觉样式,h1代表页面最高级别标题,通常一个页面只使用一个h1以明确主题,h2用于主要章节,h3至h6逐级作为子标题,形成清晰的内容结构,这种语义化结构对seo和用户体验至关重要,搜索引擎通过标题层级理解页面内容,用户尤其是视障者依赖标题导航,合…

    2025年12月22日
    000
  • 解决响应式侧边栏遮挡内容的问题

    解决响应式侧边栏遮挡内容的问题 本文旨在解决在响应式侧边栏设计中,当侧边栏在小屏幕下展开时,出现在内容下方的遮挡问题。通过调整 CSS 的 z-index 属性,确保侧边栏始终位于内容之上,从而提供更好的用户体验。文章将提供详细的 CSS 代码示例和关键步骤,帮助开发者轻松修复这一常见问题。 在开发…

    2025年12月22日
    000
  • HTML表单如何实现区块链存证?怎样永久记录提交?

    html表单无法直接实现区块链存证,必须通过后端服务将表单数据的哈希值写入区块链,1. 首先前端收集数据并提交至后端,2. 后端进行数据校验、标准化后使用sha-256等算法生成哈希值,3. 再通过区块链sdk构造并签名交易,将哈希值上链,4. 最终利用区块链的密码学哈希链、分布式共识和时间戳机制确…

    2025年12月22日
    000
  • React 中使用 map() 实现点击图片放大功能

    本文档旨在帮助开发者理解如何在 React 应用中使用 map() 函数渲染图片列表,并实现点击特定图片后将其放大的功能。我们将探讨两种实现方式:一种是重新创建事件处理函数,另一种是利用 HTML 元素的 data 属性。通过本文,你将掌握如何正确地将索引传递给事件处理函数,从而实现图片放大效果。 …

    2025年12月22日 好文分享
    000
  • HTML多行文本框怎么用?textarea标签的作用是什么?

    textarea是HTML中用于输入多行文本的表单元素,支持通过rows、cols设置初始尺寸,name定义提交字段名,可包含默认文本。2. 常用属性包括placeholder(提示文本)、readonly(只读)、disabled(禁用且不提交)、maxlength(限制字符数)。3. 可通过Ja…

    2025年12月22日 好文分享
    000
  • 在禁用按钮上触发悬停事件并显示提示信息的实现指南

    本教程旨在解决如何在禁用状态的HTML按钮上触发悬停事件并显示非子元素提示信息的挑战。由于原生禁用按钮不响应鼠标事件,且CSS相邻选择器有严格的结构限制,文章将详细探讨两种主要解决方案:一是通过移除disabled属性并模拟禁用状态,以恢复事件响应;二是利用按钮的父容器或透明覆盖层作为悬停目标。教程…

    2025年12月22日
    000
  • 解决DIV容器中SELECT下拉选项被截断的问题

    在开发Web页面时,我们经常会遇到需要在具有滚动条的DIV容器中使用SELECT下拉框的情况。当DIV容器设置了overflow: auto属性时,如果SELECT下拉选项的数量过多,超过了DIV容器的高度,就会出现下拉选项被截断,无法完整显示的问题。这会严重影响用户体验,因为用户无法看到所有的选项…

    2025年12月22日
    000
  • HTML如何制作图片轮播?自动切换的幻灯片怎么做?

    轮播图通过HTML构建结构、CSS控制样式、JavaScript实现切换,支持触摸滑动需监听touch事件并判断方向,无限循环可通过复制首尾图片实现,性能优化包括图片压缩、懒加载、硬件加速和节流处理,常见问题如图片变形可用object-fit解决,过渡不流畅可启用transform 3D加速。 HT…

    2025年12月22日 好文分享
    000
  • HTML表单如何实现容器化部署?怎样用Docker打包表单?

    要将html表单容器化,实际上是指容器化其依赖的web服务器或后端应用。对于纯静态表单,最直接的做法是使用nginx容器托管文件:准备html等静态资源,编写dockerfile将文件复制到nginx镜像中并暴露80端口,通过docker build和docker run命令即可在http://lo…

    2025年12月22日
    000
  • HTML如何设置背景颜色?bgcolor属性的作用是什么?

    设置html背景颜色的核心方法是使用css而非bgcolor属性,因为bgcolor已被w3c弃用且不利于维护;推荐通过内联样式、内部样式表或外部样式表三种方式应用css,其中外部样式表最利于样式复用与管理;bgcolor属性曾用于直接在html标签中设置背景色,如表格背景,但因降低可读性、无法复用…

    2025年12月22日
    000
  • HTML如何设置画中画播放样式?picture-in-picture-play伪类的用法是什么?

    无法直接设置html画中画(pip)窗口的样式,因为它是由浏览器或操作系统独立管理的顶级窗口,不属于网页dom,出于安全、隐私和用户体验一致性的考虑,网页css无法控制其外观;2. 可通过picture-in-picture-play伪类修改原页面视频元素的样式,用于提供视觉反馈,如设置半透明、虚线…

    2025年12月22日
    000
  • HTML如何设置列表项标记样式?marker伪元素的作用是什么?

    要使用::marker伪元素自定义列表标记的颜色、大小和字体,可通过color、font-size和font-family属性直接设置,例如“ul li::marker { color: red; font-size: 1.2em; font-family: arial; }”即可改变标记的样式,该…

    2025年12月22日
    000
  • HTML如何设置文本装饰?text-decoration属性的用法是什么?

    使用text-decoration属性可设置文本装饰效果,1. text-decoration-line用于定义下划线、上划线、删除线或无装饰;2. text-decoration-color设置装饰线颜色;3. text-decoration-style定义实线、双线、点线、虚线或波浪线;4. t…

    2025年12月22日
    000
  • HTML表单如何实现无障碍访问?怎样优化表单的屏幕阅读?

    要让html表单对无障碍用户更友好,必须使用语义化标签如label与input通过for和id正确关联,确保屏幕阅读器能准确识别控件用途;对复杂组件补充aria属性如aria-label、aria-labelledby提供可访问名称,避免依赖placeholder替代label;利用fieldset…

    2025年12月22日
    000
  • HTML如何设置图片对齐?img的align属性作用是什么?

    现代html图片对齐应使用css而非已弃用的align属性;2. 垂直对齐文字用vertical-align;3. 水平居中可用text-align:center或margin:0 auto配合display:block;4. 文字环绕用float并注意清除浮动;5. 复杂布局推荐flexbox或g…

    2025年12月22日 好文分享
    000
  • CSS 全局样式导致元素背景色混淆问题排查与解决方案

    本文旨在帮助开发者解决由于 CSS全局样式设置不当,导致网页元素(如段落)的背景色与导航栏背景色一致,从而产生元素“位于”导航栏内部的视觉错觉问题。我们将分析问题根源,并提供修改 CSS样式的解决方案,确保页面元素按照预期渲染。 问题分析 在网页开发中,CSS 的全局样式设置会对所有元素产生影响。当…

    2025年12月22日
    000

发表回复

登录后才能评论
关注微信