XML的unparsed entity怎么引用？

程序猿 • 2025年12月17日 03:15:28 • 好文分享 • 阅读 0

非解析实体通过属性引用外部资源，解析器不解析其内容，仅将uri和类型传递给应用程序；2. 使用非解析实体的核心在于通过notation实现类型化引用，提供比直接使用url更丰富的语义信息；3. 与解析实体不同，非解析实体不参与xml内容解析，仅作为外部资源的强类型化指针，适用于多媒体集成、非xml文档引用及高可靠性数据交换场景。

XML的非解析实体（unparsed entity）引用，说白了，你不是直接在XML文档内容里“解析”它，而是通过一个元素的属性来“指向”它。XML解析器不会去处理这个实体的内容，它只是把这个实体的URI和它的类型信息（notation）传递给应用程序，让应用程序自己去搞定。这就像是给你的程序一个线索，告诉它“这里有个外部文件，长这样，你看着办吧。”

解决方案

要引用一个非解析实体，你需要在XML的文档类型定义（DTD）中完成两步：先声明一个“记号”（notation），再声明这个非解析实体本身。最后，在你的XML文档中，通过一个特定类型的属性来引用它。

第一步：声明一个记号（Notation）

记号是用来描述外部非XML数据格式的。它告诉应用程序这个实体是什么类型的数据（比如JPEG图片、PDF文档、或者某个特定应用的数据格式）。

这里，jpeg和pdf是记号的名字，SYSTEM "..."后面通常是MIME类型或一个外部标识符，用于帮助应用程序识别数据类型。

第二步：声明非解析实体

现在，你可以声明你的非解析实体了。声明时，你需要指定它的名字、它指向的外部资源（URI），以及它所关联的记号。

myCoverImage和annualReport是实体的名字。SYSTEM "..."指向实际的文件路径。NDATA jpeg和NDATA pdf就是将这些实体分别与前面声明的jpeg和pdf记号关联起来。

第三步：在XML文档中引用

非解析实体不能像解析实体那样用&entityName;的方式直接插入到XML内容中。它们必须作为某个元素的属性值来引用。但这个属性本身也得在DTD中声明为ENTITY类型。

这里，我们声明了一个book元素，它有两个属性coverImage和reportLink，它们的类型都是ENTITY。这意味着这些属性的值必须是已声明的非解析实体的名字。

最后，在你的XML文档中这样使用：

     XML探险记    张三    ...

当XML解析器处理到时，它会识别出coverImage是一个ENTITY类型的属性，并且其值myCoverImage是一个非解析实体。解析器不会去读取images/cover.jpg的内容，它只会将myCoverImage这个实体的URI（images/cover.jpg）和它关联的记号（jpeg）传递给处理这个XML文档的应用程序。应用程序拿到这些信息后，就知道要去加载images/cover.jpg这个JPEG图片文件并进行相应的处理。

为什么我们需要使用XML的非解析实体（Unparsed Entity）？

这其实是个挺有意思的设计。你可能会想，我直接在XML属性里写个URL不就行了吗？比如，多简单。但非解析实体提供的，远不止一个简单的URL链接那么粗暴。

在我看来，它的核心价值在于“类型化”和“语义丰富性”。当你只给一个URL时，应用程序并不知道这个URL指向的是图片、PDF、还是一个视频。它需要额外的逻辑去猜测或者依赖文件扩展名。而通过非解析实体，结合NDATA和NOTATION，我们是在DTD层面就给这个外部资源打上了一个明确的“类型标签”。这个标签（notation）可以非常具体，比如“这是一个JPEG图片”，或者“这是一个特定版本的CAD图纸文件”。

这使得XML文档不仅仅是数据的容器，更是外部资源管理的一个协调者。XML解析器虽然不碰外部数据本身，但它能确保你的XML文档中引用的外部资源是“合法”的，并且能向应用程序传递足够的信息，让应用程序知道如何正确地处理这些外部数据。这在那些需要严格验证和多媒体集成的场景下，比如早期的文档发布系统或者复杂的行业数据交换标准中，显得尤为重要。它提供了一种基于DTD的、强类型化的外部资源引用机制，确保了数据的一致性和可预测性。

非解析实体（Unparsed Entity）与解析实体（Parsed Entity）的核心差异在哪里？

这个问题触及了XML实体机制的本质区别。说白了，它们俩虽然都叫“实体”，但骨子里干的活儿完全不一样。

解析实体 (Parsed Entity)，顾名思义，是XML解析器会“解析”其内容的实体。当XML解析器遇到一个解析实体引用（比如&copyrightInfo;），它会做一件事：把这个引用替换成实体声明中定义的内容，然后继续解析替换后的内容。这就像一个文本宏，解析器会把它展开。

内容类型： 必须是XML解析器能够处理的文本内容，可以是内部定义的字符串，也可以是外部的XML或纯文本文件（但XML解析器会尝试将其作为XML片段来处理）。引用方式： 通常使用&entityName;的形式，出现在XML文档的内容区域或属性值中。解析行为： XML解析器会读取实体内容，并将其整合到主文档的解析流中。如果内容是XML，它会被解析；如果是非XML文本，它会被视为字符数据。

非解析实体 (Unparsed Entity)，则完全是另一回事。它指向的是XML解析器“不解析”的内容，通常是外部的、非XML格式的二进制数据或者其他应用程序特有的数据。

内容类型： 任何外部数据，包括图片（JPEG, PNG）、音频、视频、PDF文档，或者任何不符合XML语法的文本文件。XML解析器根本不关心其内部结构。引用方式： 只能通过一个属性来引用，而且这个属性必须在DTD中声明为ENTITY类型。你不能在XML内容里直接写&myImageEntity;来引用它。解析行为： XML解析器不会读取或解析非解析实体的内容。它只会识别出实体名称，获取其关联的URI和记号（notation），然后将这些信息传递给处理XML文档的应用程序。应用程序收到这些信息后，才负责根据URI去加载外部数据，并根据记号来决定如何处理这些数据（比如用图片查看器打开，或者用PDF阅读器打开）。

所以，最核心的差异在于：解析实体是XML文档的“内容扩展”，它们的内容是XML解析过程的一部分；而非解析实体则是XML文档的“外部资源引用”，它们的内容是应用程序的责任，XML解析器只是一个信息传递者。

在实际应用中，如何有效地利用XML的非解析实体？

虽然在现代XML应用中，特别是那些基于XML Schema（XSD）而非DTD的项目里，非解析实体可能不像过去那么常见，但它在特定场景下依然有着不可替代的价值。我个人觉得，理解它的设计哲学，对我们理解XML的“元数据”能力很有帮助。

1. 多媒体和二进制资源的集成： 这是非解析实体最经典、也最直观的应用场景。想象一下，你正在构建一个XML文档来描述一本电子书。这本书里有封面图片、章节插图、甚至一些嵌入的音频或视频片段。你当然可以在XML里直接写，但这只是一个URI。如果你的应用程序需要知道这个image.jpg是JPEG格式还是PNG格式，或者需要特定的处理方式，非解析实体就能派上用场。

    XML实战

在这里，coverImage="cover"不仅仅指向一个文件，它还通过DTD告诉应用程序：“嘿，这个cover实体，它是一个JPEG图片！”应用程序就能据此调用正确的图像处理模块。

2. 引用非XML格式的外部文档： 除了多媒体，很多时候我们需要在XML中引用其他格式的文档，比如一份PDF报告、一个Excel电子表格、或者一个CAD设计文件。这些文件本身不是XML，也不应该被XML解析器处理。非解析实体提供了一个干净的引用机制。

    第三季度预算报告已完成。

这使得你的XML文档可以作为不同类型信息的“总目录”或“清单”，而无需将所有数据都塞进XML格式。

3. 强类型化外部资源： 这点其实是前面两点的基础。非解析实体通过NDATA和NOTATION机制，为外部资源提供了一种强类型化的声明。这对于需要严格验证和互操作性的系统非常重要。例如，在航空航天或医疗领域的数据交换中，一个XML文档可能需要引用特定格式的传感器数据文件或医学影像。通过非解析实体，你可以确保引用的文件类型是符合预期的，从而提高数据的可靠性和系统的健壮性。

然而，值得一提的是，非解析实体是DTD特有的功能。在基于XML Schema（XSD）的现代XML应用中，由于XSD没有直接等同于NDATA和NOTATION的机制来声明外部非XML数据的类型，通常会采用xs:anyURI类型结合自定义属性（例如type="image/jpeg"）来达到类似的目的。但这需要应用程序自己去解析这些自定义属性，而不是像DTD那样在解析器层面就提供类型提示。所以，如果你还在使用DTD，或者处理一些老旧但依然重要的XML标准，非解析实体依然是一个非常具体且有效的解决方案。

以上就是XML的unparsed entity怎么引用？的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1430021.html

cad xml 为什么区别

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

XSD的final属性限制什么派生行为？

上一篇 2025年12月17日 03:15:26

XSLT的function元素如何定义自定义函数？

下一篇 2025年12月17日 03:15:36

好文分享

CSS mask属性无法获取图片：为什么我的图片不见了？

CSS mask属性无法获取图片在使用CSS mask属性时，可能会遇到无法获取指定照片的情况。这个问题通常表现为：网络面板中没有请求图片：尽管CSS代码中指定了图片地址，但网络面板中却找不到图片的请求记录。问题原因：此问题的可能原因是浏览器的兼容性问题。某些较旧版本的浏览器可能不支持CSS…

程序猿
2025年12月24日
15000
为什么设置 `overflow: hidden` 会导致 `inline-block` 元素错位？

overflow 导致 inline-block 元素错位解析当多个 inline-block 元素并列排列时，可能会出现错位显示的问题。这通常是由于其中一个元素设置了 overflow 属性引起的。问题现象在不设置 overflow 属性时，元素按预期显示在同一水平线上：不设置 overf…

程序猿
2025年12月24日 • 好文分享
5000
好文分享

网页使用本地字体：为什么 CSS 代码中明明指定了“荆南麦圆体”，页面却仍然显示“微软雅黑”？

网页中使用本地字体本文将解答如何将本地安装字体应用到网页中，避免使用 src 属性直接引入字体文件。问题：想要在网页上使用已安装的“荆南麦圆体”字体，但 css 代码中将其置于第一位的“font-family”属性，页面仍显示“微软雅黑”字体。立即学习“前端免费学习笔记（深入）”；答案： …

程序猿
2025年12月24日
3000
好文分享

为什么我的特定 DIV 在 Edge 浏览器中无法显示？

特定 DIV 无法显示：用户代理样式表的困扰当你在 Edge 浏览器中打开项目中的某个 div 时，却发现它无法正常显示，仔细检查样式后，发现是由用户代理样式表中的 display none 引起的。但你疑问的是，为什么会出现这样的样式表，而且只针对特定的 div？背后的原因用户代理样式表是由…

程序猿
2025年12月24日
3000
好文分享

inline-block元素错位了，是为什么？

inline-block元素错位背后的原因 inline-block元素是一种特殊类型的块级元素，它可以与其他元素行内排列。但是，在某些情况下，inline-block元素可能会出现错位显示的问题。错位的原因当inline-block元素设置了overflow:hidden属性时，它会影响元素的…

程序猿
2025年12月24日
1000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
3000
好文分享

为什么使用 inline-block 元素时会错位？

inline-block 元素错位成因剖析在使用 inline-block 元素时，可能会遇到它们错位显示的问题。如代码 demo 所示，当设置了 overflow 属性时，a 标签就会错位下沉，而未设置时却不会。问题根源： overflow:hidden 属性影响了 inline-block …

程序猿
2025年12月24日
1000
好文分享

为什么我的 CSS 元素放大效果无法正常生效？

css 设置元素放大效果的疑问解答原提问者在尝试给元素添加 10em 字体大小和过渡效果后，未能在进入页面时看到放大效果。探究发现，原提问者将 CSS 代码直接写在页面中，导致放大效果无法触发。解决办法如下：将 CSS 样式写在一个单独的文件中，并使用标签引入该样式文件。这个操作与原提问者观…

程序猿
2025年12月24日
1000
好文分享

为什么我的 em 和 transition 设置后元素没有放大？

元素设置 em 和 transition 后不放大一个 youtube 视频中展示了设置 em 和 transition 的元素在页面加载后会放大，但同样的代码在提问者电脑上没有达到预期效果。可能原因：问题在于 css 代码的位置。在视频中，css 被放置在单独的文件中并通过 link 标签引…

程序猿
2025年12月24日
3000
好文分享

为什么在父元素为inline或inline-block时，子元素设置width: 100%会出现不同的显示效果？

width:100%在父元素为inline或inline-block下的显示问题问题提出当父元素为inline或inline-block时，内部元素设置width:100%会出现不同的显示效果。以代码为例：测试内容这是inline-block span 效果1：父元素为inline-bloc…

程序猿
2025年12月24日
5000
好文分享

为什么自定义样式表在 Safari 中访问百度页面时无法生效？

自定义样式表在 safari 中失效的原因用户尝试在 safari 偏好设置中添加自定义样式表，代码如下： body { background-image: url(“/users/luxury/desktop/wallhaven-o5762l.png”) !important;} 测试后发现，在…

程序猿
2025年12月24日
1000
如何在网页 F12 调试中查看鼠标悬停时才出现的 DOM 元素？

如何在网页 f12 调试中查看鼠标悬停时才出现的 dom 元素？在 f12 调试模式下，鼠标悬停时才出现的 dom 元素无法通过直接选择查看。解决方法根据显示原理的不同而有所区别： 1. css 控制的元素强制开启悬停状态：在 firefox 浏览器中，可以通过在开发者工具中手动开启选中元素的 …

程序猿
2025年12月24日 • 好文分享
2000
好文分享

TDesign UI库中小程序开发的CSS选择器：为什么“.t-grid–card”能生效？

TDesign UI库中CSS选择器困惑在小程序开发中，使用TDesign UI库时，您可能会遇到一个困惑的CSS选择器。例如，在DOM结构中，一个元素的class为”t-grid t-card class t-class”, 但其CSS选择器却是”&#8216…

程序猿
2025年12月24日
1000
好文分享

逻辑属性与旧版属性：如何根据文本方向选择合适的CSS属性？

CSS 逻辑属性与旧版属性 CSS 中引入了逻辑属性和旧版属性的概念。这些属性负责控制页面元素的外观和布局。逻辑属性逻辑属性以逻辑方向命名，如左右、上下。它们根据元素在文档流中的位置来确定元素的外观。例如：立即学习“前端免费学习笔记（深入）”； marginBlockStart：控制元素在垂直…

程序猿
2025年12月24日
1000
好文分享

CSS 逻辑属性和旧版属性：如何选择？

css逻辑属性与旧版属性 css中，逻辑属性和旧版属性用于控制元素的布局和外观。然而，两者在语法和使用方式上有所不同。逻辑属性逻辑属性是基于元素在现实世界中的预期行为来命名的。它使用诸如 “start”、”end” 和 “block&#…

程序猿
2025年12月24日
2000
好文分享

您不需要 CSS 预处理器

原生 css 在最近几个月/几年里取得了长足的进步。在这篇文章中，我将回顾人们使用 sass、less 和 stylus 等 css 预处理器的主要原因，并向您展示如何使用原生 css 完成这些相同的事情。分隔文件分离文件是人们使用预处理器的主要原因之一。尽管您已经能够将另一个文件导入到 css…

程序猿
2025年12月24日
1000
好文分享

动态样式类名为何失效：嵌套与并列选择器的区别在哪里？

动态样式类名不起作用：嵌套与并列问题在使用动态样式类名时，有时会遇到尽管触发事件但样式却没有改变的情况。这可能是由于使用了后代选择器而造成的。以提供的代码为例：块中，嵌套的类是content类的后代。这意味着类仅在元素包含子元素时才能生效。为了解决这个问题，需要将与类编写为并列，而不是嵌套方…

程序猿
2025年12月24日
3000
好文分享

CSS 定位属性：六种定位方式的区别是什么？

CSS中的定位属性及其区别 CSS中的 position 属性定义元素的定位行为，它共有六个可供选择的属性值，分别是：静态定位 (static)：默认值，元素按照正常文档流进行定位。相对定位 (relative)：元素相对于自身原本的位置进行偏移。绝对定位 (absolute)：元素相对于最近的非…

程序猿
2025年12月24日
1000
好文分享

父元素仅设置 Line-height 对子元素高度的影响：行内块级元素与块级元素有什么区别？

父元素仅设置 Line-height 对子元素的块级或行内块级元素的影响当父元素只设置了 Line-height 而没有设置高度时，对其子元素的影响将取决于子元素的类型。如果子元素是行内块级元素，如 inine-block，父元素的 Line-height 将成为子元素的高度。这是因为行内块级元…

程序猿
2025年12月24日
1000
好文分享

当父元素仅设置行高时，块级和行内块级元素的行为有何区别？

当父元素仅设置行高时，块级或行内块级子元素的行为在 html 中，当父元素仅设置行高 line-height 时，块级或行内块级元素的行为会有所不同。 <line-height: 60px; background-color: antiquewhite; 哈哈哈行内块级元素（display…

程序猿
2025年12月24日
3000