从字节数组中高效提取跨字节边界的位范围数据

程序猿 • 2025年11月28日 16:48:32 • 用户投稿 • 阅读 0

本教程详细介绍了如何在java中利用`bitset`高效地从字节数组中存取跨字节边界的位范围数据。文章通过重构数据编码和解码方法，展示了如何将整数值精确地写入字节数组的指定位范围，并从这些范围中准确提取数据。核心在于利用`bitset`进行位操作，并通过转换为二进制字符串再解析的方式，避免了复杂的位反转和字节序问题，提供了清晰、可维护的解决方案。

引言：理解字节数组中的位操作

在许多低层数据处理场景中，例如网络协议解析、文件格式处理或嵌入式系统通信，我们经常需要从字节数组中存取非字节对齐的数据。这意味着一个数值可能只占据几个位，并且这些位可能跨越一个或多个字节的边界。Java的BitSet类为这种场景提供了强大的支持，它能够以位为单位进行操作，极大地简化了位级别的数据管理。

然而，在使用BitSet将数据写入字节数组或从字节数组中读取数据时，可能会遇到一些挑战，例如BitSet内部的位序表示、toByteArray()和valueOf()方法的行为，以及如何正确处理跨字节边界的数值。本教程将提供一套清晰且经过优化的方法，用于解决这些问题。

数据编码：将数值写入指定位范围

为了确保数据能够被正确地提取，首先需要确保数据被正确地编码并写入到字节数组中。原始的编码方法可能涉及复杂的位移和反转操作，容易出错。这里我们提供一个更直观、更易于理解和调试的编码方案。

核心思想是：将要存储的整数转换为其二进制字符串表示，然后将其各位数字（0或1）精确地放置到BitSet的指定位索引中。

1. createMessageHeader 方法重构

createMessageHeader 方法负责初始化一个包含所有预设值的BitSet，并最终将其转换为byte[]。我们简化了原始代码中的数组重赋值和末尾的位反转逻辑，使之更直接地生成BitSet。

protected byte[] createMessageHeader() {    // 初始化一个足够大的int数组来表示所有位    int[] set = new int[128]; // 128位    // 使用 integrate 方法将数值写入指定位范围    integrate(set, 3, 3);    integrate(set, 0, 5);    integrate(set, 1000, 15);    integrate(set, 200, 23);    integrate(set, 200, 31);    integrate(set, 1294967295, 63); // 这是一个int范围内的最大值    integrate(set, 5, 71);    integrate(set, 3, 79);    integrate(set, 0, 83);    integrate(set, 0, 85);    integrate(set, 1000, 94); // 注意这里是94，不是95    integrate(set, 200, 103);    integrate(set, 200, 111);    integrate(set, 300, 127);    // 将int数组转换为BitSet    BitSet bitSet = binArrayToBitset(set);    // 将BitSet转换为byte数组。BitSet.toByteArray() 会自动处理位到字节的转换    return bitSet.toByteArray();}

2. integrate 方法详解

integrate 方法是编码的核心。它接收一个整数值和其在BitSet中应结束的索引，然后将该值的二进制表示右对齐地插入到int[]数组中。

/** * 将给定值插入到int数组中，其二进制表示在数组中右对齐到给定索引。 * * @param binary          表示所有位的int数组（0或1） * @param value           要插入的整数值 * @param alignEndToIndex 值在数组中应结束的索引（包含） */protected void integrate(int[] binary, int value, int alignEndToIndex) {    // 将整数转换为其二进制字符串表示    String binaryRepresentation = Integer.toBinaryString(value);    // 将二进制字符串转换为int数组（每个元素是0或1）    int[] digits = numberStringToArrayOfDigits(binaryRepresentation);    // 计算起始索引，确保二进制表示右对齐    int startIndex = alignEndToIndex + 1 - digits.length;    // 使用 System.arraycopy 将数字数组复制到目标int数组的正确位置    System.arraycopy(digits, 0, binary, startIndex, digits.length);}/** * 将表示数字的字符串转换为包含其单个数字的整数数组。 * * @param binaryRepresentation 二进制字符串，例如 "10110" * @return 包含单个数字的int数组，例如 {1, 0, 1, 1, 0} */protected int[] numberStringToArrayOfDigits(String binaryRepresentation) {    int[] digits = new int[binaryRepresentation.length()];    for (int i = 0; i < binaryRepresentation.length(); i++) {        // 将字符 '0' 或 '1' 转换为整数 0 或 1        digits[i] = binaryRepresentation.charAt(i) - '0';    }    return digits;}

3. binArrayToBitset 方法

这个辅助方法将一个由0和1组成的int[]数组转换为BitSet。

/** * 将一个由0和1组成的int数组转换为BitSet。 * * @param binArray 包含0和1的int数组 * @return 对应的BitSet */protected BitSet binArrayToBitset(int[] binArray) {    BitSet set = new BitSet(binArray.length); // 初始化BitSet，指定容量    for (int i = 0; i < binArray.length; i++) {        if (binArray[i] != 0) {            set.set(i); // 如果数组元素为1，则设置BitSet中对应的位        }    }    return set;}

数据解码：从指定位范围提取数值

数据编码完成后，下一步是从字节数组中准确地提取出特定位范围内的数值。原始的提取尝试可能因为BitSet.toLongArray()的内部实现和位序问题而导致错误。这里提供一个更健壮的提取方法。

核心思想是：将输入的byte[]转换回BitSet，然后使用BitSet.get(start, end + 1)方法提取所需的子BitSet。接着，将这个子BitSet转换为一个二进制字符串，并使用Integer.parseInt(String, 2)进行解析。

腾讯交互翻译

腾讯AI Lab发布的一款AI辅助翻译产品

183 查看详情

1. extractBits 方法重构

/** * 从字节数组中提取由给定索引形成的整数。 * * @param header       包含位的字节数组 * @param start        要提取的位范围的起始索引（包含） * @param endInclusive 要提取的位范围的结束索引（包含） * @return 提取出的整数值 */private int extractBits(byte[] header, int start, int endInclusive) {    // 将字节数组转换为BitSet    BitSet bitSet = BitSet.valueOf(header);    // 获取指定范围的子BitSet    final BitSet subset = bitSet.get(start, endInclusive + 1);    // 将子BitSet转换为二进制字符串    final int length = endInclusive - start + 1;    StringBuilder b = new StringBuilder(length);    for (int i = 0; i < length; i++) {        b.append(subset.get(i) ? '1' : '0');    }    // 使用基数2解析二进制字符串为整数    return Integer.parseInt(b.toString(), 2);}

处理 long 类型数值的注意事项：

如果提取的位范围表示的数值可能超出int的范围（即超过31位或数值大于Integer.MAX_VALUE），则需要使用Long.parseLong(b.toString(), 2)来解析，并且extractBits方法的返回类型也应改为long。

/** * 从字节数组中提取由给定索引形成的长整数。 * * @param header       包含位的字节数组 * @param start        要提取的位范围的起始索引（包含） * @param endInclusive 要提取的位范围的结束索引（包含） * @return 提取出的长整数值 */private long extractLongBits(byte[] header, int start, int endInclusive) {    BitSet bitSet = BitSet.valueOf(header);    final BitSet subset = bitSet.get(start, endInclusive + 1);    final int length = endInclusive - start + 1;    StringBuilder b = new StringBuilder(length);    for (int i = 0; i < length; i++) {        b.append(subset.get(i) ? '1' : '0');    }    return Long.parseLong(b.toString(), 2);}

辅助与验证：确保数据完整性

为了在开发和调试过程中验证BitSet的内容是否符合预期，一个可视化的打印方法非常有用。

printBitSetByteWise 方法

这个工具方法可以将BitSet以字节为单位的二进制形式打印到控制台，方便与预期的二进制表示进行比对。

/** * 将BitSet以二进制字节形式打印到标准输出，用'|'分隔字节。 * * @param bitSet 要打印的BitSet */private static void printBitSetByteWise(BitSet bitSet) {    // 遍历BitSet的所有位    for (int i = 0; i  0 && i % 8 == 0) {            System.out.print('|');        }        // 打印当前位的值 (1或0)        System.out.print(bitSet.get(i) ? 1 : 0);    }    System.out.println();}

注意： bitSet.length() 返回的是最高设置位的索引加1。如果BitSet中所有位都未设置，则返回0。为了确保打印出整个预期的128位，可以改为 for(int i = 0; i < 128; i++)。

完整示例与实践

现在，我们将所有组件整合在一起，展示一个完整的从数据创建、打印到提取的流程。

public class BitExtractionTutorial {    // ... (此处放置上面定义的所有 protected 和 private 方法) ...    // createMessageHeader(), integrate(), numberStringToArrayOfDigits(),    // binArrayToBitset(), extractBits(), extractLongBits(), printBitSetByteWise()    public static void main(String[] args) {        BitExtractionTutorial tutorial = new BitExtractionTutorial();        // 1. 创建消息头部（字节数组）        final byte[] header = tutorial.createMessageHeader();        // 2. 验证创建的字节数组内容        System.out.println("--- 原始 BitSet 内容 (字节序打印) ---");        // 将 byte[] 转换回 BitSet 进行打印验证        BitSet createdBitSet = BitSet.valueOf(header);        tutorial.printBitSetByteWise(createdBitSet);        // 预期输出示例：0011|0011|1110|1000|1100|1000|1100|1000|0100|1101|0010|1111|1010|0001|1111|1111|0000|0101|0000|0011|0000|0000|0000|0000|0000|0000|0000|0000|0000|0000|0000|0000... (实际会根据BitSet.toByteArray()的填充和长度有所不同，但前128位应与原始数据匹配)        // 示例数据中的BitSet.toByteArray()行为是 little-endian，即低位字节在前。        // 所以实际打印出的可能与原始问题中从左到右的二进制表示是反的。        // 为了和原始问题中的二进制表示对应，需要注意BitSet.valueOf(byte[])的解释方式。        // BitSet.valueOf(byte[]) 将 byte[0] 的最低位映射到 BitSet 的索引 0，byte[0] 的最高位映射到 BitSet 的索引 7，以此类推。        // 实际 BitSet.valueOf(header) 后的 BitSet 打印结果需要根据 BitSet 的实际行为来解释。        // 如果要严格匹配原始问题中的从左到右的二进制串，需要对 BitSet.valueOf(header) 后的 BitSet 进行位序调整，        // 或者在 integrate 时就按照 BitSet.valueOf(byte[]) 的 little-endian 规则来写入。        // 当前的 integrate 方法是按照从左到右的逻辑写入 int[]，然后 binArrayToBitset 再将其转换为 BitSet。        // BitSet.toByteArray() 是 little-endian，所以 byte[0] 包含 BitSet 的 0-7 位，byte[1] 包含 8-15 位。        // 打印时，printBitSetByteWise 是按照 BitSet 索引从小到大打印。        // 因此，如果原始问题中的数据是 MSB-first，而 BitSet 内部是 LSB-first，则需要进行转换。        // 这里的解决方案通过将 BitSet 子集转换为字符串再解析，规避了直接处理字节序的复杂性。        // 3. 提取并打印指定范围的数值        System.out.println("\n--- 提取的数值 ---");        System.out.println("位范围 [6, 15] (期望 1000): " + tutorial.extractBits(header, 6, 15));        System.out.println("位范围 [32, 63] (期望 1294967295): " + tutorial.extractBits(header, 32, 63));        System.out.println("位范围 [104, 111] (期望 200): " + tutorial.extractBits(header, 104, 111));        // 示例：提取一个潜在的 long 值 (如果其位数超过 int 范围)        // 假设有一个值存储在 [112, 127] 且预期是 300        System.out.println("位范围 [112, 127] (期望 300): " + tutorial.extractBits(header, 112, 127));    }    // 复制上面定义的 protected 和 private 方法到此处，以便 main 方法可以调用    protected byte[] createMessageHeader() { /* ... */ return null; }    protected void integrate(int[] binary, int value, int alignEndToIndex) { /* ... */ }    protected int[] numberStringToArrayOfDigits(String binaryRepresentation) { /* ... */ return null; }    protected BitSet binArrayToBitset(int[] binArray) { /* ... */ return null; }    private int extractBits(byte[] header, int start, int endInclusive) { /* ... */ return 0; }    private long extractLongBits(byte[] header, int start, int endInclusive) { /* ... */ return 0L; }    private static void printBitSetByteWise(BitSet bitSet) { /* ... */ }}

(请将上述代码中的 /* … */ 替换为实际的方法实现，并确保 BitExtractionTutorial 类包含所有这些方法)

注意事项与最佳实践

位序（Endianness）：BitSet.valueOf(byte[]) 和 BitSet.toByteArray() 默认是小端序（Little-Endian）的。这意味着字节数组的第一个字节（byte[0]）对应BitSet的最低位（索引0-7），第二个字节（byte[1]）对应BitSet的次低位（索引8-15），依此类推。本教程的integrate方法通过将数值转换为二进制字符串并直接放置到BitSet的指定索引，然后extractBits方法通过获取子BitSet并转换为二进制字符串解析，巧妙地规避了直接处理字节内部位序

以上就是从字节数组中高效提取跨字节边界的位范围数据的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/894267.html

ai app git java 字符串解析字节工具编码

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

windows11如何查看主板型号和BIOS版本_Windows 11主板型号与BIOS信息查看教程

上一篇 2025年11月28日 16:48:30

小米14Pro怎么关闭自动更新？

下一篇 2025年11月28日 16:48:32

好文分享

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
4000
好文分享

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
8000
好文分享

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
4000
好文分享

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
好文分享

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
6000
好文分享

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
3000
好文分享

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
2000
好文分享

如何让“元素跟随文本高度，而不是撑高父容器？

如何让元素跟随文本高度，而不是撑高父容器在页面布局中，经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中，父容器被较高的图片撑开，而文本的高度没有被考虑。本问答将提供纯css解决方案，让图片跟随文本高度，确保父容器的高度不会被图片影响。解决方法为了解决这个问题，需要将图片从文档流中脱离…

程序猿
2025年12月24日
1000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
3000
好文分享

如何利用 CSS 选中激活标签并影响相邻元素的样式？

如何利用 css 选中激活标签并影响相邻元素？为了实现激活标签影响相邻元素的样式需求，可以通过 :has 选择器来实现。以下是如何具体操作：对于激活标签相邻后的元素，可以在 css 中使用以下代码进行设置： li:has(+li.active) { border-radius: 0 0 10px…

程序猿
2025年12月24日
2000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
3000
好文分享

为什么我的 Safari 自定义样式表在百度页面上失效了？

为什么在 Safari 中自定义样式表未能正常工作？在 Safari 的偏好设置中设置自定义样式表后，您对其进行测试却发现效果不同。在您自己的网页中，样式有效，而在百度页面中却失效。造成这种情况的原因是，第一个访问的项目使用了文件协议，可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

程序猿
2025年12月24日
1000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
1000
好文分享

使用CSS mask属性指定图片URL时，为什么浏览器无法加载图片？

css mask属性未能加载图片的解决方法使用css mask属性指定图片url时，如示例中所示： mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是，在网络面板中却…

程序猿
2025年12月24日
1000
好文分享

如何用CSS Paint API为网页元素添加时尚的斑马线边框？

为元素添加时尚的斑马线边框在网页设计中，有时我们需要添加时尚的边框来提升元素的视觉效果。其中，斑马线边框是一种既醒目又别致的设计元素。实现斜向斑马线边框要实现斜向斑马线间隔圆环，我们可以使用css paint api。该api提供了强大的功能，可以让我们在元素上绘制复杂的图形。立即学习“前端…

程序猿
2025年12月24日
1000
好文分享

图片如何不撑高父容器？

如何让图片不撑高父容器？当父容器包含不同高度的子元素时，父容器的高度通常会被最高元素撑开。如果你希望父容器的高度由文本内容撑开，避免图片对其产生影响，可以通过以下 css 解决方法：绝对定位元素： .child-image { position: absolute; top: 0; left: …

程序猿
2025年12月24日
1000
CSS 帮助

我正在尝试将文本附加到棕色框的左侧。我不能。我不知道代码有什么问题。请帮助我。 css .hero { position: relative; bottom: 80px; display: flex; justify-content: left; align-items: start; color:…

程序猿
2025年12月24日 • 好文分享
3000
好文分享

HTML、CSS 和 JavaScript 中的简单侧边栏菜单

构建一个简单的侧边栏菜单是一个很好的主意，它可以为您的网站添加有价值的功能和令人惊叹的外观。侧边栏菜单对于客户找到不同项目的方式很有用，而不会让他们觉得自己有太多选择，从而创造了简单性和秩序。今天，我将分享一个简单的 HTML、CSS 和 JavaScript 源代码来创建一个简单的侧边栏菜单。…

程序猿
2025年12月24日
5000
好文分享

前端代码辅助工具：如何选择最可靠的AI工具？

前端代码辅助工具：可靠性探讨对于前端工程师来说，在HTML、CSS和JavaScript开发中借助AI工具是司空见惯的事情。然而，并非所有工具都能提供同等的可靠性。个性化需求关于哪个AI工具最可靠，这个问题没有一刀切的答案。每个人的使用习惯和项目需求各不相同。以下是一些影响选择的重要因素：立…

程序猿
2025年12月24日
1000
好文分享

带有 HTML、CSS 和 JavaScript 工具提示的响应式侧边导航栏

响应式侧边导航栏不仅有助于改善网站的导航，还可以解决整齐放置链接的问题，从而增强用户体验。通过使用工具提示，可以让用户了解每个链接的功能，包括设计紧凑的情况。在本教程中，我将解释使用 html、css、javascript 创建带有工具提示的响应式侧栏导航的完整代码。对于那些一直想要一个干净、简…

程序猿
2025年12月24日
1000