从字节数组中高效提取跨字节边界的位范围数据

从字节数组中高效提取跨字节边界的位范围数据

本教程详细介绍了如何在java中利用`bitset`高效地从字节数组中存取跨字节边界的位范围数据。文章通过重构数据编码和解码方法,展示了如何将整数值精确地写入字节数组的指定位范围,并从这些范围中准确提取数据。核心在于利用`bitset`进行位操作,并通过转换为二进制字符串再解析的方式,避免了复杂的位反转和字节序问题,提供了清晰、可维护的解决方案。

引言:理解字节数组中的位操作

在许多低层数据处理场景中,例如网络协议解析、文件格式处理或嵌入式系统通信,我们经常需要从字节数组中存取非字节对齐的数据。这意味着一个数值可能只占据几个位,并且这些位可能跨越一个或多个字节的边界。Java的BitSet类为这种场景提供了强大的支持,它能够以位为单位进行操作,极大地简化了位级别的数据管理。

然而,在使用BitSet将数据写入字节数组或从字节数组中读取数据时,可能会遇到一些挑战,例如BitSet内部的位序表示、toByteArray()和valueOf()方法的行为,以及如何正确处理跨字节边界的数值。本教程将提供一套清晰且经过优化的方法,用于解决这些问题。

数据编码:将数值写入指定位范围

为了确保数据能够被正确地提取,首先需要确保数据被正确地编码并写入到字节数组中。原始的编码方法可能涉及复杂的位移和反转操作,容易出错。这里我们提供一个更直观、更易于理解和调试的编码方案。

核心思想是:将要存储的整数转换为其二进制字符串表示,然后将其各位数字(0或1)精确地放置到BitSet的指定位索引中。

1. createMessageHeader 方法重构

createMessageHeader 方法负责初始化一个包含所有预设值的BitSet,并最终将其转换为byte[]。我们简化了原始代码中的数组重赋值和末尾的位反转逻辑,使之更直接地生成BitSet。

protected byte[] createMessageHeader() {    // 初始化一个足够大的int数组来表示所有位    int[] set = new int[128]; // 128位    // 使用 integrate 方法将数值写入指定位范围    integrate(set, 3, 3);    integrate(set, 0, 5);    integrate(set, 1000, 15);    integrate(set, 200, 23);    integrate(set, 200, 31);    integrate(set, 1294967295, 63); // 这是一个int范围内的最大值    integrate(set, 5, 71);    integrate(set, 3, 79);    integrate(set, 0, 83);    integrate(set, 0, 85);    integrate(set, 1000, 94); // 注意这里是94,不是95    integrate(set, 200, 103);    integrate(set, 200, 111);    integrate(set, 300, 127);    // 将int数组转换为BitSet    BitSet bitSet = binArrayToBitset(set);    // 将BitSet转换为byte数组。BitSet.toByteArray() 会自动处理位到字节的转换    return bitSet.toByteArray();}

2. integrate 方法详解

integrate 方法是编码的核心。它接收一个整数值和其在BitSet中应结束的索引,然后将该值的二进制表示右对齐地插入到int[]数组中。

/** * 将给定值插入到int数组中,其二进制表示在数组中右对齐到给定索引。 * * @param binary          表示所有位的int数组(0或1) * @param value           要插入的整数值 * @param alignEndToIndex 值在数组中应结束的索引(包含) */protected void integrate(int[] binary, int value, int alignEndToIndex) {    // 将整数转换为其二进制字符串表示    String binaryRepresentation = Integer.toBinaryString(value);    // 将二进制字符串转换为int数组(每个元素是0或1)    int[] digits = numberStringToArrayOfDigits(binaryRepresentation);    // 计算起始索引,确保二进制表示右对齐    int startIndex = alignEndToIndex + 1 - digits.length;    // 使用 System.arraycopy 将数字数组复制到目标int数组的正确位置    System.arraycopy(digits, 0, binary, startIndex, digits.length);}/** * 将表示数字的字符串转换为包含其单个数字的整数数组。 * * @param binaryRepresentation 二进制字符串,例如 "10110" * @return 包含单个数字的int数组,例如 {1, 0, 1, 1, 0} */protected int[] numberStringToArrayOfDigits(String binaryRepresentation) {    int[] digits = new int[binaryRepresentation.length()];    for (int i = 0; i < binaryRepresentation.length(); i++) {        // 将字符 '0' 或 '1' 转换为整数 0 或 1        digits[i] = binaryRepresentation.charAt(i) - '0';    }    return digits;}

3. binArrayToBitset 方法

这个辅助方法将一个由0和1组成的int[]数组转换为BitSet。

/** * 将一个由0和1组成的int数组转换为BitSet。 * * @param binArray 包含0和1的int数组 * @return 对应的BitSet */protected BitSet binArrayToBitset(int[] binArray) {    BitSet set = new BitSet(binArray.length); // 初始化BitSet,指定容量    for (int i = 0; i < binArray.length; i++) {        if (binArray[i] != 0) {            set.set(i); // 如果数组元素为1,则设置BitSet中对应的位        }    }    return set;}

数据解码:从指定位范围提取数值

数据编码完成后,下一步是从字节数组中准确地提取出特定位范围内的数值。原始的提取尝试可能因为BitSet.toLongArray()的内部实现和位序问题而导致错误。这里提供一个更健壮的提取方法。

核心思想是:将输入的byte[]转换回BitSet,然后使用BitSet.get(start, end + 1)方法提取所需的子BitSet。接着,将这个子BitSet转换为一个二进制字符串,并使用Integer.parseInt(String, 2)进行解析。

腾讯交互翻译 腾讯交互翻译

腾讯AI Lab发布的一款AI辅助翻译产品

腾讯交互翻译 183 查看详情 腾讯交互翻译

1. extractBits 方法重构

/** * 从字节数组中提取由给定索引形成的整数。 * * @param header       包含位的字节数组 * @param start        要提取的位范围的起始索引(包含) * @param endInclusive 要提取的位范围的结束索引(包含) * @return 提取出的整数值 */private int extractBits(byte[] header, int start, int endInclusive) {    // 将字节数组转换为BitSet    BitSet bitSet = BitSet.valueOf(header);    // 获取指定范围的子BitSet    final BitSet subset = bitSet.get(start, endInclusive + 1);    // 将子BitSet转换为二进制字符串    final int length = endInclusive - start + 1;    StringBuilder b = new StringBuilder(length);    for (int i = 0; i < length; i++) {        b.append(subset.get(i) ? '1' : '0');    }    // 使用基数2解析二进制字符串为整数    return Integer.parseInt(b.toString(), 2);}

处理 long 类型数值的注意事项:

如果提取的位范围表示的数值可能超出int的范围(即超过31位或数值大于Integer.MAX_VALUE),则需要使用Long.parseLong(b.toString(), 2)来解析,并且extractBits方法的返回类型也应改为long。

/** * 从字节数组中提取由给定索引形成的长整数。 * * @param header       包含位的字节数组 * @param start        要提取的位范围的起始索引(包含) * @param endInclusive 要提取的位范围的结束索引(包含) * @return 提取出的长整数值 */private long extractLongBits(byte[] header, int start, int endInclusive) {    BitSet bitSet = BitSet.valueOf(header);    final BitSet subset = bitSet.get(start, endInclusive + 1);    final int length = endInclusive - start + 1;    StringBuilder b = new StringBuilder(length);    for (int i = 0; i < length; i++) {        b.append(subset.get(i) ? '1' : '0');    }    return Long.parseLong(b.toString(), 2);}

辅助与验证:确保数据完整性

为了在开发和调试过程中验证BitSet的内容是否符合预期,一个可视化的打印方法非常有用。

printBitSetByteWise 方法

这个工具方法可以将BitSet以字节为单位的二进制形式打印到控制台,方便与预期的二进制表示进行比对。

/** * 将BitSet以二进制字节形式打印到标准输出,用'|'分隔字节。 * * @param bitSet 要打印的BitSet */private static void printBitSetByteWise(BitSet bitSet) {    // 遍历BitSet的所有位    for (int i = 0; i  0 && i % 8 == 0) {            System.out.print('|');        }        // 打印当前位的值 (1或0)        System.out.print(bitSet.get(i) ? 1 : 0);    }    System.out.println();}

注意: bitSet.length() 返回的是最高设置位的索引加1。如果BitSet中所有位都未设置,则返回0。为了确保打印出整个预期的128位,可以改为 for(int i = 0; i < 128; i++)。

完整示例与实践

现在,我们将所有组件整合在一起,展示一个完整的从数据创建、打印到提取的流程。

public class BitExtractionTutorial {    // ... (此处放置上面定义的所有 protected 和 private 方法) ...    // createMessageHeader(), integrate(), numberStringToArrayOfDigits(),    // binArrayToBitset(), extractBits(), extractLongBits(), printBitSetByteWise()    public static void main(String[] args) {        BitExtractionTutorial tutorial = new BitExtractionTutorial();        // 1. 创建消息头部(字节数组)        final byte[] header = tutorial.createMessageHeader();        // 2. 验证创建的字节数组内容        System.out.println("--- 原始 BitSet 内容 (字节序打印) ---");        // 将 byte[] 转换回 BitSet 进行打印验证        BitSet createdBitSet = BitSet.valueOf(header);        tutorial.printBitSetByteWise(createdBitSet);        // 预期输出示例:0011|0011|1110|1000|1100|1000|1100|1000|0100|1101|0010|1111|1010|0001|1111|1111|0000|0101|0000|0011|0000|0000|0000|0000|0000|0000|0000|0000|0000|0000|0000|0000... (实际会根据BitSet.toByteArray()的填充和长度有所不同,但前128位应与原始数据匹配)        // 示例数据中的BitSet.toByteArray()行为是 little-endian,即低位字节在前。        // 所以实际打印出的可能与原始问题中从左到右的二进制表示是反的。        // 为了和原始问题中的二进制表示对应,需要注意BitSet.valueOf(byte[])的解释方式。        // BitSet.valueOf(byte[]) 将 byte[0] 的最低位映射到 BitSet 的索引 0,byte[0] 的最高位映射到 BitSet 的索引 7,以此类推。        // 实际 BitSet.valueOf(header) 后的 BitSet 打印结果需要根据 BitSet 的实际行为来解释。        // 如果要严格匹配原始问题中的从左到右的二进制串,需要对 BitSet.valueOf(header) 后的 BitSet 进行位序调整,        // 或者在 integrate 时就按照 BitSet.valueOf(byte[]) 的 little-endian 规则来写入。        // 当前的 integrate 方法是按照从左到右的逻辑写入 int[],然后 binArrayToBitset 再将其转换为 BitSet。        // BitSet.toByteArray() 是 little-endian,所以 byte[0] 包含 BitSet 的 0-7 位,byte[1] 包含 8-15 位。        // 打印时,printBitSetByteWise 是按照 BitSet 索引从小到大打印。        // 因此,如果原始问题中的数据是 MSB-first,而 BitSet 内部是 LSB-first,则需要进行转换。        // 这里的解决方案通过将 BitSet 子集转换为字符串再解析,规避了直接处理字节序的复杂性。        // 3. 提取并打印指定范围的数值        System.out.println("\n--- 提取的数值 ---");        System.out.println("位范围 [6, 15] (期望 1000): " + tutorial.extractBits(header, 6, 15));        System.out.println("位范围 [32, 63] (期望 1294967295): " + tutorial.extractBits(header, 32, 63));        System.out.println("位范围 [104, 111] (期望 200): " + tutorial.extractBits(header, 104, 111));        // 示例:提取一个潜在的 long 值 (如果其位数超过 int 范围)        // 假设有一个值存储在 [112, 127] 且预期是 300        System.out.println("位范围 [112, 127] (期望 300): " + tutorial.extractBits(header, 112, 127));    }    // 复制上面定义的 protected 和 private 方法到此处,以便 main 方法可以调用    protected byte[] createMessageHeader() { /* ... */ return null; }    protected void integrate(int[] binary, int value, int alignEndToIndex) { /* ... */ }    protected int[] numberStringToArrayOfDigits(String binaryRepresentation) { /* ... */ return null; }    protected BitSet binArrayToBitset(int[] binArray) { /* ... */ return null; }    private int extractBits(byte[] header, int start, int endInclusive) { /* ... */ return 0; }    private long extractLongBits(byte[] header, int start, int endInclusive) { /* ... */ return 0L; }    private static void printBitSetByteWise(BitSet bitSet) { /* ... */ }}

(请将上述代码中的 /* … */ 替换为实际的方法实现,并确保 BitExtractionTutorial 类包含所有这些方法)

注意事项与最佳实践

位序(Endianness):BitSet.valueOf(byte[]) 和 BitSet.toByteArray() 默认是小端序(Little-Endian)的。这意味着字节数组的第一个字节(byte[0])对应BitSet的最低位(索引0-7),第二个字节(byte[1])对应BitSet的次低位(索引8-15),依此类推。本教程的integrate方法通过将数值转换为二进制字符串并直接放置到BitSet的指定索引,然后extractBits方法通过获取子BitSet并转换为二进制字符串解析,巧妙地规避了直接处理字节内部位序

以上就是从字节数组中高效提取跨字节边界的位范围数据的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/894267.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月28日 16:45:06
下一篇 2025年11月28日 16:48:43

相关推荐

  • soul怎么发长视频瞬间_Soul长视频瞬间发布方法

    可通过分段发布、格式转换或剪辑压缩三种方法在Soul上传长视频。一、将长视频用相册编辑功能拆分为多个30秒内片段,依次发布并标注“Part 1”“Part 2”保持连贯;二、使用“格式工厂”等工具将视频转为MP4(H.264)、分辨率≤1080p、帧率≤30fps、大小≤50MB,适配平台要求;三、…

    2025年12月6日 软件教程
    400
  • 云闪付怎么快速赚取积点_云闪付积点快速获取方法

    通过微信小程序用云闪付支付可日赚692积点;62VIP会员消费满10元返积点,月上限3000;转账超1000元得2积点,还款超100元得10积点,每月各限3笔;扫本人收款码支付5元以上每笔得10积点,日限3笔;改定位至杭州领“浙里有优惠”活动卡可得2025积点。 如果您在使用云闪付时希望快速积累积点…

    2025年12月6日 软件教程
    400
  • AO3镜像站备用镜像网址_AO3镜像站快速访问官网

    AO3镜像站备用网址包括ao3mirror.com和xiaozhan.icu,当主站archiveofourown.org无法访问时可切换使用,二者均同步更新内容并支持多语言检索与离线下载功能。 AO3镜像站备用镜像网址在哪里?这是不少网友都关注的,接下来由PHP小编为大家带来AO3镜像站快速访问官…

    2025年12月6日 软件教程
    100
  • 天猫app淘金币抵扣怎么使用

    在天猫app购物时,淘金币是一项能够帮助你节省开支的实用功能。掌握淘金币的抵扣使用方法,能让你以更实惠的价格买到心仪商品。 当你选好商品并准备下单时,记得查看商品页面是否支持淘金币抵扣。如果该商品支持此项功能,在提交订单的页面会明确显示相关提示。你会看到淘金币的具体抵扣比例——通常情况下,淘金币可按…

    2025年12月6日 软件教程
    500
  • Pboot插件缓存机制的详细解析_Pboot插件缓存清理的命令操作

    插件功能异常或页面显示陈旧内容可能是缓存未更新所致。PbootCMS通过/runtime/cache/与/runtime/temp/目录缓存插件配置、模板解析结果和数据库查询数据,提升性能但影响调试。解决方法包括:1. 手动删除上述目录下所有文件;2. 后台进入“系统工具”-“缓存管理”,勾选插件、…

    2025年12月6日 软件教程
    100
  • Word2013如何插入SmartArt图形_Word2013SmartArt插入的视觉表达

    答案:可通过四种方法在Word 2013中插入SmartArt图形。一、使用“插入”选项卡中的“SmartArt”按钮,选择所需类型并插入;二、从快速样式库中选择常用模板如组织结构图直接应用;三、复制已有SmartArt图形到目标文档后调整内容与格式;四、将带项目符号的文本选中后右键转换为Smart…

    2025年12月6日 软件教程
    000
  • 《kk键盘》一键发图开启方法

    如何在kk键盘中开启一键发图功能? 1、打开手机键盘,找到并点击“kk”图标。 2、进入工具菜单后,选择“一键发图”功能入口。 3、点击“去开启”按钮,跳转至无障碍服务设置页面。 4、在系统通用设置中,进入“已下载的应用”列表。 j2me3D游戏开发简单教程 中文WORD版 本文档主要讲述的是j2m…

    2025年12月6日 软件教程
    100
  • 怎样用免费工具美化PPT_免费美化PPT的实用方法分享

    利用KIMI智能助手可免费将PPT美化为科技感风格,但需核对文字准确性;2. 天工AI擅长优化内容结构,提升逻辑性,适合高质量内容需求;3. SlidesAI支持语音输入与自动排版,操作便捷,利于紧急场景;4. Prezo提供多种模板,自动生成图文并茂幻灯片,适合学生与初创团队。 如果您有一份内容完…

    2025年12月6日 软件教程
    000
  • Pages怎么协作编辑同一文档 Pages多人实时协作的流程

    首先启用Pages共享功能,点击右上角共享按钮并选择“添加协作者”,设置为可编辑并生成链接;接着复制链接通过邮件或社交软件发送给成员,确保其使用Apple ID登录iCloud后即可加入编辑;也可直接在共享菜单中输入邮箱地址定向邀请,设定编辑权限后发送;最后在共享面板中管理协作者权限,查看实时在线状…

    2025年12月6日 软件教程
    100
  • 咸鱼遇到“只退款不退货”的买家怎么办_咸鱼处理只退款不退货方法

    先与买家协商解决,要求其按规则退货退款,并保留聊天记录;若协商无效,申请平台介入并提交发货、签收及沟通等证据;若平台处理不利且金额较大,可依法提起民事诉讼,主张买家违反《民法典》合同规定,追回货款。 如果您在咸鱼平台出售手机后,买家申请“仅退款不退货”,这可能导致您既损失商品又损失资金。以下是应对该…

    2025年12月6日 软件教程
    000
  • 怎么下载安装快手极速版_快手极速版下载安装详细教程

    1、优先通过华为应用市场搜索“快手极速版”,确认开发者为北京快手科技有限公司后安装;2、若应用商店无结果,可访问快手极速版官网下载APK文件,需手动开启浏览器的未知来源安装权限;3、也可选择豌豆荚、应用宝等可信第三方平台下载官方版本,核对安全标识后完成安装。 如果您尝试在手机上安装快手极速版,但无法…

    2025年12月6日 软件教程
    000
  • 哔哩哔哩的视频卡在加载中怎么办_哔哩哔哩视频加载卡顿解决方法

    视频加载停滞可先切换网络或重启路由器,再清除B站缓存并重装应用,接着调低播放清晰度并关闭自动选分辨率,随后更改播放策略为AVC编码,最后关闭硬件加速功能以恢复播放。 如果您尝试播放哔哩哔哩的视频,但进度条停滞在加载状态,无法继续播放,这通常是由于网络、应用缓存或播放设置等因素导致。以下是解决此问题的…

    2025年12月6日 软件教程
    000
  • REDMI K90系列正式发布,售价2599元起!

    10月23日,redmi k90系列正式亮相,推出redmi k90与redmi k90 pro max两款新机。其中,redmi k90搭载骁龙8至尊版处理器、7100mah大电池及100w有线快充等多项旗舰配置,起售价为2599元,官方称其为k系列迄今为止最完整的标准版本。 图源:REDMI红米…

    2025年12月6日 行业动态
    200
  • 买家网购苹果手机仅退款不退货遭商家维权,法官调解后支付货款

    10 月 24 日消息,据央视网报道,近年来,“仅退款”服务逐渐成为众多网购平台的常规配置,但部分消费者却将其当作“免费试用”的手段,滥用规则谋取私利。 江苏扬州市民李某在某电商平台购买了一部苹果手机,第二天便以“不想要”为由在线申请“仅退款”,当时手机尚在物流运输途中。第三天货物送达后,李某签收了…

    2025年12月6日 行业动态
    000
  • Linux中如何安装Nginx服务_Linux安装Nginx服务的完整指南

    首先更新系统软件包,然后通过对应包管理器安装Nginx,启动并启用服务,开放防火墙端口,最后验证欢迎页显示以确认安装成功。 在Linux系统中安装Nginx服务是搭建Web服务器的第一步。Nginx以高性能、低资源消耗和良好的并发处理能力著称,广泛用于静态内容服务、反向代理和负载均衡。以下是在主流L…

    2025年12月6日 运维
    000
  • 当贝X5S怎样看3D

    当贝X5S观看3D影片无立体效果时,需开启3D模式并匹配格式:1. 播放3D影片时按遥控器侧边键,进入快捷设置选择3D模式;2. 根据片源类型选左右或上下3D格式;3. 可通过首页下拉进入电影专区选择3D内容播放;4. 确认片源为Side by Side或Top and Bottom格式,并使用兼容…

    2025年12月6日 软件教程
    100
  • Linux journalctl与systemctl status结合分析

    先看 systemctl status 确认服务状态,再用 journalctl 查看详细日志。例如 nginx 启动失败时,systemctl status 显示 Active: failed,journalctl -u nginx 发现端口 80 被占用,结合两者可快速定位问题根源。 在 Lin…

    2025年12月6日 运维
    100
  • 华为新机发布计划曝光:Pura 90系列或明年4月登场

    近日,有数码博主透露了华为2025年至2026年的新品规划,其中pura 90系列预计在2026年4月发布,有望成为华为新一代影像旗舰。根据路线图,华为将在2025年底至2026年陆续推出mate 80系列、折叠屏新机mate x7系列以及nova 15系列,而pura 90系列则将成为2026年上…

    2025年12月6日 行业动态
    100
  • TikTok视频无法下载怎么办 TikTok视频下载异常修复方法

    先检查链接格式、网络设置及工具版本。复制以https://www.tiktok.com/@或vm.tiktok.com开头的链接,删除?后参数,尝试短链接;确保网络畅通,可切换地区节点或关闭防火墙;更新工具至最新版,优先选用yt-dlp等持续维护的工具。 遇到TikTok视频下载不了的情况,别急着换…

    2025年12月6日 软件教程
    100
  • Linux如何防止缓冲区溢出_Linux防止缓冲区溢出的安全措施

    缓冲区溢出可通过栈保护、ASLR、NX bit、安全编译选项和良好编码实践来防范。1. 使用-fstack-protector-strong插入canary检测栈破坏;2. 启用ASLR(kernel.randomize_va_space=2)随机化内存布局;3. 利用NX bit标记不可执行内存页…

    2025年12月6日 运维
    000

发表回复

登录后才能评论
关注微信