优化自定义分类器：实现未知类别检测的二阶段策略

程序猿 • 2025年12月2日 04:49:04 • 用户投稿 • 阅读 0

本文探讨了多类别分类器在处理不属于任何已知类别的输入时，总是返回一个预测结果的常见问题。针对这一挑战，文章提出了一种有效的二阶段分类策略：首先进行二元分类以判断目标是否存在，然后仅在目标存在时执行多类别分类。这种方法能显著提高模型的鲁棒性，并支持“无目标检测”的提示，避免误报。

在构建自定义图像分类应用时，一个常见的问题是，即使上传的图片不属于任何已训练的类别，分类器也总会返回一个预测结果。例如，一个水果检测应用在用户上传非水果图片时，仍然会显示某种水果的检测结果，这显然不符合预期。为了解决这个问题，并实现如“未检测到植物”之类的提示，我们需要对传统的单阶段多类别分类方法进行优化。

深入理解问题根源

当前的多类别分类模型，如提供的代码片段所示，其工作原理是计算输入图片属于每个已知类别的概率（置信度），然后选择置信度最高的类别作为最终预测。

// ... (图像预处理代码) ...FruitDisease.Outputs outputs = model.process(inputFeature);TensorBuffer outputFeature0 = outputs.getOutputFeature0AsTensorBuffer();float[] confidences = outputFeature0.getFloatArray();int maxPos = 0;float maxConfidence = 0;for (int i = 0; i  maxConfidence) {        maxConfidence = confidences[i];        maxPos = i;    }}String[] classes = {"Watermelon Healthy", "Watermelon Blossom End Rot", "Watermelon Anthracnose", /* ... 其他类别 ... */};result.setText(classes[maxPos]); // 总是会显示一个类别

这段代码的问题在于，它假设输入图片一定属于某个已知的 classes 数组中的类别。当输入图片是完全不相关的物体（例如，一张桌子或一辆车）时，模型仍然会计算出对所有水果类别的置信度，并从中选出最高的一个，即使这个“最高”的置信度可能非常低，也依然会被当作有效预测。这导致了“假阳性”的检测结果，即模型错误地识别出不存在的目标。

解决方案：二阶段分类策略

为了解决上述问题，最有效且推荐的方法是采用二阶段分类策略。这种方法将问题分解为两个独立的、更易于管理和优化的子任务：

二元分类（目标存在性检测）：首先判断图片中是否存在我们感兴趣的目标（例如，是否存在水果）。多类别分类（具体目标识别）：如果第一阶段确认存在目标，则进一步识别具体是哪种目标（例如，是哪种水果）。

阶段一：二元分类（存在性检测）

在这个阶段，我们需要训练一个独立的二元分类模型。这个模型的任务非常简单：判断输入图片是属于“目标类别”（例如，“水果”）还是“非目标类别”（例如，“非水果”）。

训练数据准备：

正样本：包含目标物体的图片（例如，各种水果的图片）。负样本：不包含任何目标物体的图片（例如，风景、人物、日常物品等，这些是用户可能上传的“无关”图片）。负样本的多样性至关重要，以确保模型能够有效地区分出与目标完全不相关的图片。

模型输出：这个模型会输出一个概率值，表示图片中存在目标的可能性。我们可以设定一个阈值（例如，0.7），如果概率超过此阈值，则认为图片中存在目标，并进入第二阶段；否则，显示“未检测到目标”的消息。

阶段二：多类别分类（具体目标识别）

如果第一阶段的二元分类器判断图片中存在目标，那么我们才将图片输入到现有的多类别分类器中，以识别具体的类别。这正是您当前代码所实现的功能。

集成优势：

Pic Copilot

AI时代的顶级电商设计师，轻松打造爆款产品图片

158 查看详情 避免误报：只有当图片被确认为包含目标时，才会进行具体的类别识别，从而避免了对无关图片的错误分类。提高鲁棒性：两个模型各司其职，可以分别进行优化，提高了整个系统的鲁棒性。清晰的用户反馈：可以根据第一阶段的结果，清晰地向用户展示“未检测到目标”或具体的检测结果。

替代方案：N+1 类分类（不推荐）

另一种可能的方案是在现有的多类别分类器中添加一个额外的“无目标”或“非水果”类别。

优点：

概念上简单，只需要一个模型。

缺点（通常不推荐）：

类别不平衡：如果“无目标”类别涵盖了所有非水果的图片，那么这个类别的样本空间将是无限的，且其内部多样性远超其他具体水果类别。这会导致严重的类别不平衡问题，使得模型难以有效地学习“无目标”的特征。定义困难：很难收集到足够全面且代表性的“无目标”训练数据。模型可能会将训练集中未见过的非目标图片错误地分类为某个水果，或者将新的水果图片错误地分类为“无目标”。性能下降：由于“无目标”类别的复杂性，可能会影响模型对具体目标类别的识别精度。

基于以上原因，二阶段分类策略通常是处理未知类别输入的更优选择。

实施二阶段策略的示例代码结构

以下是根据二阶段策略修改后的 classifyImage 方法的伪代码结构，以展示其逻辑：

private void classifyImage(Bitmap image) {    try {        // 1. 图像预处理 (与原代码相同)        // ... (省略预处理细节) ...        TensorBuffer inputFeature = TensorBuffer.createFixedSize(new int[]{1, 224, 224, 3}, DataType.FLOAT32);        // ... (加载图片到 inputFeature) ...        // 阶段一：二元分类 - 检测是否存在目标 (例如，是否存在水果)        // 假设您有一个名为 FruitPresenceModel 的二元分类模型        FruitPresenceModel presenceModel = FruitPresenceModel.newInstance(getApplicationContext());        FruitPresenceModel.Outputs presenceOutputs = presenceModel.process(inputFeature);        TensorBuffer presenceOutputBuffer = presenceOutputs.getOutputFeature0AsTensorBuffer(); // 假设输出是 [1, 2] 或 [1, 1]        float[] presenceConfidences = presenceOutputBuffer.getFloatArray();        // 假设 presenceConfidences[0] 是“非水果”的置信度，presenceConfidences[1] 是“水果”的置信度        // 或者如果模型只输出一个值，比如“水果”的概率        float fruitProbability = presenceConfidences.length > 1 ? presenceConfidences[1] : presenceConfidences[0]; // 根据模型实际输出调整        float presenceThreshold = 0.7f; // 设置一个阈值，判断是否为水果        if (fruitProbability > presenceThreshold) {            // 阶段二：多类别分类 - 识别具体是哪种水果            FruitDisease multiClassModel = FruitDisease.newInstance(getApplicationContext());            FruitDisease.Outputs multiClassOutputs = multiClassModel.process(inputFeature);            TensorBuffer multiClassOutputBuffer = multiClassOutputs.getOutputFeature0AsTensorBuffer();            float[] confidences = multiClassOutputBuffer.getFloatArray();            int maxPos = 0;            float maxConfidence = 0;            for (int i = 0; i  maxConfidence) {                    maxConfidence = confidences[i];                    maxPos = i;                }            }            // 再次检查多类别分类的置信度，确保不是一个非常低的预测            float multiClassConfidenceThreshold = 0.6f; // 可以根据实际情况调整            String[] classes = {"Watermelon Healthy", "Watermelon Blossom End Rot", /* ... 其他水果类别 ... */};            if (maxConfidence > multiClassConfidenceThreshold) {                result.setText(classes[maxPos]);                // 显示所有类别的置信度                StringBuilder s = new StringBuilder();                for (int i = 0; i < classes.length; i++) {                    s.append(String.format("%s: %.1f%%n", classes[i], confidences[i] * 100));                }                confidence.setText(s.toString());                confidence.setVisibility(View.VISIBLE);            } else {                // 虽然第一阶段认为是水果，但第二阶段的置信度太低，可能是模糊或难以识别的图片                result.setText("未检测到明确的水果类别。");                confidence.setVisibility(View.GONE);            }        } else {            // 第一阶段判断为非水果            result.setText("未检测到水果。");            confidence.setVisibility(View.GONE);        }        // 释放模型资源        presenceModel.close();        // 如果在条件块内创建，则在条件块内关闭，或者确保在finally块中关闭所有模型        // multiClassModel.close(); // 需要根据实际模型生命周期管理    } catch (Exception e) {        // 处理异常        result.setText("分类失败：" + e.getMessage());        confidence.setVisibility(View.GONE);    }}

注意事项：

模型训练：您需要单独训练一个 FruitPresenceModel 二元分类器。这通常意味着准备一个专门的数据集，包含“水果”和“非水果”两类图片。置信度阈值：presenceThreshold 和 multiClassConfidenceThreshold 的设定至关重要。它们需要根据您的模型性能和实际应用需求进行调优。过高的阈值可能导致漏报，过低的阈值可能导致误报。模型资源管理：确保在不再需要模型时正确关闭它们，以释放内存和其他系统资源。在 Android 开发中，通常在 onDestroy() 或适当的生命周期回调中关闭模型。

总结

通过采用二阶段分类策略，我们可以有效解决多类别分类器在处理未知输入时总是返回预测结果的问题。这种方法不仅提高了模型的准确性和鲁棒性，还使得应用程序能够提供更智能、更符合用户预期的反馈，例如在未检测到目标时显示“未检测到水果”的消息。虽然这需要额外训练一个二元分类模型，但其带来的系统稳定性提升和用户体验优化是显而易见的。

以上就是优化自定义分类器：实现未知类别检测的二阶段策略的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1054456.html

android app go win 常见问题

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

php 闭包实例解析

上一篇 2025年12月2日 04:49:02

css skeleton在快速原型开发中的应用

下一篇 2025年12月2日 04:49:08

好文分享

揭示绝对定位的缺点并提出解决方案：常见问题的规避策略

绝对定位的弊端揭秘：如何避免常见问题？绝对定位是网页设计中常用的一种布局方式，它可以让元素精确地定位在页面上的指定位置。然而，尽管绝对定位在某些情况下非常有用，但它也存在一些弊端。本文将揭示绝对定位的弊端，并提供一些方法来避免常见问题。首先，绝对定位的一个弊端是元素定位可能受到浏览器窗口大小的影…

程序猿
2025年12月24日
0000
好文分享

常见问题和解决方法：绝对定位运动指令的疑问与解答

绝对定位运动指令的常见问题及解决方法摘要：随着技术的不断进步，绝对定位运动在现代机械设备中得到了广泛应用。然而，在使用绝对定位运动指令的过程中，常常会遇到各种问题。本文将重点讨论常见的绝对定位运动指令问题，并提供相应的解决方法和具体的代码示例。一、绝对定位运动指令简介绝对定位运动指令是指根据目标…

程序猿
2025年12月24日
0000
好文分享

揭秘绝对定位故障：常见问题和解决方法曝光

绝对定位故障大揭秘：常见问题及解决方案引言：绝对定位（Absolute positioning）是CSS中常用的一种定位方式，它允许开发者将元素精确地放置在一个给定的位置上。然而，由于其特殊的性质和较为复杂的用法，绝对定位经常会出现各种问题。本文将揭示绝对定位的常见故障，并提供相应的解决方案，同…

程序猿
2025年12月24日
0000
好文分享

详解Css Flex 弹性布局中的常见问题及解决方案

详解CSS Flex弹性布局中的常见问题及解决方案引言：CSS Flex弹性布局是一种现代的布局方式，其具有优雅简洁的语法和强大的灵活性，广泛应用于构建响应式的web页面。然而，在实际应用中，经常会遇到一些常见的问题，如元素排列不如预期、尺寸不一致等。本文将详细介绍这些问题，并提供相应的解决方案，…

程序猿
2025年12月24日
2000
CSS的选择器有哪些常见问题

这次给大家带来css的选择器有哪些常见问题，处理css的选择器常见问题的注意事项有哪些，下面就是实战案例，一起来看一下。选择器常见的有哪几种？1.标签选择器p{ }/选择标签名为p的元素/2.类选择器.box{ }/选择class名为box的元素/3.ID选择器#header{ }/选择id名为h…

程序猿
好文分享 2025年12月24日
0000
HTML里的常见问题一

这次给大家带来在html里有哪些经常出现的问题？有序列表、无序列表、自定义列表如何使用？写个简单的例子。三者在语义上有什么区别？使用场景是什么？能否嵌套？有序列表是以数字进行标记的列表项目： CoffeeMilk 效果如下： CoffeeMilk 无序列表是以原点标记的列表项目： CoffeeM…

程序猿
好文分享 2025年12月24日
0000
HTML里的常见问题二

如何去查css熟悉的兼容性？比如inline-block哪些浏览器支持？a 标签的href, title, target 是什么？ title 和 alt有什么区别？如何新窗口打开链接?display: none和visibility: hidden有什么作用？有什么区别？ line-height有…

程序猿
好文分享 2025年12月24日
0000
好文分享

响应式HTML5按钮适配不同屏幕方法【方法】

实现响应式HTML5按钮需五种方法：一、CSS媒体查询按max-width断点调整样式；二、用rem/vw等相对单位替代px；三、Flexbox控制容器与按钮伸缩；四、CSS变量配合requestAnimationFrame优化的JS动态适配；五、Tailwind等框架的响应式工具类。如果您希望H…

程序猿
2025年12月23日
1000
好文分享

html5怎么加php_html5用Ajax与PHP后端交互实现数据传递【交互】

HTML5不能直接运行PHP，需通过Ajax与PHP通信：前端用fetch发送请求，PHP接收处理并返回JSON，前端解析响应更新DOM；注意跨域、编码、CSRF防护和输入过滤。 HTML5 本身是前端标记语言，不能直接运行 PHP 代码，但可以通过 Ajax（异步 JavaScript）与 PHP…

程序猿
2025年12月23日
3000
好文分享

html5 js怎么加_html5用script标签内嵌或外链引入JS代码【添加】

在HTML5中执行JavaScript需通过script标签：一、内联编写于head或body中；二、外链引入.js文件并建议放body末尾或加defer；三、defer按序执行，async独立执行；四、可动态创建script元素插入执行。如果您希望在HTML5页面中执行JavaScript代码，…

程序猿
2025年12月23日
0000
好文分享

node.js怎么运行html_node.js运行html步骤【指南】

答案是使用Node.js内置http模块、Express框架或第三方工具serve可快速搭建服务器预览HTML文件。首先通过http模块创建服务器并读取index.html返回响应；其次用Express初始化项目并配置静态文件服务；最后利用serve工具全局安装后一键启动服务器，三种方式均在浏览器访…

程序猿
2025年12月23日
4000
好文分享

html5能否插入带表单的文档_html5表单文档嵌入与数据提交【步骤】

HTML5中无法直接嵌入外部带表单的HTML文档并原生提交；可行方案有四：一、用iframe嵌入，需同源或CORS支持，并用postMessage通信；二、用fetch+DOMParser动态加载表单片段并手动绑定事件；三、在当前页面直接编写表单，最规范且兼容性好；四、用JavaScript+fet…

程序猿
2025年12月23日
1000
好文分享

HTML5怎么制作广告_HTML5用动画与交互制横幅或弹窗广告吸引点击【制作】

可利用HTML5结合CSS3动画、Canvas、Web Animations API、Intersection Observer和video标签制作互动广告：一用@keyframes实现横幅入场动画；二用Canvas绘制并响应悬停；三用Web Animations API控制弹窗时序；四用Inter…

程序猿
2025年12月23日
3000
html5怎么引用js_HTML5用外链或内嵌JS代码引用脚本【引用】

HTML5中执行JavaScript需通过外链或内嵌方式引入：一、外链用，支持defer/async；二、内嵌将代码写入间，推荐置于body底部；三、type属性默认可省略；四、模块化使用type=”module”支持ES6 import/export。 <img sr…

程序猿
好文分享 2025年12月23日
1000
好文分享

360怎么装html5_360浏览器默认支持HTML5无需额外安装设置【说明】

HTML5是网页标准，非独立软件，360浏览器7.0+已原生支持；需确认内核为Blink/Chromium、关闭兼容模式、禁用强制兼容策略、重置Flash插件、清除HTML5本地存储、检查系统Media Foundation组件。如果您在使用360浏览器时发现HTML5网页功能异常（如视频无法播放…

程序猿
2025年12月23日
4000
好文分享

html5怎么跳出页面_HT5用location.href或a标签实现页面跳转跳出【跳出】

HTML5页面跳转有五种方法：一、location.href直接跳转并替换历史；二、location.replace()跳转且不保留当前页历史；三、a标签href跳转，支持新窗口及历史回退；四、a标签+JavaScript事件控制条件跳转；五、meta refresh实现定时自动跳转。如果您希望在…

程序猿
2025年12月23日
3000
好文分享

html如何滑动_实现HTML页面或元素滑动效果【效果】

可通过CSS scroll-behavior实现平滑锚点跳转，JavaScript scrollTo精确控制滚动位置，CSS transform模拟高性能滑动动画，或使用Swiper等第三方库实现触摸拖拽、循环播放等高级交互功能。如果您希望在网页中实现页面或特定元素的滑动效果，可以通过CSS和Ja…

程序猿
2025年12月23日
0000
好文分享

html5怎么写app_HTML5用PWA或WebView打包成类APP的网页应用【编写】

可通过PWA、WebView（Android/iOS）、Cordova或Capacitor五种方式将HTML5网页转为类原生APP：PWA依赖Manifest与Service Worker实现安装与离线；WebView分别在Android Studio和Xcode中加载本地资源；Cordova与Ca…

程序猿
2025年12月23日
1000
好文分享

html5怎么插入文档_HT5用object或iframe嵌入PDF/Word文档显示【插入】

可在HTML5中用iframe或object标签嵌入PDF，需设宽高及可访问路径；Word文档需借OneDrive等第三方服务代理渲染；须处理跨域限制并提供下载降级方案。如果您希望在HTML5页面中嵌入PDF或Word文档并直接显示，可以使用或标签实现。以下是几种可行的嵌入方法：一、使用ifra…

程序猿
2025年12月23日
3000
好文分享

html5能否让搜索框随滚动固定_html5positionfixed固定布局【攻略】

可使用CSS的position: fixed实现搜索框固定定位，或用position: sticky实现边界感知粘性效果，配合JavaScript动态控制、响应式适配及占位修复，确保滚动时稳定显示。如果您希望在网页滚动过程中让搜索框始终保持在可视区域的固定位置，HTML5 本身不提供直接的布局控制…

程序猿
2025年12月23日
3000