
谷歌近日正式发布 Magika 1.0,这是其基于人工智能的文件类型识别系统的首个稳定版本。此次更新标志着该项目在性能优化与系统安全性上的重要进展——其核心引擎现已完全用 Rust 语言重写。自去年向公众开源以来,Magika 迅速在开发者社区中流行,目前每月下载量已突破百万次。
新版本对整体架构进行了深度重构,在提升运行效率的同时增强了内存安全防护能力。据谷歌介绍,Magika 1.0可在单核 CPU 上实现每秒数百个文件的快速识别,若使用多核处理器,则处理速度可扩展至每秒数千个文件。该系统采用 ONNX Runtime 执行模型推理,并结合 Tokio 异步运行时框架,保障了高并发场景下的稳定表现。
在支持的文件格式方面,Magika 1.0现已能够识别超过200种文件类型,较初代版本翻了一倍。新增支持涵盖数据科学和机器学习领域的 Jupyter Notebook、Numpy 和 PyTorch 文件,也包括现代开发中广泛使用的 Swift、Kotlin 和 TypeScript 等编程语言文件。同时,DevOps 工具链中的配置文件、SQLite 数据库以及 AutoCAD 图形文件等也已被纳入检测范围。
Smodin AI Content Detector
多语种AI内容检测工具
44 查看详情
本版本还显著提升了对高度相似文件类型的区分精度,例如能更准确地区分 C 与 C++ 源码、JavaScript 与 TypeScript 脚本。在技术攻坚过程中,谷歌面临训练数据体量庞大及部分文件样本稀少的难题。为此,团队构建了专用数据集平台 SedPack,并借助自家生成式 AI 模型 Gemini 生成高质量合成数据,有效增强了模型的泛化性和鲁棒性。
此外,Magika 1.0同步更新了 Python 和 TypeScript 的客户端模块,大幅简化了集成流程。开发者可通过简单命令在主流操作系统上完成安装与部署。谷歌也诚邀更多开源贡献者加入项目,共同推动这一工具的功能拓展与持续优化。
以上就是谷歌发布 AI 文件检测工具 Magika 1.0,全面采用 Rust 语言的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/601132.html
微信扫一扫
支付宝扫一扫