VirusTotal API URL扫描结果获取：正确处理ID的关键

程序猿 • 2025年12月14日 11:19:55 • 用户投稿 • 阅读 0

本教程详细介绍了如何使用Python通过VirusTotal API进行URL扫描。文章重点阐述了在提交URL进行扫描后获取的分析ID与查询扫描结果所需的URL ID之间的区别与正确处理方法，旨在帮助用户避免常见的“Wrong URL id”错误，确保能准确检索到URL扫描报告。

1. VirusTotal API 简介与URL扫描流程

virustotal是一个免费的在线服务，用于分析可疑文件和url，以检测病毒、蠕虫、木马和其他类型的恶意软件。其api允许开发者集成virustotal的功能到自己的应用程序中，实现自动化扫描和报告检索。

使用VirusTotal API扫描URL通常包括两个主要步骤：

提交URL进行扫描： 向API发送一个POST请求，将待扫描的URL提交给VirusTotal。此操作会返回一个“分析ID”或“提交ID”。获取扫描结果： 使用第一步中获得的特定ID，向API发送一个GET请求，以检索该URL的详细扫描报告。

在实际操作中，许多开发者在第二步获取扫描结果时会遇到Wrong URL id的错误，这通常是因为对ID的处理方式存在误解。

2. 提交URL进行扫描

首先，我们需要使用POST请求将URL提交给VirusTotal。以下是使用Python requests 库实现此操作的示例代码：

import requestsimport jsondef submit_url_for_scan(scan_url, api_key):    """    提交URL到VirusTotal进行扫描。    :param scan_url: 待扫描的URL字符串。    :param api_key: 您的VirusTotal API密钥。    :return: 扫描任务的分析ID (analysis_id) 或 None。    """    url = "https://www.virustotal.com/api/v3/urls"    payload = {"url": scan_url}    headers = {        "accept": "application/json",        "x-apikey": api_key,    }    try:        response = requests.post(url, data=payload, headers=headers)        response.raise_for_status()  # 检查HTTP响应状态码，如果不是2xx则抛出异常        response_json = response.json()        # 从响应中提取分析ID        analysis_id = response_json.get('data', {}).get('id')        if analysis_id:            print(f"成功提交URL: {scan_url}，分析ID: {analysis_id}")            return analysis_id        else:            print(f"提交URL失败或未获取到分析ID: {response_json}")            return None    except requests.exceptions.RequestException as e:        print(f"提交URL时发生网络或HTTP错误: {e}")        return None    except json.JSONDecodeError:        print(f"提交URL时响应内容不是有效的JSON: {response.text}")        return None# 示例调用 (请替换为您的实际API密钥)# api_key = "YOUR_VIRUSTOTAL_API_KEY"# analysis_id_example = submit_url_for_scan("https://www.youtube.com/", api_key)# print(f"获得的分析ID: {analysis_id_example}")

执行上述代码后，如果成功，您将获得一个类似 u-dbae2d0204aa489e234eb2f903a0127b17c712386428cab12b86c5f68aa75867-1701503514 的字符串。这个字符串是VirusTotal为您的提交任务生成的“分析ID”或“提交ID”。

3. 正确获取URL扫描结果：ID处理的关键

许多用户会直接将上述获得的 analysis_id 用于查询URL扫描结果的GET请求，从而导致 Wrong URL id 错误。这是因为VirusTotal的URL分析结果查询API（/api/v3/urls/{id}）所需的{id}并不是完整的分析ID，而是分析ID中的一个特定部分——通常是去除前缀和时间戳的哈希值部分。

问题根源：提交URL后返回的分析ID格式通常是 u-{哈希值}-{时间戳}。例如：u-dbae2d0204aa489e234eb2f903a0127b17c712386428cab12b86c5f68aa75867-1701503514。然而，用于查询具体URL报告的GET请求，其URL路径中的ID部分（即{id}）需要的是中间的哈希值部分，而不是完整的分析ID。

解决方案：我们需要从完整的分析ID中提取出中间的哈希值部分。一种简单有效的方法是使用字符串的 split(‘-‘) 方法，并取其第二个元素（索引为1）。

# 假设我们获得的分析ID是full_analysis_id = 'u-dbae2d0204aa489e234eb2f903a0127b17c712386428cab12b86c5f68aa75867-1701503514'# 正确提取用于查询的URL IDurl_id_for_query = full_analysis_id.split('-')[1] # 此时 url_id_for_query 将是 'dbae2d0204aa489e234eb2f903a0127b17c712386428cab12b86c5f68aa75867'

4. 完整的URL扫描与结果获取示例代码

结合上述提交和ID处理逻辑，以下是一个完整的Python函数，用于提交URL并获取其VirusTotal扫描报告：

import requestsimport jsonimport timedef scan_and_get_url_report(scan_url, api_key, wait_time=10, max_retries=5):    """    提交URL到VirusTotal进行扫描，并获取其报告。    :param scan_url: 待扫描的URL字符串。    :param api_key: 您的VirusTotal API密钥。    :param wait_time: 每次重试之间的等待时间（秒）。    :param max_retries: 最大重试次数。    :return: URL扫描报告的JSON数据，如果失败则为None。    """    # 1. 提交URL进行扫描    submit_url = "https://www.virustotal.com/api/v3/urls"    payload = {"url": scan_url}    headers = {        "accept": "application/json",        "x-apikey": api_key,    }    print(f"正在提交URL '{scan_url}' 进行扫描...")    try:        post_response = requests.post(submit_url, data=payload, headers=headers)        post_response.raise_for_status()        post_response_json = post_response.json()        full_analysis_id = post_response_json.get('data', {}).get('id')        if not full_analysis_id:            print(f"提交URL失败或未获取到分析ID: {post_response_json}")            return None        print(f"成功获取分析ID: {full_analysis_id}")        # 2. 从分析ID中提取用于查询的URL ID        # 格式通常为 u-{哈希值}-{时间戳}        # 我们需要的是中间的哈希值部分        try:            url_id_for_query = full_analysis_id.split('-')[1]            print(f"提取出用于查询的URL ID: {url_id_for_query}")        except IndexError:            print(f"无法从分析ID '{full_analysis_id}' 中正确提取URL ID。ID格式可能不符合预期。")            return None    except requests.exceptions.RequestException as e:        print(f"提交URL时发生网络或HTTP错误: {e}")        return None    except json.JSONDecodeError:        print(f"提交URL时响应内容不是有效的JSON: {post_response.text}")        return None    # 3. 循环查询扫描结果    get_report_url = f"https://www.virustotal.com/api/v3/urls/{url_id_for_query}"    for attempt in range(max_retries):        print(f"尝试获取报告 (第 {attempt + 1}/{max_retries} 次)...")        try:            get_response = requests.get(get_report_url, headers=headers)            get_response.raise_for_status()            report_json = get_response.json()            # 检查报告中是否存在错误，特别是BadRequestError            if 'error' in report_json:                error_message = report_json['error'].get('message', '未知错误')                error_code = report_json['error'].get('code', '未知代码')                print(f"获取报告时API返回错误: {error_code} - {error_message}")                # 如果是 Wrong URL id 错误，通常是ID处理问题，但我们已经处理了                # 可能是报告尚未生成，或URL本身的问题                if error_code == "BadRequestError" and "Wrong URL id" in error_message:                    print("尽管已尝试正确处理ID，但仍收到 'Wrong URL id' 错误。请检查原始分析ID是否有效或VirusTotal是否已处理此URL。")                # 对于某些错误，可能需要重试，但对于Wrong URL id，重试意义不大                # 对于报告未就绪的情况，可以继续等待                if "Not found" in error_message or "still processing" in error_message.lower():                    print(f"报告尚未就绪或正在处理中，等待 {wait_time} 秒后重试...")                    time.sleep(wait_time)                    continue # 继续下一次循环尝试                else:                    return None # 其他错误直接退出            # 如果报告成功返回且没有错误，则返回报告            print("成功获取URL扫描报告。")            return report_json        except requests.exceptions.RequestException as e:            print(f"获取报告时发生网络或HTTP错误: {e}")        except json.JSONDecodeError:            print(f"获取报告时响应内容不是有效的JSON: {get_response.text}")        print(f"等待 {wait_time} 秒后重试...")        time.sleep(wait_time)    print("达到最大重试次数，未能获取URL扫描报告。")    return None# --- 示例调用 ---# 请替换为您的实际API密钥VIRUSTOTAL_API_KEY = "YOUR_VIRUSTOTAL_API_KEY" TARGET_URL = "https://www.youtube.com/" # 替换为您想要扫描的URLif VIRUSTOTAL_API_KEY == "YOUR_VIRUSTOTAL_API_KEY":    print("请将 'YOUR_VIRUSTOTAL_API_KEY' 替换为您的实际VirusTotal API密钥。")else:    report = scan_and_get_url_report(TARGET_URL, VIRUSTOTAL_API_KEY)    if report:        # 打印部分报告内容，例如检测引擎数量        print("n--- 扫描报告摘要 ---")        attributes = report.get('data', {}).get('attributes', {})        last_analysis_stats = attributes.get('last_analysis_stats', {})        print(f"URL: {TARGET_URL}")        print(f"恶意检测数: {last_analysis_stats.get('malicious', 0)}")        print(f"可疑检测数: {last_analysis_stats.get('suspicious', 0)}")        print(f"无害检测数: {last_analysis_stats.get('harmless', 0)}")        print(f"未检测数: {last_analysis_stats.get('undetected', 0)}")        # print(json.dumps(report, indent=2)) # 打印完整报告    else:        print(f"未能获取 {TARGET_URL} 的扫描报告。")

5. 注意事项与最佳实践

API 密钥安全： 您的API密钥是敏感信息，请勿将其硬编码到公开的代码库中，或以不安全的方式共享。建议使用环境变量或配置文件来管理API密钥。错误处理： 在实际应用中，应更健壮地处理API请求可能出现的各种错误，例如网络问题、HTTP状态码非2xx、JSON解析失败、API限速等。示例代码中已包含基本的错误处理。API 限速： VirusTotal API对请求频率有限制。免费公共API通常有较低的限速（例如每分钟4个请求）。如果您的应用需要进行大量扫描，可能需要购买私有API计划。在设计代码时，应考虑加入适当的延迟或重试机制来应对限速。报告延迟： 提交URL后，VirusTotal需要时间来完成扫描。立即查询报告可能会得到“正在处理中”或“未找到”的响应。因此，在获取报告时，通常需要一个循环等待和重试机制，直到报告可用。示例代码中的 wait_time 和 max_retries 参数就是为此目的。官方文档： 始终参考VirusTotal官方API文档（https://developers.virustotal.com/reference/overview）获取最新、最准确的信息。API的行为和ID格式可能会更新。

总结

通过本教程，我们深入探讨了使用Python与VirusTotal API进行URL扫描的关键步骤，特别是解决了在获取扫描结果时常见的Wrong URL id错误。核心在于理解VirusTotal返回的“分析ID”与查询报告所需的“URL ID”之间的差异，并学会通过字符串处理（split(‘-‘)[1]）正确提取后者。遵循这些指导和最佳实践，开发者可以更有效地利用VirusTotal API，构建稳定可靠的恶意URL检测系统。

以上就是VirusTotal API URL扫描结果获取：正确处理ID的关键的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1371306.html

ai app js json python python函数 youtube 区别环境变量网络问题

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

解耦Flask-SQLAlchemy：在应用外部执行数据库操作的教程

上一篇 2025年12月14日 11:19:50

Pandas中从混合字符串列提取数字并进行分组聚合的教程

下一篇 2025年12月14日 11:20:01

好文分享

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
4000
好文分享

CSS 元素设置 10em 和 transition 后为何没有放大效果？

CSS 元素设置 10em 和 transition 后为何无放大效果？你尝试设置了一个 .box 类，其中包含字体大小为 10em 和过渡持续时间为 2 秒的文本。当你载入到页面时，它没有像 YouTube 视频中那样产生放大效果。原因可能在于你将 CSS 直接写在页面中在你的代码示例中，C…

程序猿
2025年12月24日
5000
好文分享

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
7000
好文分享

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
4000
好文分享

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
好文分享

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
6000
好文分享

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
3000
好文分享

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
2000
好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
3000
好文分享

如何让“元素跟随文本高度，而不是撑高父容器？

如何让元素跟随文本高度，而不是撑高父容器在页面布局中，经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中，父容器被较高的图片撑开，而文本的高度没有被考虑。本问答将提供纯css解决方案，让图片跟随文本高度，确保父容器的高度不会被图片影响。解决方法为了解决这个问题，需要将图片从文档流中脱离…

程序猿
2025年12月24日
1000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
3000
好文分享

如何利用 CSS 选中激活标签并影响相邻元素的样式？

如何利用 css 选中激活标签并影响相邻元素？为了实现激活标签影响相邻元素的样式需求，可以通过 :has 选择器来实现。以下是如何具体操作：对于激活标签相邻后的元素，可以在 css 中使用以下代码进行设置： li:has(+li.active) { border-radius: 0 0 10px…

程序猿
2025年12月24日
2000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
3000
好文分享

为什么我的 em 和 transition 设置后元素没有放大？

元素设置 em 和 transition 后不放大一个 youtube 视频中展示了设置 em 和 transition 的元素在页面加载后会放大，但同样的代码在提问者电脑上没有达到预期效果。可能原因：问题在于 css 代码的位置。在视频中，css 被放置在单独的文件中并通过 link 标签引…

程序猿
2025年12月24日
2000
好文分享

为什么我的 Safari 自定义样式表在百度页面上失效了？

为什么在 Safari 中自定义样式表未能正常工作？在 Safari 的偏好设置中设置自定义样式表后，您对其进行测试却发现效果不同。在您自己的网页中，样式有效，而在百度页面中却失效。造成这种情况的原因是，第一个访问的项目使用了文件协议，可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

程序猿
2025年12月24日
1000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
1000
好文分享

使用CSS mask属性指定图片URL时，为什么浏览器无法加载图片？

css mask属性未能加载图片的解决方法使用css mask属性指定图片url时，如示例中所示： mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是，在网络面板中却…

程序猿
2025年12月24日
1000
好文分享

如何用CSS Paint API为网页元素添加时尚的斑马线边框？

为元素添加时尚的斑马线边框在网页设计中，有时我们需要添加时尚的边框来提升元素的视觉效果。其中，斑马线边框是一种既醒目又别致的设计元素。实现斜向斑马线边框要实现斜向斑马线间隔圆环，我们可以使用css paint api。该api提供了强大的功能，可以让我们在元素上绘制复杂的图形。立即学习“前端…

程序猿
2025年12月24日
1000
好文分享

图片如何不撑高父容器？

如何让图片不撑高父容器？当父容器包含不同高度的子元素时，父容器的高度通常会被最高元素撑开。如果你希望父容器的高度由文本内容撑开，避免图片对其产生影响，可以通过以下 css 解决方法：绝对定位元素： .child-image { position: absolute; top: 0; left: …

程序猿
2025年12月24日
1000
好文分享

为什么自定义样式表在 Safari 中访问百度页面时无法生效？

自定义样式表在 safari 中失效的原因用户尝试在 safari 偏好设置中添加自定义样式表，代码如下： body { background-image: url(“/users/luxury/desktop/wallhaven-o5762l.png”) !important;} 测试后发现，在…

程序猿
2025年12月24日
1000