正确使用 skopt.gp_minimize 进行优化与结果可视化

正确使用 skopt.gp_minimize 进行优化与结果可视化

## 理解 `skopt.gp_minimize` 的维度不匹配错误与 `x0` 参数

在使用 scikit-optimize 库中的 gp_minimize 函数进行贝叶斯优化时,常见的错误源于对 x0 参数(初始评估点)和搜索空间维度理解的偏差。当用户尝试提供多个初始点进行优化时,如果 x0 的格式与定义的搜索空间维度不一致,就会引发 runtimeerror 和 valueerror。

错误类型一:RuntimeError: Optimization space (…) and initial points in x0 use inconsistent dimensions.

此错误表明 gp_minimize 接收到的初始点 x0 的维度与 bounds 参数定义的搜索空间维度不匹配。例如,在一个一维优化问题中,如果 bounds 被定义为 [(0.0, 1.0)],这意味着搜索空间是一个一维区间。然而,如果 x0 被错误地设置为一个包含多个数值的 NumPy 数组(如 np.random.rand(5)),gp_minimize 会将其解释为一个 单点,但这个点却拥有 五维。这与一维的搜索空间定义相冲突,从而导致维度不一致的错误。

错误类型二:ValueError: The truth value of an array with more than one element is ambiguous.

当 gp_minimize 尝试验证 x0 中的每个点是否位于定义的搜索空间内时,如果 x0 是一个多元素的 NumPy 数组,且 skopt 内部的维度检查机制尝试对整个数组执行 low <= point <= high 这样的布尔比较,就会引发此错误。NumPy 数组的这种比较会返回一个布尔数组,而不是单个布尔值,因此其“真值”是模糊的,Python 无法直接判断其真假,从而抛出 ValueError。

核心原因在于: gp_minimize 的 x0 参数期望的是一个列表,其中每个元素都是一个与搜索空间维度相匹配的 单点。例如,对于一维空间,x0 应该像 [0.5] 或 [[0.2], [0.8]] 这样,其中每个内部列表或数值代表一个一维点。将 np.random.rand(5) 这样的数组直接作为 x0 传递,会被误解为一个五维的单点。

修正高斯过程优化实现

为了正确地利用 gp_minimize 进行多点初始化或多轮优化,我们需要调整 gaussian_process_optimization 函数,使其迭代地为每个初始点调用 gp_minimize。

可赞AI 可赞AI

文字一秒可视化,免费AI办公神器

可赞AI 56 查看详情 可赞AI

import numpy as npfrom scipy.optimize import minimizefrom skopt import gp_minimizeimport matplotlib.pyplot as plt# 辅助函数(与原问题代码保持一致,此处省略详细定义,但在完整代码中会包含)def gaussian_rbf(x, x_prime, beta):    return np.exp(-beta * np.linalg.norm(x - x_prime)**2)def construct_interpolation_matrix(nodes, beta):    N = len(nodes)    K = np.zeros((N, N))    for i in range(N):        for j in range(N):            K[i, j] = gaussian_rbf(nodes[i], nodes[j], beta)    return Kdef conditioning_analysis(N, m, beta):    nodes = np.linspace(0, 1, N)    K = construct_interpolation_matrix(nodes, beta)    selected_indices = np.random.choice(N, m, replace=False)    selected_nodes = nodes[selected_indices]    condition_full = np.linalg.cond(K)    condition_partial = np.linalg.cond(K[selected_indices][:, selected_indices])    return condition_full, condition_partial# 目标函数:应能处理单个标量输入def objective_function(x):    # 确保x是标量,对于numpy数组也兼容    x_scalar = np.atleast_1d(x)[0] if np.ndim(x) > 0 else x    return -(x_scalar**2 + np.sin(5 * x_scalar))# 牛顿法相关的梯度和Hessian(与原问题代码保持一致)def gradient_hessian(x):    # 注意:原始代码中的梯度和Hessian函数与objective_function不匹配,    # 原始的objective_function是 -(x^2 + sin(5x))    # 原始的gradient_hessian似乎是为 f(x) = x * exp(-(1-x)^2) 编写的。    # 为保持教程的焦点,此处使用原始的gradient_hessian,但请注意此潜在不一致。    # 正确的梯度和Hessian应为:    # df_dx = - (2 * x + 5 * np.cos(5 * x))    # d2f_dx2 = - (2 - 25 * np.sin(5 * x))    # 为避免引入新的复杂性,此处沿用原代码中的gradient_hessian,但建议用户根据实际目标函数进行修正。    df_dx = 2 * x * np.exp(-(1 - x)**2) - 4 * x * (1 - x) * np.exp(-(1 - x)**2)    d2f_dx2 = -2 * np.exp(-(1 - x)**2) + 4 * x * (1 - x) * np.exp(-(1 - x)**2) - 4 * (1 - x) * np.exp(-(1 - x)**2)    return df_dx, d2f_dx2def optimize_with_newton(initial_guess, max_iter=10):    x_opt = initial_guess    for _ in range(max_iter):        df_dx, d2f_dx2 = gradient_hessian(x_opt)        # 避免除以零或非常小的数        if abs(d2f_dx2) < 1e-9:            print(f"Warning: Hessian near zero at x={x_opt}, stopping Newton iteration.")            break        x_opt = x_opt - df_dx / d2f_dx2    return x_opt# 修正后的高斯过程优化函数def gaussian_process_optimization(initial_points, objective_function, bounds, n_iter=10):    """    对每个初始点独立运行 gp_minimize,并返回所有优化结果。    """    optimal_x_values = np.zeros(len(initial_points))    for i, x0_val in enumerate(initial_points):        # 关键修正:x0 必须是包含单个点的列表,例如 [0.5]        # 并且直接传入原始的 objective_function,它应处理标量输入        result = gp_minimize(objective_function, bounds, acq_func="LCB", n_calls=n_iter + 1, random_state=42 + i, x0=[x0_val])        optimal_x_values[i] = result.x[0] # result.x 是一个列表,取第一个元素    return optimal_x_values

修正要点:

迭代调用 gp_minimize: 新函数通过循环遍历 initial_points 数组中的每个初始值。x0 参数的正确格式: 在每次迭代中,将单个初始点 x0_val 包装成一个列表,即 x0=[x0_val]。这确保 gp_minimize 将其解释为一个一维搜索空间中的单个初始点。直接传入 objective_function: gp_minimize 期望接收一个能够处理单个输入(与搜索空间维度匹配)并返回单个标量输出的目标函数。原始的 objective_function 符合此要求。返回多个最优解: 由于我们对每个初始点都运行了一次优化,函数将返回一个包含所有找到的最优 x 值的 NumPy 数组。

准确可视化优化结果

在修正了 gp_minimize 的使用方式后,我们需要确保优化结果能够正确地在图表中呈现。特别是当高斯过程优化返回多个最优解时,如何有效地在图上标记这些点是关键。

# Task 1: Analyze conditioning (与原问题代码一致)N = 10m = 5beta = 1.0condition_full, condition_partial = conditioning_analysis(N, m, beta)print(f"Conditioning for full matrix: {condition_full}")print(f"Conditioning for partial matrix: {condition_partial}")# 优化与牛顿法initial_guess_newton = 0.5x_opt_newton = optimize_with_newton(initial_guess_newton)print(f"Optimal solution with Newton's method: {x_opt_newton}")# 高斯过程优化initial_points_gp = np.random.rand(5) # 5个随机初始点bounds_gp = [(0.0, 1.0)]# 调用修正后的高斯过程优化函数x_opt_gp_array = gaussian_process_optimization(initial_points_gp, objective_function, bounds_gp, n_iter=10)print(f"Optimal solutions with Gaussian process optimization (from multiple starts): {x_opt_gp_array}")# 从多个GP结果中选择最佳点进行可视化,以便与牛顿法进行直接比较# 假设我们寻找的是最小值,因此选择 objective_function 值最小的点y_values_gp = [objective_function(x) for x in x_opt_gp_array]best_gp_index = np.argmin(y_values_gp)best_x_opt_gp = x

以上就是正确使用 skopt.gp_minimize 进行优化与结果可视化的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/584550.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月10日 12:32:23
下一篇 2025年11月10日 12:36:57

相关推荐

  • 如何解决本地图片在使用 mask JS 库时出现的跨域错误?

    如何跨越localhost使用本地图片? 问题: 在本地使用mask js库时,引入本地图片会报跨域错误。 解决方案: 要解决此问题,需要使用本地服务器启动文件,以http或https协议访问图片,而不是使用file://协议。例如: python -m http.server 8000 然后,可以…

    2025年12月24日
    200
  • 旋转长方形后,如何计算其相对于画布左上角的轴距?

    绘制长方形并旋转,计算旋转后轴距 在拥有 1920×1080 画布中,放置一个宽高为 200×20 的长方形,其坐标位于 (100, 100)。当以任意角度旋转长方形时,如何计算它相对于画布左上角的 x、y 轴距? 以下代码提供了一个计算旋转后长方形轴距的解决方案: const x = 200;co…

    2025年12月24日
    000
  • 旋转长方形后,如何计算它与画布左上角的xy轴距?

    旋转后长方形在画布上的xy轴距计算 在画布中添加一个长方形,并将其旋转任意角度,如何计算旋转后的长方形与画布左上角之间的xy轴距? 问题分解: 要计算旋转后长方形的xy轴距,需要考虑旋转对长方形宽高和位置的影响。首先,旋转会改变长方形的长和宽,其次,旋转会改变长方形的中心点位置。 求解方法: 计算旋…

    2025年12月24日
    000
  • 旋转长方形后如何计算其在画布上的轴距?

    旋转长方形后计算轴距 假设长方形的宽、高分别为 200 和 20,初始坐标为 (100, 100),我们将它旋转一个任意角度。根据旋转矩阵公式,旋转后的新坐标 (x’, y’) 可以通过以下公式计算: x’ = x * cos(θ) – y * sin(θ)y’ = x * …

    2025年12月24日
    000
  • 如何计算旋转后长方形在画布上的轴距?

    旋转后长方形与画布轴距计算 在给定的画布中,有一个长方形,在随机旋转一定角度后,如何计算其在画布上的轴距,即距离左上角的距离? 以下提供一种计算长方形相对于画布左上角的新轴距的方法: const x = 200; // 初始 x 坐标const y = 90; // 初始 y 坐标const w =…

    2025年12月24日
    200
  • CSS元素设置em和transition后,为何载入页面无放大效果?

    css元素设置em和transition后,为何载入无放大效果 很多开发者在设置了em和transition后,却发现元素载入页面时无放大效果。本文将解答这一问题。 原问题:在视频演示中,将元素设置如下,载入页面会有放大效果。然而,在个人尝试中,并未出现该效果。这是由于macos和windows系统…

    2025年12月24日
    200
  • 如何计算旋转后的长方形在画布上的 XY 轴距?

    旋转长方形后计算其画布xy轴距 在创建的画布上添加了一个长方形,并提供其宽、高和初始坐标。为了视觉化旋转效果,还提供了一些旋转特定角度后的图片。 问题是如何计算任意角度旋转后,这个长方形的xy轴距。这涉及到使用三角学来计算旋转后的坐标。 以下是一个 javascript 代码示例,用于计算旋转后长方…

    2025年12月24日
    000
  • 使用 Mask 导入本地图片时,如何解决跨域问题?

    跨域疑难:如何解决 mask 引入本地图片产生的跨域问题? 在使用 mask 导入本地图片时,你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢?让我们深入了解一下: mask 框架假设你以 http(s) 协议加载你的 html 文件,而当使用 file:// 协议打开本地文件时,就会产生跨域…

    2025年12月24日
    200
  • 正则表达式在文本验证中的常见问题有哪些?

    正则表达式助力文本输入验证 在文本输入框的验证中,经常遇到需要限定输入内容的情况。例如,输入框只能输入整数,第一位可以为负号。对于不会使用正则表达式的人来说,这可能是个难题。下面我们将提供三种正则表达式,分别满足不同的验证要求。 1. 可选负号,任意数量数字 如果输入框中允许第一位为负号,后面可输入…

    2025年12月24日
    000
  • 如何在 VS Code 中解决折叠代码复制问题?

    解决 VS Code 折叠代码复制问题 在 VS Code 中使用折叠功能可以帮助组织长代码,但使用复制功能时,可能会遇到只复制可见部分的问题。以下是如何解决此问题: 当代码被折叠时,可以使用以下简单操作复制整个折叠代码: 按下 Ctrl + C (Windows/Linux) 或 Cmd + C …

    2025年12月24日
    000
  • 如何相对定位使用 z-index 在小程序中将文字压在图片上?

    如何在小程序中不使用绝对定位压住上面的图片? 在小程序开发中,有时候需要将文字内容压在图片上,但是又不想使用绝对定位来实现。这种情况可以使用相对定位和 z-index 属性来解决。 问题示例: 小程序中的代码如下: 顶顶顶顶 .index{ width: 100%; height: 100vh;}.…

    2025年12月24日
    000
  • 为什么多年的经验让我选择全栈而不是平均栈

    在全栈和平均栈开发方面工作了 6 年多,我可以告诉您,虽然这两种方法都是流行且有效的方法,但它们满足不同的需求,并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序,但它们的实现方式却截然不同。如果您在两者之间难以选择,我希望我在两者之间的经验能给您一些有用的见解。 在这篇文章中,我…

    2025年12月24日
    000
  • 姜戈顺风

    本教程演示如何在新项目中从头开始配置 django 和 tailwindcss。 django 设置 创建一个名为 .venv 的新虚拟环境。 # windows$ python -m venv .venv$ .venvscriptsactivate.ps1(.venv) $# macos/linu…

    2025年12月24日
    000
  • 花 $o 学习这些编程语言或免费

    → Python → JavaScript → Java → C# → 红宝石 → 斯威夫特 → 科特林 → C++ → PHP → 出发 → R → 打字稿 []https://x.com/e_opore/status/1811567830594388315?t=_j4nncuiy2wfbm7ic…

    2025年12月24日
    000
  • html5怎么导视频_html5用video标签导出或Canvas转DataURL获视频【导出】

    HTML5无法直接导出video标签内容,需借助Canvas捕获帧并结合MediaRecorder API、FFmpeg.wasm或服务端协同实现。MediaRecorder适用于WebM格式前端录制;FFmpeg.wasm支持MP4等格式及精细编码控制;服务端方案适合高负载场景。 如果您希望在网页…

    2025年12月23日
    300
  • 如何查看编写的html_查看自己编写的HTML文件效果【效果】

    要查看HTML文件的浏览器渲染效果,需确保文件以.html为扩展名保存、用浏览器直接打开、利用开发者工具调试、必要时启用本地HTTP服务器、或使用编辑器实时预览插件。 如果您编写了HTML代码,但无法直观看到其在浏览器中的实际渲染效果,则可能是由于文件未正确保存、未使用浏览器打开或文件扩展名设置错误…

    2025年12月23日
    400
  • node.js怎么运行html_node.js运行html步骤【指南】

    答案是使用Node.js内置http模块、Express框架或第三方工具serve可快速搭建服务器预览HTML文件。首先通过http模块创建服务器并读取index.html返回响应;其次用Express初始化项目并配置静态文件服务;最后利用serve工具全局安装后一键启动服务器,三种方式均在浏览器访…

    2025年12月23日
    300
  • html5怎么打包运行_HT5用Webpack或Gulp打包后浏览器打开运行【打包】

    应通过 HTTP 服务运行打包后的 HTML5 页面,而非双击打开:一、Webpack 配 webpack-dev-server 启动本地服务;二、Gulp 配 BrowserSync 提供实时重载;三、用 Python/Node.js 轻量 HTTP 工具托管 dist 目录;四、仅当必须双击运行…

    2025年12月23日
    000
  • html5文件运行不出来怎么回事_析html5文件运行失败原因【解析】

    首先检查文件扩展名和编码格式,确保为.html且使用UTF-8编码;接着验证HTML5结构完整性,包含及正确闭合的标签;然后排查外部资源路径是否正确,利用开发者工具查看404错误;排除浏览器兼容性问题,优先在现代浏览器中测试并避免未广泛支持的API;检查JavaScript语法错误与执行顺序,确保脚…

    2025年12月23日
    000
  • html5如何建立站点_HTML5站点建立步骤与网站搭建技巧【指南】

    HTML5网站搭建需五步:一、建my-website目录及css/js/images子目录,含index.html;二、写标准HTML5骨架,含DOCTYPE、lang、meta、语义化标签;三、外链CSS与defer/async脚本;四、用http-server启本地服务;五、用email/num…

    2025年12月23日
    000

发表回复

登录后才能评论
关注微信