人脸识别还能这么玩

今天我们来扩展一下,用人脸玩飞机大战。虽然思路跟手势识别类似,但代码量比手势识别版稍多。

使用的人脸算法是毫秒级的,帧率能到 30,用电脑CPU运行也很流畅。

下面我分享下项目实现过程,文末获取项目完整的源代码。

准备飞机大战程序

Github上找到一个Python版本的飞机大战程序,安装Pygame即可运行。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

人脸识别还能这么玩

键盘的A、D、W、S键用来控制飞机的移动方向,分别对应左、右、上、下。

所以,接下来我们要做的是识别人脸,并对人脸姿态进行估计,将估计后的结果映射到左、右、上、下,从而控制飞机的运行。

人脸识别

这里,我们用opencv读取摄像头中的视频流。

将视频流中的每一帧送入mediapipe中的人脸识别模型,进行识别。

人脸识别还能这么玩

图片mediapipe 不止能识别人脸,还能标注出人脸 6 个关键点左眼、右眼、左耳、右耳、鼻子、嘴巴。

核心代码:

with self.mp_face_detection.FaceDetection(model_selection=0, min_detection_confidence=0.9) as face_detection:while cap.isOpened():success, image = cap.read()image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)results = face_detection.process(image)image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)if results.detections:for detection in results.detections:# 获取人脸框坐标face_box = detection.location_data.relative_bounding_boxface_w, face_h = int(face_box.width * frame_w), int(face_box.height * frame_h)face_l = int(face_box.xmin * frame_w) + face_wface_t = int(face_box.ymin * frame_h)face_r, face_b = face_l - face_w, face_t + face_h# 显示人脸框cv2.rectangle(image, (face_l, face_t), (face_r, face_b), (0, 255, 255), 2)self.draw_zh_img(image, self.face_box_name_img, (face_r + face_l) // 2, face_t - 5)pose_direct, pose_key_points = self.pose_estimate(detection)# 显示人脸 6 个关键点for point_name in FaceKeyPoint:mp_point = self.mp_face_detection.get_key_point(detection, point_name)point_x = int(mp_point.x * frame_w)point_y = int(mp_point.y * frame_h)point_color = (0, 255, 0) if point_name in pose_key_points else (255, 0, 255)cv2.circle(image, (point_x, point_y), 4, point_color, -1)# 显示关键点中文名称point_name_img = self.face_key_point_name_img[point_name]self.draw_zh_img(image, point_name_img, point_x, point_y-5)

这里有个小知识点需要大家注意下。

代码中用draw_zh_img来显示中文,由于opencv不支持直接显示中文。因此,我用PIL模块中Image方法提前绘制中文图片,并转为opencv格式。

Swapface人脸交换 Swapface人脸交换

一款创建逼真人脸交换的AI换脸工具

Swapface人脸交换 45 查看详情 Swapface人脸交换

人脸识别还能这么玩

在需要的时候,直接与视频流合并,效率高,不掉帧。

人脸姿态估计

之前手势识别,我们用相邻帧来判断手势的移动。人脸姿态估计只用当前帧就可以,相对容易一些。

我们通过人脸 6 个关键点的坐标距离,就可以判断出人脸的姿态

人脸识别还能这么玩

这里,左耳和鼻子的水平距离很近,因此,我们可以估计脸向左转,从而可以用只飞机向左移动。

同样的,用其他关键点,我们可以估计出人脸向右转、向上(抬头)和向下(低头)

核心代码:

# 左耳与鼻子水平距离,判断面部左转left_ear_to_nose_dist = left_ear.x - nose_pos.x # 右耳与鼻子水平距离,判断面部右转nose_to_right_ear_dist = nose_pos.x - right_ear.x# 鼻子与左眼垂直距离,判断面部向上nose_to_left_eye_dist = nose_pos.y - left_eye.y# 左耳与左眼垂直距离,判断面部向下left_ear_to_left_eye_dist = left_ear.y - left_eye.yif left_ear_to_nose_dist < 0.07:# print('左转')self.key_board.press_key('A')time.sleep(0.07)self.key_board.release_key('A')return 'A', [FaceKeyPoint.NOSE_TIP, FaceKeyPoint.LEFT_EAR_TRAGION]if nose_to_right_ear_dist < 0.07:# print('右转')self.key_board.press_key('D')time.sleep(0.07)self.key_board.release_key('D')return 'D', [FaceKeyPoint.NOSE_TIP, FaceKeyPoint.RIGHT_EAR_TRAGION]

姿态控制飞机移动

识别出人脸姿态,我们就可以用程序控制键盘,从而控制飞机移动。

这里我用PyKeyboard模块控制键盘按键

self.key_board = PyKeyboard()# print('左转')self.key_board.press_key('A')time.sleep(0.07)self.key_board.release_key('A')

press_key和release_key函数分别是按键和释放按键。

它们之间,调用了time.sleep(0.07)控制按键的时长,按键时间长,则飞机移动距离就长,反之,按键时间短,则飞机移动距离就短,大家可以根据自己的需求来调节。

以上就是人脸识别还能这么玩的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/548021.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 18:44:14
下一篇 2025年11月9日 18:45:16

相关推荐

  • HTML数据怎样进行数据创新 HTML数据创新应用的发展方向

    HTML5通过语义化标签、原生可视化和响应式设计构建智能数据界面,融合AI实现智能分析与应用,结合WebGPU等新技术打造跨平台数据生态,推动静态页面向动态智能工具演进。 HTML本身是网页的结构语言,不直接存储或处理数据,但通过与现代Web技术和数据平台结合,能成为数据创新的关键载体。真正的“HT…

    2025年12月23日
    000
  • html函数如何创建模态弹窗效果 html函数对话框元素的现代用法

    使用原生元素是创建模态弹窗的最佳方式,语义清晰且自带可访问性支持;通过showModal()和close()方法控制显示与关闭,结合::backdrop可自定义遮罩样式,减少JavaScript依赖,提升用户体验。 在现代 HTML 中,创建模态弹窗(Modal Dialog)最推荐的方式是使用原生…

    2025年12月23日
    000
  • canvas标签是用来做什么的

    canvas用于通过JavaScript在网页上绘制图形,提供像素级控制,适合高性能动态图形场景。 canvas 标签主要用来在网页上通过JavaScript绘制图形。它提供了一块空白的绘图区域,你可以用代码在这上面画出各种形状、文字、图片,甚至复杂的动画和游戏界面。它本质上是一个位图(bitmap…

    2025年12月22日
    000
  • html在用户按下按键时触发的事件属性onkeydown

    实例 当用户按键时执行一段 javascript: 浏览器支持 IE Firefox Chrome Safari 立即学习“前端免费学习笔记(深入)”; Opera 所有主流浏览器都支持 onkeydown 属性。 定义和用法 onkeydown 属性在用户(在键盘上)按键时触发。 提示:相对于 o…

    好文分享 2025年12月21日
    000
  • html中用户(在键盘上)按键时触发的事件属性onkeypress

    实例 当用户按键时执行一段 javascript: 浏览器支持 IE Firefox Chrome 立即学习“前端免费学习笔记(深入)”; Safari Opera 所有主流浏览器都支持 onkeypress 属性。 定义和用法 onkeypress 属性在用户(在键盘上)按键时触发。 提示:相对于…

    好文分享 2025年12月21日
    000
  • html中用户(在键盘上)释放按键时触发的事件属性onkeyup

    实例 当用户放松按键时执行一段 javascript: 浏览器支持 IE Firefox Chrome Safari 立即学习“前端免费学习笔记(深入)”; Opera 所有主流浏览器都支持 onkeyup 属性。 定义和用法 onkeyup 属性在用户(在键盘上)释放按键时触发。 提示:相对于 o…

    好文分享 2025年12月21日
    000
  • 水印添加技术实现_防止信息泄露的保护措施

    水印技术通过可见与不可见方式保护数字内容,适用于图像、文档、视频等场景,结合动态信息嵌入与业务流程,提升版权保护与溯源能力,是低成本高效的信息防护手段。 在数字化信息传播日益频繁的今天,如何有效防止敏感内容被非法复制或滥用,成为企业和个人关注的重点。水印添加技术作为一种实用的信息保护手段,能够帮助追…

    2025年12月21日
    000
  • javascript_如何实现人脸识别

    JavaScript可通过TensorFlow.js或face-api.js在浏览器中实现人脸检测与识别,首先加载预训练模型,再利用摄像头视频流进行实时推理,提取人脸特征向量并比对,完成身份识别,全过程本地运行保障隐私,适合轻量级应用。 JavaScript 实现人脸识别主要依赖于浏览器中的前端技术…

    2025年12月21日
    000
  • JavaScript实现键盘控制音频播放的教程

    本文详细阐述了如何在web应用中通过键盘事件控制音频播放。核心内容包括:解析元素焦点对键盘事件监听的影响,推荐使用html “ 元素结合 `focus()` 方法实现无障碍的键盘控制,以及提供一种更通用的全局 `window.keydown` 事件监听方案,并强调在处理全局事件时避免干扰用户输入的…

    2025年12月21日
    000
  • 使用face-api.js在浏览器中实现多目标人脸识别与Svelte集成

    本教程旨在解决使用face-api.js在svelte项目中进行人脸识别时,多个人脸被错误识别为同一人的问题。文章将深入探讨`labeledfacedescriptors`和`facematcher`的正确构建方法,确保每个已知人脸都能被准确识别。通过详细的代码示例和专业指导,读者将学会如何加载模型…

    2025年12月20日
    000
  • 浏览器端基于face-api.js的多人脸识别系统构建与优化

    本教程详细探讨了在浏览器中使用face-api.js构建多人脸识别系统时,如何解决人脸误识别的问题。核心在于正确地为每个用户生成独立的标签化人脸描述符(labeledfacedescriptors),并利用facematcher进行高效准确的匹配。文章提供了完整的svelte代码示例,涵盖模型加载、…

    2025年12月20日
    000
  • 基于Face-api.js的浏览器端多目标人脸识别优化指南

    本文旨在解决使用face-api.js在浏览器中进行人脸识别时,无法正确区分多个已知人脸的问题。通过优化`labeledfacedescriptors`的构建方式和`facematcher`的使用逻辑,确保系统能够准确识别并标记视频流中的每一张已知人脸,并提供完整的svelte代码实现及详细解析,帮…

    2025年12月20日
    000
  • face-api.js 浏览器人脸识别:精确识别多个人脸的实践指南

    本教程详细阐述了如何使用 face-api.js 在浏览器环境中实现稳定且准确的多目标人脸识别。针对常见的多人脸误识别问题,文章深入分析了 `labeledfacedescriptors` 和 `facematcher` 的正确构建与使用方法,确保每个已知人脸都能被独立且准确地识别,并提供了完整的 …

    2025年12月20日
    000
  • 如何利用JavaScript进行音频和视频的实时处理与分析?

    JavaScript通过Web Audio API和MediaStream API实现音视频实时处理,首先调用navigator.mediaDevices.getUserMedia()获取麦克风或摄像头流,接着利用AudioContext与AnalyserNode分析音频频率数据,结合canvas绘…

    2025年12月20日
    000
  • 如何利用机器学习库在浏览器中实现实时智能功能?

    选择轻量级模型和高效推理引擎是关键。使用TensorFlow.js、ONNX Runtime Web或MediaPipe Tasks等库,可在浏览器中实现实时人脸识别、手势控制、智能填充等功能,通过加载预训练模型、优化资源使用(如量化、WebGL加速、Web Workers)和合理控制推理频率,实现…

    2025年12月20日
    000
  • 怎样使用JavaScript控制浏览器摄像头并实现人脸识别?

    首先调用摄像头获取视频流,再通过face-api.js进行人脸识别。使用navigator.mediaDevices.getUserMedia()请求摄像头权限并绑定到video元素,然后加载face-api.js的预训练模型,实时检测人脸关键点与特征描述符,最后通过FaceMatcher比对实现身…

    2025年12月20日
    000
  • 如何通过JavaScript实现实时音视频流的处理与特效叠加?

    通过WebRTC和Canvas实现实时音视频特效:1. 使用getUserMedia获取摄像头流并显示在video元素;2. 利用Canvas逐帧绘制视频,通过getImageData操作像素实现灰度等滤镜;3. 可叠加图形或贴纸(如结合face-api.js识别人脸添加猫耳朵);4. 通过canv…

    2025年12月20日
    000
  • 如何用JavaScript进行计算机视觉的基本处理?

    JavaScript通过Canvas API和图像数据操作可实现基础计算机视觉功能,如灰度化、边缘检测和人脸识别;利用tracking.js、ml5.js等库能简化开发,结合getUserMedia()还可处理实时视频流,适用于Web端轻量级视觉应用。 用JavaScript进行计算机视觉的基本处理…

    2025年12月20日
    000
  • 如何用WebRTC实现浏览器端的实时视频滤镜?

    答案:实现实时视频滤镜需通过WebRTC获取摄像头流,绘制到Canvas进行像素处理,再用canvas.captureStream()将处理后的流重新用于WebRTC。具体步骤包括:使用navigator.mediaDevices.getUserMedia()获取视频流并显示在video元素;将vi…

    2025年12月20日
    000
  • js 怎么实现人脸识别

    在浏览器中获取摄像头视频流需使用navigator.mediadevices.getusermedia() api,通过请求用户权限获取视频流并绑定到video元素;2. 使用face-api.js等javascript库可实现人脸检测与特征提取,需先加载预训练模型,再通过定时处理视频帧调用dete…

    2025年12月20日
    000

发表回复

登录后才能评论
关注微信