人脸识别还能这么玩

程序猿 • 2025年11月9日 18:44:45 • 用户投稿 • 阅读 0

今天我们来扩展一下，用人脸玩飞机大战。虽然思路跟手势识别类似，但代码量比手势识别版稍多。

使用的人脸算法是毫秒级的，帧率能到 30，用电脑CPU运行也很流畅。

下面我分享下项目实现过程，文末获取项目完整的源代码。

准备飞机大战程序

Github上找到一个Python版本的飞机大战程序，安装Pygame即可运行。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

用键盘的A、D、W、S键用来控制飞机的移动方向，分别对应左、右、上、下。

所以，接下来我们要做的是识别人脸，并对人脸姿态进行估计，将估计后的结果映射到左、右、上、下，从而控制飞机的运行。

人脸识别

这里，我们用opencv读取摄像头中的视频流。

将视频流中的每一帧送入mediapipe中的人脸识别模型，进行识别。

图片mediapipe 不止能识别人脸，还能标注出人脸 6 个关键点左眼、右眼、左耳、右耳、鼻子、嘴巴。

核心代码：

with self.mp_face_detection.FaceDetection(model_selection=0, min_detection_confidence=0.9) as face_detection:while cap.isOpened():success, image = cap.read()image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)results = face_detection.process(image)image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)if results.detections:for detection in results.detections:# 获取人脸框坐标face_box = detection.location_data.relative_bounding_boxface_w, face_h = int(face_box.width * frame_w), int(face_box.height * frame_h)face_l = int(face_box.xmin * frame_w) + face_wface_t = int(face_box.ymin * frame_h)face_r, face_b = face_l - face_w, face_t + face_h# 显示人脸框cv2.rectangle(image, (face_l, face_t), (face_r, face_b), (0, 255, 255), 2)self.draw_zh_img(image, self.face_box_name_img, (face_r + face_l) // 2, face_t - 5)pose_direct, pose_key_points = self.pose_estimate(detection)# 显示人脸 6 个关键点for point_name in FaceKeyPoint:mp_point = self.mp_face_detection.get_key_point(detection, point_name)point_x = int(mp_point.x * frame_w)point_y = int(mp_point.y * frame_h)point_color = (0, 255, 0) if point_name in pose_key_points else (255, 0, 255)cv2.circle(image, (point_x, point_y), 4, point_color, -1)# 显示关键点中文名称point_name_img = self.face_key_point_name_img[point_name]self.draw_zh_img(image, point_name_img, point_x, point_y-5)

这里有个小知识点需要大家注意下。

代码中用draw_zh_img来显示中文，由于opencv不支持直接显示中文。因此，我用PIL模块中Image方法提前绘制中文图片，并转为opencv格式。

Swapface人脸交换

一款创建逼真人脸交换的AI换脸工具

45 查看详情

在需要的时候，直接与视频流合并，效率高，不掉帧。

人脸姿态估计

之前手势识别，我们用相邻帧来判断手势的移动。人脸姿态估计只用当前帧就可以，相对容易一些。

我们通过人脸 6 个关键点的坐标距离，就可以判断出人脸的姿态

这里，左耳和鼻子的水平距离很近，因此，我们可以估计脸向左转，从而可以用只飞机向左移动。

同样的，用其他关键点，我们可以估计出人脸向右转、向上（抬头）和向下（低头）

核心代码：

# 左耳与鼻子水平距离，判断面部左转left_ear_to_nose_dist = left_ear.x - nose_pos.x # 右耳与鼻子水平距离，判断面部右转nose_to_right_ear_dist = nose_pos.x - right_ear.x# 鼻子与左眼垂直距离，判断面部向上nose_to_left_eye_dist = nose_pos.y - left_eye.y# 左耳与左眼垂直距离，判断面部向下left_ear_to_left_eye_dist = left_ear.y - left_eye.yif left_ear_to_nose_dist < 0.07:# print('左转')self.key_board.press_key('A')time.sleep(0.07)self.key_board.release_key('A')return 'A', [FaceKeyPoint.NOSE_TIP, FaceKeyPoint.LEFT_EAR_TRAGION]if nose_to_right_ear_dist < 0.07:# print('右转')self.key_board.press_key('D')time.sleep(0.07)self.key_board.release_key('D')return 'D', [FaceKeyPoint.NOSE_TIP, FaceKeyPoint.RIGHT_EAR_TRAGION]

姿态控制飞机移动

识别出人脸姿态，我们就可以用程序控制键盘，从而控制飞机移动。

这里我用PyKeyboard模块控制键盘按键。

self.key_board = PyKeyboard()# print('左转')self.key_board.press_key('A')time.sleep(0.07)self.key_board.release_key('A')

press_key和release_key函数分别是按键和释放按键。

它们之间，调用了time.sleep(0.07)控制按键的时长，按键时间长，则飞机移动距离就长，反之，按键时间短，则飞机移动距离就短，大家可以根据自己的需求来调节。

以上就是人脸识别还能这么玩的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/548021.html

人脸识别按键键盘

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

java框架与物联网的协同发展

上一篇 2025年11月9日 18:44:43

酷安怎么发布优质好物_酷安发布好物的步骤是什么

下一篇 2025年11月9日 18:44:48

用户投稿

比特币新手教程比特币交易平台有哪些

比特币是一种去中心化的数字货币，基于区块链技术实现点对点交易，具有匿名性、有限发行和不可篡改等特点；新手可通过交易所购买，P2P交易获得比特币，常用平台包括Binance、OKX和Huobi；交易流程包括注册账户、实名认证、绑定支付方式、充值法币并下单购买，可选择市价单或限价单；比特币存储方式有交易…

程序猿
2026年5月10日
0000
用户投稿

Binance交易所2026版安卓下载币安平台正版App v3.8.8

币安（binance）是全球领先的数字资产交易平台之一，为用户提供广泛的数字货币交易服务、金融衍生品以及资产管理等功能。币安app以其安全稳定、操作便捷和功能全面的特点，受到了全球数百万用户的信赖。本文将为您提供币安平台正版app v3.8.8的安卓版本下载及安装教程，并详细介绍后续的注册、认证与交…

程序猿
2026年5月10日
0000
用户投稿

欧易APP安卓版官方下载 v6.147.0 正版OKE手机交易所客户端

欧易（oke）是一款全球领先的数字资产交易平台，为用户提供安全、稳定、可靠的数字资产交易服务。它支持数百种数字资产的现货和衍生品交易，并以其强大的技术实力、深度的交易流动性以及严格的风险控制体系而受到广大用户的信赖。本文将为您提供欧易app安卓版 v6.147.0 的官方正版下载资源与详细的图文教程…

程序猿
2026年5月10日
0000
用户投稿

o易交易所APP官方下载2025 okex安卓正版安装包v6.137.1

o易交易所APP是一款功能全面的数字资产交易平台，致力于为全球用户提供安全、便捷、专业的加密货币交易服务。该应用支持多种主流数字货币的交易，包括比特币（BTC）、以太坊（ETH）等，并提供币币交易、合约交易、理财等多元化服务。欧易官网入口：欧易okex安卓正版安装包v6.137.1： o易交易所…

程序猿
2026年5月10日
0000
用户投稿

欧易官网APP下载 v6.149.0 安卓手机正版OKX交易所

欧易okx是一款全球领先的数字资产交易平台，为用户提供包括比特币（btc）、以太坊（eth）等在内的多种数字资产的交易及相关服务。其app设计友好，功能全面，致力于为用户提供安全、稳定、可靠的交易体验。本文将为您提供欧易官网app v6.149.0 安卓手机正版的下载安装教程，并详细介绍后续的注册、…

程序猿
2026年5月10日
0000
用户投稿

火币Huobi官方APP下载入口火币交易所v11.9.1安卓最新版

作为全球知名的数字资产交易平台，火币（huobi）一直致力于为全球用户提供安全、专业、诚信的数字货币交易服务。本次更新的v11.9.1安卓最新版，在系统稳定性、交易流畅度以及用户资产安全防护方面进行了全方位的升级。该版本优化了k线图表的加载速度，能够帮助用户更敏锐地捕捉市场行情。本文将为您提供官方正…

程序猿
2026年5月10日
0000
用户投稿

HTML数据怎样进行数据创新 HTML数据创新应用的发展方向

HTML5通过语义化标签、原生可视化和响应式设计构建智能数据界面，融合AI实现智能分析与应用，结合WebGPU等新技术打造跨平台数据生态，推动静态页面向动态智能工具演进。 HTML本身是网页的结构语言，不直接存储或处理数据，但通过与现代Web技术和数据平台结合，能成为数据创新的关键载体。真正的“HT…

程序猿
2025年12月23日
0000
用户投稿

html函数如何创建模态弹窗效果 html函数对话框元素的现代用法

使用原生元素是创建模态弹窗的最佳方式，语义清晰且自带可访问性支持；通过showModal()和close()方法控制显示与关闭，结合::backdrop可自定义遮罩样式，减少JavaScript依赖，提升用户体验。在现代 HTML 中，创建模态弹窗（Modal Dialog）最推荐的方式是使用原生…

程序猿
2025年12月23日
0000
用户投稿

canvas标签是用来做什么的

canvas用于通过JavaScript在网页上绘制图形，提供像素级控制，适合高性能动态图形场景。 canvas 标签主要用来在网页上通过JavaScript绘制图形。它提供了一块空白的绘图区域，你可以用代码在这上面画出各种形状、文字、图片，甚至复杂的动画和游戏界面。它本质上是一个位图（bitmap…

程序猿
2025年12月22日
0000
html在用户按下按键时触发的事件属性onkeydown

实例当用户按键时执行一段 javascript：浏览器支持 IE Firefox Chrome Safari 立即学习“前端免费学习笔记（深入）”； Opera 所有主流浏览器都支持 onkeydown 属性。定义和用法 onkeydown 属性在用户（在键盘上）按键时触发。提示：相对于 o…

程序猿
用户投稿 2025年12月21日
0000
html中用户（在键盘上）按键时触发的事件属性onkeypress

实例当用户按键时执行一段 javascript：浏览器支持 IE Firefox Chrome 立即学习“前端免费学习笔记（深入）”； Safari Opera 所有主流浏览器都支持 onkeypress 属性。定义和用法 onkeypress 属性在用户（在键盘上）按键时触发。提示：相对于…

程序猿
用户投稿 2025年12月21日
0000
html中用户（在键盘上）释放按键时触发的事件属性onkeyup

实例当用户放松按键时执行一段 javascript：浏览器支持 IE Firefox Chrome Safari 立即学习“前端免费学习笔记（深入）”； Opera 所有主流浏览器都支持 onkeyup 属性。定义和用法 onkeyup 属性在用户（在键盘上）释放按键时触发。提示：相对于 o…

程序猿
用户投稿 2025年12月21日
0000
用户投稿

水印添加技术实现_防止信息泄露的保护措施

水印技术通过可见与不可见方式保护数字内容，适用于图像、文档、视频等场景，结合动态信息嵌入与业务流程，提升版权保护与溯源能力，是低成本高效的信息防护手段。在数字化信息传播日益频繁的今天，如何有效防止敏感内容被非法复制或滥用，成为企业和个人关注的重点。水印添加技术作为一种实用的信息保护手段，能够帮助追…

程序猿
2025年12月21日
0000
用户投稿

javascript_如何实现人脸识别

JavaScript可通过TensorFlow.js或face-api.js在浏览器中实现人脸检测与识别，首先加载预训练模型，再利用摄像头视频流进行实时推理，提取人脸特征向量并比对，完成身份识别，全过程本地运行保障隐私，适合轻量级应用。 JavaScript 实现人脸识别主要依赖于浏览器中的前端技术…

程序猿
2025年12月21日
0000
用户投稿

JavaScript实现键盘控制音频播放的教程

本文详细阐述了如何在web应用中通过键盘事件控制音频播放。核心内容包括：解析元素焦点对键盘事件监听的影响，推荐使用html “ 元素结合 `focus()` 方法实现无障碍的键盘控制，以及提供一种更通用的全局 `window.keydown` 事件监听方案，并强调在处理全局事件时避免干扰用户输入的…

程序猿
2025年12月21日
0000
用户投稿

使用face-api.js在浏览器中实现多目标人脸识别与Svelte集成

本教程旨在解决使用face-api.js在svelte项目中进行人脸识别时，多个人脸被错误识别为同一人的问题。文章将深入探讨`labeledfacedescriptors`和`facematcher`的正确构建方法，确保每个已知人脸都能被准确识别。通过详细的代码示例和专业指导，读者将学会如何加载模型…

程序猿
2025年12月20日
2000
用户投稿

浏览器端基于face-api.js的多人脸识别系统构建与优化

本教程详细探讨了在浏览器中使用face-api.js构建多人脸识别系统时，如何解决人脸误识别的问题。核心在于正确地为每个用户生成独立的标签化人脸描述符（labeledfacedescriptors），并利用facematcher进行高效准确的匹配。文章提供了完整的svelte代码示例，涵盖模型加载、…

程序猿
2025年12月20日
0000
用户投稿

基于Face-api.js的浏览器端多目标人脸识别优化指南

本文旨在解决使用face-api.js在浏览器中进行人脸识别时，无法正确区分多个已知人脸的问题。通过优化`labeledfacedescriptors`的构建方式和`facematcher`的使用逻辑，确保系统能够准确识别并标记视频流中的每一张已知人脸，并提供完整的svelte代码实现及详细解析，帮…

程序猿
2025年12月20日
0000
用户投稿

face-api.js 浏览器人脸识别：精确识别多个人脸的实践指南

本教程详细阐述了如何使用 face-api.js 在浏览器环境中实现稳定且准确的多目标人脸识别。针对常见的多人脸误识别问题，文章深入分析了 `labeledfacedescriptors` 和 `facematcher` 的正确构建与使用方法，确保每个已知人脸都能被独立且准确地识别，并提供了完整的 …

程序猿
2025年12月20日
0000
用户投稿

如何利用JavaScript进行音频和视频的实时处理与分析？

JavaScript通过Web Audio API和MediaStream API实现音视频实时处理，首先调用navigator.mediaDevices.getUserMedia()获取麦克风或摄像头流，接着利用AudioContext与AnalyserNode分析音频频率数据，结合canvas绘…

程序猿
2025年12月20日
0000

发表回复

登录后才能评论