从图片EXIF数据中提取并校正GPS坐标的Python教程

从图片EXIF数据中提取并校正GPS坐标的Python教程

本教程详细阐述了如何使用python从图片exif数据中提取gps经纬度信息。文章深入解析了exif中gps数据的存储格式(度分秒),并重点讲解了如何根据经纬度参考(南北半球、东西半球)正确转换并应用符号,以避免常见的坐标错误。教程提供了完整的示例代码,并涵盖了使用`geopy`库进行反向地理编码,以及处理潜在问题和最佳实践。

1. 理解EXIF中的GPS数据结构

数码照片通常包含元数据,即EXIF(可交换图像文件格式)数据,其中可能包含拍摄时的GPS坐标信息。这些信息通常存储在GPSInfo字典中,以特定的标签ID表示。

关键的GPS EXIF标签包括:

GPSLatitude (标签ID 2): 纬度值,以度、分、秒(DMS)格式存储为一个元组,例如 (33, 51, 52.4)。GPSLatitudeRef (标签ID 1): 纬度参考,指示纬度是北(’N’)还是南(’S’)。GPSLongitude (标签ID 4): 经度值,同样以DMS格式存储。GPSLongitudeRef (标签ID 3): 经度参考,指示经度是东(’E’)还是西(’W’)。

需要注意的是,GPSLatitude和GPSLongitude存储的是绝对值,其正负号取决于GPSLatitudeRef和GPSLongitudeRef。例如,南半球的纬度应为负值,西半球的经度也应为负值。

2. 将度分秒(DMS)格式转换为十进制经纬度

EXIF中的GPS数据通常以DMS格式存储,而大多数地理信息系统和API(如geopy)需要十进制格式。DMS到十进制的转换公式如下:

立即学习“Python免费学习笔记(深入)”;

十进制经纬度 = 度 + (分钟 / 60) + (秒 / 3600)

例如,如果纬度是 (33, 51, 52.4),则其十进制值为 33 + (51 / 60) + (52.4 / 3600)。

在转换过程中,必须结合GPSLatitudeRef和GPSLongitudeRef来确定最终的符号:

如果GPSLatitudeRef为 ‘S’ (South),则十进制纬度应乘以 -1。如果GPSLongitudeRef为 ‘W’ (West),则十进制经度应乘以 -1。

这是解决纬度或经度符号错误的关键。例如,原始问题中用户在澳大利亚(南半球)拍照,但计算出的纬度为正值,导致被错误识别为日本。通过检查GPSLatitudeRef是否为’S’并应用负号,即可纠正此问题。

3. Python实现:提取、转换与反向地理编码

以下是一个完整的Python代码示例,演示如何从图片中提取EXIF GPS数据,将其转换为正确的十进制格式,并使用geopy库进行反向地理编码。

import PIL.Imageimport PIL.ExifTagsfrom geopy.geocoders import Nominatimfrom geopy.exc import GeocoderTimedOut, GeocoderServiceErrordef get_exif_data(image_path):    """    从指定路径的图片中提取EXIF数据。    返回一个字典,其中键为EXIF标签名,值为对应的EXIF数据。    """    try:        img = PIL.Image.open(image_path)        exif_data = img._getexif()        if exif_data is None:            return {}        # 将EXIF标签ID映射到可读的标签名        exif = {            PIL.ExifTags.TAGS.get(k, k): v            for k, v in exif_data.items()        }        return exif    except Exception as e:        print(f"读取EXIF数据时发生错误: {e}")        return {}def convert_dms_to_decimal(dms_tuple, ref):    """    将度、分、秒(DMS)元组转换为十进制经纬度。    并根据参考('N', 'S', 'E', 'W')应用正确的符号。    """    if not isinstance(dms_tuple, tuple) or len(dms_tuple) != 3:        raise ValueError("DMS元组格式不正确,应为 (degrees, minutes, seconds)")    # PIL库中的DMS值通常是分数形式 (numerator, denominator)    # 需要将其转换为浮点数    degrees = float(dms_tuple[0][0]) / dms_tuple[0][1] if isinstance(dms_tuple[0], tuple) else float(dms_tuple[0])    minutes = float(dms_tuple[1][0]) / dms_tuple[1][1] if isinstance(dms_tuple[1], tuple) else float(dms_tuple[1])    seconds = float(dms_tuple[2][0]) / dms_tuple[2][1] if isinstance(dms_tuple[2], tuple) else float(dms_tuple[2])    decimal_degrees = degrees + (minutes / 60.0) + (seconds / 3600.0)    if ref in ['S', 'W']:        decimal_degrees *= -1    return decimal_degreesdef get_gps_coordinates(exif_data):    """    从EXIF数据中提取并转换GPS坐标。    返回 (latitude, longitude) 元组,如果无法获取则返回 (None, None)。    """    gps_info = exif_data.get('GPSInfo')    if not gps_info:        return None, None    # GPSInfo中的标签通常是数字ID,需要映射到GPSTAGS中的名称    # PIL.ExifTags.GPSTAGS 是一个反向映射 (tag_name: tag_id)    # 我们需要 (tag_id: tag_name)    gps_tag_id_to_name = {v: k for k, v in PIL.ExifTags.GPSTAGS.items()}    # 使用映射后的ID来获取数据    latitude_dms = gps_info.get(gps_tag_id_to_name.get('GPSLatitude'))    latitude_ref = gps_info.get(gps_tag_id_to_name.get('GPSLatitudeRef'))    longitude_dms = gps_info.get(gps_tag_id_to_name.get('GPSLongitude'))    longitude_ref = gps_info.get(gps_tag_id_to_name.get('GPSLongitudeRef'))    if all([latitude_dms, latitude_ref, longitude_dms, longitude_ref]):        try:            lat = convert_dms_to_decimal(latitude_dms, latitude_ref)            lon = convert_dms_to_decimal(longitude_dms, longitude_ref)            return lat, lon        except ValueError as e:            print(f"DMS转换错误: {e}")            return None, None    return None, None# --- 主程序执行 ---# 请替换为你的图片文件路径image_path = r"C:UsersRGCRAPicturesCamera RollWIN_20240102_11_46_09_Pro.jpg" print(f"正在处理图片: {image_path}")exif = get_exif_data(image_path)if not exif:    print("未找到EXIF数据或读取图片时发生错误。")else:    latitude, longitude = get_gps_coordinates(exif)    if latitude is not None and longitude is not None:        print(f"提取并校正后的GPS坐标: 纬度={latitude}, 经度={longitude}")        # 使用Nominatim进行反向地理编码        try:            # 必须提供一个唯一的user_agent,以遵守Nominatim的使用政策            geoLoc = Nominatim(user_agent='EXIF_GPS_Tutorial_App')             # 增加超时设置,避免网络请求无限等待            locname = geoLoc.reverse(f"{latitude}, {longitude}", timeout=10)             if locname:                print(f"反向地理编码地址: {locname.address}")            else:                print("无法对坐标进行反向地理编码。")        except GeocoderTimedOut:            print("地理编码服务超时。请稍后重试。")        except GeocoderServiceError as e:            print(f"地理编码服务错误: {e}")        except Exception as e:            print(f"反向地理编码过程中发生意外错误: {e}")    else:        print("图片EXIF数据中未找到有效的GPS坐标。")

4. 注意事项与最佳实践

EXIF数据存在性检查: 并非所有图片都包含EXIF数据,更不是所有包含EXIF数据的图片都有GPS信息。在处理之前,务必检查_getexif()的返回值以及GPSInfo字典是否存在。数据格式: PIL库在处理EXIF数据时,DMS元组中的度、分、秒可能以分数形式(例如 (分子, 分母))存储。上述convert_dms_to_decimal函数已更新以处理这种情况。geopy的user_agent: 使用Nominatim等地理编码服务时,必须提供一个描述性的user_agent字符串,以遵守服务提供商的使用政策。网络请求超时: 反向地理编码是网络请求,可能会因为网络问题而延迟或失败。设置timeout参数可以避免程序无限等待。错误处理: 在实际应用中,应加入更完善的错误处理机制,例如捕获文件不存在、EXIF数据损坏、网络请求失败等异常。隐私问题: GPS数据可能包含敏感的个人位置信息。在处理和分享包含此类信息的图片时,请注意隐私保护。坐标精度: 图像EXIF中的GPS数据精度取决于拍摄设备。并非所有设备的GPS都提供高精度数据。

总结

通过本教程,我们学习了如何利用Python的PIL库提取图片EXIF中的GPS数据,并解决了将度分秒格式转换为十进制经纬度时,因半球参考(南北、东西)导致的正负号问题。正确处理GPSLatitudeRef和GPSLongitudeRef是确保坐标准确性的关键。结合geopy库进行反向地理编码,可以进一步验证提取出的位置信息,为图片处理和地理位置分析提供了强大的工具。在实际应用中,务必注意数据完整性、错误处理和用户隐私。

以上就是从图片EXIF数据中提取并校正GPS坐标的Python教程的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1381627.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 23:07:16
下一篇 2025年12月14日 23:07:28

相关推荐

  • Python临时文件操作:解决复制与外部访问难题

    在Python中处理临时文件时,`tempfile.TemporaryFile`因其自动清理机制,常导致文件被占用或在外部操作前被删除的问题。本文将深入探讨这一挑战,并提供使用`tempfile.NamedTemporaryFile`结合`delete=False`的专业解决方案,确保临时文件在外部…

    2025年12月14日
    000
  • Python 异常链 Exception chaining 的概念

    异常链用于在抛出新异常时保留原始异常信息,帮助追踪错误根源。Python支持隐式和显式两种异常链:隐式链自动将except块中引发的新异常关联到当前异常,通过raise…from…可显式指定原因;使用raise…from None则可清除原异常信息。例如打开文件失…

    2025年12月14日
    000
  • Python 二进制文件的读取与写入

    Python中读写二进制文件需用’rb’或’wb’等带’b’的模式,配合bytes类型操作,读取时返回bytes对象,可分块处理大文件,写入时需确保数据为bytes类型,避免编码错误,注意文件会被覆盖或追加。 Python 中读…

    2025年12月14日
    000
  • python模块引入的三种方式

    import模块名可避免命名冲突,需用模块前缀访问;2. from模块名import成员可直接使用指定功能,适用于少量函数;3. from模块名import*易引发命名冲突,降低可读性,不推荐使用。 在Python中,模块引入主要有三种方式,每种方式适用于不同的场景,理解它们的区别有助于写出更清晰、…

    2025年12月14日
    000
  • python中remove()方法如何使用删除后的值?

    要获取被删除的值,需用index()和pop()组合:先通过index()找到值的索引,再用pop()删除并返回该值。示例:my_list = [10, 20, 30, 40]; value_to_remove = 30; try: index = my_list.index(value_to_re…

    2025年12月14日
    000
  • Python 文件数据缓存与内存映射 mmap

    答案:处理大文件时,小文件高频读取用内存缓存,大文件随机访问用mmap。缓存减少重复I/O,适合中小文件;mmap映射文件到内存,按需加载,支持随机读写和跨进程共享,适用于大文件处理。 处理大文件时,直接读取可能消耗大量内存和时间。Python 提供了多种方式优化文件数据访问,其中 数据缓存 和 m…

    2025年12月14日
    000
  • defaultdict在python中接收调用对象

    答案:defaultdict通过传入可调用对象为不存在的键生成默认值,如list、int、lambda等,访问缺失键时自动调用该对象创建值,常用于分组、计数等场景。 在 Python 中,defaultdict 来自 collections 模块,它的特点是在访问不存在的键时,会自动创建一个默认值。…

    2025年12月14日
    000
  • 在TensorFlow中本地加载.npz格式数据集的实用指南

    当tensorflow内置数据集加载功能因网络限制而失败时,本文提供了一种高效且可靠的替代方案。我们将详细介绍如何手动下载`.npz`格式的数据集(如mnist),并利用numpy库将其直接加载到python环境中,从而避免网络连接问题,确保机器学习项目的顺利进行。 在进行机器学习项目时,我们经常需…

    2025年12月14日
    000
  • Python编程中解决IndexError:优化最长公共前缀算法

    本教程深入探讨python中最长公共前缀算法常见的`indexerror: string index out of range`运行时错误。文章分析了错误发生的根本原因——未正确选择参考字符串进行字符比较和长度迭代,并提出通过选取最短字符串作为参考的优化方案。通过详细的代码示例和逻辑解析,帮助开发者…

    2025年12月14日
    000
  • PLY Lexer规则定义最佳实践:Token返回与优先级管理

    本文深入探讨python ply库在构建词法分析器时常见的两个关键问题:token规则函数未正确返回token对象,以及token规则之间的优先级冲突。通过详细分析`pass`语句的误用和通用规则对特定规则的遮蔽效应,文章提供了两种有效的解决方案,包括在通用规则中内联处理特定关键字和调整规则定义顺序…

    2025年12月14日
    000
  • IntelliJ IDEA文件类型识别与管理:从.txt到.py的转换与配置

    本文深入探讨intellij idea如何识别文件类型,主要通过文件名或shebang行。针对用户误创建`.txt`文件而非`.py`文件的情况,教程详细介绍了两种解决方案:一是通过右键菜单临时覆盖单个文件的类型,将其指定为python脚本;二是通过“偏好设置”中的“文件类型”功能进行全局配置和管理…

    2025年12月14日
    000
  • 在 Behave 测试中利用 Fixture 自动化临时目录创建与清理

    本文详细介绍了如何在 python 的 behave 行为驱动开发框架中,利用其强大的 fixture 机制来创建和管理临时目录。通过定义一个自定义 fixture 并结合 `before_tag` 钩子,我们能够为特定场景(scenario)或特性(feature)提供一个隔离的临时工作目录,确保…

    2025年12月14日
    000
  • Flask-SQLAlchemy 数据重复插入问题及解决方案

    本文旨在探讨并解决在使用 flask 和 sqlalchemy 进行数据持久化时,由页面刷新或脚本重复执行导致的数据库数据重复插入问题。我们将深入分析两种核心策略:通过数据库层面的唯一性约束来阻止重复数据,以及利用 web 开发中的 post-redirect-get 模式来避免客户端意外的重复提交…

    2025年12月14日
    000
  • 解决Outlook邮件中CID引用嵌入图片显示异常:VML格式干扰及解决方案

    本文旨在解决使用python通过`win32com.client`库向outlook邮件中嵌入图片时,cid引用无法正常显示的问题。尽管已正确设置cid属性并修改了html `src`引用,图片仍显示为破损。核心原因在于html内容中存在的vml(vector markup language)格式与…

    好文分享 2025年12月14日
    000
  • Python subprocess模块实现外部进程的非阻塞I/O与控制

    本文探讨了在python中使用`subprocess`模块与外部进程进行交互时,如何克服阻塞i/o的挑战,实现非阻塞的标准输出和错误流捕获。通过结合线程和队列,我们展示了一种解决方案,能够预先提供输入,并在进程运行或超时后高效收集其所有输出,同时指出其在完全实时交互式控制方面的局限性。 在Pytho…

    2025年12月14日
    000
  • 优化HDFS数据访问:利用短路本地读取提升性能

    本文探讨了在hdfs环境中,如何通过利用数据本地性来显著减少网络传输,从而优化数据访问性能。针对用户在使用fsspec等工具读取hdfs数据时遇到的高网络流量问题,文章重点介绍了hdfs的短路本地读取(short circuit local reads)机制。通过详细阐述其原理、配置方法以及潜在的优…

    2025年12月14日
    000
  • Python列表交集:二分查找实现与常见错误解析

    本文围绕使用二分查找算法求解两个列表交集时可能遇到的`typeerror`和逻辑问题展开。文章将深入剖析`list.pop()`方法的正确用法、二分查找算法的先决条件(即列表必须有序)、如何有效进行结果去重以及在多轮查找中搜索范围的重置机制。此外,文章还将提供一个经过修正的二分查找实现示例,并介绍一…

    2025年12月14日
    000
  • 使用Python在Windows上自动化显示器屏幕旋转

    本教程旨在解决Windows用户手动调整显示器方向的繁琐问题。通过结合Python的`subprocess`模块与第三方工具`Display64.exe`,本文将详细指导您如何编写脚本,实现显示器屏幕方向的自动化切换,提升操作效率。内容涵盖工具获取、代码实现及参数解析,助您轻松定制显示器显示模式。 …

    2025年12月14日
    000
  • Python Turtle:精确绘制半跨Y轴垂直椭圆教程

    本教程详细介绍了如何使用python的`turtle`模块绘制一个特定的垂直椭圆。我们将学习如何通过调整海龟的初始位置和方向,并利用不同半径的圆弧组合,实现椭圆的半跨y轴居中效果,并提供可运行的代码示例,帮助读者掌握绘制这类复杂图形的技巧。 在使用Python的turtle模块进行图形编程时,绘制标…

    2025年12月14日
    000
  • Python临时文件操作:解决文件占用与复制难题

    在使用python处理临时文件时,开发者常遇到文件被占用或在关闭后立即删除的问题,尤其当需要对临时文件执行复制等外部操作时。本文将深入探讨`tempfile`模块中`temporaryfile`和`namedtemporaryfile`的区别,并提供使用`namedtemporaryfile`配合`…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信