CSV – 在 Python 中处理本地和远程文件

csv - 在 python 中处理本地和远程文件

编码员们大家好!

本文介绍了一个开源工具,它能够处理本地和远程 csv 文件、加载和打印信息,然后将列映射到 django 类型。当数据集变大、excel不支持自定义报告或通过数据表进行完整数据操作时,通常需要处理csv文件,并且需要api。
当前的功能列表可以进一步扩展,以将 csv 文件映射到数据库表/模型并完全生成仪表板 web 应用程序。

源代码:appseed 服务的 csv 处理器部分(开源)

在开始讲解代码和用法之前,我们先总结一下工具的特点:

加载本地和远程文件打印值打印检测到的列类型将映射类型打印到 django 模型

按照 readme 中的说明克隆项目源并使其可用后,可以通过 cli 执行 csv 解析器。安装完成后,我们可以使用以下一行代码调用 cvs 处理器:

$ python manage.py tool_inspect_source -f media/tool_inspect/csv_inspect.json

该工具执行以下任务:

验证输入找到 csv 文件(如果找不到则错误退出)加载信息并检测列类型检测 django 列类型 打印前 10 行

同样可以应用于本地和远程文件。例如,我们可以通过运行这个单行代码来分析臭名昭著的 titanic.cvs:

$ python manage.py tool_inspect_source -f media/tool_inspect/csv_inspect_distant.json# output> processing .mediatool_inspectcsv_inspect_distant.json    |-- file: https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv    |-- type: csvfield        csv type    django types-----------  ----------  ------------------------------------------passengerid  int64       models.integerfield(blank=true, null=true)survived     int64       models.integerfield(blank=true, null=true)pclass       int64       models.integerfield(blank=true, null=true)name         object      models.textfield(blank=true, null=true)sex          object      models.textfield(blank=true, null=true)age          float64     models.floatfield(blank=true, null=true)sibsp        int64       models.integerfield(blank=true, null=true)parch        int64       models.integerfield(blank=true, null=true)ticket       object      models.textfield(blank=true, null=true)fare         float64     models.floatfield(blank=true, null=true)cabin        object      models.textfield(blank=true, null=true)embarked     object      models.textfield(blank=true, null=true)[1] - passengerid,survived,pclass,name,sex,age,sibsp,parch,ticket,fare,cabin,embarked[2] - 1,0,3,"braund, mr. owen harris",male,22,1,0,a/5 21171,7.25,,s[3] - 2,1,1,"cumings, mrs. john bradley (florence briggs thayer)",female,38,1,0,pc 17599,71.2833,c85,c[4] - 3,1,3,"heikkinen, miss. laina",female,26,0,0,ston/o2. 3101282,7.925,,s[5] - 4,1,1,"futrelle, mrs. jacques heath (lily may peel)",female,35,1,0,113803,53.1,c123,s[6] - 5,0,3,"allen, mr. william henry",male,35,0,0,373450,8.05,,s[7] - 6,0,3,"moran, mr. james",male,,0,0,330877,8.4583,,q[8] - 7,0,1,"mccarthy, mr. timothy j",male,54,0,0,17463,51.8625,e46,s[9] - 8,0,3,"palsson, master. gosta leonard",male,2,3,1,349909,21.075,,s[10] - 9,1,3,"johnson, mrs. oscar w (elisabeth vilhelmina berg)",female,27,0,2,347742,11.1333,,s... (truncated output)  

以下是该工具的相关部分:

立即学习“Python免费学习笔记(深入)”;

加载信息并事先检查源是本地还是远程

    print( '> processing ' + arg_json )    print( '    |-- file: ' + json_data['source'] )    print( '    |-- type: ' + json_data['type'  ] )    print( 'n')    tmp_file_path = none     if 'http' in json_data['source']:        url = json_data['source']        r = requests.get(url)        tmp_file = h_random_ascii( 8 ) + '.csv'        tmp_file_path = os.path.join( dir_tmp, tmp_file )        if not file_write(tmp_file_path, r.text ):            return        json_data['source'] = tmp_file_path    else:            if not file_exists( json_data['source'] ):            print( ' > err loading source: ' + json_data['source'] )                        return    csv_types = parse_csv( json_data['source'] )

分析标头并将检测到的类型映射到 django 类型。

对于表格视图,使用 tabulate library:

    csv_types = parse_csv( json_data['source'] )    #pprint.pp ( csv_types )    table_headers = ['field', 'csv type', 'django types']    table_rows    = []    for t in csv_types:        t_type        = csv_types[t]['type']        t_type_django = django_fields[ t_type ]        table_rows.append( [t, t_type, t_type_django] )    print(tabulate(table_rows, table_headers))

最后一步是打印csv数据

    csv_data = load_csv_data( json_data['source'] )    idx = 0    for l in csv_data:        idx += 1        print( '['+str(idx)+'] - ' + str(l) )          # truncate output ..        if idx == 10:            print( ' ... (truncated output) ' )             break 

此时,代码为我们提供了获取 csv 信息、数据类型以及 django 对应的数据类型的权限。该映射可以轻松扩展为任何框架,如 flask、express 或 nextjs。

django 的类型映射是这样的:

# Pandas Typedjango_fields = {    'int'           : 'models.IntegerField(blank=True, null=True)',    'integer'       : 'models.IntegerField(blank=True, null=True)',    'string'        : "models.TextField(blank=True, null=True)",    'string_unique' : "models.TextField(blank=True, null=False, unique=True)",    'object'        : "models.TextField(blank=True, null=True)",    'object_unique' : "models.TextField(blank=True, null=False, unique=True)",    'int64'         : 'models.IntegerField(blank=True, null=True)',    'float64'       : 'models.FloatField(blank=True, null=True)',    'bool'          : 'models.BooleanField(null=True)',}

此工具正在积极开发中,以下是后续步骤:

将该工具连接到更多数据源,例如远程/本地数据库(sqlite、mysql、pgsql)、json 为任何框架生成模型:fastapi、flask、express、nextjs在顶部生成安全的 api 使用 tailwind/bootstrap 生成服务器端分页数据表进行样式化

感谢您的阅读!

对于那些有兴趣做出贡献的人,请随时加入新的 appseed 平台并在 discord 上与社区联系:

appseed – 面向开发者的开源平台appseed 社区 – 3k+ discord 成员

以上就是CSV – 在 Python 中处理本地和远程文件的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1349516.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月13日 12:54:08
下一篇 2025年12月13日 12:54:22

相关推荐

  • 如何用dom2img解决网页打印样式不显示的问题?

    用dom2img解决网页打印样式不显示的问题 想将网页以所见即打印的的效果呈现,需要采取一些措施,特别是在使用了bootstrap等大量采用外部css样式的框架时。 问题根源 在常规打印操作中,浏览器通常会忽略css样式等非必要的页面元素,导致打印出的结果与网页显示效果不一致。这是因为打印机制只识别…

    2025年12月24日
    800
  • 如何解决本地图片在使用 mask JS 库时出现的跨域错误?

    如何跨越localhost使用本地图片? 问题: 在本地使用mask js库时,引入本地图片会报跨域错误。 解决方案: 要解决此问题,需要使用本地服务器启动文件,以http或https协议访问图片,而不是使用file://协议。例如: python -m http.server 8000 然后,可以…

    2025年12月24日
    200
  • Bootstrap 中如何让文字浮于阴影之上?

    文字浮于阴影之上 文中提到的代码片段中 元素中的文字被阴影元素 所遮挡,如何让文字显示在阴影之上? bootstrap v3和v5在处理此类问题方面存在差异。 解决方法 在bootstrap v5中,给 元素添加以下css样式: .banner-content { position: relativ…

    2025年12月24日
    000
  • Bootstrap 5:如何将文字置于阴影之上?

    文字重叠阴影 在 bootstrap 5 中,将文字置于阴影之上时遇到了困难。在 bootstrap 3 中,此问题并不存在,但升级到 bootstrap 5 后却无法实现。 解决方案 为了解决这个问题,需要给 元素添加以下样式: .banner-content { position: relati…

    2025年12月24日
    400
  • Bootstrap 5 如何将文字置于阴影上方?

    如何在 bootstrap 5 中让文字位于阴影上方? 在将网站从 bootstrap 3 升级到 bootstrap 5 后,用户遇到一个问题:文字内容无法像以前那样置于阴影层之上。 解决方案: 为了将文字置于阴影层上方,需要给 banner-content 元素添加以下 css 样式: .ban…

    2025年12月24日
    100
  • 使用 Mask 导入本地图片时,如何解决跨域问题?

    跨域疑难:如何解决 mask 引入本地图片产生的跨域问题? 在使用 mask 导入本地图片时,你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢?让我们深入了解一下: mask 框架假设你以 http(s) 协议加载你的 html 文件,而当使用 file:// 协议打开本地文件时,就会产生跨域…

    2025年12月24日
    200
  • HTML、CSS 和 JavaScript 中的简单侧边栏菜单

    构建一个简单的侧边栏菜单是一个很好的主意,它可以为您的网站添加有价值的功能和令人惊叹的外观。 侧边栏菜单对于客户找到不同项目的方式很有用,而不会让他们觉得自己有太多选择,从而创造了简单性和秩序。 今天,我将分享一个简单的 HTML、CSS 和 JavaScript 源代码来创建一个简单的侧边栏菜单。…

    2025年12月24日
    200
  • 前端代码辅助工具:如何选择最可靠的AI工具?

    前端代码辅助工具:可靠性探讨 对于前端工程师来说,在HTML、CSS和JavaScript开发中借助AI工具是司空见惯的事情。然而,并非所有工具都能提供同等的可靠性。 个性化需求 关于哪个AI工具最可靠,这个问题没有一刀切的答案。每个人的使用习惯和项目需求各不相同。以下是一些影响选择的重要因素: 立…

    2025年12月24日
    300
  • 带有 HTML、CSS 和 JavaScript 工具提示的响应式侧边导航栏

    响应式侧边导航栏不仅有助于改善网站的导航,还可以解决整齐放置链接的问题,从而增强用户体验。通过使用工具提示,可以让用户了解每个链接的功能,包括设计紧凑的情况。 在本教程中,我将解释使用 html、css、javascript 创建带有工具提示的响应式侧栏导航的完整代码。 对于那些一直想要一个干净、简…

    2025年12月24日
    000
  • 布局 – CSS 挑战

    您可以在 github 仓库中找到这篇文章中的所有代码。 您可以在这里查看视觉效果: 固定导航 – 布局 – codesandbox两列 – 布局 – codesandbox三列 – 布局 – codesandbox圣杯 &#8…

    2025年12月24日
    000
  • 隐藏元素 – CSS 挑战

    您可以在 github 仓库中找到这篇文章中的所有代码。 您可以在此处查看隐藏元素的视觉效果 – codesandbox 隐藏元素 hiding elements hiding elements hiding elements hiding elements hiding element…

    2025年12月24日
    400
  • HTMLrev 上的免费 HTML 网站模板

    HTMLrev 是唯一的人工策划的库专门专注于免费 HTML 模板,适用于由来自世界各地慷慨的模板创建者制作的网站、登陆页面、投资组合、博客、电子商务和管理仪表板世界。 这个人就是我自己 Devluc,我已经工作了 1 年多来构建、改进和更新这个很棒的免费资源。我自己就是一名模板制作者,所以我知道如…

    2025年12月24日
    300
  • 居中 – CSS 挑战

    您可以在 github 仓库中找到这篇文章中的所有代码。 您可以在此处查看垂直中心 – codesandbox 和水平中心的视觉效果。 通过 css 居中 垂直居中 centering centering centering centering centering centering立即…

    2025年12月24日 好文分享
    300
  • 如何在 Laravel 框架中轻松集成微信支付和支付宝支付?

    如何用 laravel 框架集成微信支付和支付宝支付 问题:如何在 laravel 框架中集成微信支付和支付宝支付? 回答: 建议使用 easywechat 的 laravel 版,easywechat 是一个由腾讯工程师开发的高质量微信开放平台 sdk,已被广泛地应用于许多 laravel 项目中…

    2025年12月24日
    000
  • 如何在移动端实现子 div 在父 div 内任意滑动查看?

    如何在移动端中实现让子 div 在父 div 内任意滑动查看 在移动端开发中,有时我们需要让子 div 在父 div 内任意滑动查看。然而,使用滚动条无法实现负值移动,因此需要采用其他方法。 解决方案: 使用绝对布局(absolute)或相对布局(relative):将子 div 设置为绝对或相对定…

    2025年12月24日
    000
  • 移动端嵌套 DIV 中子 DIV 如何水平滑动?

    移动端嵌套 DIV 中子 DIV 滑动 在移动端开发中,遇到这样的问题:当子 DIV 的高度小于父 DIV 时,无法在父 DIV 中水平滚动子 DIV。 无限画布 要实现子 DIV 在父 DIV 中任意滑动,需要创建一个无限画布。使用滚动无法达到负值,因此需要使用其他方法。 相对定位 一种方法是将子…

    2025年12月24日
    000
  • 移动端项目中,如何消除rem字体大小计算带来的CSS扭曲?

    移动端项目中消除rem字体大小计算带来的css扭曲 在移动端项目中,使用rem计算根节点字体大小可以实现自适应布局。但是,此方法可能会导致页面打开时出现css扭曲,这是因为页面内容在根节点字体大小赋值后重新渲染造成的。 解决方案: 要避免这种情况,将计算根节点字体大小的js脚本移动到页面的最前面,即…

    2025年12月24日
    000
  • Nuxt 移动端项目中 rem 计算导致 CSS 变形,如何解决?

    Nuxt 移动端项目中解决 rem 计算导致 CSS 变形 在 Nuxt 移动端项目中使用 rem 计算根节点字体大小时,可能会遇到一个问题:页面内容在字体大小发生变化时会重绘,导致 CSS 变形。 解决方案: 可将计算根节点字体大小的 JS 代码块置于页面最前端的 标签内,确保在其他资源加载之前执…

    2025年12月24日
    200
  • Nuxt 移动端项目使用 rem 计算字体大小导致页面变形,如何解决?

    rem 计算导致移动端页面变形的解决方法 在 nuxt 移动端项目中使用 rem 计算根节点字体大小时,页面会发生内容重绘,导致页面打开时出现样式变形。如何避免这种现象? 解决方案: 移动根节点字体大小计算代码到页面顶部,即 head 中。 原理: flexível.js 也遇到了类似问题,它的解决…

    2025年12月24日
    000
  • 形状 – CSS 挑战

    您可以在 github 仓库中找到这篇文章中的所有代码。 您可以在此处查看 codesandbox 的视觉效果。 通过css绘制各种形状 如何在 css 中绘制正方形、梯形、三角形、异形三角形、扇形、圆形、半圆、固定宽高比、0.5px 线? shapes 0.5px line .square { w…

    2025年12月24日
    000

发表回复

登录后才能评论
关注微信