
在使用 Python 的 csv.writer 模块时,有时会遇到生成的 CSV 文件中,数据记录被额外的引号包裹的情况,例如 “item1,item2,item3″,而期望的结果是 item1,item2,item3。 这个问题通常出现在从数据库或其他数据源获取数据时,数据已经被组合成一个包含逗号分隔值的字符串。
问题分析
csv.writer.writerows() 方法期望接收一个可迭代对象,其中每个元素代表一行数据,而每行数据又是一个可迭代对象,包含该行中的各个字段。如果 result_set 中的每一行只有一个字段,且该字段本身就是一个包含逗号的字符串,csv.writer 会自动将其视为一个包含特殊字符的字段,并用引号将其包裹,以避免逗号被错误地解析为字段分隔符。
解决方案
为了避免这种情况,需要在将数据写入 CSV 文件之前,将包含逗号分隔值的字符串拆分成单独的字段。 可以使用 Python 的字符串 split() 方法来实现。
以下是一个示例代码,展示了如何使用 split() 方法来解决这个问题:
import csv# 假设 result_set 的结构如下:result_set = [('item1,item2,item3',), ('item4,item5,item6',)]filename = 'output.csv'with open(filename, 'w', newline='') as csvfile: datafile = csv.writer(csvfile) # 使用生成器表达式拆分字符串并写入CSV文件 datafile.writerows((col.split(",") for (col,) in result_set))
代码解释
with open(filename, ‘w’, newline=”) as csvfile:: 以写入模式打开 CSV 文件。newline=” 参数用于避免在 Windows 系统中出现额外的空行。datafile = csv.writer(csvfile): 创建一个 csv.writer 对象,用于将数据写入 CSV 文件。datafile.writerows((col.split(“,”) for (col,) in result_set)): 这是核心部分。(col.split(“,”) for (col,) in result_set) 是一个生成器表达式,它遍历 result_set 中的每一行。(col,) 使用元组解包,从每一行中提取唯一的字段(包含逗号分隔值的字符串)。col.split(“,”) 使用 split() 方法将该字符串按照逗号分隔成一个列表,列表中的每个元素代表一个字段。datafile.writerows() 接收这个生成器表达式,并将拆分后的字段写入 CSV 文件。
注意事项
确保 result_set 中的每一行都只有一个字段,且该字段包含逗号分隔的值。如果 result_set 的结构不同,需要相应地调整代码。如果字段中本身就包含引号,可能需要使用 csv.writer 的 quotechar 和 quoting 参数来处理。 具体来说,quotechar 指定用于包围包含特殊字符的字段的引号字符,而 quoting 指定何时使用引号。
总结
通过在写入 CSV 文件之前,使用 split() 方法将包含逗号分隔值的字符串拆分成单独的字段,可以有效避免 csv.writer 自动添加引号的问题。 这种方法简单易懂,能够满足大多数场景下的需求。 掌握这种技巧,可以更灵活地控制 CSV 文件的生成,避免不必要的麻烦。
以上就是使用 csv.writer 避免记录周围出现引号的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1363298.html
微信扫一扫
支付宝扫一扫