Python SQLite3 动态创建子表指南

程序猿 • 2025年11月29日 04:54:22 • 用户投稿 • 阅读 1

本教程详细讲解了在 python 中使用 sqlite3 动态创建子表的方法。针对数据抓取等场景中，根据主表记录动态生成关联子表的需求，文章指出了常见的sql语句格式化错误，并提供了正确的表名构建和动态创建子表的实践方法，确保数据库操作的成功与效率，同时探讨了相关的数据库设计考量。

在数据处理和爬虫应用中，我们经常会遇到需要为每一条主记录（例如，一个漫画系列）创建其关联的子记录（例如，该漫画的章节列表）的情况。虽然在大多数关系型数据库设计中，推荐使用外键关联的单个子表来存储这些数据，但在某些特定场景下，例如为了数据隔离、性能优化或简化查询逻辑，我们可能需要为每个主记录动态创建独立的子表。本教程将深入探讨如何在 Python 中利用 sqlite3 模块实现这一目标，并解决常见的动态表名构建问题。

动态创建子表的需求与挑战

假设我们有一个主表 Comics，存储了漫画的基本信息，如名称、封面URL和状态。现在，我们希望为每个漫画创建一个独立的子表，存储其所有章节的名称、发布日期和章节URL。这意味着如果 Comics 表中有100条记录，我们就需要动态创建100个子表，每个子表的名称与对应的漫画ID相关联，例如 ChildTable_1、ChildTable_2 等。

实现这一需求的关键挑战在于：

正确获取主记录的唯一标识（ID）。安全且正确地将 ID 嵌入到 SQL CREATE TABLE 语句中，形成有效的表名。

常见错误分析

在尝试动态创建子表时，一个常见的错误是表名字符串格式化不当。例如，如果 cursor.fetchall() 返回的 ids 是一个包含元组的列表（如 [(1,), (2,)]），而我们直接尝试使用 ids[0] 进行格式化：

立即学习“Python免费学习笔记（深入）”；

# 假设 ids = [(1,), (2,)]# 错误的尝试：# for id_tuple in ids:#     # id_tuple 第一次迭代是 (1,)#     # ids[0] 始终是 (1,)，而不是 1#     cursor.execute('''CREATE TABLE IF NOT EXISTS ChildTable_%s (...)''' % (ids[0]))

这段代码的问题在于：

在 for id_tuple in ids: 循环中，id_tuple 每次迭代会是一个元组（例如 (1,)）。ids[0] 在循环中始终引用列表的第一个元素，即 (1,)。% (ids[0]) 会将 (1,) 作为一个整体嵌入到字符串中，导致表名变为 ChildTable_(1,)，这是一个无效或非预期的表名。

正确的做法是，在循环中，从当前迭代的元组中提取实际的 ID 值。

正确的动态子表创建方法

为了正确地动态创建子表，我们需要确保在构建表名时，使用从 cursor.fetchall() 结果中正确提取出的 ID 值。

Kits AI

Kits.ai 是一个为音乐家提供一站式AI音乐创作解决方案的网站，提供AI语音生成和免费AI语音训练

492 查看详情

以下是修正后的代码示例，展示了如何安全有效地动态创建子表：

import sqlite3import requestsfrom bs4 import BeautifulSoupimport time # 推荐使用time模块，而不是直接导入sleep# 模拟请求头，实际应用中应更完整headers = {    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}# 连接到 SQLite 数据库connection = sqlite3.connect('parser_results.db')cursor = connection.cursor()# 创建主表 Comics (如果不存在)cursor.execute('''CREATE TABLE IF NOT EXISTS Comics (  id INTEGER PRIMARY KEY,  name TEXT NOT NULL,  cover TEXT NOT NULL,  status TEXT NOT NULL,  comic_url TEXT UNIQUE NOT NULL  )''')connection.commit()# 示例：爬取并插入 Comics 数据 (简化版，仅用于演示)# 实际应用中，这部分代码应更健壮，包含错误处理和分页逻辑def get_comic_urls_and_details():    base_url = "https://asuratoon.com/manga/?page={}&order=update"    for count in range(1, 2): # 仅爬取第一页作为示例        url = base_url.format(count)        try:            response = requests.get(url, headers=headers, timeout=10)            response.raise_for_status() # 检查HTTP请求是否成功            soup = BeautifulSoup(response.text, "html.parser")            data_url = soup.find_all('div', class_='bsx')            for comic_div in data_url:                comic_link = comic_div.find('a')                if comic_link:                    comic_url = comic_link.get('href')                    # 进一步访问每个漫画详情页获取名称、封面和状态                    detail_response = requests.get(comic_url, headers=headers, timeout=10)                    detail_response.raise_for_status()                    detail_soup = BeautifulSoup(detail_response.text, "html.parser")                    data_general = detail_soup.find('div', class_='bixbox animefull')                    if data_general:                        name_tag = data_general.find('h1', class_='entry-title')                        cover_tag = data_general.find('img')                        status_div = data_general.find('div', class_='imptdt')                        name = name_tag.text.strip() if name_tag else "Unknown Name"                        cover = cover_tag.get('src') if cover_tag else "No Cover"                        status = status_div.text.replace('Status ', '').strip() if status_div else "Unknown Status"                        # 插入主表数据                        try:                            cursor.execute('INSERT INTO Comics (name, cover, status, comic_url) VALUES (?, ?, ?, ?)',                                           (name, cover, status, comic_url))                            connection.commit()                            print(f"Inserted comic: {name}")                        except sqlite3.IntegrityError:                            print(f"Comic '{name}' (URL: {comic_url}) already exists, skipping.")                        except Exception as e:                            print(f"Error inserting comic {name}: {e}")                    time.sleep(1) # 礼貌性延时        except requests.exceptions.RequestException as e:            print(f"Error fetching URL {url}: {e}")        except Exception as e:            print(f"An unexpected error occurred: {e}")# 执行数据抓取和插入，确保Comics表有数据get_comic_urls_and_details()# 获取所有漫画的 ID 和 URL，以便后续创建子表和插入章节数据cursor.execute('SELECT id, comic_url FROM Comics')comic_data_for_children = cursor.fetchall() # 结果如 [(1, 'url1'), (2, 'url2')]print(f"Found {len(comic_data_for_children)} comics to create child tables for.")# 遍历每个漫画，创建对应的子表并插入章节数据for comic_id, comic_detail_url in comic_data_for_children:    # 构建子表名称，确保ID是整数    child_table_name = f"ChildTable_{comic_id}"    # 使用 f-string 安全地构建 CREATE TABLE 语句    # 推荐使用方括号 [] 包裹表名，以防表名包含特殊字符（虽然这里是纯数字ID）    create_table_sql = f"""    CREATE TABLE IF NOT EXISTS [{child_table_name}] (        id INTEGER PRIMARY KEY AUTOINCREMENT,        chapter_name TEXT,        release_date TEXT,        chapter_url TEXT,        comic_id INTEGER NOT NULL,        FOREIGN KEY (comic_id) REFERENCES Comics(id)    );    """    try:        cursor.execute(create_table_sql)        print(f"Created table: {child_table_name}")        connection.commit()        # 爬取当前漫画的章节信息并插入到对应的子表        # 假设章节信息可以在 comic_detail_url 页面找到        print(f"Fetching chapters for comic ID {comic_id} from {comic_detail_url}")        detail_response = requests.get(comic_detail_url, headers=headers, timeout=10)        detail_response.raise_for_status()        detail_soup = BeautifulSoup(detail_response.text, "html.parser")        chapters_data = detail_soup.find_all('div', class_='eph-num')        if not chapters_data:            print(f"No chapters found for comic ID {comic_id}.")        for chapter_item in chapters_data:            chapter_name_tag = chapter_item.find('span', class_='chapternum')            release_date_tag = chapter_item.find('span', class_='chapterdate')            chapter_url_tag = chapter_item.find('a')            chapter_name = chapter_name_tag.text.strip() if chapter_name_tag else "Unknown Chapter"            release_date = release_date_tag.text.strip() if release_date_tag else "Unknown Date"            chapter_url = chapter_url_tag.get('href') if chapter_url_tag else "No URL"            # 插入章节数据到对应的子表            insert_chapter_sql = f"""            INSERT INTO [{child_table_name}] (chapter_name, release_date, chapter_url, comic_id)            VALUES (?, ?, ?, ?);            """            try:                cursor.execute(insert_chapter_sql, (chapter_name, release_date, chapter_url, comic_id))                connection.commit()                # print(f"  Inserted chapter '{chapter_name}' into {child_table_name}")            except Exception as e:                print(f"  Error inserting chapter '{chapter_name}' into {child_table_name}: {e}")        time.sleep(1) # 礼貌性延时    except requests.exceptions.RequestException as e:        print(f"Error fetching chapter details for {comic_detail_url}: {e}")    except Exception as e:        print(f"Error creating table or inserting data for comic ID {comic_id}: {e}")# 关闭数据库连接connection.close()print("Database operations completed and connection closed.")

关键修正点：

正确获取 ID： cursor.fetchall() 返回的是一个元组的列表。在 for comic_id, comic_detail_url in comic_data_for_children: 循环中，comic_id 直接就是我们需要的整数 ID。构建表名： 使用 f-string (Python 3.6+) 或 str.format() 方法来动态构建表名。child_table_name = f”ChildTable_{comic_id}” 简洁明了。SQL 语句中的表名： 将构建好的表名 child_table_name 插入到 SQL 语句中。为了安全起见，尤其是在表名可能包含特殊字符时，建议使用方括号 [] 包裹表名，例如 CREATE TABLE IF NOT EXISTS [{child_table_name}] (…)。对于纯数字后缀的表名，这并非强制，但能增强代码的健壮性。AUTOINCREMENT： 在 PRIMARY KEY 后面添加 AUTOINCREMENT 可以确保 ID 值严格递增，并且不会重用已删除行的 ID。外键引用： 在子表中添加 comic_id INTEGER NOT NULL 列，并创建 FOREIGN KEY (comic_id) REFERENCES Comics(id)，这虽然是动态创建多个表，但依然建议在设计上保持与主表的逻辑关联性，以便于理解和可能的跨表查询。

注意事项与最佳实践

数据库设计考量：

何时使用动态子表？ 动态创建子表通常不被视为标准的关系型数据库设计模式。更常见和推荐的做法是使用一个带有外键关联的单一子表。例如，创建一个 Chapters 表，其中包含一个 comic_id 列，该列作为外键引用 Comics 表的 id。动态子表的潜在问题：查询复杂性： 如果需要查询所有漫画的所有章节，你将不得不遍历所有子表，这比查询一个大表并使用 WHERE comic_id = X 效率更低且更复杂。维护成本： 数据库模式的改变（例如，为章节表添加新列）需要对所有动态创建的子表进行操作。表数量限制： 某些数据库系统对单个数据库中的表数量有性能或硬性限制。适用场景： 动态子表可能适用于以下特定情况：每个子表的数据量非常大且完全独立，几乎不需要跨表查询。出于权限或数据隔离目的，需要将不同主记录的数据物理分离。历史遗留系统或特定性能优化需求。

SQL 注入风险： 尽管本例中表名是根据内部 ID 生成的，相对安全，但在实际应用中，如果动态生成的 SQL 语句（包括表名、列名等）包含来自用户输入的变量，必须采取严格的参数化查询或白名单验证，以防止 SQL 注入攻击。对于表名和列名，通常无法使用参数化查询，因此更应谨慎处理。

错误处理： 在实际的爬虫和数据库操作中，应包含健壮的错误处理机制（如 try-except 块），以应对网络请求失败、HTML 结构变化、数据库操作异常等情况。

连接管理： 确保在所有数据库操作完成后，调用 connection.commit() 提交事务，并调用 connection.close() 关闭数据库连接，释放资源。

总结

通过本教程，我们学习了如何在 Python 中使用 sqlite3 模块动态创建子表。关键在于正确地从查询结果中提取 ID，并利用 f-string 等方式安全有效地构建 SQL CREATE TABLE 语句中的表名。尽管动态子表在某些特定场景下有用，但在大多数关系型数据库设计中，使用外键关联的单个子表是更推荐和更具可维护性的方法。在决定采用动态子表策略时，务必权衡其优缺点，并考虑未来的可扩展性和维护成本。

以上就是Python SQLite3 动态创建子表指南的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/915227.html

ai app apple html python red safari sql语句 win windows 爬虫

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

《燕云十六声》醉花阴猫咪在哪里醉花阴猫戏收集攻略

上一篇 2025年11月29日 04:54:22

圆通快递运单查询系统圆通物流包裹运输状态更新

下一篇 2025年11月29日 04:54:23

用户投稿

修复Django电商项目中AJAX过滤产品列表图片不显示问题

在Django电商项目中，当使用AJAX动态加载过滤后的产品列表时，常遇到图片无法正常显示的问题。这通常是由于前端模板中图片加载方式（如data-setbg属性结合JavaScript库）与AJAX动态内容更新机制不兼容所致。解决方案是直接在AJAX返回的HTML中使用标准的标签来渲染图片，确保浏览…

程序猿
2026年5月10日
0000
Matplotlib 地图中多类型图例的创建与优化

本教程旨在解决matplotlib地图可视化中，如何在一个图例中同时展示颜色块（如区域分类）和自定义标记（如特定兴趣点）的问题。文章详细介绍了当传统`patch`对象无法正确显示标记时，如何利用`matplotlib.lines.line2d`创建标记图例句柄，并将其与颜色块图例句柄合并，从而生成一…

程序猿
2026年5月10日 • 用户投稿
1000
用户投稿

Golang JSON序列化：控制敏感字段暴露的最佳实践

本教程探讨golang中如何高效控制结构体字段在json序列化时的可见性。当需要将包含敏感信息的结构体数组转换为json响应时，通过利用`encoding/json`包提供的结构体标签，特别是`json:”-“`，可以轻松实现对特定字段的忽略，从而避免敏感数据泄露，确保api…

程序猿
2026年5月10日
0000
用户投稿

利用海象运算符简化条件赋值：Python教程与最佳实践

本文旨在探讨Python中海象运算符（:=）在条件赋值场景下的应用。通过对比传统if/else语句与海象运算符，以及条件表达式，分析海象运算符在简化代码、提高可读性方面的优势与局限性。并通过具体示例，展示如何在列表推导式等场景下合理使用海象运算符，同时强调其潜在的复杂性及替代方案，帮助开发者更好地掌…

程序猿
2026年5月10日
1000
用户投稿

怎么在PHP代码中实现图片上传功能_PHP图片上传功能实现与安全处理教程

首先创建含enctype的HTML表单，再用PHP接收文件，检查目录、移动临时文件，验证类型与大小，生成唯一文件名，并调整php.ini限制以确保上传成功。如果您尝试在PHP项目中添加图片上传功能，但服务器无法正确接收或保存文件，则可能是由于表单配置、文件处理逻辑或安全限制的问题。以下是实现该功能…

程序猿
2026年5月10日
1000
用户投稿

比特币新手教程比特币交易平台有哪些

比特币是一种去中心化的数字货币，基于区块链技术实现点对点交易，具有匿名性、有限发行和不可篡改等特点；新手可通过交易所购买，P2P交易获得比特币，常用平台包括Binance、OKX和Huobi；交易流程包括注册账户、实名认证、绑定支付方式、充值法币并下单购买，可选择市价单或限价单；比特币存储方式有交易…

程序猿
2026年5月10日
0000
用户投稿

c++中的SFINAE技术是什么_c++模板编程中的SFINAE原理与应用

SFINAE 是“替换失败不是错误”的原则，指模板实例化时若参数替换导致错误，只要存在其他合法候选，编译器不报错而是继续重载决议。它用于条件启用模板、类型检测等场景，如通过 decltype 或 enable_if 控制函数重载，实现类型特征判断。尽管 C++20 引入 Concepts 简化了部分…

程序猿
2026年5月10日
0000
HTML如何隐藏滚动条或去除滚动条

滚动条可以存在也可以不存在，本文主要介绍了html 隐藏滚动条和去除滚动条的方法的相关资料,大家一起来学习一下html隐藏滚动条或去除滚动条的方法吧。 1. html 标签加属性 XML/HTML Code复制内容到剪贴板 2.body中加入以下代码立即学习“前端免费学习笔记（深入）”； html…

程序猿
用户投稿 2026年5月10日
0000
用户投稿

Go语言mgo查询构建：深入理解bson.M与日期范围查询的正确实践

本文旨在解决go语言mgo库中构建复杂查询时，特别是涉及嵌套`bson.m`和日期范围筛选的常见错误。我们将深入剖析`bson.m`的类型特性，解释为何直接索引`interface{}`会导致“invalid operation”错误，并提供一种推荐的、结构清晰的代码重构方案，以确保查询条件能够正确…

程序猿
2026年5月10日
1000
用户投稿

vscode上怎么运行html_vscode上运行html步骤【指南】

首先保存文件为.html格式，再通过浏览器或Live Server插件打开预览；推荐安装Live Server实现本地服务器运行与实时刷新，提升开发体验。在 VS Code 上运行 HTML 文件并不需要复杂的配置，只需几个简单步骤即可预览页面效果。VS Code 本身是一个代码编辑器，不直接运行…

程序猿
2026年5月10日
1000
用户投稿

RichHandler与Rich Progress集成：解决显示冲突的教程

在使用rich库的`richhandler`进行日志输出并同时使用`progress`组件时，可能会遇到显示错乱或溢出问题。这通常是由于为`richhandler`和`progress`分别创建了独立的`console`实例导致的。解决方案是确保日志处理器和进度条组件共享同一个`console`实例…

程序猿
2026年5月10日
0000
用户投稿

修复点击时按钮抖动：CSS垂直对齐实践

本文探讨了在Web开发中，交互式按钮（如播放/暂停按钮）在点击时发生意外垂直位移的问题。通过分析CSS样式变化对元素布局的影响，我们发现这是由于按钮不同状态下的边框样式和内边距改变，以及默认的垂直对齐行为共同作用所致。核心解决方案是利用CSS的vertical-align属性，将其设置为middle…

程序猿
2026年5月10日
0000
用户投稿

Golang goroutine与channel调试技巧

使用go run -race检测数据竞争，结合runtime.NumGoroutine监控协程数量，通过pprof分析阻塞调用栈，利用select超时避免永久阻塞，有效排查goroutine泄漏、死锁和数据竞争问题。 Go语言的goroutine和channel是并发编程的核心，但它们也带来了调试上…

程序猿
2026年5月10日
0000
用户投稿

页面中文本域的值怎么设置

标签定义多行的文本输入控件。文本区中可容纳无限数量的文本，其中的文本的默认字体是等宽字体（通常是 Courier）。可以通过 cols 和 rows 属性来规定 textarea 的尺寸，不过更好的办法是使用 CSS 的 height 和 width 属性。注释：在文本输入区内的文本行间，用 …

程序猿
2026年5月10日
0000
《魔兽世界》将于6月11日开启国服回归技术测试

《%ign%ignore_a_1%re_a_1%》官方宣布，将于6月11日开启国服回归技术测试，时间为7天，并称可以在6月内正式开服，玩家们可以访问官网下载战网客户端并预下载“巫妖王之怒”客户端，技术测试详情见下图。 WordAi WordAI是一个AI驱动的内容重写平台 53 查看详情以上就是《…

程序猿
2026年5月10日 • 用户投稿
2000
用户投稿

使用 Jupyter Notebook 进行探索性数据分析

Jupyter Notebook通过单元格实现代码与Markdown结合，支持数据导入（pandas）、清洗（fillna）、探索（matplotlib/seaborn可视化）、统计分析（describe/corr）和特征工程，便于记录与分享分析过程。 Jupyter Notebook 是进行探索性…

程序猿
2026年5月10日
0000
用户投稿

如何在HTML中插入表单元素_HTML表单控件与输入类型使用指南

HTML表单通过标签构建，包含action和method属性定义数据提交目标与方式，常用input类型如text、password、email等适配不同输入需求，配合label、required、placeholder提升可用性，结合textarea、select、button等控件实现完整交互，是…

程序猿
2026年5月10日
0000
用户投稿

HTML5网页如何实现手势操作 HTML5网页移动端交互的处理技巧

首先利用原生touch事件实现滑动判断，再通过preventDefault解决滚动冲突，接着引入Hammer.js处理复杂手势，最后通过优化点击区域、避免事件冲突和增加视觉反馈提升体验。在移动端浏览器中，HTML5网页可以通过触摸事件实现手势操作，提升用户体验。虽然原生JavaScript提供了基…

程序猿
2026年5月10日
0000
用户投稿

深入理解 Express.js 中 next() 参数的作用与中间件机制

本文深入探讨 express.js 中间件函数中的 `next()` 参数。它负责将控制权传递给请求-响应周期中的下一个中间件或路由处理程序。文章将详细解释 `next()` 的工作原理、中间件的注册与执行顺序，以及不正确使用 `next()` 可能导致请求挂起的风险，并通过代码示例和实际应用场景，…

程序猿
2026年5月10日
0000
用户投稿

创建指定大小并填充特定数据的Golang文件教程

本文将介绍如何使用Golang创建一个指定大小的文件，并用特定数据填充它。我们将使用 `os` 包提供的函数来创建和截断文件，从而实现快速生成大文件的目的。示例代码展示了如何创建一个10MB的文件，并将其填充为全零数据。掌握这些方法，可以方便地在例如日志系统或磁盘队列等场景中，预先创建测试文件或初始…

程序猿
2026年5月10日
0000