Python中的“数组”主要指list和numpy.ndarray。list是内置的异构序列,支持多种数据类型和动态操作,适合小规模或非数值数据处理;而numpy.ndarray是同质多维数组,基于C实现,内存连续,支持高效数值运算和广播操作,适用于大规模科学计算。两者可通过np.array()和tolist()相互转换,核心区别在于数据类型一致性、性能和功能:list灵活但慢,ndarray高效专用于数值计算。

Python中,我们通常说的“数组”其实有两种主要形式:一种是内置的
list
(列表),它非常灵活,能存放各种类型的数据;另一种是
numpy
库提供的
ndarray
,这才是真正意义上的高性能、同质性数组,尤其适合数值计算和科学计算。理解这两种“数组”的差异和各自的操作方式,是高效编写Python代码的关键。
解决方案
谈到Python中的“数组”操作,我们基本上是在围绕
list
和
numpy.ndarray
打转。我个人觉得,对于初学者,先从
list
入手是比较自然的,因为它就在那里,开箱即用。而当你的数据量上去,或者需要进行复杂的数值运算时,
numpy
的强大就显现出来了。
1. Python内置列表(
list
)的操作:
list
是最常用的数据结构之一,它允许你存储任意数量、任意类型的数据项。
立即学习“Python免费学习笔记(深入)”;
创建列表:
my_list = [1, 2, 3, 'hello', True]empty_list = []another_list = list(range(5)) # [0, 1, 2, 3, 4]
访问元素: 使用索引(从0开始)和切片。
print(my_list[0]) # 1print(my_list[-1]) # True (访问最后一个元素)print(my_list[1:4]) # [2, 3, 'hello'] (切片操作,不包含结束索引)print(my_list[::2]) # [1, 3, True] (步长为2)
修改元素:
my_list[0] = 100print(my_list) # [100, 2, 3, 'hello', True]
添加元素:
my_list.append('world') # 在末尾添加my_list.insert(1, 'new') # 在指定位置插入print(my_list) # [100, 'new', 2, 3, 'hello', True, 'world']list_a = [1, 2]list_b = [3, 4]list_c = list_a + list_b # 连接列表,生成新列表print(list_c) # [1, 2, 3, 4]list_a.extend(list_b) # 将list_b的元素添加到list_a末尾print(list_a) # [1, 2, 3, 4]
删除元素:
del my_list[1] # 根据索引删除print(my_list) # [100, 2, 3, 'hello', True, 'world']popped_element = my_list.pop() # 删除并返回最后一个元素print(popped_element) # worldprint(my_list) # [100, 2, 3, 'hello', True]my_list.remove(100) # 删除第一个匹配的元素值print(my_list) # [2, 3, 'hello', True]
其他常用操作:
len()
获取长度,
sort()
排序,
reverse()
反转,
count()
计数,
index()
查找索引。
2. NumPy
ndarray
的操作:
numpy
是Python进行科学计算的核心库,它的
ndarray
对象是多维同质数组,专为高效数值运算设计。
安装NumPy: 如果没安装,先
pip install numpy
。
创建数组:
import numpy as npnp_array_1d = np.array([1, 2, 3, 4, 5])np_array_2d = np.array([[1, 2, 3], [4, 5, 6]])print(np_array_1d)print(np_array_2d)# 常用创建函数zeros_array = np.zeros((2, 3)) # 全0数组ones_array = np.ones((3, 2)) # 全1数组range_array = np.arange(0, 10, 2) # 类似range,但生成ndarraylinspace_array = np.linspace(0, 1, 5) # 在指定区间内均匀生成N个点
访问元素与切片: 比列表更强大的多维切片。
print(np_array_2d[0, 1]) # 访问第一行第二列的元素:2print(np_array_2d[:, 0]) # 访问所有行的第一列:[1 4]print(np_array_2d[0, :]) # 访问第一行的所有元素:[1 2 3]print(np_array_2d[0:2, 1:3]) # 切片:[[2 3], [5 6]]# 布尔索引mask = np_array_1d > 3print(np_array_1d[mask]) # [4 5]
元素级运算: 这是
ndarray
的巨大优势,直接对整个数组进行数学运算。
a = np.array([1, 2, 3])b = np.array([4, 5, 6])print(a + b) # [5 7 9]print(a * 2) # [2 4 6]print(a * b) # 对应元素相乘:[4 10 18]print(np.sqrt(a)) # 逐元素求平方根
形状操作:
reshaped_array = np_array_1d.reshape((5, 1)) # 改变数组形状print(reshaped_array)print(np_array_2d.T) # 转置
聚合函数:
print(np_array_1d.sum()) # 数组所有元素之和print(np_array_2d.mean(axis=0)) # 沿列求平均值print(np_array_2d.max()) # 最大值
Python列表与NumPy数组有什么区别?
这个问题问得非常好,因为这是初学者最容易混淆,也是最核心的一个点。说实话,我刚开始学Python的时候,也觉得“不都是存数据嘛,有啥区别?”但随着项目深入,你会发现它们的设计哲学和应用场景是截然不同的。
从我的经验来看,主要区别体现在以下几个方面:
数据类型:
Python列表(
list
): 是异构的,这意味着一个列表中可以同时存储整数、浮点数、字符串、甚至其他列表或对象。这种灵活性很强,但代价是内存占用和访问效率。NumPy数组(
ndarray
): 是同构的,即所有元素必须是相同的数据类型(例如,全部是整数,或者全部是浮点数)。如果你尝试放入不同类型的数据,NumPy会尝试向上转型以保持同质性。这种特性让NumPy能将数据紧密地存储在内存中,从而实现高效的数值运算。
性能:
Python列表: 由于其异构性和动态大小的特性,列表中的每个元素实际上都存储为一个指向实际数据对象的指针。这意味着当你遍历列表或进行大量数值运算时,Python需要处理这些指针,导致性能开销较大,尤其是在处理大型数据集时。NumPy数组: 底层是用C语言实现的,数据是连续存储在内存中的。这使得NumPy在进行大规模数值运算时,可以利用CPU的SIMD(单指令多数据)指令集,并避免Python的解释器开销,因此速度非常快。对于科学计算、机器学习等场景,NumPy是不可或缺的。
功能和操作:
Python列表: 提供了非常通用的序列操作,比如
append
、
insert
、
pop
、
sort
等,更侧重于数据的组织和管理。NumPy数组: 提供了极其丰富的数学函数和操作,可以直接对整个数组进行元素级的算术运算(如加减乘除)、线性代数、傅里叶变换、随机数生成等。它的设计目标就是为了高效地处理数值数据。比如,两个NumPy数组相加,
array1 + array2
会直接进行对应元素的相加,而两个列表相加
list1 + list2
则是拼接操作。
什么时候用哪个?
用
list
: 当你需要存储不同类型的数据,或者数据结构经常变化(频繁增删),或者数据量不大且不涉及大量数值计算时,
list
是更简单、更直观的选择。用
ndarray
: 当你处理的是大型数值数据集,需要进行高效的数学运算、统计分析,或者进行机器学习、深度学习等任务时,
numpy.ndarray
是绝对的首选。它的性能优势是列表无法比拟的。
Python数组的切片和索引技巧有哪些?
切片和索引是操作Python“数组”最基础也最强大的方式之一。掌握好它们,能让你在数据处理时事半功倍。我发现很多初学者对负数索引和多维数组的切片感到困惑,这里我们来详细聊聊。
1. Python列表(
list
)的切片与索引:
列表的索引是基于0的,这意味着第一个元素的索引是0,第二个是1,以此类推。
基本索引:
my_list = ['a', 'b', 'c', 'd', 'e']print(my_list[0]) # 'a'print(my_list[2]) # 'c'
负数索引: 负数索引从列表末尾开始计数。
-1
是最后一个元素,
-2
是倒数第二个,以此类推。这个真的非常方便,不用先
len(list) - 1
。
print(my_list[-1]) # 'e'print(my_list[-3]) # 'c'
切片(
[start:end:step]
): 切片会创建一个新列表,包含从
start
索引开始,到
end
索引(不包含)结束的元素。
step
是步长,默认为1。
start
省略:从头开始。
end
省略:到尾结束。
step
为负数:表示反向切片。
print(my_list[1:4]) # ['b', 'c', 'd'] (从索引1到索引3)print(my_list[:3]) # ['a', 'b', 'c'] (从头到索引2)print(my_list[2:]) # ['c', 'd', 'e'] (从索引2到尾)print(my_list[:]) # ['a', 'b', 'c', 'd', 'e'] (复制整个列表)print(my_list[::2]) # ['a', 'c', 'e'] (每隔一个取一个)print(my_list[::-1]) # ['e', 'd', 'c', 'b', 'a'] (反转列表,非常酷)
2. NumPy数组(
ndarray
)的切片与索引:
NumPy数组的索引和切片在单维度上与列表类似,但在多维数组上则展现出其真正的威力。
一维数组: 和列表几乎一样。
import numpy as nparr_1d = np.array([10, 20, 30, 40, 50])print(arr_1d[1]) # 20print(arr_1d[-2]) # 40print(arr_1d[1:4]) # [20 30 40]print(arr_1d[::-1]) # [50 40 30 20 10]
多维数组: 使用逗号分隔的索引来指定每个维度的位置。
arr_2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])print(arr_2d[0, 0]) # 1 (第一行第一列)print(arr_2d[1, 2]) # 6 (第二行第三列)print(arr_2d[0]) # [1 2 3] (访问第一行,等同于 arr_2d[0, :])
多维切片:
# 获取第一行和第二行的所有列print(arr_2d[0:2, :]) # 或者 arr_2d[:2, :]# 输出:# [[1 2 3]# [4 5 6]]# 获取所有行的第二列print(arr_2d[:, 1])# 输出:# [2 5 8]# 获取中间的子矩阵print(arr_2d[1:3, 1:3])# 输出:# [[5 6]# [8 9]]
步长切片:
arr_3d = np.arange(27).reshape((3, 3, 3))print(arr_3d[::2, ::2, ::2]) # 在所有维度上每隔一个取一个
布尔索引: 这是NumPy一个非常强大的特性,你可以用一个布尔数组来选择元素。
arr = np.array([10, 20, 30, 40, 50])mask = (arr > 25) & (arr < 45) # 创建一个布尔掩码print(mask) # [False False True True False]print(arr[mask]) # [30 40] (只选择True对应的元素)# 修改满足条件的元素arr[arr % 2 == 0] = 0 # 将所有偶数改为0print(arr) # [ 0 20 0 40 0]
整数数组索引: 使用一个整数数组作为索引,可以按任意顺序选择元素。
arr = np.array([10, 20, 30, 40, 50])indices = [0, 2, 4]print(arr[indices]) # [10 30 50]
掌握这些切片和索引的技巧,能让你在处理数据时更加灵活和高效,尤其是在数据分析和科学计算的场景中,这些操作是家常便饭。
Python中如何将列表转换为NumPy数组,反之亦然?
在实际的数据处理流程中,我们经常需要在Python的
list
和NumPy的
ndarray
之间进行转换。这通常发生在数据从外部源(比如CSV文件、数据库查询结果)加载进来时,它们可能最初以列表的形式存在,但为了进行高效的数值计算,我们需要将它们转换为NumPy数组。反过来,当你完成了NumPy数组的计算,可能需要将结果以列表的形式输出,或者与不接受NumPy数组的库进行交互。
1. Python列表转换为NumPy数组:
这是最常见的转换方向。NumPy提供了一个非常直观的函数
np.array()
来完成这个任务。
import numpy as np# 一维列表转一维NumPy数组my_list_1d = [1, 2, 3, 4, 5]np_array_1d = np.array(my_list_1d)print(f"列表: {my_list_1d}, 类型: {type(my_list_1d)}")print(f"NumPy数组: {np_array_1d}, 类型: {type(np_array_1d)}")# 输出:# 列表: [1, 2, 3, 4, 5], 类型: # NumPy数组: [1 2 3 4 5], 类型: # 二维列表(列表的列表)转二维NumPy数组my_list_2d = [[10, 20, 30], [40, 50, 60]]np_array_2d = np.array(my_list_2d)print(f"n二维列表:n{my_list_2d}")print(f"二维NumPy数组:n{np_array_2d}")# 输出:# 二维列表:# [[10, 20, 30], [40, 50, 60]]# 二维NumPy数组:# [[10 20 30]# [40 50 60]]
需要注意的细节:
数据类型推断:
np.array()
会尝试推断列表元素的统一数据类型。如果列表包含混合类型,NumPy会向上转型以保持同质性。例如,如果列表中有整数和浮点数,它会全部转为浮点数。
mixed_list = [1, 2.5, 3]mixed_np_array = np.array(mixed_list)print(mixed_np_array) # [1. 2.5 3. ]print(mixed_np_array.dtype) # float64
深拷贝: 默认情况下,
np.array()
会创建一个原始列表的深拷贝,这意味着修改NumPy数组不会影响原始列表,反之亦然。这通常是你想要的行为。
original_list = [1, 2, 3]arr = np.array(original_list)arr[0] = 99print(original_list) # [1, 2, 3] (未改变)print(arr) # [99 2 3]
2. NumPy数组转换为Python列表:
NumPy数组对象有一个
tolist()
方法,可以方便地将其转换为Python列表。对于多维数组,它会生成一个嵌套的列表。
# 一维NumPy数组转一维列表np_array_1d = np
以上就是Python中数组如何操作 Python中数组操作教程的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1368997.html
微信扫一扫
支付宝扫一扫