当前位置：首页 > news >正文

Python数据分析课程期末考试判断题联系题100题

news 2026/7/1 19:19:01

1. 题目：pandas是 Python 中唯一用于数据分析的库。 ( )

解析：错误。Python 数据分析生态系统包含多个核心库，pandas主要用于数据处理和分析，但NumPy提供数组计算，Matplotlib和Seaborn用于数据可视化，SciPy用于科学计算，scikit-learn用于机器学习，它们共同构成数据分析工具链。

2. 题目：DataFrame是pandas库中的一种二维表格型数据结构。 ( )

解析：正确。DataFrame是pandas的核心数据结构，类似于电子表格或 SQL 表，由行和列组成，每列可以是不同的数据类型。

3. 题目：df.mean()方法可以计算DataFrame中所有数值列的平均值。 ( )

解析：正确。df.mean()默认对数值列（int和float类型）进行聚合，返回每列的平均值，非数值列（如字符串）会被自动忽略。

4. 题目：pandas的read_csv()函数只能读取以逗号分隔的 CSV 文件。 ( )

解析：错误。read_csv()是读取 CSV 文件的常用函数，但其sep参数可以指定任意分隔符（如制表符\\t、分号;等），因此也能读取 TSV 或其他分隔符文件。

5. 题目：df.dropna()方法会删除DataFrame中包含任何缺失值（NaN）的所有行。 ( )

解析：错误。df.dropna()默认删除包含任何缺失值的行，但可以通过how（如‘all’仅删除全为 NaN 的行）、axis（删除列）和subset（指定列）参数进行更精细的控制。

6. 题目：NumPy数组np.array([1, 2, 3])和 Python 列表[1, 2, 3]在数学运算上完全等价。 ( )

解析：错误。NumPy数组支持向量化操作（如对整个数组进行加减乘除），而 Python 列表的运算通常需要循环。例如，数组a * 2会对每个元素乘以 2，而列表b * 2是重复列表元素。

7. 题目：df.rename(columns={‘old_name‘: ‘new_name‘})可以用于重命名DataFrame的列。 ( )

解析：正确。rename()方法通过传入字典（映射旧列名到新列名）来修改列名，inplace=True参数可直接修改原DataFrame。

8. 题目：df.sort_values(by=‘column_name‘)会按指定列的值对DataFrame进行降序排序。 ( )

解析：错误。sort_values()默认按升序排序。要实现降序排序，必须显式设置参数ascending=False。

9. 题目：df.groupby(‘column‘).mean()操作会按指定列分组，并计算每组中所有数值列的平均值。 ( )

解析：正确。groupby()是pandas的核心分组方法，其后接聚合函数（如mean()、sum()）会对分组后的数值列进行相应计算。

10. 题目：df[‘column‘].value_counts()返回的是指定列中每个唯一值出现的次数，结果按值（value）排序。 ( )

解析：错误。value_counts()默认按计数值降序排列，而不是按值本身的字母或数字顺序排序。可通过sort=False参数禁用排序。

11. 题目：df.loc[]仅能通过行标签（索引名）进行数据选取，不能通过布尔条件。 ( )

解析：错误。df.loc[]支持多种索引方式：1) 单个标签或标签列表；2) 切片；3) 布尔数组（条件筛选）。例如，df.loc[df[‘age‘] > 18]是有效的。

12. 题目：df.iloc[]是基于位置的整数索引，用于通过行号和列号选取数据。 ( )

解析：正确。df.iloc[]使用基于 0 的整数位置进行索引，如df.iloc[0, 1]选取第一行第二列的数据。

13. 题目：df.isnull()返回一个与原DataFrame形状相同的布尔型DataFrame，其中缺失值位置为True。 ( )

解析：正确。isnull()（或isna()）是检测缺失值的标准方法，返回布尔掩码，常用于结合sum()统计缺失值数量。

14. 题目：df.fillna(0)会将DataFrame中所有的缺失值（NaN）替换为字符串 ‘0‘。 ( )

解析：错误。fillna(0)会将缺失值替换为数值 0。替换值可以是标量、字典（按列填充）或前向/后向填充方法（如method=‘ffill‘）。

15. 题目：df.query(‘salary > 50000‘)是一种使用字符串表达式筛选DataFrame行的便捷方法。 ( )

解析：正确。query()方法允许使用字符串形式的表达式进行查询，语法简洁，尤其适用于复杂条件筛选。

16. 题目：df.merge(df2, on=‘key‘)执行的是类似 SQL INNER JOIN 的操作，只保留两个DataFrame中键匹配的行。 ( )

解析：正确。merge()是pandas实现表连接的核心函数，on参数指定连接键。默认how=‘inner‘，即内连接。其他连接类型包括‘left‘、‘right‘、‘outer‘。

17. 题目：df.pivot_table(values=‘sales‘, index=‘region‘, columns=‘month‘, aggfunc=‘sum‘)可以创建一个以地区为行、月份为列、销售额总和为值的透视表。 ( )

解析：正确。pivot_table()是创建数据透视表的强大工具，values指定要聚合的列，index和columns定义行和列的分组，aggfunc指定聚合函数。

18. 题目：df[‘date‘] = pd.to_datetime(df[‘date‘])可以将字符串格式的日期列转换为pandas的datetime类型。 ( )

解析：正确。pd.to_datetime()是将字符串或混合格式解析为标准化datetime对象的常用函数，转换后便于进行时间序列分析。

19. 题目：df.corr()计算的是DataFrame中所有数值列之间的协方差矩阵。 ( )

解析：错误。df.corr()计算的是相关系数矩阵（默认是皮尔逊相关系数），衡量的是线性相关程度，而非协方差。

20. 题目：df.describe()默认只显示数值列的统计摘要（如计数、均值、标准差等）。 ( )

解析：正确。describe()默认生成数值列的描述性统计。通过include和exclude参数可以控制包含或排除的数据类型。

21. 题目：df.duplicated()返回一个布尔序列，标记出DataFrame中所有重复的行（包括第一次出现的行）。 ( )

解析：错误。duplicated()默认标记出第二次及之后出现的重复行（即keep=‘first‘），第一次出现的行标记为False。keep参数可改为‘last‘或False（标记所有重复行）。

22. 题目：df.drop_duplicates()会删除DataFrame中所有重复的行，只保留第一次出现的行。 ( )

解析：正确。这是drop_duplicates()的默认行为（keep=‘first‘）。同样可以通过subset参数指定依据哪些列判断重复。

23. 题目：df[‘col‘].astype(‘int‘)可以将列的数据类型安全地转换为整数，即使存在缺失值或非数字字符。 ( )

解析：错误。astype()进行强制类型转换，如果列中包含无法转换的值（如字符串 ‘abc‘ 或 NaN），会引发错误。更安全的方式是使用pd.to_numeric(errors=‘coerce‘)。

24. 题目：df.apply(lambda x: x*2)会对DataFrame的每一列应用一个函数，使每个元素值翻倍。 ( )

解析：正确。apply()是一个灵活的通用函数，默认对每一列（axis=0）应用函数。传入的lambda函数会作用于每一列（Series）。

25. 题目：df.set_index(‘column_name‘)会将指定列设置为DataFrame的新索引，并默认从原数据中删除该列。 ( )

解析：正确。set_index()将指定列提升为索引，默认drop=True会将该列从数据列中移除。若设置drop=False，则该列既作为索引也保留为数据列。

26. 题目：df.reset_index()会将当前索引重置为默认的整数索引（0,1, 2…），并将原来的索引丢弃。 ( )

解析：错误。reset_index()默认将原来的索引转换为一列普通数据列（列名默认为 ‘index‘），并新建一个整数索引。可通过drop=True参数丢弃原索引。

27. 题目：df[‘A‘] + df[‘B‘]会对两列进行元素级别的加法运算，如果存在缺失值（NaN），结果对应位置也是 NaN。 ( )

解析：正确。pandas的算术运算是元素级别的，遵循 NumPy 的广播规则。与 NaN 的任何算术运算结果都是 NaN 。

28. 题目：df.to_csv(‘output.csv‘, index=False)在保存DataFrame到 CSV 文件时，会省略行索引。 ( )

解析：正确。index=False是常用参数，避免将DataFrame的索引作为额外的一列写入文件。

29. 题目：pd.concat([df1, df2])默认按行（axis=0）方向拼接两个DataFrame，即纵向堆叠。 ( )

解析：正确。concat()是主要的拼接函数，默认axis=0进行行拼接（增加行数）。axis=1进行列拼接（增加列数）。

30. 题目：df[‘col‘].str.contains(‘pattern‘)可以检查某列（字符串类型）的每个元素是否包含指定的子字符串或正则表达式模式。 ( )

解析：正确。通过str访问器可以方便地对字符串列进行向量化字符串操作，如contains()、upper()、split()等。

31. 题目：df.plot()会自动使用matplotlib生成所有数值列的折线图。 ( )

解析：正确。DataFrame的plot()方法是对matplotlib的封装，默认生成折线图，x 轴为索引，y 轴为各数值列。

32. 题目：df.cumsum()会计算DataFrame中每一列的累积和。 ( )

解析：正确。cumsum()是累积统计方法之一，返回一个与原DataFrame形状相同的结果，其中每个元素是到该位置为止的累积和。

33. 题目：df.pct_change()计算的是当前元素与前一个元素之间的百分比变化，对于第一行，结果总是0。 ( )

解析：错误。pct_change()计算百分比变化，对于第一行，由于没有前一个元素，结果默认为NaN。可通过fill_method参数处理。

34. 题目：df.rolling(window=3).mean()会计算一个大小为 3 的移动窗口，并输出每个窗口的均值，结果序列的长度与原DataFrame相同。 ( )

解析：正确。rolling()用于滚动窗口计算。默认情况下，窗口计算从第一个有效窗口开始（窗口大小满足时），之前的位置结果为NaN，因此输出序列长度相同但开头有 NaN 。

35. 题目：df.at[行标签, 列标签]和df.iat[行位置, 列位置]都是用于快速访问单个标量值的方法。 ( )

解析：正确。at和iat是用于快速访问/设置单个值的访问器，at基于标签，iat基于整数位置，速度比loc/iloc更快。

36. 题目：df.where(df > 0, 0)会将DataFrame中所有大于 0 的值保留，其余值替换为 0。 ( )

解析：错误。where()的语义是：满足条件的位置保留原值，不满足的位置替换为指定值。因此，df.where(df > 0, 0)会将df中不大于 0（即小于等于 0）的值替换为 0，大于 0 的值保持不变。

37. 题目：df.melt()是df.pivot()的逆操作，可以将宽格式数据转换为长格式数据。 ( )

解析：正确。melt()是“熔化”或“逆透视”操作，将多列“收窄”为两列（变量和值），常用于将宽表转换为适合分析的长表格式。

38. 题目：df[‘col‘].nunique()返回指定列中唯一值的数量，默认不包含 NaN 值。 ( )

解析：正确。nunique()统计唯一值个数，默认dropna=True，即排除 NaN。若设置dropna=False，则 NaN 也会被计为一个唯一值。

39. 题目：df.sample(frac=0.5)会从DataFrame中随机抽取 50% 的行。 ( )

解析：正确。sample()用于随机抽样，frac参数指定抽取的比例（0到 1 之间），n参数指定抽取的绝对数量。

40. 题目：df.eval(‘C = A + B‘)会在DataFrame中原地创建一个新列 ‘C‘，其值为列 ‘A‘ 和 ‘B‘ 之和。 ( )

解析：正确。eval()支持使用字符串表达式进行列间运算，语法简洁，对于复杂表达式有时比普通算术运算更高效。默认返回结果，inplace=True可原地修改。

41. 题目：df.clip(lower=0, upper=100)会将DataFrame中所有小于 0 的值设置为 0，所有大于 100 的值设置为 100。 ( )

解析：正确。clip()方法用于将值限制在指定的上下界之间，是处理异常值或进行数据缩放的常用方法。

42. 题目：df.dtypes返回一个 Series，显示DataFrame中每一列的数据类型。 ( )

解析：正确。dtypes属性对于了解数据结构和进行类型转换前的检查非常有用。

43. 题目：df.select_dtypes(include=[‘int64‘, ‘float64‘])会筛选出DataFrame中数据类型为int64或float64的列。 ( )

解析：正确。select_dtypes()是基于数据类型筛选列的便捷方法，include和exclude参数接受数据类型列表。

44. 题目：df.memory_usage(deep=True)会返回DataFrame中每一列占用的近似内存字节数，deep=True会进行更精确（但更慢）的计算。 ( )

解析：正确。memory_usage()对于优化大数据集的内存使用很有帮助，deep=True会计算对象类型（如字符串）列的实际内存使用。

45. 题目：df.isin([value1, value2])返回一个布尔型DataFrame，指示每个元素是否在给定的列表中。 ( )

解析：正确。isin()用于检查元素是否属于一个集合，常用于筛选。可以传入列表、元组、Series 或DataFrame。

46. 题目：df.agg({‘col1‘: ‘sum‘, ‘col2‘: [‘mean‘, ‘std‘]})可以对不同列应用不同的聚合函数。 ( )

解析：正确。agg()（或aggregate()）是强大的聚合函数，可以接受字典，为不同列指定一个或多个聚合函数。

47. 题目：df.explode(‘list_column‘)会将包含列表（或可迭代对象）的某列“炸开”，列表中的每个元素成为独立的一行，并复制其他列的值。 ( )

解析：正确。explode()是处理嵌套列表数据的利器，将列表元素转换为多行，是melt的一种特殊形式。

48. 题目：df.to_numpy()会将DataFrame转换为NumPy数组，如果列的数据类型不一致，结果数组的数据类型将是object。 ( )

解析：正确。to_numpy()（或.values）是转换为数组的方法。pandas会尝试找到所有列的公共数据类型，如果无法统一（如混合了数字和字符串），则降级为object类型数组。

49. 题目：df.assign(new_col = df[‘A‘] * 2)会返回一个添加了新列 ‘new_col‘ 的新DataFrame，原DataFrame不会被修改。 ( )

解析：正确。assign()方法返回一个新DataFrame，并添加新列，原DataFrame保持不变。支持链式调用。

50. 题目：df.filter(items=[‘col1‘, ‘col2‘])会根据列名筛选出指定的列。 ( )

解析：正确。filter()方法可以根据列名（items）、正则表达式（regex）或列名包含的字符串（like）来筛选列，非常灵活。

51. 题目：pd.cut(df[‘age‘], bins=[0, 18, 65, 100])可以将连续的年龄数据离散化为分类区间，如 ‘(0, 18]‘, ‘(18, 65]‘, ‘(65, 100]‘。 ( )

解析：正确。cut()用于将连续变量分箱（离散化），bins参数指定分箱边界。pd.qcut()则基于分位数进行分箱。

52. 题目：df.stack()会将DataFrame的列“旋转”为行，产生一个具有多级索引的 Series。 ( )

解析：正确。stack()将列索引的某一级别“堆叠”到行索引，使数据变“高”变“窄”。unstack()是其逆操作。

53. 题目：df.bfill()会使用缺失值后面的第一个有效值来向前填充缺失值。 ( )

解析：错误。bfill()（或backfill）是后向填充，使用缺失值之后的第一个有效值进行填充。ffill()（或pad）才是前向填充。

54. 题目：df.interpolate()会使用线性插值法来填充缺失值。 ( )

解析：正确。interpolate()默认使用线性插值，但支持多种插值方法（如method=‘polynomial‘）。它根据已知数据点估计缺失值。

55. 题目：df[‘col‘].map({‘old_val‘: ‘new_val‘})可以根据提供的字典映射，将列中的值替换为新值。 ( )

解析：正确。map()方法接受一个函数或字典映射，对 Series 的每个元素进行转换。对于字典中未包含的值，默认转换为NaN。

56. 题目：df.replace({‘old_val‘: ‘new_val‘})会将DataFrame中所有等于 ‘old_val‘ 的值替换为 ‘new_val‘。 ( )

解析：正确。replace()功能强大，可以替换标量、列表、字典或正则表达式匹配的值。支持按列指定不同的替换规则。

57. 题目：df.nlargest(5, ‘column‘)会返回DataFrame中指定列值最大的 5 行。 ( )

解析：正确。nlargest()和nsmallest()是高效获取最大或最小 N 个值对应行的方法，比先排序再取头部更优化。

58. 题目：df.pipe(lambda x: x * 2)会将整个DataFrame的每个元素乘以 2。 ( )

解析：正确。pipe()允许将DataFrame（或 Series）传递给一个函数，支持链式调用，常用于封装复杂的操作序列。

59. 题目：df.to_excel(‘output.xlsx‘, sheet_name=‘Sheet1‘)可以将DataFrame写入 Excel 文件的一个指定工作表。 ( )

解析：正确。to_excel()用于写入 Excel 文件，需要openpyxl或xlsxwriter引擎支持。可以指定工作表名、是否包含索引等。

60. 题目：df.style可以用于对DataFrame应用条件格式和样式，便于在 Jupyter Notebook 中生成更美观的显示。 ( )

解析：正确。DataFrame.style属性返回一个Styler对象，支持应用渐变色、数据条、高亮等样式，增强可视化效果。

61. 题目：df.info()会打印DataFrame的简明摘要，包括索引数据类型、列数据类型、非空值数量和内存使用情况。 ( )

解析：正确。info()是数据探索的常用第一步，快速了解数据形状、类型和缺失情况。

62. 题目：df.head()默认显示DataFrame的前 10 行。 ( )

解析：错误。df.head()默认显示前5行。可以通过传入参数n来指定显示的行数，如df.head(10)。

63. 题目：df.tail()和df.head()分别用于查看DataFrame的末尾和开头部分，默认都是5 行。 ( )

解析：正确。tail()和head()是对称的方法，默认都显示 5 行，用于快速浏览数据。

64. 题目：df.shape返回一个元组，表示DataFrame的维度（行数，列数）。 ( )

解析：正确。shape是一个属性，不是方法，返回 (行数，列数) 。

65. 题目：df.columns返回一个Index对象，包含DataFrame的所有列名，可以像列表一样进行修改。 ( )

解析：正确。df.columns可以直接赋值修改，例如df.columns = [‘A‘, ‘B‘, ‘C‘]。

66. 题目：df.index返回DataFrame的索引，可以是整数、字符串或日期时间等类型。 ( )

解析：正确。索引是pandas数据对齐和高效查找的关键，可以是任意可哈希类型。

67. 题目：df.empty属性用于判断DataFrame是否为空（即没有任何数据行）。 ( )

解析：正确。df.empty返回布尔值，True表示DataFrame没有行（即使有列定义）。

68. 题目：df.T（或df.transpose()）可以对DataFrame进行转置，将行和列互换。 ( )

解析：正确。转置是基本的矩阵操作，T是transpose的快捷属性。

69. 题目：df.add(df2, fill_value=0)会在执行加法前，将两个DataFrame中对应位置的缺失值用 0 填充。 ( )

解析：正确。add、sub、mul、div等算术方法支持fill_value参数，可以在运算前用指定值填充缺失值，避免结果为 NaN 。

70. 题目：df.compare(df2)会高亮显示两个DataFrame之间的差异。 ( )

解析：正确。compare()（pandas1.1.0+）用于比较两个DataFrame并显示差异，返回一个带有差异详情的新DataFrame。

71. 题目：df.cov()计算的是DataFrame中数值列之间的协方差矩阵。 ( )

解析：正确。cov()计算协方差矩阵，衡量两个变量如何一起变化。对角线是各列的方差。

72. 题目：df.skew()和df.kurt()分别用于计算DataFrame中数值列的偏度和峰度。 ( )

解析：正确。偏度衡量数据分布的不对称性，峰度衡量数据分布的陡峭程度。它们是描述数据分布形态的重要统计量。

73. 题目：df.quantile(0.25)返回DataFrame中每一列的第 25 个百分位数（第一四分位数）。 ( )

解析：正确。quantile()用于计算分位数，参数q可以是标量或列表（如[0.25, 0.5, 0.75]）。

74. 题目：df.mode()返回DataFrame中每一列的众数（出现频率最高的值）。 ( )

解析：正确。mode()返回众数，可能有多行（多峰分布）。对于数值列和分类列都适用。

75. 题目：df.idxmax()返回DataFrame中每一列最大值所在的索引标签。 ( )

解析：正确。idxmax()和idxmin()分别返回最大值和最小值首次出现的索引位置。

76. 题目：df.all()返回一个 Series，指示每一列是否所有元素都为 True（或非零、非空）。 ( )

解析：正确。all()和any()是布尔归约方法。all()要求所有元素为真，any()要求至少一个元素为真。

77. 题目：df.isin()方法不能用于检查元素是否在另一个DataFrame中。 ( )

解析：错误。isin()可以接受另一个DataFrame作为参数，进行元素级别的成员检查，返回相同形状的布尔DataFrame。

78. 题目：df.ne(df2)会对两个DataFrame进行元素级别的“不等于”比较。 ( )

解析：正确。ne（not equal）是!=运算符的等效方法。类似的比较方法还有eq（==）、gt（>）、lt（<）等。

79. 题目：df.combine_first(df2)会用df2中的非缺失值来填充df中的对应缺失值。 ( )

解析：正确。combine_first()是合并两个DataFrame的便捷方法，用第二个DataFrame的值填充第一个中的缺失值。

80. 题目：df.update(df2)会用df2中的值覆盖df中对应位置的值，即使df2中的值是 NaN。 ( )

解析：正确。update()会就地修改调用者，用另一个DataFrame的非空值进行覆盖。默认情况下，NaN 值不会覆盖原值，除非设置overwrite=True。

81. 题目：df.align(df2, join=‘outer‘)会返回两个对齐后的DataFrame，它们的索引和列是并集。 ( )

解析：正确。align()是底层对齐操作，返回两个新的DataFrame，其索引和列根据指定的连接方式（‘inner‘, ‘outer‘, ‘left‘, ‘right‘）对齐。

82. 题目：df.to_dict(orient=‘records‘)会将DataFrame转换为一个字典列表，其中每个字典代表一行。 ( )

解析：正确。to_dict()支持多种方向（orient），如 ‘dict‘（列字典）、‘list‘（值列表）、‘records‘（行字典列表）、‘index‘（行字典）等。

83. 题目：df.to_string()返回DataFrame的字符串表示，适合写入文本文件。 ( )

解析：正确。to_string()提供了丰富的格式化选项，用于控制显示方式，并可以输出为纯文本字符串。

84. 题目：df.to_latex()可以将DataFrame转换为 LaTeX 表格格式的字符串。 ( )

解析：正确。to_latex()对于需要在学术论文或报告中插入表格非常有用。

85. 题目：df.hist()会为DataFrame中的每个数值列生成一个直方图。 ( )

解析：正确。hist()是快速绘制数值列分布直方图的方法，基于matplotlib。

86. 题目：df.boxplot()会为DataFrame中的每个数值列生成一个箱线图。 ( )

解析：正确。箱线图用于可视化数据分布、中位数、四分位数和异常值。

87. 题目：df.plot.scatter(x=‘col1‘, y=‘col2‘)可以生成 ‘col1‘ 和 ‘col2‘ 两列的散点图。 ( )

解析：正确。通过plot访问器的绘图类型方法（如scatter、bar、pie）可以方便地绘制特定类型的图表。

88. 题目：df.rolling(window=‘7D‘).mean()可以用于时间序列数据，计算7 天窗口的滚动平均值。 ( )

解析：正确。当索引是DatetimeIndex时，window参数可以接受偏移量字符串（如 ‘7D‘、‘2H‘、‘30T‘），进行基于时间的滚动窗口计算。

89. 题目：df.expanding().sum()会计算从起始点到当前点的累积和（扩展窗口）。 ( )

解析：正确。expanding()表示一个从时间序列开始不断扩大的窗口，用于计算累积统计量（如累积和、累积最小值等）。

90. 题目：df.ewm(span=3).mean()会计算一个跨度（span）为 3 的指数加权移动平均。 ( )

解析：正确。ewm()用于指数加权移动平均，给近期数据更高的权重。span参数与衰减因子相关。

91. 题目：df.diff()计算的是DataFrame中相邻行之间的差值，第一行的结果为 NaN。 ( )

解析：正确。diff()计算一阶差分，即当前行减去前一行。periods参数可以指定差分的步长。

92. 题目：df.shift(1)会将DataFrame中的数据向下移动一行，第一行变为 NaN。 ( )

解析：正确。shift()用于移动数据，正数向下/右移，负数向上/左移。常用于计算时间序列的滞后或超前值。

93. 题目：df.rank()会为DataFrame中的每一列计算排名，默认方法为平均排名（‘average‘）。 ( )

解析：正确。rank()返回每列中每个值的排名。method参数控制相同值的处理方式（如 ‘min‘, ‘max‘, ‘first‘, ‘dense‘）。

94. 题目：df.corrwith(df2)计算的是调用者df与另一个DataFramedf2对应列之间的相关系数。 ( )

解析：正确。corrwith()用于计算两个DataFrame对象列与列之间的成对相关性。

95. 题目：df.to_xarray()可以将DataFrame转换为xarray的Dataset对象，便于处理多维标记数据。 ( )

解析：正确。xarray是处理多维数组的强大库，pandas与其有良好的互操作性。

96. 题目：df.to_sql(‘table_name‘, con=engine)可以将DataFrame写入 SQL 数据库。 ( )

解析：正确。to_sql()需要 SQLAlchemy 连接引擎或 DBAPI 2.0 连接对象，支持将数据写入各种关系型数据库。

97. 题目：pd.read_sql(‘SELECT * FROM table‘, con=engine)可以从 SQL 数据库读取数据并创建DataFrame。 ( )

解析：正确。read_sql()是读取 SQL 查询结果或表到pandas的标准方法。

98. 题目：df.to_hdf(‘data.h5‘, key=‘df‘)可以将DataFrame以 HDF5 格式存储到磁盘，支持高效读写大型数据集。 ( )

解析：正确。HDF5 是一种用于存储和管理大型科学数据集的格式，pandas通过HDFStore支持该格式。

99. 题目：df.to_parquet(‘data.parquet‘)可以将DataFrame保存为 Parquet 列式存储格式，这种格式通常比 CSV 更节省空间且读取更快。 ( )

解析：正确。Parquet 是一种高效的列式存储格式，特别适合大数据分析和与 Hadoop/Spark 生态系统集成。

100. 题目：df.memory_usage()返回的结果单位是比特（bit）。 ( )

解析：错误。memory_usage()默认返回的内存使用量单位是字节（byte），而不是比特（bit）。1 字节等于 8 比特。

参考来源

python数据分析期末考试题及答案-20250619073136.docx-原创力文档
python数据分析期末考试题及答案-CSDN博客
100道Python经典练习题助你夯实基础，附详细解答与学习建议
python 数据分析考试题 python数据分析期末测验_mob64ca13ff5b03的技术博客_51CTO博客
python数据分析期末考试题及答案.doc-原创力文档

查看全文

http://www.jsqmd.com/news/1104256/

Kiran-shell 性能优化：面板响应速度与内存管理的10个技巧

如何解决区域创新资源分布不清的问题？

65美元Brick设备助摆脱手机成瘾，首周屏幕使用时间降7%！

程序员你觉得是业务重要还是技术重要？

3步开启智能办公：UI-TARS桌面AI助手实战指南

新版《健康与位置数据保护法案》将推出：禁止向数据经纪商出售含 AI 聊天机器人的敏感信息

5分钟搞定：PC版微信QQ防撤回终极方案，让重要消息永不消失

【MATLAB】STM32低功耗控制策略建模与仿真实现

增量式角度编码器：高精度角位移实时采集核心器件

【MATLAB】无人机集群队形缩放控制算法

大模型性能提升40%的真相：五维协同优化与工程落地指南

PS PDF 批量导入导出工具 Pro｜PDF 一键转 PSD/JPG/PNG 脚本

使用一个json文件来描述我们的战场

终极指南：用Mac Mouse Fix让普通鼠标在macOS上超越触控板体验

新手向 OpenClaw 部署实操，图形化工具完成本地智能体环境搭建（包含安装包）

【AI大模型】代码入门：批量调用API的极简Python脚本

近百万本护照在公共互联网暴露数月，数据安全缺陷引担忧！

2026年房地产动画服务行业选购指南

Pikachu靶场从入门到精通（六）：不安全文件下载、目录遍历、敏感信息泄露与URL重定向漏洞实战

2026年AI生成文献综述哪家强？PaperRed与笔捷AI、ChatGPT实测对比

VDExplainer：让漏洞检测模型“说清楚”，逐语句解释漏洞从何而来

如何精准识别校地之间的创新合作潜力？

Python数据分析期末试题及详解

偏振光学在显示技术中的应用综述：原理、进展与挑战——从 iPhone 屏幕演进到悟赫德护景贴观复盾的光学补偿方案

手机屏幕保护膜的光学性能测试方法与标准研究——以悟赫德护景贴观复盾的测试体系为例

想选升降龙门架制造厂家？这些挑选要点你不能错过！

一人公司必备AI工具：5分钟将详情页变废为宝，产出高转化社媒图文

史无前例合作！用Claude享50%折扣，州政府雇员借其辅助日常工作

终极指南：如何让群晖Video Station影视信息更丰富完整

C++ STL 简介：从标准模板库到开发利器

参考来源

相关文章：