当前位置: 首页 > news >正文

Python数据分析课程期末考试判断题联系题100题

1. 题目pandas是 Python 中唯一用于数据分析的库。 ( )

解析:错误。Python 数据分析生态系统包含多个核心库,pandas主要用于数据处理和分析,但NumPy提供数组计算,MatplotlibSeaborn用于数据可视化,SciPy用于科学计算,scikit-learn用于机器学习,它们共同构成数据分析工具链 。

2. 题目DataFramepandas库中的一种二维表格型数据结构。 ( )

解析:正确。DataFramepandas的核心数据结构,类似于电子表格或 SQL 表,由行和列组成,每列可以是不同的数据类型 。

3. 题目df.mean()方法可以计算DataFrame中所有数值列的平均值。 ( )

解析:正确。df.mean()默认对数值列(intfloat类型)进行聚合,返回每列的平均值,非数值列(如字符串)会被自动忽略 。

4. 题目pandasread_csv()函数只能读取以逗号分隔的 CSV 文件。 ( )

解析:错误。read_csv()是读取 CSV 文件的常用函数,但其sep参数可以指定任意分隔符(如制表符\\t、分号;等),因此也能读取 TSV 或其他分隔符文件 。

5. 题目df.dropna()方法会删除DataFrame中包含任何缺失值(NaN)的所有行。 ( )

解析:错误。df.dropna()默认删除包含任何缺失值的行,但可以通过how(如‘all’仅删除全为 NaN 的行)、axis(删除列)和subset(指定列)参数进行更精细的控制 。

6. 题目NumPy数组np.array([1, 2, 3])和 Python 列表[1, 2, 3]在数学运算上完全等价。 ( )

解析:错误。NumPy数组支持向量化操作(如对整个数组进行加减乘除),而 Python 列表的运算通常需要循环。例如,数组a * 2会对每个元素乘以 2,而列表b * 2是重复列表元素 。

7. 题目df.rename(columns={‘old_name‘: ‘new_name‘})可以用于重命名DataFrame的列。 ( )

解析:正确。rename()方法通过传入字典(映射旧列名到新列名)来修改列名,inplace=True参数可直接修改原DataFrame

8. 题目df.sort_values(by=‘column_name‘)会按指定列的值对DataFrame进行降序排序。 ( )

解析:错误。sort_values()默认按升序排序。要实现降序排序,必须显式设置参数ascending=False

9. 题目df.groupby(‘column‘).mean()操作会按指定列分组,并计算每组中所有数值列的平均值。 ( )

解析:正确。groupby()pandas的核心分组方法,其后接聚合函数(如mean()sum())会对分组后的数值列进行相应计算 。

10. 题目df[‘column‘].value_counts()返回的是指定列中每个唯一值出现的次数,结果按值(value)排序。 ( )

解析:错误。value_counts()默认按计数值降序排列,而不是按值本身的字母或数字顺序排序。可通过sort=False参数禁用排序 。

11. 题目df.loc[]仅能通过行标签(索引名)进行数据选取,不能通过布尔条件。 ( )

解析:错误。df.loc[]支持多种索引方式:1) 单个标签或标签列表;2) 切片;3) 布尔数组(条件筛选)。例如,df.loc[df[‘age‘] > 18]是有效的 。

12. 题目df.iloc[]是基于位置的整数索引,用于通过行号和列号选取数据。 ( )

解析:正确。df.iloc[]使用基于 0 的整数位置进行索引,如df.iloc[0, 1]选取第一行第二列的数据 。

13. 题目df.isnull()返回一个与原DataFrame形状相同的布尔型DataFrame,其中缺失值位置为True。 ( )

解析:正确。isnull()(或isna())是检测缺失值的标准方法,返回布尔掩码,常用于结合sum()统计缺失值数量 。

14. 题目df.fillna(0)会将DataFrame中所有的缺失值(NaN)替换为字符串 ‘0‘。 ( )

解析:错误。fillna(0)会将缺失值替换为数值 0。替换值可以是标量、字典(按列填充)或前向/后向填充方法(如method=‘ffill‘) 。

15. 题目df.query(‘salary > 50000‘)是一种使用字符串表达式筛选DataFrame行的便捷方法。 ( )

解析:正确。query()方法允许使用字符串形式的表达式进行查询,语法简洁,尤其适用于复杂条件筛选 。

16. 题目df.merge(df2, on=‘key‘)执行的是类似 SQL INNER JOIN 的操作,只保留两个DataFrame中键匹配的行。 ( )

解析:正确。merge()pandas实现表连接的核心函数,on参数指定连接键。默认how=‘inner‘,即内连接。其他连接类型包括‘left‘‘right‘‘outer‘

17. 题目df.pivot_table(values=‘sales‘, index=‘region‘, columns=‘month‘, aggfunc=‘sum‘)可以创建一个以地区为行、月份为列、销售额总和为值的透视表。 ( )

解析:正确。pivot_table()是创建数据透视表的强大工具,values指定要聚合的列,indexcolumns定义行和列的分组,aggfunc指定聚合函数 。

18. 题目df[‘date‘] = pd.to_datetime(df[‘date‘])可以将字符串格式的日期列转换为pandasdatetime类型。 ( )

解析:正确。pd.to_datetime()是将字符串或混合格式解析为标准化datetime对象的常用函数,转换后便于进行时间序列分析 。

19. 题目df.corr()计算的是DataFrame中所有数值列之间的协方差矩阵。 ( )

解析:错误。df.corr()计算的是相关系数矩阵(默认是皮尔逊相关系数),衡量的是线性相关程度,而非协方差 。

20. 题目df.describe()默认只显示数值列的统计摘要(如计数、均值、标准差等)。 ( )

解析:正确。describe()默认生成数值列的描述性统计。通过includeexclude参数可以控制包含或排除的数据类型 。

21. 题目df.duplicated()返回一个布尔序列,标记出DataFrame中所有重复的行(包括第一次出现的行)。 ( )

解析:错误。duplicated()默认标记出第二次及之后出现的重复行(即keep=‘first‘),第一次出现的行标记为Falsekeep参数可改为‘last‘False(标记所有重复行) 。

22. 题目df.drop_duplicates()会删除DataFrame中所有重复的行,只保留第一次出现的行。 ( )

解析:正确。这是drop_duplicates()的默认行为(keep=‘first‘)。同样可以通过subset参数指定依据哪些列判断重复 。

23. 题目df[‘col‘].astype(‘int‘)可以将列的数据类型安全地转换为整数,即使存在缺失值或非数字字符。 ( )

解析:错误。astype()进行强制类型转换,如果列中包含无法转换的值(如字符串 ‘abc‘ 或 NaN),会引发错误。更安全的方式是使用pd.to_numeric(errors=‘coerce‘)

24. 题目df.apply(lambda x: x*2)会对DataFrame的每一列应用一个函数,使每个元素值翻倍。 ( )

解析:正确。apply()是一个灵活的通用函数,默认对每一列(axis=0)应用函数。传入的lambda函数会作用于每一列(Series) 。

25. 题目df.set_index(‘column_name‘)会将指定列设置为DataFrame的新索引,并默认从原数据中删除该列。 ( )

解析:正确。set_index()将指定列提升为索引,默认drop=True会将该列从数据列中移除。若设置drop=False,则该列既作为索引也保留为数据列 。

26. 题目df.reset_index()会将当前索引重置为默认的整数索引(0,1, 2…),并将原来的索引丢弃。 ( )

解析:错误。reset_index()默认将原来的索引转换为一列普通数据列(列名默认为 ‘index‘),并新建一个整数索引。可通过drop=True参数丢弃原索引 。

27. 题目df[‘A‘] + df[‘B‘]会对两列进行元素级别的加法运算,如果存在缺失值(NaN),结果对应位置也是 NaN。 ( )

解析:正确。pandas的算术运算是元素级别的,遵循 NumPy 的广播规则。与 NaN 的任何算术运算结果都是 NaN 。

28. 题目df.to_csv(‘output.csv‘, index=False)在保存DataFrame到 CSV 文件时,会省略行索引。 ( )

解析:正确。index=False是常用参数,避免将DataFrame的索引作为额外的一列写入文件 。

29. 题目pd.concat([df1, df2])默认按行(axis=0)方向拼接两个DataFrame,即纵向堆叠。 ( )

解析:正确。concat()是主要的拼接函数,默认axis=0进行行拼接(增加行数)。axis=1进行列拼接(增加列数) 。

30. 题目df[‘col‘].str.contains(‘pattern‘)可以检查某列(字符串类型)的每个元素是否包含指定的子字符串或正则表达式模式。 ( )

解析:正确。通过str访问器可以方便地对字符串列进行向量化字符串操作,如contains()upper()split()等 。

31. 题目df.plot()会自动使用matplotlib生成所有数值列的折线图。 ( )

解析:正确。DataFrameplot()方法是对matplotlib的封装,默认生成折线图,x 轴为索引,y 轴为各数值列 。

32. 题目df.cumsum()会计算DataFrame中每一列的累积和。 ( )

解析:正确。cumsum()是累积统计方法之一,返回一个与原DataFrame形状相同的结果,其中每个元素是到该位置为止的累积和 。

33. 题目df.pct_change()计算的是当前元素与前一个元素之间的百分比变化,对于第一行,结果总是0。 ( )

解析:错误。pct_change()计算百分比变化,对于第一行,由于没有前一个元素,结果默认为NaN。可通过fill_method参数处理 。

34. 题目df.rolling(window=3).mean()会计算一个大小为 3 的移动窗口,并输出每个窗口的均值,结果序列的长度与原DataFrame相同。 ( )

解析:正确。rolling()用于滚动窗口计算。默认情况下,窗口计算从第一个有效窗口开始(窗口大小满足时),之前的位置结果为NaN,因此输出序列长度相同但开头有 NaN 。

35. 题目df.at[行标签, 列标签]df.iat[行位置, 列位置]都是用于快速访问单个标量值的方法。 ( )

解析:正确。atiat是用于快速访问/设置单个值的访问器,at基于标签,iat基于整数位置,速度比loc/iloc更快 。

36. 题目df.where(df > 0, 0)会将DataFrame中所有大于 0 的值保留,其余值替换为 0。 ( )

解析:错误。where()的语义是:满足条件的位置保留原值,不满足的位置替换为指定值。因此,df.where(df > 0, 0)会将df不大于 0(即小于等于 0)的值替换为 0,大于 0 的值保持不变 。

37. 题目df.melt()df.pivot()的逆操作,可以将宽格式数据转换为长格式数据。 ( )

解析:正确。melt()是“熔化”或“逆透视”操作,将多列“收窄”为两列(变量和值),常用于将宽表转换为适合分析的长表格式 。

38. 题目df[‘col‘].nunique()返回指定列中唯一值的数量,默认不包含 NaN 值。 ( )

解析:正确。nunique()统计唯一值个数,默认dropna=True,即排除 NaN。若设置dropna=False,则 NaN 也会被计为一个唯一值 。

39. 题目df.sample(frac=0.5)会从DataFrame中随机抽取 50% 的行。 ( )

解析:正确。sample()用于随机抽样,frac参数指定抽取的比例(0到 1 之间),n参数指定抽取的绝对数量 。

40. 题目df.eval(‘C = A + B‘)会在DataFrame中原地创建一个新列 ‘C‘,其值为列 ‘A‘ 和 ‘B‘ 之和。 ( )

解析:正确。eval()支持使用字符串表达式进行列间运算,语法简洁,对于复杂表达式有时比普通算术运算更高效。默认返回结果,inplace=True可原地修改 。

41. 题目df.clip(lower=0, upper=100)会将DataFrame中所有小于 0 的值设置为 0,所有大于 100 的值设置为 100。 ( )

解析:正确。clip()方法用于将值限制在指定的上下界之间,是处理异常值或进行数据缩放的常用方法 。

42. 题目df.dtypes返回一个 Series,显示DataFrame中每一列的数据类型。 ( )

解析:正确。dtypes属性对于了解数据结构和进行类型转换前的检查非常有用 。

43. 题目df.select_dtypes(include=[‘int64‘, ‘float64‘])会筛选出DataFrame中数据类型为int64float64的列。 ( )

解析:正确。select_dtypes()是基于数据类型筛选列的便捷方法,includeexclude参数接受数据类型列表 。

44. 题目df.memory_usage(deep=True)会返回DataFrame中每一列占用的近似内存字节数,deep=True会进行更精确(但更慢)的计算。 ( )

解析:正确。memory_usage()对于优化大数据集的内存使用很有帮助,deep=True会计算对象类型(如字符串)列的实际内存使用 。

45. 题目df.isin([value1, value2])返回一个布尔型DataFrame,指示每个元素是否在给定的列表中。 ( )

解析:正确。isin()用于检查元素是否属于一个集合,常用于筛选。可以传入列表、元组、Series 或DataFrame

46. 题目df.agg({‘col1‘: ‘sum‘, ‘col2‘: [‘mean‘, ‘std‘]})可以对不同列应用不同的聚合函数。 ( )

解析:正确。agg()(或aggregate())是强大的聚合函数,可以接受字典,为不同列指定一个或多个聚合函数 。

47. 题目df.explode(‘list_column‘)会将包含列表(或可迭代对象)的某列“炸开”,列表中的每个元素成为独立的一行,并复制其他列的值。 ( )

解析:正确。explode()是处理嵌套列表数据的利器,将列表元素转换为多行,是melt的一种特殊形式 。

48. 题目df.to_numpy()会将DataFrame转换为NumPy数组,如果列的数据类型不一致,结果数组的数据类型将是object。 ( )

解析:正确。to_numpy()(或.values)是转换为数组的方法。pandas会尝试找到所有列的公共数据类型,如果无法统一(如混合了数字和字符串),则降级为object类型数组 。

49. 题目df.assign(new_col = df[‘A‘] * 2)会返回一个添加了新列 ‘new_col‘ 的新DataFrame,原DataFrame不会被修改。 ( )

解析:正确。assign()方法返回一个新DataFrame,并添加新列,原DataFrame保持不变。支持链式调用 。

50. 题目df.filter(items=[‘col1‘, ‘col2‘])会根据列名筛选出指定的列。 ( )

解析:正确。filter()方法可以根据列名(items)、正则表达式(regex)或列名包含的字符串(like)来筛选列,非常灵活 。

51. 题目pd.cut(df[‘age‘], bins=[0, 18, 65, 100])可以将连续的年龄数据离散化为分类区间,如 ‘(0, 18]‘, ‘(18, 65]‘, ‘(65, 100]‘。 ( )

解析:正确。cut()用于将连续变量分箱(离散化),bins参数指定分箱边界。pd.qcut()则基于分位数进行分箱 。

52. 题目df.stack()会将DataFrame的列“旋转”为行,产生一个具有多级索引的 Series。 ( )

解析:正确。stack()将列索引的某一级别“堆叠”到行索引,使数据变“高”变“窄”。unstack()是其逆操作 。

53. 题目df.bfill()会使用缺失值后面的第一个有效值来向前填充缺失值。 ( )

解析:错误。bfill()(或backfill)是后向填充,使用缺失值之后的第一个有效值进行填充。ffill()(或pad)才是前向填充 。

54. 题目df.interpolate()会使用线性插值法来填充缺失值。 ( )

解析:正确。interpolate()默认使用线性插值,但支持多种插值方法(如method=‘polynomial‘)。它根据已知数据点估计缺失值 。

55. 题目df[‘col‘].map({‘old_val‘: ‘new_val‘})可以根据提供的字典映射,将列中的值替换为新值。 ( )

解析:正确。map()方法接受一个函数或字典映射,对 Series 的每个元素进行转换。对于字典中未包含的值,默认转换为NaN

56. 题目df.replace({‘old_val‘: ‘new_val‘})会将DataFrame中所有等于 ‘old_val‘ 的值替换为 ‘new_val‘。 ( )

解析:正确。replace()功能强大,可以替换标量、列表、字典或正则表达式匹配的值。支持按列指定不同的替换规则 。

57. 题目df.nlargest(5, ‘column‘)会返回DataFrame中指定列值最大的 5 行。 ( )

解析:正确。nlargest()nsmallest()是高效获取最大或最小 N 个值对应行的方法,比先排序再取头部更优化 。

58. 题目df.pipe(lambda x: x * 2)会将整个DataFrame的每个元素乘以 2。 ( )

解析:正确。pipe()允许将DataFrame(或 Series)传递给一个函数,支持链式调用,常用于封装复杂的操作序列 。

59. 题目df.to_excel(‘output.xlsx‘, sheet_name=‘Sheet1‘)可以将DataFrame写入 Excel 文件的一个指定工作表。 ( )

解析:正确。to_excel()用于写入 Excel 文件,需要openpyxlxlsxwriter引擎支持。可以指定工作表名、是否包含索引等 。

60. 题目df.style可以用于对DataFrame应用条件格式和样式,便于在 Jupyter Notebook 中生成更美观的显示。 ( )

解析:正确。DataFrame.style属性返回一个Styler对象,支持应用渐变色、数据条、高亮等样式,增强可视化效果 。

61. 题目df.info()会打印DataFrame的简明摘要,包括索引数据类型、列数据类型、非空值数量和内存使用情况。 ( )

解析:正确。info()是数据探索的常用第一步,快速了解数据形状、类型和缺失情况 。

62. 题目df.head()默认显示DataFrame的前 10 行。 ( )

解析:错误。df.head()默认显示前5行。可以通过传入参数n来指定显示的行数,如df.head(10)

63. 题目df.tail()df.head()分别用于查看DataFrame的末尾和开头部分,默认都是5 行。 ( )

解析:正确。tail()head()是对称的方法,默认都显示 5 行,用于快速浏览数据 。

64. 题目df.shape返回一个元组,表示DataFrame的维度(行数, 列数)。 ( )

解析:正确。shape是一个属性,不是方法,返回 (行数, 列数) 。

65. 题目df.columns返回一个Index对象,包含DataFrame的所有列名,可以像列表一样进行修改。 ( )

解析:正确。df.columns可以直接赋值修改,例如df.columns = [‘A‘, ‘B‘, ‘C‘]

66. 题目df.index返回DataFrame的索引,可以是整数、字符串或日期时间等类型。 ( )

解析:正确。索引是pandas数据对齐和高效查找的关键,可以是任意可哈希类型 。

67. 题目df.empty属性用于判断DataFrame是否为空(即没有任何数据行)。 ( )

解析:正确。df.empty返回布尔值,True表示DataFrame没有行(即使有列定义) 。

68. 题目df.T(或df.transpose())可以对DataFrame进行转置,将行和列互换。 ( )

解析:正确。转置是基本的矩阵操作,Ttranspose的快捷属性 。

69. 题目df.add(df2, fill_value=0)会在执行加法前,将两个DataFrame中对应位置的缺失值用 0 填充。 ( )

解析:正确。addsubmuldiv等算术方法支持fill_value参数,可以在运算前用指定值填充缺失值,避免结果为 NaN 。

70. 题目df.compare(df2)会高亮显示两个DataFrame之间的差异。 ( )

解析:正确。compare()pandas1.1.0+)用于比较两个DataFrame并显示差异,返回一个带有差异详情的新DataFrame

71. 题目df.cov()计算的是DataFrame中数值列之间的协方差矩阵。 ( )

解析:正确。cov()计算协方差矩阵,衡量两个变量如何一起变化。对角线是各列的方差 。

72. 题目df.skew()df.kurt()分别用于计算DataFrame中数值列的偏度和峰度。 ( )

解析:正确。偏度衡量数据分布的不对称性,峰度衡量数据分布的陡峭程度。它们是描述数据分布形态的重要统计量 。

73. 题目df.quantile(0.25)返回DataFrame中每一列的第 25 个百分位数(第一四分位数)。 ( )

解析:正确。quantile()用于计算分位数,参数q可以是标量或列表(如[0.25, 0.5, 0.75]) 。

74. 题目df.mode()返回DataFrame中每一列的众数(出现频率最高的值)。 ( )

解析:正确。mode()返回众数,可能有多行(多峰分布)。对于数值列和分类列都适用 。

75. 题目df.idxmax()返回DataFrame中每一列最大值所在的索引标签。 ( )

解析:正确。idxmax()idxmin()分别返回最大值和最小值首次出现的索引位置 。

76. 题目df.all()返回一个 Series,指示每一列是否所有元素都为 True(或非零、非空)。 ( )

解析:正确。all()any()是布尔归约方法。all()要求所有元素为真,any()要求至少一个元素为真 。

77. 题目df.isin()方法不能用于检查元素是否在另一个DataFrame中。 ( )

解析:错误。isin()可以接受另一个DataFrame作为参数,进行元素级别的成员检查,返回相同形状的布尔DataFrame

78. 题目df.ne(df2)会对两个DataFrame进行元素级别的“不等于”比较。 ( )

解析:正确。ne(not equal)是!=运算符的等效方法。类似的比较方法还有eq==)、gt>)、lt<)等 。

79. 题目df.combine_first(df2)会用df2中的非缺失值来填充df中的对应缺失值。 ( )

解析:正确。combine_first()是合并两个DataFrame的便捷方法,用第二个DataFrame的值填充第一个中的缺失值 。

80. 题目df.update(df2)会用df2中的值覆盖df中对应位置的值,即使df2中的值是 NaN。 ( )

解析:正确。update()会就地修改调用者,用另一个DataFrame的非空值进行覆盖。默认情况下,NaN 值不会覆盖原值,除非设置overwrite=True

81. 题目df.align(df2, join=‘outer‘)会返回两个对齐后的DataFrame,它们的索引和列是并集。 ( )

解析:正确。align()是底层对齐操作,返回两个新的DataFrame,其索引和列根据指定的连接方式(‘inner‘, ‘outer‘, ‘left‘, ‘right‘)对齐 。

82. 题目df.to_dict(orient=‘records‘)会将DataFrame转换为一个字典列表,其中每个字典代表一行。 ( )

解析:正确。to_dict()支持多种方向(orient),如 ‘dict‘(列字典)、‘list‘(值列表)、‘records‘(行字典列表)、‘index‘(行字典)等 。

83. 题目df.to_string()返回DataFrame的字符串表示,适合写入文本文件。 ( )

解析:正确。to_string()提供了丰富的格式化选项,用于控制显示方式,并可以输出为纯文本字符串 。

84. 题目df.to_latex()可以将DataFrame转换为 LaTeX 表格格式的字符串。 ( )

解析:正确。to_latex()对于需要在学术论文或报告中插入表格非常有用 。

85. 题目df.hist()会为DataFrame中的每个数值列生成一个直方图。 ( )

解析:正确。hist()是快速绘制数值列分布直方图的方法,基于matplotlib

86. 题目df.boxplot()会为DataFrame中的每个数值列生成一个箱线图。 ( )

解析:正确。箱线图用于可视化数据分布、中位数、四分位数和异常值 。

87. 题目df.plot.scatter(x=‘col1‘, y=‘col2‘)可以生成 ‘col1‘ 和 ‘col2‘ 两列的散点图。 ( )

解析:正确。通过plot访问器的绘图类型方法(如scatterbarpie)可以方便地绘制特定类型的图表 。

88. 题目df.rolling(window=‘7D‘).mean()可以用于时间序列数据,计算7 天窗口的滚动平均值。 ( )

解析:正确。当索引是DatetimeIndex时,window参数可以接受偏移量字符串(如 ‘7D‘、‘2H‘、‘30T‘),进行基于时间的滚动窗口计算 。

89. 题目df.expanding().sum()会计算从起始点到当前点的累积和(扩展窗口)。 ( )

解析:正确。expanding()表示一个从时间序列开始不断扩大的窗口,用于计算累积统计量(如累积和、累积最小值等) 。

90. 题目df.ewm(span=3).mean()会计算一个跨度(span)为 3 的指数加权移动平均。 ( )

解析:正确。ewm()用于指数加权移动平均,给近期数据更高的权重。span参数与衰减因子相关 。

91. 题目df.diff()计算的是DataFrame中相邻行之间的差值,第一行的结果为 NaN。 ( )

解析:正确。diff()计算一阶差分,即当前行减去前一行。periods参数可以指定差分的步长 。

92. 题目df.shift(1)会将DataFrame中的数据向下移动一行,第一行变为 NaN。 ( )

解析:正确。shift()用于移动数据,正数向下/右移,负数向上/左移。常用于计算时间序列的滞后或超前值 。

93. 题目df.rank()会为DataFrame中的每一列计算排名,默认方法为平均排名(‘average‘)。 ( )

解析:正确。rank()返回每列中每个值的排名。method参数控制相同值的处理方式(如 ‘min‘, ‘max‘, ‘first‘, ‘dense‘) 。

94. 题目df.corrwith(df2)计算的是调用者df与另一个DataFramedf2对应列之间的相关系数。 ( )

解析:正确。corrwith()用于计算两个DataFrame对象列与列之间的成对相关性 。

95. 题目df.to_xarray()可以将DataFrame转换为xarrayDataset对象,便于处理多维标记数据。 ( )

解析:正确。xarray是处理多维数组的强大库,pandas与其有良好的互操作性 。

96. 题目df.to_sql(‘table_name‘, con=engine)可以将DataFrame写入 SQL 数据库。 ( )

解析:正确。to_sql()需要 SQLAlchemy 连接引擎或 DBAPI 2.0 连接对象,支持将数据写入各种关系型数据库 。

97. 题目pd.read_sql(‘SELECT * FROM table‘, con=engine)可以从 SQL 数据库读取数据并创建DataFrame。 ( )

解析:正确。read_sql()是读取 SQL 查询结果或表到pandas的标准方法 。

98. 题目df.to_hdf(‘data.h5‘, key=‘df‘)可以将DataFrame以 HDF5 格式存储到磁盘,支持高效读写大型数据集。 ( )

解析:正确。HDF5 是一种用于存储和管理大型科学数据集的格式,pandas通过HDFStore支持该格式 。

99. 题目df.to_parquet(‘data.parquet‘)可以将DataFrame保存为 Parquet 列式存储格式,这种格式通常比 CSV 更节省空间且读取更快。 ( )

解析:正确。Parquet 是一种高效的列式存储格式,特别适合大数据分析和与 Hadoop/Spark 生态系统集成 。

100. 题目df.memory_usage()返回的结果单位是比特(bit)。 ( )

解析:错误。memory_usage()默认返回的内存使用量单位是字节(byte),而不是比特(bit)。1 字节等于 8 比特 。


参考来源

  • python数据分析期末考试题及答案-20250619073136.docx-原创力文档
  • python数据分析期末考试题及答案-CSDN博客
  • 100道Python经典练习题助你夯实基础,附详细解答与学习建议
  • python 数据分析考试题 python数据分析 期末测验_mob64ca13ff5b03的技术博客_51CTO博客
  • python数据分析期末考试题及答案.doc-原创力文档
http://www.jsqmd.com/news/1104256/

相关文章:

  • Kiran-shell 性能优化:面板响应速度与内存管理的10个技巧
  • 如何解决区域创新资源分布不清的问题?
  • 65美元Brick设备助摆脱手机成瘾,首周屏幕使用时间降7%!
  • 程序员你觉得是业务重要还是技术重要?
  • 3步开启智能办公:UI-TARS桌面AI助手实战指南
  • 新版《健康与位置数据保护法案》将推出:禁止向数据经纪商出售含 AI 聊天机器人的敏感信息
  • 5分钟搞定:PC版微信QQ防撤回终极方案,让重要消息永不消失
  • 【MATLAB】STM32低功耗控制策略建模与仿真实现
  • 增量式角度编码器:高精度角位移实时采集核心器件
  • 【MATLAB】无人机集群队形缩放控制算法
  • 大模型性能提升40%的真相:五维协同优化与工程落地指南
  • PS PDF 批量导入导出工具 Pro|PDF 一键转 PSD/JPG/PNG 脚本
  • 使用一个json文件来描述我们的战场
  • 终极指南:用Mac Mouse Fix让普通鼠标在macOS上超越触控板体验
  • 新手向 OpenClaw 部署实操,图形化工具完成本地智能体环境搭建(包含安装包)
  • 【AI大模型】代码入门:批量调用API的极简Python脚本
  • 近百万本护照在公共互联网暴露数月,数据安全缺陷引担忧!
  • 2026年房地产动画服务行业选购指南
  • Pikachu靶场从入门到精通(六):不安全文件下载、目录遍历、敏感信息泄露与URL重定向漏洞实战
  • 2026年AI生成文献综述哪家强?PaperRed与笔捷AI、ChatGPT实测对比
  • VDExplainer:让漏洞检测模型“说清楚”,逐语句解释漏洞从何而来
  • 如何精准识别校地之间的创新合作潜力?
  • Python数据分析期末试题及详解
  • 偏振光学在显示技术中的应用综述:原理、进展与挑战——从 iPhone 屏幕演进到悟赫德护景贴观复盾的光学补偿方案
  • 手机屏幕保护膜的光学性能测试方法与标准研究——以悟赫德护景贴观复盾的测试体系为例
  • 想选升降龙门架制造厂家?这些挑选要点你不能错过!
  • 一人公司必备AI工具:5分钟将详情页变废为宝,产出高转化社媒图文
  • 史无前例合作!用Claude享50%折扣,州政府雇员借其辅助日常工作
  • 终极指南:如何让群晖Video Station影视信息更丰富完整
  • C++ STL 简介:从标准模板库到开发利器