数据分析常用库基础知识
一、numpy
1、简介
NumPy(Numerical Python)是Python进行科学计算的一个扩展库,提供了大量的函数和操作,主要用于对多维数组执行计算,它比Python自身的嵌套列表结构要高效的多。
NumPy数组(class ndarray)和 Python列表(list)的主要区别:
数组会对元素的数据类型做统一,而列表不会。
数组创建后具有固定大小,而列表由于内存自动管理,可动态调整。
2、创建数组
np.array(object, dtype=None)
- object:aray_like,类似于数组的对象。如果object是标量,则返回包含object的0维数组
- dtype:data-type,数据类型。如果没有给出(一般不给),会从输入数据推断数据类型创建一个数组对象并返回(ndarray实例对象)
import numpy as np num = 369 arr = np.array(num) print(num) print(arr) print(type(num)) print(type(arr)) print('-'*30) print("虽然同样输出369,但数据类型不同") print('='*30) lst=[9,5,6,8,0] arr = np.array(list) print(lst) print(arr) print('-'*30) print('判断几维数组的方法:几个括号就是几个,如:num是0维,lst是1维') print('='*30) print('数组与列表的相同点') print('1、求长度') print(len(num)) print(len(arr)) Print('2、遍历') for i in lst: print(i) for a in arr: print(a) print('3、定位') print(lst[4]) print(lst[-1]) print(arr[4]) print(arr[-1]) print('4、切片') print(lst[1:4:2]) print(arr[1:4:2]) print('4、修改') lst[1:3] = [55,100] arr[1:3] = [55,100] print(lst) print(arr) print('='*30)3、基本运算
4、广播机制
5、索引和切片
6、常用操作
二、Pandas
