当前位置: 首页 > news >正文

案例之 逻辑回归_癌症预测

案例:使用 逻辑回归模型 实现癌症预测

逻辑回归模型介绍:
1.概述:属于有监督学习,即有特征、有标签、且标签是离散的。主要适用于二分类;
2.原理:把线性回归处理后的预测值–>通过Sigmoid激活函数,映射到[0, 1]概率–>基于自定义的阈值,结合概率来分类;
3.损失函数:极大似然估计函数的 负数形式;

""" 案例:演示逻辑回归模型实现癌症预测 逻辑回归模型介绍: 概述:属于有监督学习,即有特征、有标签、且标签是离散的。主要适用于二分类。 原理:把线性回归处理后的预测值-->通过Sigmoid激活函数,映射到[0, 1]概率-->基于自定义的阈值,结合概率来分类 损失函数:极大自然估计函数的 负数形式 机器学习开发流程: 1.加载数据 2.数据的预处理 3.特征工程(特征提取、特征与处理、特征降维、特征选择、特征组合) 4.模型训练 5.模型预测 6.模型评估 """# 导包importnumpyasnpimportpandasaspdfromsklearn.linear_modelimportLogisticRegression#逻辑回归模型fromsklearn.metricsimportaccuracy_scorefromsklearn.preprocessingimportStandardScaler#标准化fromsklearn.model_selectionimporttrain_test_split#训练集和测试集分割fromday02.案例之波士顿房价预测_正规方程法importtransfer# from sklearn.metrics import accuracy_score #模型评估# 1.加载数据data=pd.read_csv('data/breast-cancer-wisconsin.csv')# data.info()# 2.数据的预处理# 2.1 把 ? 替换成np.nan,参1:要被替换的值,参2:用来替换的值,参3:是否替换源数据,默认为Falsedata=data.replace('?',np.nan,inplace=True)# 2.2 确实值处理--》删除data.dropna(axis=0,inplace=True)#axis=0表示行,删除包含缺省值的行(确定axis=0表示行还是列:一般源方法都是默认按行删除,点进原方法看axis等于几)# 2.3 打印处理后的信息# data.info()# 3.特征工程(特征提取、特征与处理、特征降维、特征选择、特征组合)# 3.1 特征提取之 提取特征和标签x=data.iloc[:,1:-1]#按照行号、列索引获取数据,: 表示所有行,1:-1表示从第1列到最后一列,包左不包右# y=data.iloc[:, -1] #获取最后一列# y=data['Class'] #获取最后一列,效果同上y=data.Class.values#获取最后一列,效果同上# 3.2 查看特征和标签print(x[:5])print(y[:5])print(f'特征:{x.shape}, 标签:{y.shape}')#特征:(683, 9), 标签:(683,)# 3.3切割训练集和测试集x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,random_state=23)# 3.4 特征工程:标准化# 3.4.1 创建标准化对象transfer=StandardScaler()# 3.4.2 对训练集进行标准化处理x_train=transfer.fit_transform(x_train)# 3.4.3 对测试集进行标准化处理x_test=transfer.transform(x_test)# 4.模型训练# 4.1 创建模型对象 --》逻辑回归对象estimator=LogisticRegression()# 4.2 模型训练estimator.fit(x_train,y_train)# 5.模型预测y_predict=estimator.predict(x_test)print(f'预测结果:{y_predict}')# 6.模型评估# 正确率(准确率),公式为:预测对的/ 样本总数print(f'预测前评估,正确率:{estimator.score(x_test,y_test)}')#测试集的特征、标签print(f'预测后评估,正确率:{accuracy_score(y_test,y_predict)}')#测试集的标签、预测值# 思考:逻辑回归模型能用 准确率来评测吗?# 答案:可以,但是结果不精准,因为逻辑回归模型主要用于 二分类,即:A类还是B类,不能说 97%的A类,3%的B类# 所以要通过 混淆矩阵来评测,即:精确率,召回率,F1值(F1-Score),ROC曲线,AUC值.
http://www.jsqmd.com/news/719712/

相关文章:

  • pH计品牌推荐:耐用性强、技术先进且售后响应快的品牌对比(产品包含台式/笔式/实验室PH计) - 品牌推荐大师1
  • Flutter for OpenHarmony 天气应用实战DAY2:天气图标渲染+多日预报布局开发
  • 从游戏背包到任务队列:用C++ list的splice实战优化你的数据结构设计
  • **用Python实现从头到尾的分子几何优化:计算化学中的发散创新实践**在现代计算化学中,**分子几何优化(Geometr
  • FAST-LIVO:高性能稀疏直接法激光-视觉-惯导紧耦合SLAM系统深度解析
  • 上海恩翔搬家服务:上海市国际物流推荐哪几家 - LYL仔仔
  • 别再乱画了!新手用嘉立创打样PCB,这5个设计细节最容易翻车
  • 免费跨平台剧本写作软件Trelby:告别格式烦恼,专注故事创作
  • NVIDIA NVENC视频编码技术解析与优化实践
  • YOLOv5-face深度解析:如何让计算机像人类一样“看见“人脸
  • 从四轴飞行器炸机到平稳悬停:我的Mahony算法调参踩坑实录与避坑指南
  • 2026年中资出海欧洲咨询口碑榜哪家好?德国GmbH注册、欧盟蓝卡、税务合规、公司并购、企业托管优选指南 - 海棠依旧大
  • mysql 进阶语法 新手必看
  • 2026年动态漫画制作软件有哪些值得关注的产品?(五大主流平台)
  • 超低功耗反向散射通信系统设计与实现
  • 前端人跟进 AI 时代:手把手本地部署一个 Ollama 本地 AI 助手,迈出 Agent 第一步
  • B站用户成分智能识别工具:深度解析与实战指南
  • 终极Windows系统优化指南:用Winhance让你的电脑重获新生
  • PyOneDark Qt Widgets Modern GUI:快速打造专业级深色主题界面的终极指南
  • 【MicroPython编程-ESP32篇:设备驱动】-GUVA-S12SD紫外线检测传感器驱动
  • WeChatMsg留痕:构建个人AI数据中心的年度记忆可视化平台
  • 3个Jasminum插件核心功能,让你的中文文献管理效率提升90%
  • Citra模拟器终极指南:在电脑上免费畅玩任天堂3DS游戏
  • 京东API批量操作优化:单次1000条限制的突破方案
  • 10分钟实战:用Auto-Video-Generator打造AI视频的完整解决方案
  • 培洋机械设备:青岛起重设备回收怎么联系 - LYL仔仔
  • 广州品冠装饰设计:广州市装饰工程施工公司 - LYL仔仔
  • 如何配置QLVideo的视频预览时间点和缩略图质量
  • 3步掌握微生物网络分析:microeco包快速构建生态关联网络指南
  • C++ -- 模板的声明和定义