当前位置: 首页 > news >正文

duckdb excel插件和rusty_sheet插件在python中的不同表现

  1. 建立虚拟环境
    安装python扩展包duckdb、polars和pandas
python -m venv pwin313 pwin313\scripts\activate.bat pwin313)C:\d\pwin313>pip install duckdb polars pandas
  1. 在python中引入扩展包,安装加载duckdb插件
pwin313) C:\d\pwin313>python Python 3.13.2 (tags/v3.13.2:4f8bb39, Feb 4 2025, 15:23:48) [MSC v.1942 64 bit (AMD64)] on win32 Type "help", "copyright", "credits" or "license" for more information. >>> import duckdb >>> duckdb.sql("install excel") >>> duckdb.sql("install rusty_sheet from community") >>> import time >>> duckdb.sql("load excel") >>> duckdb.sql("load rusty_sheet")

rusty_sheet是 v0.4.2版。
分别测试两种插件不转成数据框和转成polars、duckdb数据框

>>> t=time.time();duckdb.sql("select * from read_xlsx('/d/lineitem.xlsx')");t1=time.time();print(t1-t) 0.3100736141204834 >>> t=time.time();duckdb.sql("select * from read_xlsx('/d/lineitem.xlsx')").pl();t1=time.time();print(t1-t) 4.7497313022613525 >>> t=time.time();duckdb.sql("select * from read_xlsx('/d/lineitem.xlsx')").fetchdf();t1=time.time();print(t1-t) 4.8916003704071045 >>> t=time.time();duckdb.sql("select * from read_sheet('/d/lineitem.xlsx',range='2:')");t1=time.time();print(t1-t) 4.251304626464844 >>> t=time.time();duckdb.sql("select * from read_sheet('/d/lineitem.xlsx',range='2:')").pl();t1=time.time();print(t1-t) 9.083962440490723 >>> t=time.time();duckdb.sql("select * from read_sheet('/d/lineitem.xlsx',range='2:')").fetchdf();t1=time.time();print(t1-t) 9.565066576004028

可见,read_xlsx不转数据框,则不实际读取数据,而read_sheet读取。

http://www.jsqmd.com/news/689830/

相关文章:

  • NCM格式逆向工程深度解析:ncmdump解密引擎架构设计与性能优化指南
  • RK356X Android11上GT9271触摸屏调试:从设备树配置到坐标反转的完整避坑指南
  • 从GPF地面分割到点云配准:手把手教你实现多激光雷达联合标定(ROS+PCL实战)
  • 别再手动调样式了!用ECharts 5.4 + ec-canvas 2.0 实现小程序图表自适应布局(附完整代码)
  • 2026年4月新消息:浙江韩系女鞋源头厂家实力盘点,优选指南看这里 - 2026年企业推荐榜
  • 避坑指南:LabVIEW安装后除了范例打不开,你可能还会遇到这3个隐藏问题
  • GROMACS模拟避坑大全:从力场选择、离子命名到mdp参数配置,新手必看的7个实战细节
  • 别慌!遇到‘FATAL XX000: the limit of 818 distributed transactions has been reached’报错,手把手教你调优瀚高数据库max_con
  • 后量子密码学中的拒绝采样技术及硬件优化
  • 4月24日成都地区华岐产焊管(Q235B;内径DN15-200mm)现货批发 - 四川盛世钢联营销中心
  • ADI DSP仿真器接口升级了?从14PIN到10PIN的实战转换指南(附CCES链路测试方法)
  • 2026 语言培训行业优质 GEO 优化服务商推荐榜 - GEO优化
  • 告别卡顿!在Ubuntu 20.04上搭建轻量级远程桌面(Xfce4+Xrdp),附Chrome浏览器安装与色深问题解决
  • 别再手动写聊天室了!用uni-im插件5分钟搞定uniapp用户与商家私信功能(附完整源码)
  • RK3568串口RS485驱动改造实战:从设备树到tasklet避坑全记录
  • OmenSuperHub:3分钟解锁惠普游戏本终极性能控制指南
  • 别再手动转换了!CAPL脚本中字符串与数据互转的5个高效函数详解(附避坑指南)
  • Kill-Doc:一键自动化文档下载工具,告别繁琐下载限制
  • 2026年上海注册金融科技公司:上海自贸区注册公司、上海财务代理公司、上海财务代理记账、上海财务咨询、上海财务外包选择指南 - 优质品牌商家
  • YOLOv8 OBB + 关键点:从旋转框到方向判定的端到端实践
  • 深入蓝桥杯开发板:拆解74HC138与74HC573,手把手教你写稳定的数码管驱动
  • Rust 泛型系统的底层逻辑
  • 嵌入式开发者的RAM管理课:在STM32H743上为自检函数划一块‘专属内存’
  • 2026年4月更新:无烟自净化烤肉桌批发商深度解析,重庆爱无烟电器有限公司为何脱颖而出? - 2026年企业推荐榜
  • 【2026 C语言内存安全编码白皮书】:20年一线专家亲授——97%的缓冲区溢出漏洞可被这5条规范彻底拦截
  • C#线程底层原理知识
  • 2026年4月武汉沸石滤料直销工厂专业评估:为何坚凝工程材料有限公司值得关注? - 2026年企业推荐榜
  • 【CSS魔法实战】打造吸睛网页的4种文字视觉特效
  • 手把手教你用MuJoCo XML构建一个闭链机器人模型(附完整代码)
  • 跨端语音直播实战:基于UniApp与WebRTC构建多平台(App+H5)互动房间的架构与核心实现