当前位置: 首页 > news >正文

MiniRAG + LLM (三)

.docx 支持

from docx import Documentdef read_docx_file(filepath):"""读取 docx 文件内容"""try:doc = Document(filepath)paragraphs = []for para in doc.paragraphs:if para.text.strip():paragraphs.append(para.text)for table in doc.tables:for row in table.rows:for cell in row.cells:if cell.text.strip():paragraphs.append(cell.text)return '\n'.join(paragraphs)except Exception as e:print(f"❌ 读取 docx 失败 {filepath}: {e}")return ""

.pdf 支持

  • 还没学

其他

http://www.jsqmd.com/news/432896/

相关文章:

  • DeepSeek新论文“双通道”,让AI服务器的闲置带宽重新活过来了
  • 2026大专国际经济与贸易学数据分析的价值分析
  • Docker实操全解析:常用镜像安装+自定义镜像构建
  • 新手 Java 编程学习日志(Ai生成内容,用于学习和测试 mcp 服务)
  • 用于编程、写作与研究的Agent趋势
  • 第一章
  • KV Cache管理架构演进:从连续分配到统一混合内存架构
  • 新手 Java 编程学习日志(Ai生成内容,用于测试 mcp 服务)
  • 通义上线语音双模型:自然语言指令控制声音表达、音色与场景;儿童 AI 语音互动故事平台 Giant 融资 800 万美元丨日报
  • 24.Context
  • C++游戏开发之旅 22
  • Solution - P3642 [APIO2016] 烟花表演
  • 六轴机械臂粒子群轨迹规划与关节动态特性展示:包括收敛曲线、位置、速度及加速度曲线,并支持多种智...
  • 用投入换未来,从爱奇艺财报看它的新打法
  • 基于YOLO26深度学习的无人机视角河道水面垃圾检测系统【python源码+Pyqt5界面+数据集+训练代码】
  • 【开题答辩全过程】以 基于Web的医院日间手术管理系统设计与实现为例,包含答辩的问题和答案
  • 成都小程序开发公司排名|性价比高、不踩坑 - 企业数字化改造和转型
  • 【开题答辩全过程】以 基于Web的学生就业管理系统为例,包含答辩的问题和答案
  • 2026开学第一周
  • 200 本电子书乱糟糟?Reader + cpolar 让碎片时间都能高效读
  • Nginx 高分实战博客:从原理到生产优化的完整指南
  • LLM-VN LLM-Enhanced Rumor Detection via Virtual Node Induced Edge Prediction
  • 2026 小程序开发公司十强|避坑要点 + 选择标准一次说清 - 企业数字化改造和转型
  • 强劲性能+超大电池,荣耀WIN畅快游戏不设限
  • 荣耀400以开放推进创新 驱动行业体验升级
  • PCC框架: FACT-CHECKING WITH LARGE LANGUAGE MODELS VIA PROBABILISTIC CERTAINTY AND CONSISTENCY
  • Python print full text via pprint
  • 深圳小程序公司大盘点:报价、案例、口碑一次看清 - 企业数字化改造和转型
  • 2026 年 TOP10 小程序开发公司行业报告!十大服务商深度剖析 - 企业数字化改造和转型
  • 2026年8款AI字幕与语音转文字工具深度评测:教育、LD与企业培训选型指南