当前位置: 首页 > news >正文

python:crawl4ai安装

一,项目 地址:

https://github.com/unclecode/crawl4ai

 

二,通过pip安装:

$ mkdir crawl4ai
$ cd crawl4ai/
$ python3 -m venv venv
$ source venv/bin/activate
(venv) liuhongdi@liuhongdi-pc:/data/python/crawl4ai$ pip install -U crawl4ai
Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple

执行安装命令:

(venv) liuhongdi@liuhongdi-pc:/data/python/crawl4ai$ crawl4ai-setup

三,测试效果:

import asyncio
from crawl4ai import *async def main():async with AsyncWebCrawler() as crawler:result = await crawler.arun(# url="https://movie.douban.com/explore?support_type=movie&is_all=false&category=%E7%83%AD%E9%97%A8&type=%E5%85%A8%E9%83%A8",url="https://baidu.com",# js_code="window.scrollTo(0, document.body.scrollHeight);",timeout=6000,  # 6秒超时# wait_for="document.querySelector('.drc-subject-card')",# wait_for="css:.drc-subject-card")print(result.markdown)html_content = result.model_dump_json()print(html_content)if __name__ == "__main__":asyncio.run(main())

 

http://www.jsqmd.com/news/46002/

相关文章:

  • 洛谷 P4458
  • http1.1流水线传输方式
  • SLB及健康检查
  • 2025贝赛思考试培训哪家专业?5大优质机构测评,覆盖全阶段备考需求
  • 2025牛客国庆集训派对day7 M C 个人题解 - 教程
  • C++ 中 struct 与 class 的用法与区别
  • PyTorch 分布式训练底层原理与 DDP 实战指南
  • 2025年11月SAT辅导哪家强?机考适配/名师授课/定制方案的机构推荐
  • 07.创建型 - 抽象工厂模式(Abstract Factory Pattern)
  • 模型量化原理
  • 日总结 29
  • AI浪潮下的行业变革:从气象到游戏,我们学到了什么
  • 2025.11.19 C 题解
  • 2025.11.20
  • 【比赛记录】2025CSP+NOIP 冲刺模拟赛合集Ⅵ
  • 智能座舱项目管理中多团队协作的创新之道 - 指南
  • 自指自洽,普世的逻辑,特别的因果
  • 3 分钟上手 SightAI:在你熟悉的工具里直接调用顶级大模型 - sight
  • 聚焦SAT高分核心需求:2025年值得信赖的5大辅导机构,覆盖全阶段备考
  • 2025.11.20博客
  • 2025.11.19 D 题解
  • P11626 [迷宫寻路 Round 3] 七连击 分析
  • 芯谷科技--高性能电动工具直流调速电路GS069 - 指南
  • 【个人成长笔记】在本地Windows系统中如何正确使用adb pull命令,把Linux环境中的记录或文件夹复制到本地中(亲测有效)
  • 钩子
  • IOI 2026 中国国家集训队作业(试题泛做)记录
  • 洛谷 B4411:[GESP202509 二级] 优美的数字 ← 嵌套循环
  • 2025年门窗十大品牌专业选购手册:行业评估报告 + 白皮书指引,选窗更安心!
  • 文字识别系统
  • 2025 门窗十大品牌精准选购指南:行业评估报告 + 白皮书护航,选窗不踩坑!