当前位置: 首页 > news >正文

maxun爬虫机器人介绍与部署

软件介绍

机器人爬虫工具,绕开编码,直接从网页中截图并且进行解析

一款全新的无代码网页数据提取平台,无需编程即可轻松抓取网站的数据,支持列表/文本抓取、截图、自定义代理、自动处理分页和滚动等功能。作为一个新的开源项目,它的功能还在不停迭代,计划推比如适应网站布局变化和登录后数据提取等新功能

代码地址:

https://github.com/getmaxun/maxun?tab=readme-ov-file

软件部署

1、下载git

yum install git

2、克隆代码

git clone https://github.com/getmaxun/maxun.git

3、创建配置文件

cd maxun mkdir .env

添加如下内容

# App Setup NODE_ENV=production # Set to 'development' or 'production' as required JWT_SECRET=a9Z$kLq7^f03GzNw!bP9dH4xV6sT2yXl3O8vR@uYq3 # Replace with a secure JWT secret key DB_NAME=maxun # Your PostgreSQL database name DB_USER=postgres # PostgreSQL username DB_PASSWORD=postgres # PostgreSQL password DB_HOST=postgres # Host for PostgreSQL in Docker DB_PORT=5432 # Port for PostgreSQL (default: 5432) ENCRYPTION_KEY=f4d5e6a7b8c9d0e1f23456789abcdef01234567890abcdef123456789abcdef0 # Key for encrypting sensitive data (passwords and proxies) MINIO_ENDPOINT=minio # MinIO endpoint in Docker MINIO_PORT=9000 # Port for MinIO (default: 9000) MINIO_CONSOLE_PORT=9001 # Web UI Port for MinIO (default: 9001) MINIO_ACCESS_KEY=minio_access_key # MinIO access key MINIO_SECRET_KEY=minio_secret_key # MinIO secret key REDIS_HOST=redis # Redis host in Docker REDIS_PORT=6379 # Redis port (default: 6379) # Backend and Frontend URLs and Ports BACKEND_PORT=8080 # Port to run backend on. Needed for Docker setup FRONTEND_PORT=5173 # Port to run frontend on. Needed for Docker setup BACKEND_URL=http://localhost:8080 # URL on which the backend runs. You can change it based on your needs. PUBLIC_URL=http://localhost:5173 # URL on which the frontend runs. You can change it based on your needs. VITE_BACKEND_URL=http://localhost:8080 # URL used by frontend to connect to backend. It should always have the same value as BACKEND_URL VITE_PUBLIC_URL=http://localhost:5173 # URL used by backend to connect to frontend. It should always have the same value as PUBLIC_URL # Optional Google OAuth settings for Google Sheet Integration GOOGLE_CLIENT_ID=your_google_client_id GOOGLE_CLIENT_SECRET=your_google_client_secret GOOGLE_REDIRECT_URI=your_google_redirect_uri # Telemetry Settings - Please keep it enabled. Keeping it enabled helps us understand how the product is used and assess the impact of any new changes. MAXUN_TELEMETRY=true

方式一:

Docker部署minio-CSDN博客

Docker部署Redis教程-CSDN博客

Docker部署Postgres教程_docker pull postgres-CSDN博客

Linux部署NodeJS-CSDN博客

项目部署

git clone https://github.com/getmaxun/maxun # change directory to the project root cd maxun # install dependencies npm install # change directory to maxun-core to install dependencies cd maxun-core npm install # get back to the root directory cd .. # make sure playwright is properly initialized npx playwright install npx playwright install-deps # get back to the root directory cd .. # start frontend and backend together npm run start

方式二:

a、下载docker compose

yum -y update yum install -y docker-compose-plugin yum install -y python-pip docker compose version

b、启动容器

docker compose --env-file .env up -d

4、测试

浏览器中输入http://localhost:5173/

如果远程,需要讲localhost改成服务器IP

部署参考:

https://github.com/getmaxun/maxun

http://www.jsqmd.com/news/212119/

相关文章:

  • Java进阶-SpringCloud设计模式-工厂模式的设计与详解
  • Thinkphp和Laravel框架的高校教室报修管理系统_14oaj0v7
  • 快速查看电脑开机时间
  • JDK17在Windows安装以及环境变量配置(超详细的教程)
  • Python+flask的高校餐饮档口管理系统的设计与实现_6t8pw5bl-Pycharm vue django项目源码
  • Thinkphp和Laravel框架的成都某民宿预订系统的设计与实现_r93v34dv
  • MS SQL Server partition by 函数实战三 成绩排名
  • Thinkphp和Laravel框架的电信学院年终高校考核材料归档平台研究与设计_80664x25
  • Java进阶-在Ubuntu上部署SpringBoot应用
  • Spring Boot Admin与Kubernetes集成监控
  • 【Unity】实现Quad瓦片(MeshRenderer)渲染图集图片
  • 【课程设计/毕业设计】基于python-CNN深度学习的水果识别
  • MSSQL2022的一个错误:未在本地计算机上注册“Microsoft.ACE.OLEDB.16.0”提供程序
  • Thinkphp和Laravel框架的茶叶购物网上商城系统 潇湘知茶小程序_dyo5sig5
  • 【状态估计】基于LQR控制和卡尔曼滤波算法实现二维四旋翼的状态估计(噪声传感器数据)附Matlab代码
  • 【毕业设计】基于深度学习python-CNN的水果识别
  • 2026免费好用的AIPPT工具榜:智能演示文稿制作新纪元
  • Thinkphp和Laravel框架的蛋糕甜品烘焙教程微信小程序设计与实现_6uy1k94r
  • Java进阶07 嵌套类
  • 计算机深度学习毕设实战-卷神经网络基于深度学习的土豆疾病识别
  • 【毕业设计】机器学习 基于python-cnn深度学习的罗马数据集训练识别
  • Knife4j文档请求异常(基于SpringBoot3,查找原因并解决)
  • 从执行到管理:SOP思维,是你必须掌握的职场杠杆
  • Kafka 基础概念
  • 【毕业设计】机器学习基于python深度学习的苹果和西红柿识别
  • knife4j+springboot3.4异常无法正确展示文档
  • 深度学习计算机毕设之基于深度学习的土豆疾病识别卷神经网络
  • LangChain-09 Query SQL DB With RUN GPT 查询数据库 并 执行SQL 返回结果
  • Python高效计算斐波那契数列
  • AWS OpenSearch Service TLS 策略升级指南