当前位置：首页 > news >正文

browser39：现代浏览器自动化工具的设计原理与实战应用

news 2026/5/7 3:57:30

1. 项目概述：一个浏览器自动化与数据采集的瑞士军刀

最近在折腾一些网页数据抓取和自动化测试的活儿，发现很多现成的工具要么太重，要么太局限。直到我遇到了一个叫alejandroqh/browser39的开源项目，它就像一把专门为浏览器自动化打造的瑞士军刀，让我眼前一亮。这个项目本质上是一个基于现代浏览器引擎（通常是 Chromium）构建的自动化工具集，但它巧妙地将底层复杂的 WebDriver 协议、浏览器实例管理、页面交互逻辑封装成了一个更简洁、更符合开发者直觉的接口。

简单来说，browser39让你能用更少的代码，完成诸如自动登录网站、批量抓取列表数据、定时执行网页操作、生成页面截图或PDF等任务。它解决的痛点非常明确：当你面对需要与大量 JavaScript 交互的现代网页时，传统的基于 HTTP 请求的爬虫（如requests+BeautifulSoup）往往力不从心，因为数据很可能是在前端动态渲染的。而直接使用 Selenium 或 Puppeteer 这类底层工具，又需要处理不少繁琐的细节，比如浏览器驱动管理、复杂的等待逻辑和异常处理。

browser39的价值就在于它在强大功能和易用性之间找到了一个不错的平衡点。它适合有一定编程基础（比如熟悉 Python 或 Node.js）的开发者、数据分析师、测试工程师，或者任何需要与网页进行自动化、规模化交互的人。无论是想监控竞争对手的价格变动，自动填写并提交线上表单，还是为你的 Web 应用做端到端的自动化测试，这个工具都能提供一套高效的解决方案。接下来，我就结合自己的实际使用经验，把这个项目的核心设计、使用技巧和踩过的坑，系统地拆解一遍。

2. 核心设计理念与架构拆解

2.1 为什么是“浏览器自动化”而不是“网络爬虫”？

首先要厘清一个概念。很多人一听到抓取网页数据，第一反应就是写爬虫。但在当今的 Web 环境下，纯粹的“爬虫”概念已经不够用了。许多网站采用单页面应用（SPA）架构，如 React、Vue.js 构建的站点，页面内容完全由 JavaScript 在客户端生成。如果你直接用curl或requests库去请求网址，拿到的很可能是一个几乎空的 HTML 骨架，真正的数据是通过后续的 API 调用异步加载的。

这就是browser39这类工具的用武之地。它采用“浏览器自动化”的思路，即真正启动一个无头（Headless）或有头的浏览器，像真人用户一样加载网页、执行 JavaScript、渲染页面，然后你再通过脚本与这个完全渲染后的页面进行交互。这种方式能 100% 模拟用户行为，因此能获取到最终呈现的所有内容，无论其来源是初始 HTML 还是异步 JS。当然，代价是资源消耗（内存、CPU）比简单 HTTP 请求高得多。

browser39在设计上，通常会将这种浏览器自动化能力封装成几个高层次的操作原语。例如：

导航：跳转到指定 URL。
选择器：使用 CSS 选择器或 XPath 定位页面元素。
交互：对元素进行点击、输入文本、悬停等操作。
提取：获取元素的文本、属性、HTML 结构或执行页面内 JavaScript 来提取数据。
等待：智能等待页面元素出现、网络请求完成或特定条件满足。

通过组合这些原语，你就能像搭积木一样构建出复杂的自动化流程。

2.2 架构分层：从驱动到高级 API

理解browser39的架构，有助于我们更好地使用它和排查问题。其架构通常是分层设计的：

底层浏览器引擎：通常是 Chromium，通过chromedriver或直接通过 DevTools Protocol（CDP）进行通信。这是实际执行页面渲染和 JavaScript 的“大脑”。
协议层：实现 WebDriver 协议或 CDP 协议的客户端。这一层负责与浏览器进程进行底层的命令/响应交互，例如“点击这个坐标”、“执行这段 JS”。
核心会话管理层：browser39的核心。它管理浏览器实例的生命周期（启动、关闭）、标签页（Tab）或窗口（Window）的会话，并提供基本的页面控制功能。这一层会处理很多令人头疼的细节，比如自动寻找并匹配浏览器驱动版本。
高级 API 与语法糖层：这是browser39最具价值的部分。它将底层协议生硬的操作，封装成流畅的、链式调用的或更符合直觉的 API。例如，它可能提供一个page.type(‘#search’, ‘keyword’)方法，内部帮你处理了元素等待、聚焦、清空、输入等一系列操作。
工具与集成层：提供额外的便利功能，如并发控制（同时运行多个浏览器实例）、代理集成、自定义插件/中间件机制、与测试框架（如 pytest）的集成等。

这种分层设计的好处是隔离了变化。如果未来 Chrome 的 CDP 协议有变动，只需要修改协议层；如果你想支持 Firefox，理论上可以替换底层引擎和驱动，而高级 API 尽量保持稳定。

注意：开源项目的具体实现可能有所不同。有些browser39类的项目可能基于 Puppeteer（Node.js）或 Playwright（跨浏览器）二次封装，但它们解决的核心问题和分层思想是相通的。

3. 环境准备与快速上手

3.1 安装与依赖管理

假设browser39是一个 Python 项目（这是此类工具最常见的语言之一），它的安装通常很简单。我们首先需要一个干净的 Python 环境（推荐使用venv或conda创建虚拟环境以避免依赖冲突）。

# 1. 创建并激活虚拟环境 python -m venv browser39_env source browser39_env/bin/activate # Linux/macOS # 或 browser39_env\Scripts\activate # Windows # 2. 安装 browser39 包 # 通常可以通过 pip 从 GitHub 直接安装 pip install git+https://github.com/alejandroqh/browser39.git # 或者，如果项目已发布到 PyPI，则更简单 # pip install browser39

安装过程会自动处理 Python 端的依赖，比如selenium,webdriver-manager,requests等。但最关键的一步往往在安装之后：浏览器二进制文件。browser39可能需要一个特定版本的 Chromium 或 Chrome。优秀的项目会集成webdriver-manager这类工具，在第一次运行时自动下载匹配的浏览器驱动和二进制文件。但为了确保万无一失，最好手动检查一下。

# 一个典型的初始化检查脚本 import browser39 # 尝试启动一个浏览器实例，如果缺少驱动或浏览器，通常会抛出清晰的错误信息 try: browser = browser39.launch(headless=True) # headless 模式，不显示图形界面 page = browser.new_page() page.goto("about:blank") print("环境检查通过！") browser.close() except Exception as e: print(f"启动失败，请检查: {e}") # 常见问题：Chrome/Chromium 未安装，或版本不匹配。 # 解决方案：根据错误提示，安装指定版本的 Chrome，或允许工具自动下载。

3.2 你的第一个自动化脚本：抓取页面标题

让我们从一个最简单的例子开始，感受一下browser39的 API 风格。这个脚本将启动浏览器，访问一个网页，并获取它的标题。

import browser39 import asyncio # 如果 browser39 是异步的，则需要 asyncio # 同步 API 示例（假设 browser39 提供同步接口） def sync_example(): # 启动浏览器，headless=True 表示在后台运行，不显示窗口 browser = browser39.launch(headless=True) # 打开一个新页面（标签页） page = browser.new_page() # 导航到目标网址 page.goto("https://httpbin.org/html") # 等待页面主要内容加载（这里等待 h1 标签出现，是一种常见的等待策略） page.wait_for_selector("h1") # 获取页面标题 title = page.title() print(f"页面标题是: {title}") # 获取特定元素的文本内容 h1_text = page.text_content("h1") print(f"H1 的内容是: {h1_text}") # 任务完成，关闭浏览器，释放资源 browser.close() # 异步 API 示例（更现代、性能更好） async def async_example(): # 异步启动 browser = await browser39.launch(headless=True) page = await browser.new_page() await page.goto("https://httpbin.org/html") await page.wait_for_selector("h1") title = await page.title() print(f"页面标题是: {title}") h1_text = await page.text_content("h1") print(f"H1 的内容是: {h1_text}") await browser.close() # 运行 if __name__ == "__main__": # 根据项目实际提供的 API 选择运行哪一个 # sync_example() # 或者运行异步版本 # asyncio.run(async_example()) pass

这个简单的例子揭示了几个关键点：

上下文管理：browser对象是顶级入口，负责管理浏览器进程。page对象代表一个标签页，是大多数交互发生的地方。
导航与等待：goto负责跳转，但网络加载和渲染需要时间。直接跳转后立即操作元素很可能失败，因为元素可能还没加载出来。因此wait_for_selector是至关重要的，它让脚本暂停，直到指定元素出现在 DOM 中。
资源清理：务必在脚本最后调用browser.close()。否则，无头浏览器进程可能会在后台残留，消耗内存。

4. 核心操作详解与实战技巧

4.1 元素定位：选择器的艺术与科学

与页面交互的第一步是找到元素。browser39一般支持多种定位方式：

CSS 选择器：最常用、最灵活。page.query_selector(‘#id’),page.query_selector_all(‘.class’)。
XPath：功能强大，可以基于层级、属性、文本进行复杂定位。page.xpath(‘//button[contains(text(), “提交”)]’)。
文本内容：通过文本直接定位。page.get_by_text(“登录”)。
角色与属性：如page.get_by_role(‘button’, name=‘Submit’)，这是更语义化的方式，源自 Accessibility 树，稳定性更高。

实操心得：选择器的稳定性

网页结构经常变动，一个依赖于复杂 CSS 路径（如div > div:nth-child(3) > span > a）的选择器非常脆弱。为了提高脚本的健壮性，应遵循以下原则：
优先使用 ID：如果元素有唯一 ID，这是最稳定的选择。
使用有意义的类名或属性：寻找那些看起来是开发者为功能定义的类名（如.submit-btn,[data-testid=”search-input”]），而不是样式类名（如.mt-4 .text-blue）。
组合使用：page.query_selector(‘header nav .login’)比一长串的嵌套选择器要好。
避免索引：如:nth-child(3)应尽量避免，因为顺序容易变化。
文本定位的陷阱：get_by_text对国际化（多语言）和微小文本改动非常敏感，慎用。如果要用，尽量用部分匹配（contains）而非完全匹配。

4.2 页面交互：模拟真实用户行为

定位到元素后，就可以与之交互了。常见的交互命令包括：

# 点击 await page.click("#submit-button") # 或更稳健的方式：先定位，再点击 button = await page.wait_for_selector("#submit-button") await button.click() # 输入文本 await page.fill("#username", "my_username") # fill 会先清空再输入 await page.type("#password", "my_password", delay=100) # type 可以模拟按键延迟，更像真人 # 选择下拉框 await page.select_option("#country", "CN") # 通过 value 选择 await page.select_option("#country", label="中国") # 通过显示文本选择 # 上传文件 # 注意：对于 input[type="file"]，直接设置文件路径，而不是尝试点击上传窗口 file_input = await page.query_selector("input[type='file']") await file_input.set_input_files(["/path/to/your/file.pdf"]) # 悬停（Hover） await page.hover(".menu-item") # 键盘操作 await page.keyboard.press("Enter") await page.keyboard.type("Hello, World!")

注意事项：处理动态内容与框架

现代网页大量使用 iframe（内嵌框架）和 Shadow DOM（影子DOM）。如果元素位于其中，直接在主页面（Main Frame）的page对象上操作是无效的。
iframe：你需要先获取到 iframe 的Frame对象，然后在这个对象上进行元素定位。
# 通过名称或选择器定位 iframe frame = page.frame(name="login-frame") # 或 page.frame(selector="iframe[src*='login']") if frame: await frame.fill("#user", "name")
Shadow DOM：需要穿透影子根（Shadow Root）。browser39的 API 可能提供类似page.eval_on_selector的方法，让你在元素上下文中执行 JavaScript 来访问 Shadow DOM 内的元素。或者，你可以直接使用 JavaScript 路径。
# 假设有一个自定义组件 <my-component> # 其 Shadow DOM 内有一个按钮 <button id="inner-btn"> js_script = """ (element) => { return element.shadowRoot.querySelector('#inner-btn'); } """ inner_button = await page.eval_on_selector("my-component", js_script) await inner_button.click()

4.3 数据提取：从页面到结构化信息

自动化不仅仅是操作，更是获取数据。提取数据的方法多样：

# 1. 获取元素属性 href = await page.get_attribute("a.link", "href") data_id = await page.get_attribute("div.item", "data-id") # 2. 获取元素文本或 HTML text = await page.text_content("h1.title") inner_html = await page.inner_html("div.content") # 3. 获取多个元素（列表） all_items = await page.query_selector_all(".product-list .item") items_data = [] for item in all_items: name = await item.text_content(".name") price = await item.get_attribute(".price", "data-price") items_data.append({"name": name, "price": price}) # 4. 执行页面 JavaScript 提取复杂数据（终极武器） # 这对于从 JavaScript 变量或复杂对象中提取数据非常有用 complex_data = await page.evaluate(""" () => { // 这段代码在浏览器页面上下文中执行，可以访问 window, document 等 return window.__INITIAL_STATE__?.products || []; } """)

实操心得：evaluate的强大与风险

page.evaluate()是你与页面 JavaScript 上下文直接对话的桥梁。你可以用它做任何事：操作 DOM、读取全局变量、调用页面内函数。但需要注意：
参数传递：从 Python 传递到 JS 函数的参数必须是 JSON 可序列化的（数字、字符串、列表、字典）。函数返回值也会被序列化后传回 Python。
上下文隔离：evaluate中执行的代码与页面原有代码在同一个全局上下文中，但它是临时的。对页面的修改可能会影响后续操作。
错误处理：如果 JS 代码有错误，evaluate会抛出异常。务必做好异常捕获。
性能：频繁调用evaluate会有通信开销。对于批量数据提取，尽量在一次调用中完成所有工作并返回一个集合。

4.4 等待策略：让脚本“聪明”地等待

等待是浏览器自动化中最容易出错的部分。browser39应该提供多种等待机制：

硬性等待：await asyncio.sleep(5)或time.sleep(5)。这是最差的选择，因为它固定等待时间，无论页面是否已就绪。网络慢时可能不够，网络快时又浪费资源。
选择器等待：await page.wait_for_selector(“.loaded”)。等待特定元素出现。这是最常用、最可靠的方式。
导航等待：await page.goto(url, wait_until=”networkidle”)。wait_until参数可以指定等待到什么程度才认为导航完成。“load”（加载事件），“domcontentloaded”（DOM 解析完成），“networkidle”（网络空闲，通常指 500ms 内无新请求）。“networkidle” 对于 SPA 应用很实用。
函数等待：await page.wait_for_function(“() => document.readyState === ‘complete'”)。等待一个自定义的 JavaScript 条件为真。
事件等待：await page.wait_for_event(“response”)。等待特定的页面事件，如收到某个网络响应。

最佳实践：组合等待与超时设置

永远不要依赖单一的硬性等待。一个稳健的等待策略通常是组合式的：
await page.goto(url, wait_until="networkidle") # 等待网络基本平静 try: # 等待关键内容元素出现，设置一个合理的超时（如10秒） await page.wait_for_selector("#main-content", state="visible", timeout=10000) except TimeoutError: print("关键内容未在10秒内加载，可能页面有问题或选择器已失效。") # 这里可以记录日志、截图，然后优雅地退出或重试
同时，为所有等待操作设置一个合理的timeout参数，避免脚本因某个元素永远不出现而无限期挂起。

5. 高级应用与性能优化

5.1 并发控制与资源池

当需要处理大量页面（如抓取成千上万个商品详情页）时，同步地一个接一个处理效率极低。我们需要并发。但直接启动数百个浏览器实例会压垮系统。正确的做法是使用并发控制和浏览器上下文（Browser Context）。

import asyncio import browser39 async def worker(browser, url_queue, result_queue): """一个工作协程，负责处理单个页面任务""" context = await browser.new_context() # 创建一个新的上下文（类似隐身会话） page = await context.new_page() while True: url = await url_queue.get() if url is None: # 终止信号 break try: await page.goto(url, wait_until="networkidle") data = await extract_data(page) # 你的数据提取函数 await result_queue.put((url, data)) except Exception as e: await result_queue.put((url, f"Error: {e}")) finally: await page.goto("about:blank") # 清空页面状态，为下一个任务准备 await context.close() async def main_concurrent(urls, max_concurrent=5): """主函数，控制并发度""" browser = await browser39.launch(headless=True) url_queue = asyncio.Queue() result_queue = asyncio.Queue() # 将任务放入队列 for url in urls: await url_queue.put(url) for _ in range(max_concurrent): await url_queue.put(None) # 每个 worker 一个终止信号 # 启动 worker 池 workers = [asyncio.create_task(worker(browser, url_queue, result_queue)) for _ in range(max_concurrent)] # 收集结果 results = [] for _ in range(len(urls)): result = await result_queue.get() results.append(result) # 等待所有 worker 结束 await asyncio.gather(*workers) await browser.close() return results

关键点解析：

new_context()：创建一个独立的浏览器上下文。每个上下文拥有独立的 cookies、本地存储和缓存，彼此隔离。这比为每个任务都launch一个新浏览器要轻量得多，也比所有任务共享同一个page更安全（避免状态污染）。
并发数 (max_concurrent)：这个数字不是越大越好。它受限于你的机器内存和 CPU。每个无头 Chrome 实例大约消耗 100-300MB 内存。对于普通台式机，5-10 个并发是安全的起点。你需要根据任务性质和硬件情况进行压测调整。
任务队列 (asyncio.Queue)：用于协调生产（待抓取URL）和消费（worker）任务，是控制并发流的标准模式。

5.2 反反爬虫策略与隐身技巧

许多网站会检测并屏蔽自动化脚本。browser39虽然模拟浏览器，但仍有特征可能被识别（如 WebDriver 属性、无头模式特征等）。以下是一些对抗措施：

使用有头模式：在调试或应对严格检测时，可以设置headless=False。一个真实的浏览器窗口更难被检测。
注入 Stealth 插件：有些库（如puppeteer-extra-plugin-stealth）可以抹去许多自动化指纹。检查browser39是否支持类似插件，或者手动在new_context时注入一些 JS 来覆盖navigator.webdriver等属性。
伪装 User-Agent 和 Viewport：使用常见的、真实的浏览器 UA 和窗口大小。

context = await browser.new_context( user_agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 ...", viewport={"width": 1920, "height": 1080} )

合理设置请求头：通过上下文或页面设置，添加Accept-Language,Referer等常见头。
使用代理 IP：对于大规模抓取，轮换代理 IP 是必须的，以避免 IP 被封。

context = await browser.new_context( proxy={"server": "http://your-proxy-server:port"} )

模拟人类行为：加入随机延迟（await asyncio.sleep(random.uniform(1, 3))）、随机移动鼠标轨迹（如果支持）、在输入时使用type带延迟而非fill。

重要提醒：请务必遵守目标网站的robots.txt协议，尊重对方的服务条款。自动化操作不应给目标网站服务器造成过大负担（控制请求频率）。这些技术应用于学习、测试或获取已公开且允许的数据。

5.3 调试与日志记录

自动化脚本出问题时，调试比普通代码更麻烦，因为你面对的是一个动态的、远程的浏览器环境。

截图与录屏：这是最直接的调试手段。

# 在出错时截图 try: await page.click(".non-existent-button") except Exception as e: await page.screenshot(path="error.png", full_page=True) raise e # 录屏（如果 browser39 支持） # await page.start_video(path="session.mp4") # ... 你的操作 ... # await page.stop_video()

保存页面状态：将出问题时的页面 HTML 保存下来，便于离线分析。

html_content = await page.content() with open("page_dump.html", "w", encoding="utf-8") as f: f.write(html_content)

启用详细日志：在启动浏览器时，可以开启 DevTools 协议日志或浏览器进程日志。

browser = await browser39.launch( headless=True, args=["--enable-logging", "--v=1"], # Chrome 日志参数 dumpio=True # 将浏览器进程的 stderr/stdout 重定向到你的程序 )

运行脚本时，注意观察控制台输出，可能会有网络错误、JS 错误的线索。

监听网络请求与响应：这对于理解数据加载流程、排查 API 调用问题至关重要。

async def log_request(request): print(f">> Request: {request.method} {request.url}") async def log_response(response): print(f"<< Response: {response.status} {response.url}") page.on("request", log_request) page.on("response", log_response)

6. 常见问题排查与实战案例

6.1 典型错误与解决方案速查表

问题现象	可能原因	解决方案
启动失败，提示找不到浏览器或驱动	1. 未安装 Chrome/Chromium。 2. 已安装的浏览器版本与驱动不匹配。 3. 浏览器安装路径不在系统 PATH 中。	1. 安装指定版本的 Chrome。 2. 使用`webdriver-manager`等工具自动管理驱动。 3. 在`launch`时通过`executable_path`参数指定浏览器可执行文件的绝对路径。
`wait_for_selector`超时	1. 选择器写错了，元素不存在。 2. 元素在 iframe 或 Shadow DOM 内。 3. 页面加载太慢，超时时间太短。 4. 元素是动态生成的，需要更特定的等待条件。	1. 在浏览器开发者工具中验证选择器。 2. 切换到正确的 frame 或使用 JS 穿透 Shadow DOM。 3. 增加`timeout`参数。 4. 改用`wait_for_function`等待更复杂的条件。
点击或输入无效	1. 元素被遮挡（如弹窗、其他元素）。 2. 元素不可交互（`disabled`,`readonly`）。 3. 页面有未处理的模态框（alert/confirm）。 4. 需要先触发其他事件（如 hover）才能激活。	1. 等待遮挡物消失或先关闭它。 2. 检查元素状态，或尝试用 JS 直接设置值 (`page.evaluate`)。 3. 监听并处理`dialog`事件。 4. 先执行`page.hover()`。
脚本运行慢，内存占用高	1. 未及时关闭页面和上下文。 2. 并发数过高。 3. 页面内资源（如图片、视频）自动加载。	1. 每个任务完成后，确保`page.close()`和`context.close()`。 2. 降低并发数，使用连接池。 3. 启动时设置`--blink-settings=imagesEnabled=false`禁用图片加载，或通过路由（Route）拦截不必要的资源请求。
被网站检测并屏蔽	浏览器自动化指纹被识别。	1. 使用有头模式。 2. 应用反检测插件或脚本。 3. 轮换 User-Agent 和代理。 4. 降低操作频率，模拟人类行为。

6.2 实战案例：抓取动态加载的商品列表

假设我们要抓取一个电商网站的商品列表，该列表是滚动加载的（无限滚动）。

import asyncio import browser39 import json async def scrape_infinite_scroll(page, scroll_selector="body", max_scrolls=10, scroll_delay=2000): """处理无限滚动页面""" items_set = set() # 用于去重 last_count = 0 scroll_attempts = 0 while scroll_attempts < max_scrolls: # 1. 滚动到底部 await page.evaluate(f"document.querySelector('{scroll_selector}').scrollTo(0, document.body.scrollHeight)") # 等待新内容加载 await asyncio.sleep(scroll_delay / 1000) # 转换为秒 # 2. 提取当前所有商品项的唯一标识（例如>browser = await browser39.launch( headless=True, args=[ "--disable-gpu", "--disable-dev-shm-usage", # 在 Docker 等受限环境有用 "--disable-setuid-sandbox", "--no-sandbox", # 注意：降低安全性，仅在信任的环境使用 "--disable-blink-features=AutomationControlled", # 尝试隐藏自动化特征 "--blink-settings=imagesEnabled=false" # 禁止加载图片 ] )

拦截不必要请求：图片、样式表、字体、媒体文件对于数据抓取通常是不需要的，拦截它们可以大幅提升加载速度并减少带宽。

async def route_handler(route, request): resource_type = request.resource_type if resource_type in ["image", "stylesheet", "font", "media"]: await route.abort() # 中止请求 else: await route.continue_() # 继续请求 await page.route("**/*", route_handler) # 为页面设置路由拦截

复用浏览器实例与上下文：绝对不要在每次任务中都launch和close浏览器。启动一个浏览器的开销是秒级的。应该在脚本开始时启动一个浏览器实例，然后在整个运行期间复用，通过创建和销毁context和page来处理不同任务。
监控与告警：在脚本中集成简单的资源监控和错误报告。记录每个任务的耗时、成功率。如果内存持续增长（可能发生了内存泄漏），可以设置一个阈值，定期重启浏览器实例。

浏览器自动化是一个强大的工具，alejandroqh/browser39这样的项目将其封装得更加易用。掌握其核心原理、熟练运用等待与选择器、善用并发与调试技巧，你就能高效地解决各种网页交互和数据获取的难题。记住，稳健的脚本来自于对细节的关注和对异常情况的充分处理。在实际项目中，多写日志、多做异常捕获、并始终对目标网站保持友好和尊重。

查看全文

http://www.jsqmd.com/news/767758/