当前位置：首页 > news >正文

构建智能应用生命周期编排器：从事件驱动到策略即代码的云原生自动化实践

news 2026/5/17 2:25:44

1. 项目概述：一个面向应用全生命周期的智能编排器

最近在梳理团队内部的CI/CD流程和运维自动化方案时，我一直在思考一个问题：我们是否过于依赖“工具链”的堆砌，而忽略了“流程”本身的智能化和连贯性？一个典型的应用，从代码提交、构建、测试、部署到上线后的监控、扩缩容、故障自愈，再到最终的版本回滚或下线，会经历数十个甚至上百个状态节点。这些节点通常由Jenkins、GitLab CI、ArgoCD、Prometheus、Kubernetes HPA等不同工具负责，它们之间通过Webhook或API进行简单的串联。这种模式带来了几个痛点：流程割裂（工具间数据不通）、状态分散（没有一个全局视图）、响应迟钝（事件驱动链条长，故障恢复慢），以及策略僵化（扩缩容、回滚规则固定，无法根据业务上下文动态调整）。

这正是sandeep-mewara/lifecycle-agent-orchestrator这个项目试图解决的核心问题。它不是一个替代现有工具的新工具，而是一个更高维度的“编排大脑”或“流程中枢”。你可以把它理解为一个专门为应用生命周期管理设计的“操作系统内核”或“中央调度器”。它的核心职责不是去执行具体的构建任务或部署动作，而是感知整个生命周期中的所有事件（如代码推送、测试失败、生产环境CPU飙升），理解当前应用所处的状态和上下文，然后决策并调度最合适的动作（如触发自动化测试、执行金丝雀发布、启动故障转移），最终驱动底层的Jenkins、K8s等“执行器”去完成工作。

简单来说，它让应用的生命周期从一串由“if-else”和“cron job”驱动的、僵硬的脚本流程，转变为一个由状态机、策略引擎和智能决策驱动的、动态的、自适应的有机体。这对于追求高可用、高自动化的云原生团队和运维平台开发者来说，具有极大的吸引力。接下来，我将深入拆解这个项目的设计思路、核心组件以及如何将其融入你的技术栈。

2. 核心架构与设计哲学解析

这个编排器的设计并非凭空而来，它融合了状态机、事件驱动架构、策略即代码以及智能体（Agent）等多种设计模式。理解其背后的哲学，比直接看代码更重要。

2.1 以“状态”为中心的生命周期模型

传统流程以“任务”为中心，关注“做什么”（do this, then do that）。而生命周期编排器则以“状态”为中心，关注“处于何境”（what is the current situation）。这是根本性的范式转变。

项目为每个应用维护一个精细化的状态模型。这个状态远不止“运行中”或“已停止”这么简单，它是一个多维度的集合，可能包括：

部署状态：开发、集成测试、预发布、生产、回滚中。
健康状态：健康、亚健康（如延迟升高）、不健康、未知。
业务状态：流量高峰、大促活动、日常运营。
变更状态：代码正在构建、镜像正在推送、正在进行金丝雀发布。

编排器持续从各个数据源（版本控制系统、CI系统、监控系统、K8s API）收集数据，来更新这个状态模型。所有的决策都基于这个最新的、统一的状态视图，而不是某个孤立的工具告警。这确保了决策依据的全面性和一致性。

2.2 事件驱动与智能体（Agent）协同

项目名称中的“Agent Orchestrator”点明了其核心运行机制。这里通常包含两类角色：

采集器Agent：这些是轻量级的、专注于特定数据源的代理。例如：
- Git Agent：监听代码仓库的push、merge request事件。
- Monitoring Agent：从Prometheus、Datadog拉取应用性能指标。
- Kubernetes Agent：监听Pod状态变化、HPA事件。它们负责将外部事件转化为编排器内部能理解的标准化事件（Event），并附带上下文数据。
执行器Agent：它们负责执行具体的动作。编排器做出决策后，会生成一个明确的指令（Action），由对应的执行器Agent接收并执行。例如：
- CI Agent：调用Jenkins API触发指定流水线。
- CD Agent：调用ArgoCD API同步应用或更新Helm Chart参数。
- Kubernetes Operator Agent：直接对K8s资源进行扩缩容、重启等操作。

编排器自身则作为协调者（Orchestrator），坐在中间。它接收来自采集器Agent的事件，根据当前应用状态和预定义的策略，决定是否需要响应、如何响应，然后调度相应的执行器Agent去完成任务。这种架构解耦了事件的产生、决策的制定和动作的执行，使得系统非常灵活和可扩展。

2.3 策略即代码与动态决策

“策略”是这个系统的大脑。最理想的实现方式是“策略即代码”。这意味着你的运维规则和流程逻辑，不再是配置界面上的复选框或YAML文件里的静态规则，而是一段可以版本控制、代码审查、测试的真实代码（通常使用一种领域特定语言DSL或通用语言如Python、JavaScript）。

例如，一个动态扩缩容策略可能不再是“CPU超过80%就扩容”，而是一段策略代码：

def scaling_policy(app_state, event): # 获取当前指标 cpu = app_state.metrics.cpu_usage qps = app_state.metrics.requests_per_second is_business_peak = app_state.business_context == ‘shopping_festival‘ # 动态决策逻辑 if is_business_peak: # 大促期间，更激进且考虑QPS if cpu > 70 or qps > app_state.capacity * 0.9: return Action(‘scale_out‘, replicas=‘+50%‘) else: # 日常期间，保守策略 if cpu > 85: return Action(‘scale_out‘, replicas=‘+2‘) elif cpu < 20 and app_state.replicas > 2: return Action(‘scale_in‘, replicas=‘-1‘) return None # 不采取行动

这种代码化的策略允许你实现极其复杂和场景化的逻辑，比如“只有在预发布环境测试通过且代码覆盖率大于90%时才允许部署到生产”，或者“如果数据库延迟同时升高，则优先告警而不是扩容应用”。

注意：策略引擎的复杂性和灵活性是一把双刃剑。过于复杂的策略可能带来难以调试和不可预测的风险。建议从简单的、确定性的策略开始，逐步迭代，并为所有策略编写单元测试。

3. 关键组件深度拆解与实操配置

理解了设计哲学，我们来看看如何搭建这样一个系统。虽然sandeep-mewara/lifecycle-agent-orchestrator可能是一个具体的代码实现，但其组件思想是通用的。我们可以基于开源生态来构建一个类似的架构。

3.1 事件总线的选型与集成

事件总线是整个系统的中枢神经系统，所有Agent都通过它来通信。选型至关重要。

Apache Kafka: 工业级标准，高吞吐、高可靠、持久化。适合大规模、对消息顺序和可靠性要求极高的场景。但运维复杂度较高。
NATS (特别是NATS JetStream): 云原生领域的热门选择，设计简单，性能极高，支持At-least-once和Exactly-once语义。与Go语言生态结合好，非常适合云原生环境。
Redis Pub/Sub: 实现简单，延迟极低。但消息是即时的，没有持久化，消费者离线会丢失消息。适合对可靠性要求不高的内部事件通知。
云服务商托管服务：如AWS EventBridge、Google Cloud Pub/Sub、Azure Event Grid。省去运维烦恼，天然与同云的其他服务集成。

实操建议：对于大多数团队，从NATS JetStream开始是一个平衡了性能、可靠性和复杂度的好选择。下面是一个使用NATS作为事件总线的简单架构配置示意：

部署NATS集群：可以使用Helm在K8s中快速部署。

helm repo add nats https://nats-io.github.io/k8s/helm/charts/ helm install my-nats nats/nats --set nats.jetstream.enabled=true

定义事件Schema：这是确保系统一致性的关键。使用Protocol Buffers或JSON Schema来定义所有事件的统一格式。

// 示例：代码推送事件Schema { “$schema”: “http://json-schema.org/draft-07/schema#“, “type”: “object“, “properties”: { “event_id”: { “type”: “string“ }, “event_type”: { “const”: “git.push“ }, “app_id”: { “type”: “string“ }, “repository”: { “type”: “string“ }, “branch”: { “type”: “string“ }, “commit_id”: { “type”: “string“ }, “timestamp”: { “type”: “string“, “format”: “date-time“ } }, “required”: [“event_type“, “app_id“, “repository“, “branch“] }

Agent连接总线：每个采集器和执行器Agent都需要作为客户端连接到NATS，订阅或发布到特定的主题（Subject），如events.git.>或actions.ci.trigger。

3.2 状态管理器的实现方案

状态管理器是编排器的“记忆”。它需要持久化存储每个应用的当前状态，并支持高并发读写。

存储选型：
- Redis: 天然适合做状态缓存，数据结构丰富（Hash, Sorted Set），性能极高。可以将应用ID作为Key，状态对象序列化后存储。配合Redis的持久化（AOF/RDB）可以保证状态不丢失。
- 关系型数据库 (如PostgreSQL): 适合状态结构非常复杂、需要复杂查询（如“找出所有健康状态为亚健康的生产应用”）的场景。利用其JSONB字段类型可以灵活存储状态对象。
- 云原生数据库 (如TiKV, etcd): 提供强一致性和高可用，但运维复杂度高，通常在内核级系统中使用。
状态更新策略：状态更新必须是原子性的，避免竞态条件。通常采用“读取-计算-写入”模式，并使用乐观锁（如Redis的WATCH/MULTI/EXEC，或数据库的版本号）来保证一致性。

实操示例（使用Redis）：

import redis import json import time class AppStateManager: def __init__(self, redis_client): self.redis = redis_client def update_state(self, app_id, event): # 使用Redis事务保证原子性 with self.redis.pipeline() as pipe: while True: try: # 1. 监听当前应用状态的key pipe.watch(f“app_state:{app_id}“) # 2. 获取旧状态 old_state_data = pipe.get(f“app_state:{app_id}“) old_state = json.loads(old_state_data) if old_state_data else {“version”: 0} # 3. 基于事件计算新状态（这是业务逻辑核心） new_state = self._compute_new_state(old_state, event) new_state[“version”] = old_state[“version”] + 1 new_state[“last_updated”] = time.time() # 4. 开始事务，更新状态 pipe.multi() pipe.set(f“app_state:{app_id}“, json.dumps(new_state)) # 5. 同时发布一个“状态变更”事件，供其他关心状态的组件订阅 pipe.publish(f“state_changed:{app_id}“, json.dumps({“new_state”: new_state, “trigger_event”: event})) pipe.execute() break # 更新成功，退出循环 except redis.WatchError: # 如果在此期间状态被其他进程修改，则重试 continue def _compute_new_state(self, old_state, event): # 这里是状态转换的核心逻辑 new_state = old_state.copy() if event[“type”] == “git.push“: new_state[“last_commit”] = event[“commit_id“] new_state[“deployment_status”] = “pending_build“ elif event[“type”] == “build.success“: new_state[“deployment_status”] = “ready_for_deploy“ new_state[“build_image”] = event[“image_url“] # ... 更多状态转换规则 return new_state

3.3 策略引擎的集成与实践

策略引擎是“大脑”。你可以选择集成成熟的开源引擎，也可以自己实现一个简单的规则引擎。

开源方案：
- OPA (Open Policy Agent): 云原生领域的策略引擎事实标准。使用Rego语言编写策略，功能强大，与Kubernetes、Envoy等集成极深。非常适合做授权、准入控制，也可用于生命周期策略。
- JSONLogic: 使用JSON格式定义逻辑规则，轻量级，易于理解和集成。适合逻辑相对简单的场景。
- Drools: 老牌Java规则引擎，功能全面，但较重。
自定义引擎：如果策略逻辑相对固定且不复杂，用自己熟悉的编程语言（Python、Go）实现一个规则解释器也是可行的，更轻量、更可控。

实操：集成OPA引擎

部署OPA：作为Sidecar或独立服务部署。

编写Rego策略：例如，一个自动回滚策略。

# policy/rollback.rego package lifecycle.automation default rollback_action = null # 如果生产环境应用错误率在5分钟内持续高于5%，且当前版本部署时间小于1小时，则触发回滚 rollback_action := { “type”: “trigger_rollback“, “target_app”: app.id, “to_version”: app.previous_stable_version } if { # 输入数据 app := input.app_state metrics := input.metrics # 策略条件 app.environment == “production“ metrics.error_rate > 0.05 metrics.sample_duration_minutes >= 5 time.now_ns() - app.current_deployment_time_ns < 3600*1e9 # 1小时 app.previous_stable_version != ““ }

编排器调用OPA：在需要决策时，编排器将当前应用状态和事件上下文作为input发送给OPA服务查询，OPA返回决策结果（如上述的rollback_action）。

4. 构建一个最小可行原型

理论说再多，不如动手搭一个。我们来构建一个针对“自动扩缩容”场景的MVP（最小可行产品）。

场景：当监控指标显示应用CPU使用率持续过高时，自动触发Kubernetes Deployment的扩容。

架构组件：

事件总线：NATS Server (带JetStream)。
采集器Agent：一个简单的Go程序，定期从Prometheus查询CPU指标，超过阈值则向NATS发布事件。
编排器（核心）：一个Python服务，订阅指标事件，持有状态并执行策略逻辑。
执行器Agent：一个Python客户端，接收扩容动作，调用Kubernetes API。
状态存储：Redis。

详细步骤：

4.1 部署基础设施

# 使用Docker Compose快速启动NATS和Redis version: ‘3.8‘ services: nats: image: nats:latest command: [“-js“] # 启用JetStream ports: - “4222:4222“ - “8222:8222“ # 管理端口 redis: image: redis:alpine ports: - “6379:6379“

4.2 实现采集器Agent (Prometheus Agent)

# prometheus_agent.py import asyncio import time import json from nats.aio.client import Client as NATS import aiohttp async def fetch_cpu_usage(app_name): # 模拟从Prometheus查询 prom_url = f“http://prometheus:9090/api/v1/query“ query = f‘rate(container_cpu_usage_seconds_total{{container=~“{app_name}“}}[5m])‘ async with aiohttp.ClientSession() as session: async with session.get(prom_url, params={‘query‘: query}) as resp: data = await resp.json() # 解析结果，返回CPU使用率 return float(data[‘data‘][‘result‘][0][‘value‘][1]) if data[‘data‘][‘result‘] else 0.0 async def main(): nc = NATS() await nc.connect(“nats://localhost:4222“) app_id = “my-app“ while True: cpu_usage = await fetch_cpu_usage(app_id) print(f“Current CPU for {app_id}: {cpu_usage}“) if cpu_usage > 0.7: # 阈值70% event = { “event_id”: f“metric_high_cpu_{int(time.time())}“, “event_type”: “metric.cpu.high“, “app_id”: app_id, “value”: cpu_usage, “timestamp”: time.time() } await nc.publish(“events.metric”, json.dumps(event).encode()) print(f“Published high CPU event: {event}“) await asyncio.sleep(60) # 每分钟检查一次 if __name__ == “__main__“: asyncio.run(main())

4.3 实现核心编排器

# orchestrator.py import asyncio import json import redis from nats.aio.client import Client as NATS from nats.aio.errors import ErrTimeout class LifecycleOrchestrator: def __init__(self, nats_url, redis_url): self.nc = NATS() self.redis = redis.from_url(redis_url) self.app_state_key = “app_state:{app_id}“ async def handle_metric_event(self, msg): data = json.loads(msg.data.decode()) app_id = data[‘app_id‘] event_type = data[‘event_type‘] # 1. 更新状态 current_state = self._get_app_state(app_id) # ... 更新状态逻辑，例如记录最近一次高CPU时间 current_state[‘last_high_cpu_time‘] = data[‘timestamp‘] self._save_app_state(app_id, current_state) # 2. 执行策略决策 action = self._policy_engine(app_id, current_state, data) if action: # 3. 发布动作指令 await self.nc.publish(f“actions.{action[‘type‘]}“, json.dumps(action).encode()) print(f“Orchestrator triggered action: {action}“) def _policy_engine(self, app_id, state, event): # 简单的策略：如果5分钟内触发两次高CPU事件，则扩容 high_cpu_times = state.get(‘recent_high_cpu_times‘, []) high_cpu_times.append(event[‘timestamp‘]) # 只保留最近5分钟的记录 five_min_ago = time.time() - 300 high_cpu_times = [t for t in high_cpu_times if t > five_min_ago] state[‘recent_high_cpu_times‘] = high_cpu_times self._save_app_state(app_id, state) if len(high_cpu_times) >= 2: return { “type”: “scale.out“, “app_id”: app_id, “increment”: 2 # 增加2个副本 } return None def _get_app_state(self, app_id): data = self.redis.get(self.app_state_key.format(app_id=app_id)) return json.loads(data) if data else {} def _save_app_state(self, app_id, state): self.redis.set(self.app_state_key.format(app_id=app_id), json.dumps(state)) async def run(self): await self.nc.connect(“nats://localhost:4222“) # 订阅所有指标事件 await self.nc.subscribe(“events.metric.>“, cb=self.handle_metric_event) print(“Orchestrator is listening for events...“) await asyncio.Future() # 永久运行 if __name__ == “__main__“: orchestrator = LifecycleOrchestrator(“nats://localhost:4222“, “redis://localhost:6379“) asyncio.run(orchestrator.run())

4.4 实现执行器Agent (Kubernetes执行器)

# k8s_executor_agent.py import asyncio import json from kubernetes import client, config from nats.aio.client import Client as NATS config.load_kube_config() # 或使用 in_cluster_config apps_v1 = client.AppsV1Api() async def handle_scale_action(msg): data = json.loads(msg.data.decode()) if data[‘type‘] != ‘scale.out‘: return app_id = data[‘app_id‘] increment = data.get(‘increment‘, 1) # 1. 获取当前Deployment deployment_name = f“deployment-{app_id}“ # 假设命名规则 try: dep = apps_v1.read_namespaced_deployment(deployment_name, “default“) # 2. 修改副本数 dep.spec.replicas += increment # 3. 更新Deployment apps_v1.patch_namespaced_deployment(deployment_name, “default“, dep) print(f“Successfully scaled out {app_id} by {increment} replicas.“) except client.exceptions.ApiException as e: print(f“Failed to scale {app_id}: {e}“) async def main(): nc = NATS() await nc.connect(“nats://localhost:4222“) await nc.subscribe(“actions.scale.out“, cb=handle_scale_action) print(“K8s Executor Agent is listening for scale actions...“) await asyncio.Future() if __name__ == “__main__“: asyncio.run(main())

运行以上四个组件，你就得到了一个能自动根据CPU指标扩容的、最简单的生命周期编排系统原型。虽然简陋，但它完整演示了事件驱动、状态管理、策略决策和动作执行的闭环。

5. 生产级考量与避坑指南

从一个原型到一个稳定可靠的生产系统，还有很长的路要走。以下是我在构建类似系统时总结的关键经验和常见陷阱。

5.1 可靠性设计：至少一次与恰好一次处理

事件处理中的消息传递语义至关重要。

至少一次（At-least-once）：这是最低要求，确保事件不丢失。可以通过消息总线的持久化和消费者的ACK机制实现。在NATS JetStream中，需要创建Durable Consumer并手动确认消息。

# 创建持久化消费者 await js.add_stream(name=“EVENTS“, subjects=[“events.>“]) await js.add_consumer(“EVENTS“, durable_name=“orchestrator-consumer“) # 处理消息并手动ACK async def cb(msg): try: await process_message(msg.data) await msg.ack() # 处理成功才确认 except Exception as e: await msg.nak() # 处理失败，让服务器重发 log.error(f“Process failed: {e}“)

恰好一次（Exactly-once）：这是理想状态，确保事件既不丢失也不重复处理。在分布式系统中实现成本很高。一个实用的折中方案是幂等性处理。让事件处理器具备幂等性，即使收到重复事件，效果也是一样的。通常通过事件ID去重来实现。

# 在状态管理器或数据库中维护一个已处理事件ID集合 def is_event_processed(event_id): return redis.sismember(“processed_events“, event_id) def mark_event_processed(event_id): redis.sadd(“processed_events“, event_id) # 可以设置过期时间，避免集合无限膨胀 redis.expire(“processed_events“, 86400)

5.2 可观测性与调试

当自动化系统做出错误决策时，调试会非常困难。必须建立强大的可观测性。

结构化日志：每个组件（Agent、Orchestrator）都必须输出结构化的JSON日志，包含event_id、app_id、action_id、trace_id等关联字段，方便用ELK或Loki进行聚合查询。
分布式追踪：为每个外部触发的事件（如Git Push）生成一个唯一的trace_id，并让这个ID在所有后续的内部事件、状态更新、动作指令中传递。这样可以在Jaeger或Zipkin中完整看到一个生命周期请求的完整路径。
决策审计：将所有策略引擎的输入（状态、事件）、输出（决策结果）以及最终执行的动作，持久化到审计日志或专门的数据库中。这是事后复盘和优化策略的黄金数据。

5.3 策略的灰度发布与回滚

策略即代码，意味着它也需要像业务代码一样进行版本控制和CI/CD。

策略仓库：使用Git单独管理策略文件（.rego, .jsonlogic, .py）。
策略测试：建立策略的单元测试和集成测试套件。模拟各种应用状态和事件，验证策略输出是否符合预期。
灰度发布：不要一次性将所有应用的策略都升级到新版本。可以通过在策略中增加条件，例如if app_id in [‘canary-app-1‘, ‘canary-app-2‘]，让新策略只对少数金丝雀应用生效。观察其决策和行为一段时间，确认无误后再全量推广。
快速回滚：策略仓库的每个提交都应该对应一个可快速回滚的版本。当发现新策略导致异常时，能立即切回上一个稳定版本。

5.4 安全与权限控制

自动化意味着更高的权限，安全至关重要。

最小权限原则：每个Agent和编排器自身都应该使用独立的、权限最小的服务账户或API Token。执行器Agent的权限应严格限定在它需要操作的目标资源上（如只能对特定Namespace的Deployment进行扩容）。
动作审批流程：并非所有动作都应全自动。对于高风险操作（如生产环境全量发布、数据库Schema变更），编排器在做出决策后，不应直接执行，而应生成一个“待审批动作”，发送到审批系统（如钉钉、企业微信、Jira）或ChatOps工具（如Slack），等待人工确认后再执行。
秘密管理：所有连接外部系统（Git、K8s、云平台）的凭证，必须从安全的秘密存储器（如HashiCorp Vault、AWS Secrets Manager、K8s Secrets）中动态获取，绝不能硬编码在配置文件中。

6. 进阶场景与扩展思路

当基础的生命周期自动化稳定运行后，可以考虑向更智能、更前瞻性的方向演进。

6.1 与ChatOps集成：人机协同

将编排器与Slack、钉钉、飞书等聊天工具集成，实现ChatOps。

通知与告警：将重要的状态变更和决策动作推送到指定频道。
人工干预：在聊天工具中，通过简单的命令触发编排器执行特定动作，如/deploy app-name to production，或/rollback app-name。
查询状态：通过命令如/status app-name，让编排器返回应用的实时状态视图。这极大地提升了运维的交互效率和透明度。

6.2 预测性伸缩与成本优化

结合机器学习，从反应式自动化走向预测式自动化。

历史数据训练：收集历史流量（QPS）、业务指标（订单数）、资源使用率（CPU、内存）以及外部事件（节假日、营销活动）数据。
预测模型：训练时间序列预测模型（如Prophet、LSTM），预测未来一段时间内的资源需求。
策略增强：编排器的策略引擎在决策时，不仅看当前指标，也参考预测结果。例如，预测到一小时后有流量洪峰，可以提前缓慢扩容，避免临时扩容不及时导致的雪崩。也可以在预测到业务低峰期时，更积极地缩容以节省成本。

6.3 多集群与混合云编排

对于拥有多个Kubernetes集群（不同区域、不同环境、甚至不同云厂商）的团队，编排器可以升级为全局调度器。

统一状态视图：编排器需要维护跨集群的应用状态。这要求每个集群都有一个“集群Agent”负责上报状态和接收指令。
全局策略：策略可以基于全局状态制定。例如，“如果A区域集群负载过高，且B区域集群有空闲资源，则将部分应用实例调度到B区域”。
故障转移：当监控到某个集群整体不可用时，编排器可以自动将关键应用的生命周期管理（如重新部署、扩缩容）切换到备援集群。这实现了真正意义上的应用高可用和云容灾。

构建一个成熟的生命周期智能编排器是一个渐进式的旅程。我的建议是，从一个小而具体的痛点场景开始（比如自动扩缩容），搭建MVP，让团队感受到价值。然后，逐步扩展事件源和动作类型（加入代码推送触发构建、测试失败阻断部署）。接着，深化策略的复杂性（实现金丝雀发布、蓝绿部署自动化）。最后，再考虑引入预测、多集群等高级特性。在整个过程中，可观测性、安全性和可靠性是必须从一开始就筑牢的基石。这个系统最终会成为你运维体系中最核心的“智能驾驶舱”，让团队从繁琐重复的日常操作中解放出来，专注于更有价值的工程和创新工作。

查看全文

http://www.jsqmd.com/news/831945/