当前位置：首页 > news >正文

Python+Selenium实现今日头条自动发文：从原理到实战的完整指南

news 2026/7/4 18:24:55

1. 项目概述与核心价值

如果你是一个自媒体运营者、内容创作者，或者是一个对自动化技术感兴趣的开发者，那么“批量发文”这个需求你一定不陌生。每天手动登录后台、复制粘贴、上传图片、设置标签、点击发布，这套流程不仅枯燥重复，还极其消耗时间。尤其是在管理多个账号或者需要定时发布大量内容时，手动操作几乎是不可能完成的任务。今天，我就来分享一个我实际开发并稳定运行了半年多的自动化方案：使用 Python 和 Selenium 实现今日头条的自动发文。

这个项目的核心价值非常直接：解放双手，提升效率。通过编写一个脚本，你可以将一篇准备好的文章（包括标题、正文、图片、标签）全自动地发布到今日头条的后台。想象一下，你可以提前准备好一周甚至一个月的内容，然后让脚本在凌晨自动发布，而你只需要在白天检查一下数据反馈即可。这对于需要保持日更频率的自媒体账号来说，简直是“降维打击”。我当初就是为了解决自己手头几个账号的运营压力，才决定动手搞这个自动化工具。在开发过程中，我踩遍了几乎所有能踩的坑，从环境配置、元素定位到反爬对抗、异常处理，每一个环节都交过“学费”。这篇文章，我会把这些经验教训掰开揉碎了讲清楚，并附上我优化后的完整源码，让你能直接上手，避开我走过的弯路。

2. 技术选型与工具准备

为什么选择 Python + Selenium 这个组合？这背后有非常实际的考量。首先，今日头条的后台是一个标准的 Web 应用，所有操作（登录、编辑、上传、发布）都是通过浏览器完成的。Selenium 的核心能力就是模拟真实用户在浏览器中的操作，比如点击、输入、滚动等，这完美契合了我们的需求。其次，Python 语言语法简洁，生态丰富，有大量成熟的库可以辅助我们处理文本、图片、定时任务等。相比其他方案，比如直接调用未公开的 API（风险高且不稳定）或者使用桌面自动化工具（如 PyAutoGUI，对界面变化过于敏感），Selenium 的方案在稳定性和可维护性上找到了一个很好的平衡点。

注意：任何自动化工具的使用都必须遵守平台的服务条款。本方案仅用于学习和技术交流，以及个人账号的合规效率提升，严禁用于恶意刷量、 spam 等违规行为，否则可能导致账号被封禁。

接下来，我们来看看需要准备哪些工具。我把它们分为三类：核心库、浏览器驱动和辅助工具。

2.1 核心 Python 库安装

你需要一个 Python 环境（建议 3.7 及以上版本）。然后通过 pip 安装以下核心库：

pip install selenium pip install pillow # 用于图片处理 pip install schedule # 用于定时任务（可选） pip install python-dotenv # 用于管理配置文件（推荐）

Selenium: 自动化操作的基石。
Pillow (PIL): 我们上传的图片可能需要调整尺寸或格式，Pillow 是处理这类任务的标准库。
Schedule: 如果你想实现定时自动发布（例如每天上午9点），这个轻量级的库非常方便。
Python-dotenv: 将账号、密码等敏感信息从代码中分离，存储在一个.env文件里，更安全、更易于管理。

2.2 浏览器与驱动配置

Selenium 需要对应的浏览器驱动才能工作。我强烈推荐使用Chrome 浏览器和ChromeDriver，因为它们的兼容性和社区支持最好。

安装 Chrome 浏览器：确保你安装了较新版本的 Chrome。
下载 ChromeDriver：访问 ChromeDriver 官网，下载与你的 Chrome 浏览器版本号匹配的驱动。你可以通过在 Chrome 地址栏输入chrome://version/查看你的 Chrome 版本。
配置驱动路径：将下载的chromedriver.exe(Windows) 或chromedriver(Mac/Linux) 文件放在一个固定的目录，并将该目录添加到系统的环境变量PATH中。或者，你也可以在代码中直接指定驱动文件的绝对路径，这是我更推荐的方式，因为更可控。

2.3 开发环境与调试工具

一个好的开发环境能事半功倍。我使用VS Code或PyCharm进行开发。这里特别提一下浏览器开发者工具（按 F12 打开），它是我们定位页面元素的“眼睛”。我们需要熟练使用“检查”功能，来获取按钮、输入框等元素的id,name,class,xpath或css selector。Selenium 正是通过这些定位器来找到并操作元素的。

3. 项目核心思路与流程拆解

在开始写代码之前，我们必须把整个自动发布的流程想清楚。不能一上来就对着登录按钮写click()，那样代码会很快变得混乱且难以维护。我的思路是将整个流程模块化，每个模块负责一个清晰的、独立的功能。

整个自动发文流程可以拆解为以下六个核心步骤，它们形成了一个清晰的流水线：

环境启动与登录：启动浏览器，打开头条后台登录页，输入账号密码完成登录。这里最大的挑战是登录验证码和可能出现的滑块验证。
导航至发文编辑器：登录成功后，需要准确地点击或跳转到文章发布页面。
填充文章内容：在编辑器中，自动输入文章标题、正文内容。这里要处理富文本编辑器可能带来的输入问题。
上传与处理图片：将本地图片文件上传到编辑器。需要处理文件选择对话框，以及图片上传成功后的等待。
设置文章属性：选择文章分类、添加标签、设置封面等。
提交发布与状态确认：点击发布按钮，并等待页面跳转或出现成功提示，以确认发布成功。最后，妥善关闭浏览器，释放资源。

基于这个流程，我们的代码结构也应该与之对应。我会创建一个主类，比如叫做ToutiaoAutoPublisher，然后为每个步骤编写对应的方法。这样的好处是逻辑清晰，当某个步骤出错时（比如登录失败），我们可以快速定位问题，也方便后续维护和功能扩展（比如增加视频发布功能）。

4. 核心代码模块详解与避坑指南

现在，我们进入最核心的部分，逐一拆解每个模块的代码实现，并分享我踩过的坑和解决方案。我会先给出代码片段，然后解释关键点和注意事项。

4.1 驱动初始化与浏览器设置

这是所有操作的起点。一个稳定的浏览器实例是成功的一半。

from selenium import webdriver from selenium.webdriver.chrome.options import Options from selenium.webdriver.chrome.service import Service import time class ToutiaoAutoPublisher: def __init__(self, driver_path, headless=False): """ 初始化浏览器驱动 :param driver_path: chromedriver 的绝对路径 :param headless: 是否使用无头模式（不显示浏览器界面） """ chrome_options = Options() # 添加常用选项以绕过一些检测和优化体验 chrome_options.add_argument('--disable-blink-features=AutomationControlled') chrome_options.add_experimental_option("excludeSwitches", ["enable-automation"]) chrome_options.add_experimental_option('useAutomationExtension', False) # 无头模式设置，适合在服务器上运行 if headless: chrome_options.add_argument('--headless') chrome_options.add_argument('--disable-gpu') chrome_options.add_argument('--window-size=1920,1080') # 无头模式必须指定窗口大小 # 防止被检测为自动化工具的核心设置 chrome_options.add_argument('--disable-dev-shm-usage') chrome_options.add_argument('--no-sandbox') # 初始化服务和服务 service = Service(executable_path=driver_path) self.driver = webdriver.Chrome(service=service, options=chrome_options) # 执行CDP命令，隐藏webdriver属性 self.driver.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument', { 'source': ''' Object.defineProperty(navigator, 'webdriver', { get: () => undefined }) ''' }) # 设置隐式等待，全局生效 self.driver.implicitly_wait(10) self.wait = WebDriverWait(self.driver, 15) # 显式等待，更灵活 def quit(self): """关闭浏览器""" if self.driver: self.driver.quit()

关键点与避坑指南：

驱动路径：使用Service类来指定chromedriver路径是现代 Selenium 的推荐做法，比旧版的executable_path参数更清晰。
反爬对抗：今日头条等大型网站通常有反爬机制，会检测navigator.webdriver属性。我们通过excludeSwitches和 CDP 命令来隐藏这个属性，这是避免被识别为自动化脚本的关键一步。
无头模式 (Headless)：在服务器或后台运行时，不需要图形界面，可以开启无头模式节省资源。但请注意：无头模式下的页面渲染和行为可能与有界面模式略有不同，有时会遇到元素定位失败的问题。建议开发调试时关闭无头模式，稳定后再开启。
等待策略：implicitly_wait是隐式等待，设置后对所有的find_element操作都生效。WebDriverWait是显式等待，可以针对某个特定条件（如元素可点击、元素出现）进行更精确的控制。混合使用是最佳实践：隐式等待设一个较短时间作为兜底，复杂操作用显式等待。

4.2 登录模块的实现与验证码处理

登录是第一个难关，也是最容易失败的地方。

def login(self, username, password): """ 登录今日头条后台 """ login_url = "https://mp.toutiao.com/login/" self.driver.get(login_url) time.sleep(2) # 等待页面加载 # 方式一：可能通过账号密码直接输入（有时会跳转到扫码登录） try: # 尝试找到账号密码输入框 username_input = self.wait.until( EC.presence_of_element_located((By.NAME, "user")) ) password_input = self.driver.find_element(By.NAME, "password") username_input.clear() username_input.send_keys(username) time.sleep(0.5) password_input.clear() password_input.send_keys(password) time.sleep(0.5) # 找到登录按钮并点击 login_btn = self.driver.find_element(By.XPATH, "//button[@type='submit']") login_btn.click() except Exception as e: print(f"未找到传统登录框，可能需扫码或验证码: {e}") # 方式二：处理扫码登录（更常见） # 通常页面会有一个二维码，我们需要人工干预或使用更复杂的方案 print("请手动扫描页面二维码完成登录...") input("登录成功后，按回车键继续...") # 等待登录成功，跳转到主页 try: self.wait.until(EC.url_contains("mp.toutiao.com/profile_v4")) print("登录成功！") time.sleep(3) # 等待页面完全稳定 except TimeoutException: print("登录超时或失败，请检查网络或账号状态。") # 这里可以截图保存现场，便于排查 self.driver.save_screenshot('login_failed.png') raise

关键点与避坑指南：

登录方式多变：今日头条后台的登录方式可能会变化，有时是账号密码，有时强制扫码，有时还会出现滑块验证。上面的代码提供了两种情况的处理思路。最稳妥的方式是扫码登录，虽然需要一次人工干预，但避免了处理复杂验证码的麻烦。你可以让脚本停在这里，等你手动扫码登录后再继续执行。
异常处理与截图：登录环节异常率高，一定要用try...except包裹，并在失败时保存截图 (save_screenshot)。这张图能告诉你当时页面是什么状态，是定位错了还是出现了验证码。
等待与休眠：time.sleep要谨慎使用，它会让脚本无条件等待固定时间，效率低。但在页面跳转、登录状态切换这种“里程碑”式的事件后，适当的sleep可以让页面元素和 JavaScript 稳定下来，避免后续操作找不到元素。通常与WebDriverWait结合使用。

4.3 导航至发文编辑器

登录成功后，我们需要找到“发布文章”的入口。

def goto_editor(self): """导航到文章发布编辑器页面""" # 方法1：直接访问发文编辑器的URL（最稳定） editor_url = "https://mp.toutiao.com/article_publish" self.driver.get(editor_url) time.sleep(3) # 方法2：通过点击页面上的按钮（如果直接URL不可用） # try: # publish_btn = self.wait.until( # EC.element_to_be_clickable((By.XPATH, "//span[contains(text(),'发布')]/..")) # ) # publish_btn.click() # time.sleep(2) # article_item = self.driver.find_element(By.XPATH, "//div[contains(text(),'发布文章')]") # article_item.click() # time.sleep(3) # except Exception as e: # print(f"通过按钮导航失败: {e}") # # 回退到直接访问URL # self.driver.get(editor_url) # 等待编辑器核心元素加载完成 try: self.wait.until( EC.presence_of_element_located((By.XPATH, "//div[@role='textbox']")) ) print("已成功进入文章编辑器。") except TimeoutException: print("进入编辑器超时，可能页面结构已变化。") self.driver.save_screenshot('editor_load_failed.png') raise

关键点与避坑指南：

直接访问 URL：如果知道发文页面的固定 URL，直接get过去是最可靠的方式，省去了中间点击的步骤。你需要通过手动操作一次，从浏览器地址栏复制这个链接。
备用方案：直接 URL 有时会变，或者需要特定的登录状态。因此，准备一个通过界面按钮点击的备用方案是很有必要的。代码中提供了注释掉的示例。
确认到达：导航后，一定要用一个关键元素的出现来确认我们真的到达了编辑器页面。这里我用的是role='textbox'的富文本编辑器 div。这个定位器需要你通过开发者工具去确认。

4.4 填充文章标题与正文

这是内容填充的核心。头条的编辑器可能是一个复杂的富文本组件。

def fill_content(self, title, content, images_paths=None): """ 填充文章标题和正文 :param title: 文章标题 :param content: 文章正文（纯文本或带简单HTML标签） :param images_paths: 图片路径列表，用于在正文中插入图片 """ # 1. 填充标题 try: # 标题输入框可能有多种定位方式，需要观察页面 title_input = self.wait.until( EC.presence_of_element_located((By.XPATH, "//textarea[@placeholder='请输入标题']")) ) title_input.clear() # 不要一次性send_keys，模拟人工输入，避免触发异常检测 for char in title: title_input.send_keys(char) time.sleep(0.05) # 轻微延迟，模拟人打字 print(f"标题填充完成: {title}") except Exception as e: print(f"填充标题失败: {e}") # 尝试其他可能的定位器 title_input = self.driver.find_element(By.TAG_NAME, "textarea") title_input.send_keys(title) time.sleep(1) # 2. 填充正文 try: # 定位到正文编辑区域（一个可编辑的div） editor_div = self.driver.find_element(By.XPATH, "//div[@role='textbox']") # 先点击激活编辑器 editor_div.click() time.sleep(0.5) # 方法A：直接发送文本（适用于纯文本） # editor_div.send_keys(content) # 方法B：使用JavaScript直接设置innerHTML（适用于带格式的内容，更高效） # 这是关键技巧！可以绕过富文本编辑器的一些输入限制 js_script = f""" arguments[0].innerHTML = `{content}`; """ self.driver.execute_script(js_script, editor_div) print("正文内容已填充。") except Exception as e: print(f"填充正文失败: {e}") self.driver.save_screenshot('fill_content_failed.png') raise # 3. 处理图片（如果有） if images_paths: self._upload_images(images_paths, editor_div)

关键点与避坑指南：

标题输入：有些网站会对快速的、非人类的输入进行检测。使用for char in title循环并加入微小延迟，可以更好地模拟真人输入，降低被拦截的风险。
正文输入的“黑科技”：富文本编辑器（如头条用的可能是自研或基于 Quill 等库）直接使用send_keys输入可能会很慢，或者格式错乱。最有效的方法是使用execute_script直接修改 DOM 元素的innerHTML。你可以提前将你的正文内容（包括<p>、<br>等简单 HTML 标签）准备好，一次性注入。这速度快，且格式控制精准。
定位器的灵活性：页面的 HTML 结构可能会更新。//textarea[@placeholder='请输入标题']是一个利用 placeholder 文本的定位方式，通常比较稳定。但如果失效，要有备用方案，比如用find_element(By.TAG_NAME, “textarea”)，虽然可能找到多个，但通常第一个就是标题框。

4.5 图片上传的难点攻克

图片上传是另一个重灾区，因为涉及到系统级的文件选择对话框。

def _upload_images(self, image_paths, editor_element): """在编辑器中上传并插入图片""" for img_path in image_paths: try: # 1. 找到图片上传按钮（通常是一个“图片”图标） # 需要根据实际页面图标定位，这里用常见的SVG路径或class举例 pic_button = self.wait.until( EC.element_to_be_clickable((By.XPATH, "//svg[@data-icon='picture']/..")) ) pic_button.click() time.sleep(1) # 2. 在弹出的上传区域，找到文件输入 input[type='file'] # 这个input通常被隐藏，但Selenium可以直接操作 file_input = self.driver.find_element(By.XPATH, "//input[@type='file']") # 关键！使用send_keys发送图片的绝对路径 file_input.send_keys(os.path.abspath(img_path)) print(f"开始上传图片: {img_path}") # 3. 等待图片上传完成并插入编辑器 # 通常上传成功后，页面会有变化，比如一个loading图标消失，或者图片缩略图出现 # 这里需要根据实际页面找一个“上传完成”的标志 self.wait.until( EC.invisibility_of_element_located((By.CLASS_NAME, "upload-loading")) # 假设的loading类名 ) time.sleep(2) # 额外等待，确保图片插入编辑器 print(f"图片上传并插入成功: {img_path}") except Exception as e: print(f"上传图片 {img_path} 时出错: {e}") # 记录错误，但可能继续尝试下一张 continue

关键点与避坑指南：

文件输入框：网页上的文件上传功能，本质是一个<input type=”file”>元素。即使它在页面上不可见（display: none），Selenium 也能通过send_keys(文件路径)将本地文件路径“注入”进去，从而触发上传。这是处理文件上传的标准且最可靠的方法。
绝对路径：send_keys中的图片路径必须使用绝对路径。使用os.path.abspath()进行转换是个好习惯。
等待上传完成：上传需要时间，必须等待。不能点击上传后立刻进行下一步操作。等待的标志可以是某个“上传中”的 loading 元素消失，或者图片的预览图出现。你需要通过开发者工具观察上传过程中的页面变化，找到合适的等待条件。盲目使用time.sleep(10)是不可靠的，因为网络速度不同。
异常处理：单张图片上传失败不应导致整个任务崩溃。用try...except包裹每次上传，记录错误并继续，保证脚本的健壮性。

4.6 设置标签与封面并发布

最后一步，设置文章属性并点击发布。

def set_attributes_and_publish(self, tags=None, cover_image_path=None): """ 设置标签、封面，并发布文章 :param tags: 标签列表，如 ['Python', '技术', '自动化'] :param cover_image_path: 封面图片路径 """ # 1. 设置标签 if tags: try: # 找到标签输入框 tag_input = self.wait.until( EC.presence_of_element_located((By.XPATH, "//input[@placeholder='请输入标签']")) ) for tag in tags: tag_input.clear() tag_input.send_keys(tag) time.sleep(0.5) # 通常输入后需要按回车确认标签 tag_input.send_keys(Keys.ENTER) time.sleep(0.5) print(f"标签设置完成: {tags}") except Exception as e: print(f"设置标签失败: {e}") # 2. 设置封面（如果需要） if cover_image_path: try: # 点击“设置封面”按钮 cover_btn = self.driver.find_element(By.XPATH, "//div[contains(text(),'设置封面')]") cover_btn.click() time.sleep(1) # 在弹窗中找到文件上传input cover_file_input = self.driver.find_element(By.XPATH, "//div[@role='dialog']//input[@type='file']") cover_file_input.send_keys(os.path.abspath(cover_image_path)) print(f"开始上传封面: {cover_image_path}") # 等待封面上传完成 time.sleep(3) # 点击“确定”或“完成”按钮 confirm_btn = self.driver.find_element(By.XPATH, "//span[contains(text(),'确定')]/..") confirm_btn.click() time.sleep(1) except Exception as e: print(f"设置封面失败: {e}") # 3. 点击发布按钮 try: # 发布按钮可能有两个阶段：“发布”和“确认发布” publish_btn = self.wait.until( EC.element_to_be_clickable((By.XPATH, "//button/span[contains(text(),'发布')]/..")) ) publish_btn.click() time.sleep(2) # 处理可能的二次确认弹窗 confirm_btn = self.driver.find_element(By.XPATH, "//button/span[contains(text(),'确认发布')]/..") confirm_btn.click() # 等待发布成功提示 self.wait.until( EC.presence_of_element_located((By.XPATH, "//*[contains(text(), '发布成功') or contains(text(), '审核中')]")) ) print("文章发布指令提交成功！") time.sleep(5) # 等待页面跳转或稳定 except TimeoutException: print("发布成功提示未出现，但可能已提交。") except Exception as e: print(f"点击发布按钮时出错: {e}") self.driver.save_screenshot('publish_failed.png') raise

关键点与避坑指南：

标签输入：输入标签后，通常需要按Keys.ENTER来将输入的词变成一个标签块。观察手动操作时的交互方式。
封面设置：封面设置通常是一个独立的弹窗（role=’dialog’），在里面同样用input[type=’file’]的方式上传图片。操作完成后，别忘了关闭弹窗。
发布确认：发布按钮点击后，经常会出现一个二次确认的弹窗。代码需要处理这个流程。定位“确认发布”按钮时，XPath 可以更精确一些，比如//button/span[contains(text(),’确认发布’)]/..。
成功判定：发布成功后，页面可能会跳转，或者出现“发布成功”、“文章进入审核”等提示。用WebDriverWait等待这些提示元素的出现，作为发布成功的依据。如果超时未出现，也不一定代表失败，可能是提示方式变了，可以结合截图和后续的页面 URL 来判断。

5. 完整源码整合与使用示例

将上述所有模块整合起来，并添加主函数和配置管理，就形成了完整的脚本。这里我提供一个高度整合、便于使用的版本。

# toutiao_auto_publish.py import os import time from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.chrome.options import Options from selenium.webdriver.chrome.service import Service from selenium.common.exceptions import TimeoutException, NoSuchElementException from dotenv import load_dotenv import schedule # 可选，用于定时任务 class ToutiaoAutoPublisher: def __init__(self, driver_path, headless=False): # ... 初始化代码同上 ... pass def login(self, username, password): # ... 登录代码同上 ... pass def goto_editor(self): # ... 导航代码同上 ... pass def fill_content(self, title, content, images_paths=None): # ... 填充内容代码同上 ... pass def _upload_images(self, image_paths, editor_element): # ... 上传图片代码同上 ... pass def set_attributes_and_publish(self, tags=None, cover_image_path=None): # ... 设置属性并发布代码同上 ... pass def publish_article(self, title, content, images=None, tags=None, cover=None): """发布单篇文章的完整流程""" print(f"开始发布文章: {title}") try: self.goto_editor() self.fill_content(title, content, images) self.set_attributes_and_publish(tags, cover) print(f"文章《{title}》发布流程执行完毕。") return True except Exception as e: print(f"发布文章《{title}》时发生严重错误: {e}") self.driver.save_screenshot(f'error_{int(time.time())}.png') return False def quit(self): # ... 退出代码同上 ... pass # 主函数与配置示例 if __name__ == "__main__": # 1. 加载配置（推荐使用.env文件管理敏感信息） load_dotenv() DRIVER_PATH = os.getenv("CHROMEDRIVER_PATH", "C:/path/to/your/chromedriver.exe") # 你的驱动路径 USERNAME = os.getenv("TOUTIAO_USERNAME") PASSWORD = os.getenv("TOUTIAO_PASSWORD") # 2. 文章内容准备 article_title = "Python自动化实战：用Selenium解放你的双手" article_content = """ <p>在当今内容为王的时代，持续输出高质量文章是自媒体运营者的核心任务。然而，重复的手动发布操作耗时耗力。本文将详细介绍如何使用Python和Selenium库，构建一个今日头条自动发文机器人。</p> <p><strong>核心优势：</strong></p> <ul> <li>全自动完成登录、编辑、上传、发布全流程。</li> <li>支持定时批量发布，实现“无人值守”。</li> <li>代码结构清晰，易于维护和扩展。</li> </ul> <p>下面，我们来看看具体实现。</p> """ image_list = ["./images/cover1.jpg", "./images/demo1.png"] # 正文图片路径列表 article_tags = ["Python", "Selenium", "自动化", "技术分享"] cover_image = "./images/cover.jpg" # 封面图片路径 # 3. 执行发布 publisher = ToutiaoAutoPublisher(driver_path=DRIVER_PATH, headless=False) # 调试时关闭无头模式 try: publisher.login(USERNAME, PASSWORD) success = publisher.publish_article( title=article_title, content=article_content, images=image_list, tags=article_tags, cover=cover_image ) if success: print("本次发布任务成功完成！") else: print("本次发布任务执行中遇到问题。") finally: # 确保浏览器被关闭 time.sleep(5) # 发布后稍作停留，观察结果 publisher.quit() # 4. 定时任务示例（可选） # def job(): # publisher = ToutiaoAutoPublisher(driver_path=DRIVER_PATH, headless=True) # publisher.login(USERNAME, PASSWORD) # # ... 准备多篇文章数据 ... # publisher.publish_article(...) # publisher.quit() # schedule.every().day.at("09:30").do(job) # while True: # schedule.run_pending() # time.sleep(60)

如何使用这个脚本：

将上面的完整代码保存为toutiao_auto_publish.py。

在项目根目录创建.env文件，填入你的配置：

CHROMEDRIVER_PATH=你的chromedriver绝对路径 TOUTIAO_USERNAME=你的头条号 TOUTIAO_PASSWORD=你的密码

准备好你的文章内容（标题、带HTML标签的正文）、图片文件。
修改if __name__ == “__main__”:下面的内容，替换成你的文章数据。
运行脚本python toutiao_auto_publish.py。

6. 常见问题排查与实战心得

即使有了完整的代码，在实际运行中你还是会遇到各种各样的问题。下面是我总结的“排坑手册”和实战心得。

6.1 元素定位失败（NoSuchElementException）

这是最常见的问题，没有之一。

原因1：页面还没加载完。
- 解决：增加等待。优先使用WebDriverWait配合EC.presence_of_element_located或EC.element_to_be_clickable。implicitly_wait作为全局兜底。
原因2：元素在 iframe 里。
- 解决：使用driver.switch_to.frame(frame_element)切换到对应的 iframe 内再进行查找。操作完后用driver.switch_to.default_content()切回来。
原因3：元素是动态生成的，其属性（如ID）每次刷新都变。
- 解决：使用相对稳定的属性定位，如text()内容、placeholder、role属性，或者使用层级关系组合的 XPath。避免使用包含随机字符串的id或class。
原因4：页面结构变了。
- 解决：这是无法避免的。定期运行脚本，并准备好更新定位器。将定位器字符串集中定义在代码开头，方便统一修改。

6.2 被检测为自动化脚本

网站会通过一些 JavaScript 属性（如navigator.webdriver）或行为特征（如无间隔的快速点击）来检测 Selenium。

解决：
1. 使用我在初始化代码中提供的chrome_options设置，特别是 CDP 命令来隐藏webdriver属性。
2. 在关键操作（如输入、点击）之间加入随机、微小的时间延迟 (time.sleep(random.uniform(0.1, 0.5)))。
3. 可以考虑使用undetected-chromedriver这类第三方库，它专门用于绕过检测，但会增加复杂度。

6.3 文件上传不成功

原因1：文件路径错误。
- 解决：使用os.path.abspath()确保是绝对路径，并检查文件是否存在。
原因2：文件输入框定位错误。
- 解决：确保你定位到的input[type=’file’]是属于当前上传模块的。有时页面上有多个文件输入框。使用更精确的 XPath，如//div[@role=’dialog’]//input[@type=’file’]。
原因3：网络或服务器问题导致上传超时。
- 解决：增加上传后的等待时间，并设置更智能的等待条件（如等待进度条消失）。

6.4 登录环节卡住（验证码/扫码）

这是自动化脚本最大的“拦路虎”。

策略：
1. 接受扫码：对于个人用途，让脚本在扫码页面暂停，手动扫码后继续，是最简单稳定的方案。代码中已体现。
2. 验证码识别：对于简单的图形验证码，可以引入pytesseract（OCR库）或django-simple-captcha等方案尝试识别，但成功率有限且维护成本高。
3. 商业打码平台：对于复杂验证码（如点选、滑块），可以考虑接入付费的打码平台 API，但需要成本。
4. Cookie 复用：手动登录一次，通过driver.get_cookies()获取 Cookie 并保存。下次运行时，直接driver.get(url)后add_cookie()注入 Cookie，可能绕过登录。但 Cookie 有有效期。

6.5 实战心得与优化建议

日志是生命线：在代码的关键节点（开始、成功、失败）添加print日志，并记录到文件。出错时，日志能帮你快速定位阶段。
截图是最好的诊断工具：在任何except块中，保存当前页面的截图。一张图胜过千行日志。
循序渐进，模块测试：不要一次性写完所有代码再运行。先测试登录，成功了再测试导航，接着测试填充内容... 分模块调试，效率更高。
准备“降级”方案：如果某个环节（如自动设置标签）因为页面改版总是失败，可以考虑注释掉这部分代码，发布一篇不带标签的文章，总比完全失败好。脚本的健壮性比功能的完整性更重要。
关于定时任务：如果在服务器（如 Linux）上运行定时任务，务必使用无头模式 (headless=True)，并确保服务器安装了图形依赖（对于 Chrome，可能需要安装xvfb或headless相关包）。使用schedule库或系统的crontab来管理定时。
道德与合规：再次强调，请将自动化工具用于提升个人工作效率，遵守平台规则。控制发布频率，模拟人类行为，避免对平台服务器造成不必要的压力。

自动化不是一劳永逸的，今日头条的页面随时可能更新。这个脚本的价值在于提供了一个经过实战检验的、可工作的框架和一套解决问题的思路。当页面变化时，你需要做的就是拿起开发者工具（F12），重新分析页面结构，更新对应的元素定位器，然后你的机器人就又能继续为你工作了。希望我踩过的这些坑，能为你铺平自动化之路。

查看全文

http://www.jsqmd.com/news/1123304/