当前位置：首页 > news >正文

输入电影/书籍名称，自动生成精简版剧情梗概，提取核心人物和主题，帮快速判断是否想看/读。

news 2026/7/3 7:22:05

1. 实际应用场景描述

在信息爆炸的时代，我们每天都会看到大量电影、书籍推荐，但往往只有标题和海报，难以快速判断是否值得花时间观看或阅读。

- 想看某部电影，但不确定剧情是否喜欢。

- 想读一本书，但简介太长或剧透太多。

- 需要在短时间内筛选多个作品。

如果有一个智能程序，输入电影或书籍名称，就能自动生成精简版剧情梗概，并提取核心人物和主题，就能帮助用户快速决策。

2. 痛点分析

1. 信息获取效率低：需要自己去搜索、阅读长篇简介。

2. 剧透风险：部分简介包含关键情节。

3. 筛选成本高：面对大量推荐，难以快速判断兴趣点。

4. 缺乏个性化：现有推荐系统多为评分或标签，缺少针对内容的快速摘要。

3. 核心逻辑讲解

3.1 数据来源

- 使用公开 API（如 TMDB 电影、Open Library 书籍）获取基本信息。

- 或使用本地预存的电影/书籍数据库（演示用静态数据）。

3.2 剧情梗概生成

- 对原始简介进行文本摘要（可用规则截取前几句，或 TF-IDF + TextRank 算法）。

- 保持简洁，避免剧透关键结局。

3.3 核心人物提取

- 使用命名实体识别（NER）或规则匹配（如“主演”、“主角”等关键词后的名字）。

- 可结合角色出现频率排序。

3.4 主题提取

- 使用关键词提取（TF-IDF、TextRank）或简单规则（如高频名词）。

- 可映射到预定义主题标签（爱情、悬疑、科幻等）。

3.5 输出结构化信息

- 返回

"{title, summary, characters, themes}"。

4. 模块化代码（Python）

# media_summary.py

import re

class MediaSummary:

def __init__(self):

# 模拟数据库

self.database = {

"肖申克的救赎": {

"summary_full": "银行家安迪被误判入狱，在肖申克监狱中，他凭借智慧和毅力，最终成功越狱并揭露了典狱长的腐败。",

"characters": ["安迪", "瑞德", "典狱长"],

"themes": ["希望", "自由", "坚持"]

"三体": {

"summary_full": "人类与外星文明三体人的接触引发了一系列科学、政治和哲学的冲突，故事跨越数百年，探讨宇宙文明的生存法则。",

"characters": ["叶文洁", "罗辑", "程心"],

"themes": ["科幻", "文明冲突", "人性"]

}

def get_info(self, title):

"""根据标题获取数据"""

return self.database.get(title, None)

def generate_summary(self, full_text, max_length=50):

"""生成精简版剧情梗概（取前max_length字）"""

if len(full_text) <= max_length:

return full_text

# 简单规则：取到最后一个完整句子

sentences = re.split(r'[。！？]', full_text)

summary = ""

for s in sentences:

if len(summary + s) <= max_length:

summary += s + "。"

else:

break

return summary.strip("。")

def extract_characters(self, data):

"""提取核心人物"""

return data.get("characters", [])

def extract_themes(self, data):

"""提取主题"""

return data.get("themes", [])

def analyze(self, title):

"""主分析函数"""

data = self.get_info(title)

if not data:

return {"error": "未找到该作品"}

summary = self.generate_summary(data["summary_full"])

characters = self.extract_characters(data)

themes = self.extract_themes(data)

return {

"title": title,

"summary": summary,

"characters": characters,

"themes": themes

}

def main():

analyzer = MediaSummary()

title = input("请输入电影或书籍名称：").strip()

result = analyzer.analyze(title)

if "error" in result:

print(result["error"])

else:

print(f"\n作品：{result['title']}")

print(f"剧情梗概：{result['summary']}")

print(f"核心人物：{', '.join(result['characters'])}")

print(f"主题：{', '.join(result['themes'])}")

if __name__ == "__main__":

main()

5. README 文件

# 电影/书籍快速摘要工具

基于 Python 实现，输入电影或书籍名称，自动生成精简版剧情梗概，并提取核心人物与主题，帮助用户快速判断是否想看/读。

## 功能

- 输入作品名称

- 输出精简剧情梗概

- 提取核心人物

- 提取主题标签

## 安装

无需额外依赖，Python 3.x 直接运行。

## 使用

bash

python media_summary.py

输入作品名称即可。

## 示例

输入：`肖申克的救赎`

输出：

作品：肖申克的救赎

剧情梗概：银行家安迪被误判入狱，在肖申克监狱中，他凭借智慧和毅力，最终成功越狱并揭露了典狱长的腐败。

核心人物：安迪, 瑞德, 典狱长

主题：希望, 自由, 坚持

6. 使用说明

1. 确保 Python 环境已安装（3.6+）。

2. 下载

"media_summary.py"。

3. 运行

"python media_summary.py"。

4. 输入电影或书籍名称（需在数据库中）。

5. 查看精简摘要、核心人物、主题。

7. 核心知识点卡片

知识点说明

文本摘要规则截取或 TF-IDF/TextRank 算法生成精简内容

命名实体识别（NER）提取人名等关键信息

关键词提取识别主题词

模块化设计分离数据获取、摘要生成、实体提取等功能

可扩展性可接入外部 API 或训练模型提升效果

8. 总结

本项目展示了如何用 Python + 规则/NLP 方法快速实现一个电影/书籍快速摘要工具，解决了信息筛选和剧透风险的问题。

- 优点：响应快、结构清晰、易于扩展。

- 未来可引入机器学习摘要模型（如 BART、T5）和外部数据源（TMDB、豆瓣 API），实现更智能的推荐与分析。

- 适合作为 AI 方法与技术课程的实践案例，涵盖文本处理、信息抽取、API 集成等内容。

如果你愿意，可以升级为 API 版本，接入 TMDB 和豆瓣数据，并用 Transformer 模型生成摘要，让它能处理任意电影/书籍。

利用AI高效解决实际问题，如果你觉得这个工具好用，欢迎关注我！

查看全文

http://www.jsqmd.com/news/284378/

AI诗歌：老街的弦理论的地质振动

2026 年的 AI 赛道，正在上演新一轮 “薪资狂飙”

‌10个习惯：让AI从业者2026年薪资翻倍的日常法则

爱信食品产品靠谱吗，看看用户真实评价

拍摄发票照片，自动识别发票金额，开票日期，商家名称，提取关键信息，生成电子记账表。

2026年大模型就业全景：技术演进、核心技能与职业发展指南

学术会议资料管理与共享平台开题报告

智能会议系统集成生产厂哪家售后给力，优质厂家大汇总

【基于无人机搭载相机网络的交互式监控分布式方法】基于无人机搭载摄像头网络的交互式监控分布式方法研究附Matlab代码

学历普通也能找到高薪！CSDN博主教你：用网络安全打破“双非”魔咒，锁定高薪offer！

收藏备用！SFT/ReFT/RLHF/DPO/PPO五大大模型微调技术全解析+对比

GPT-5.2-Pro与Sora 2强强联手：底层架构深度解析与企业级API低成本接入实战（附全套Python源码）

盘点2026年工业记录仪品牌，杭州美控稳定性强排名靠前

从学生建言到省厅红头文件：一个普通大学生的产业政策“漂流记”

收藏！985程序员弃考公选企业，5年中层年薪30万，大模型才是破局关键

2025年12月威胁情报：供应链攻击与恶意软件分析

【计算机视觉、关键点检测、特征提取和匹配】基于SIFT、PCA-SIFT和GLOH算法在不同图像之间建立特征对应关系，并实现点匹配算法和图像匹配附Matlab代码

几十个人的3D设计团队如何提升SolidWorks、catia、ug等三维设计软件的利用率

企业私有化部署首选，MonkeyCode 安全适配本地模型

【CNN+DOA】告别繁琐实验！这款DOA估计框架，一键对比深度学习与传统算法【附python代码】

必学收藏！12个大模型Agent实战应用案例：从电影生成到金融分析的完整指南

杭州中小工厂展览会举办时间、报名方式及展会持续多久全揭秘

深度收藏：RAG架构革命 - 解决大模型幻觉与知识瓶颈的终极方案

‌职业倦怠自救：2026年软件测试从业者心理健康管理指南

收藏！大模型岗位薪资真相曝光，程序员/小白必看的职业启示

【基于STFT-CNN-LSTM的故障诊断】基于短时傅里叶变换（STFT）、卷积神经网络（CNN）与长短期记忆网络（LSTM）的混合故障诊断模型（STFT-CNN-LSTM）研究附Matlab代码

【基于STFT-CNN-SVM的故障诊断】一种融合短时傅里叶变换（STFT）、卷积神经网络（CNN）和支持向量机（SVM）的故障诊断研究附Matlab代码

收藏备用！2026顶流AI Agent全解析：程序员必懂的概念、区别与落地案例

收藏！人均收入数据背后，2026年AI风口下普通人可入局的高薪岗位

如何用开源项目打造你的2026职业护城河？——软件测试从业者的进阶指南

相关文章：