当前位置: 首页 > news >正文

文本预处理--分词模式 - f

pip install jieba
该库用来实现不同模式的分词功能

import jieba
# print(jieba.__version__)
# print(type(jieba))#1.jieba实现精确模式的分词
def bu_dong1():content = "传智教育是一家上市公司,旗下有黑马程序员品牌。我是在黑马这里学习人工智能"#返回的是生成器,用for循环、list,next(a)来取出# seg_list1 = jieba.cut(content,cut_all=False)# print(f'seg_list1---》{seg_list1}')# for value in seg_list1:#     print(value)seg_list2=jieba.lcut(content,cut_all=False)print(f'seg_list2---》{seg_list2}')#2.jieba实现全模式的分词
def bu_dong2():# 定义一个字符串变量content,存储关于传智教育和黑马程序员的信息content = "传智教育是一家上市公司,旗下有黑马程序员品牌。我是在黑马这里学习人工智能"# 返回的是生成器,用for循环、list,next(a)来取出seg_list1 = jieba.cut(content,cut_all=True)print(f'seg_list1---》{list(seg_list1)}')#list强转# for value in seg_list1:#     print(value)# seg_list2 = jieba.lcut(content, cut_all=True)# print(f'seg_list2---》{seg_list2}')#3.jieba实现搜索引擎模式的分词
def bu_dong3():content = "传智教育是一家上市公司,旗下有黑马程序员品牌。我是在黑马这里学习人工智能"#返回的是生成器,用for循环、list,next(a)来取出# seg_list1 = jieba.cut(content,cut_all=False)# print(f'seg_list1---》{seg_list}')# for value in seg_list1:#     print(value)seg_list3=jieba.lcut_for_search(content)print(f'seg_list3---》{seg_list3}')
if __name__ == "__main__":bu_dong1()bu_dong2()bu_dong3()
http://www.jsqmd.com/news/379384/

相关文章:

  • 【毕业设计】高校校园点餐系统
  • 【无人机】5G辅助优化无人机附Matlab代码
  • 【光学】高效的多分辨率融合技术对具有标签不确定性的遥感数据进行处理附Matlab代码
  • 【计算机毕业设计案例】基于SpringBoot+Vue的旅游推荐系统基于springboot的县文化旅游推荐系统的设计与实现(程序+文档+讲解+定制)
  • 【无人机】基于WyNDA算法进行无人机参数估计的模拟 附matlab代码
  • Ookla Speedtest安卓版(网速测试工具)
  • Java计算机毕设之基于springboot的智能推荐高考志愿辅助填报系统基于web的高考志愿填报系统的设计与实现基于Java + vue高考志愿填报系统(完整前后端代码+说明文档+LW,调试定制等)
  • 测试测试07
  • 【毕业设计】基于springboot的县文化旅游推荐系统的设计与实现(源码+文档+远程调试,全bao定制等)
  • 收藏!RAG核心工具大全: 7大解析工具+向量模型+数据库+检索排序 - AI
  • 2026国内最新化妆品库存尾货厂家top5推荐!广东广州等地优质货源供应链权威榜单发布,全品类货源助力创业经营 - 品牌推荐2026
  • C# 中的类型转换详解
  • 田忌赛马模型 ← 双指针 + 排序 + 贪心
  • 热门激光切管机怎么选?2026十大品牌深度解析,选购指南在此 - 匠言榜单
  • 测试一下 Lovable 生成的网页效果
  • C#中如何防止序列化文件丢失和损坏
  • Java毕设项目推荐-基于SpringBoot的实验室共享预约系统基于springboot中学物理实验预约系统【附源码+文档,调试定制服务】
  • 教培管家第03讲:集结号角——接入企微机器人完成新线索通知
  • 【开题答辩全过程】以 基于Java的网上书店销售系统的设计与实现为例,包含答辩的问题和答案
  • 实用指南:GitHub Copilot 使用笔记
  • 【开题答辩全过程】以 基于Java的甜品蛋糕网上商城的设计与实现为例,包含答辩的问题和答案
  • 【计算机毕业设计案例】基于web的高考志愿填报系统的设计与实现智能推荐高考志愿辅助填报系统的设计与实现(程序+文档+讲解+定制)
  • 出来年终总结了!今天不聊技术咯,只唠唠 25 年的「副业收入」和「AI 对我的影响」25年 我的额外收入关注我的都知道,我目前的工作算是比较轻松吧,
  • 【路径规划】多因素蚁群算法的移动机器人路径规划研究附Matlab代码
  • 【电力系统】光伏VSG-基于虚拟同步发电机的光伏并网逆变器系统附Simulink仿真
  • 【预测模型】麻雀算法改进BP神经网络的风电功率预测附Matlab代码
  • 【开题答辩全过程】以 基于Java的体育竞赛管理的设计与实现为例,包含答辩的问题和答案
  • LAN9252学习笔记(一)
  • OpenClaw工作原理
  • 基于遗传算法车辆路径优化附Matlab代码