当前位置: 首页 > news >正文

onehot编码的实现和复用--文本张量 - f

1.所需依赖:tensorflow
我下载的依赖版本是2.16.1,因为2.20版本太高不兼容,会报错CLL动态链接的...
第一个方法是编码的生成和保存
第二个方法是实现对编码的复用
2.pip install安装位置的问题(在cmd管理员权限下,并且激活环境conda activate base/直接使用Anaconda Prompt)
我执行该命令安装以来的时候都会默认安装到用户文件夹下,不能安装到我的anaconda下
方法:pip config list查看:
image
需要添加第二行,命令 :python -m pip config set global.user false
3.下载速度慢:
添加国内镜像源:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
添加之后进行查看:conda config --show channels
image
4.下载依赖的命令:

# 安装包
python -m pip install 包名
# 安装指定版本,我的2.16.1就是安装的指定版本,包名是tensorflow
python -m pip install 包名==版本号

或者是命令:

# 安装包(默认从配置的频道安装)
conda install 包名# 安装指定版本的包
conda install 包名=版本号

5.文本张量onehot代码练习

import jieba
#tensorflow下的keras下的Tokenizer
from tensorflow.keras.preprocessing.text import Tokenizer
#joblib用于保存对象
import joblibdef dm_onehot_get():#1.准备语料vocabs={'周杰伦','陈奕迅','王力宏','李宗盛','吴亦凡','鹿晗','邓超'}#2.实例化Tokenizertokenizer = Tokenizer()#3.调用Tokenizer的fit_on_texts方法传入语料tokenizer.fit_on_texts(vocabs)#4.生成onehotfor vocab in vocabs:list=[0]*len(vocabs)index=tokenizer.word_index[vocab]-1list[index]=1print(f'{vocab}的onehot编码为{list}')#5.保存训练好的tokenizermypath='./mytokenizer'joblib.dump(tokenizer,mypath)print('tokenizer已保存')
def dm_onehot_use():#集合是无序的vocabs = {'周杰伦', '陈奕迅', '王力宏', '李宗盛', '吴亦凡', '鹿晗', '邓超'}#1.加载已保存的词汇映射器Tokenizer joblib.load(mypath)mypath='./mytokenizer'mytokenizer=joblib.load(mypath)#2.编码token为“李宗盛” 查询单词idx 赋值list,生成onehottoken="邓超"list=[0]*len(vocabs)idx=mytokenizer.word_index[token]-1list[idx]=1print(f'{token}的onehot编码为{list}')
if __name__ == '__main__':dm_onehot_get()dm_onehot_use()
http://www.jsqmd.com/news/381509/

相关文章:

  • 2026年口碑不错的教室课桌椅生产厂家排名,嘉陈商贸名列前茅 - myqiye
  • TRAE直接制作网页
  • 2026年株洲名匠家装口碑排名,细聊湖南名匠家装是否靠谱 - 工业品牌热点
  • 广东广秀发展前景如何,在广东地区做公共艺术工程它靠谱吗 - mypinpai
  • 盘点资质齐全的网络犯罪辩护律师推荐,看看哪家口碑好? - 工业设备
  • 聊聊浙江农村建房靠谱机构,哪家性价比更高 - 工业品网
  • 天虹提货券回收三大误区解析,警惕“馅饼”变陷阱 - 京顺回收
  • python-django-flask校园网络报修运维系统
  • python-django-flask的在线食品安全信息平台
  • 商务部通告英国首相时隔8年访华-万祥军| 国研政情·中国国政研究
  • 2026年上海实力强的公司注册服务商,口碑好的推荐 - 工业推荐榜
  • 升鲜宝供应链管理系统B端客户价格域的表结构设计及相关说明
  • 聊聊口碑不错的PP罐厂家,湖北、贵州有哪些诚信之选 - myqiye
  • 探索电机多转速工况下的 NVH 分析之旅
  • 2026年重庆本土地道美食推荐,带外地朋友吃李子坝梁山鸡靠谱吗 - 工业品牌热点
  • 2026年滑触线集电器厂家推荐:山东腾云电气,单级/钢体/安全/行车滑触线全系专业制造商 - 品牌推荐官
  • 2026年可靠的棱透复合镜品牌产品,佳视路口碑出众 - 工业设备
  • 聊聊2026年长沙可靠的电子机器人教练品牌有哪些 - mypinpai
  • 无缝衔接scverse,空间组学QC的Python优选 - 详解
  • AMR十年演进
  • 从代码搬运到精益求精:一次发票打印功能的优化实录
  • Linux服务器CPU飙高应急手册:从快速定位到根治预防
  • 完整教程:Spring Boot核心注解详解:@ResponseBody深度解析与实战
  • 2026年合肥好用的无人机培训企业排名Top10 - 工业品牌热点
  • 二叉搜索树的最小绝对差
  • 剖析2026年比较好的短视频运营机构,哪家性价比高? - 工业品网
  • 2026年淀粉设备靠谱品牌盘点,分析固德威淀粉设备评价如何 - 工业推荐榜
  • Lua 的 String(字符串) 模块 - 实践
  • 算法竞赛进阶指南 # 前缀和 # IncDec 序列
  • 宝藏技能网站