AI知识库投喂:喂什么,它就学什么
你可曾思考过,你当下和AI进行聊天,它能够瞬间回复你,并非是由于它切实“懂”你,而是源于其背后有人给它投喂了数量众多的资料。
就如同养一只狗,你给它骨头喂食,它便会长成看家护院的狗,你给它书本喂食,它便会长成引导盲人的犬。
AI也是一样的。
倘若你喂予它什么,它便会学习什么。这般听上去仿佛颇为简捷,然而于实际进行操作之际,背后全然皆为陷阱。
什么是“知识库投喂”?
说白了,就是给AI“吃饭”。
只是这顿饭并非米饭面条,而是文档,是PDF,是网页,是Excel表格,甚至是一堆杂乱无章的聊天记录。
要想透过AI去帮你解答公司产品相关问题,那你就得把产品手册,还有FAQ以及售后记录,全部都塞给它才有办法呈现出效果来。
你想让AI写诗,你就得把唐诗三百首、现代诗集都丢进去。
问题来了——你塞的东西质量不行,AI就会给你整出一堆垃圾。
我曾目睹有人给AI投喂了一堆已然过时的数据,随后,AI向客户所推荐的产品,乃是那种早就已经停产三年时间的产品了。
尴尬不?
数据精准到个位数,有多难?
你以为随便扔一堆数据进去就行?
天真。
举例来讲,像是你要使得AI去回答“我们公司去年售卖了多少台设备”这个问题,你给予它一个Excel,其中第5行第3列所呈现的是“1,234台”。然而要是你没有告知它确切是哪一个单元格、哪一个版本,AI便有可能会从另外一个旧文件当中抓取到“1,200台 ”的数据。
然后它就回答错了。
差了34台。
不要小瞧这34台,于真实的商业场景当中,一个数字出现差错,便可能致使客户对你们公司的信任度径直归零。
于是,当下好多公司在进行知识库投喂行为时,会特意耗费人力去对数据予以标注,要将每一个数字的来源,时间,版本,都清晰地标注明白。
累,但必须做。
为什么AI会“胡说八道”?
你可曾碰到过这般情形:向AI询问一个专业性问题,它应答得有条有理,然而你认真去查证时,却发觉它在胡乱编造。
这不是它在骗你。
是它的知识库里,混进了错误的信息。
比如说,你投喂了一篇行业报告,年份是2018年,其中记载着“该技术预计2020年普及”。然而,AI并不清楚时间是存在过期这一情况的,它会将这句话认定为当下的事实,进而直接告知你“该技术已经普及”。
这就出事了。
故而,知识库的“时效性”管控,变成了投喂流程里极为令人头疼的事项之一,好多公司每星期乃至每日都得去更新数据,将陈旧的、已过时的、有误的文件排除掉。
但人总有疏忽的时候。
文档格式,也是个大坑
于你而言,或许会认为,PDF 这般便是 PDF,Word 如此即为 Word,究竟存有怎样不同之处呢?
不一样大了去了。
当AI进行PDF读取操作时,要是其中文字是以图片形式呈现的话,它根本就无法识别出来。它会将一份产品说明书误当作一张风景照,以至于连一个字都读取不到。
另外存在一些表格,当AI进行读取操作时它会将行与列弄混淆,原本处于第2行位置的内容是“价格”,处于第3行位置的内容是“库存”,然而当AI读取结束后,它有可能会认为“价格”所在的那一列实际上是“库存”。
结果你问它“这个产品多少钱”,它告诉你“库存还有5件”。
哭笑不得。
于是,当下不少团队于开展知识库投喂工作之前,都会先行将文档转化为纯文本样式,把表格拆解成文字叙述。虽说颇为费事儿,然而准确率却要高出许多。
你知道“投喂量”多少才够吗?
喂太少,AI啥都学不会。
喂太多,AI会“学杂了”,反而表现变差。
有一个例情况是我所碰见的,即有一家公司,它把过去十年期间的全部,关于客户的那些对话记录,都提供给了人工智能了,数量大概是五十万条之多。最终出现的状况是,当这个人工智能去回答问题时,却经常性的,引用五年之前的旧政策,并由此使得客户感到莫名其妙,不知所以然呢。
之后,他们将大部分的旧数据给删除了,仅仅留存下最近两年的,然而效果却反倒好了许多。
这如同人开展学习之际的情况,倘若给予你100本书籍,那么你极有可能一本书都无法记住,换个情形,要是给予你10本经典之作,并且反复去阅读,那你反倒能够成为专家呢。
AI也是。
所以,投喂不是越多越好。关键是要“精”。
小团队怎么做知识库投喂?
大公司有钱,可以请专门的团队来做数据清洗、标注、版本管理。
但你只是个自媒体博主,或者小公司的运营,怎么办?
我见过一些聪明的人,他们会在投喂之前,自己先把文档过一遍。
删掉过时的内容
把长文章拆成短段落
把表格里的数字改成文字描述
竟然自己去撰写一份“AI使用说明书”,告知AI先是要看哪个文件,接着再去看哪个文件。
虽然土,但真的有效。
另有一项技巧,将高频问题单独整理成一个文档,直接提供给AI。比如说,你的客户最常问“发货时间”“退款流程”,那么就把这几个问题的标准答案写成一篇千字文,让AI先学习这个。
这样,AI回答准确率会直线上升。
最后说一句
知识库投喂这件事,听起来很技术,其实很笨拙。
它没有捷径。
就是一遍遍地筛选、清洗、测试、再筛选、再清洗、再测试。
AI再聪明,也架不住你喂给它一堆垃圾。
你喂什么,它就学什么。
你喂得有多用心,它回答得就有多靠谱。
所以,下次你觉得AI的回答很不靠谱的时候,别急着骂AI。
先想想,你给它吃了什么。
