当前位置: 首页 > news >正文

能面试完都不错了,脚趾抠地。社招-面经-WDKJ(al)-文本评测方向

面试太难了,就是,你收到了面试邀请,你有进入了一面,然后面试官说,啊,好像方向不太符合吧,然后面完,第二天感谢信一封。

我开始找工作的时候比较偏晚了,所以现在有给面试机会的,几乎都是些相对来说比较好的公司了,例如我前司还有JD,其实有隐形的门槛,gap半年就不看简历了。

但是说实话,我也不是自愿的,找到现在快三个月了,之前确实是没经验。朋友们,别写离职日期,让hr来问吧。写在简历上,简历都过不了。

而且面试很容易紧张,紧张就想不起来。

看到大冰哥说的,找个支点,https://www.bilibili.com/video/BV1c8gGzmEQu/

今天面试的时候,确实有用。

以下是某一次的面试回忆:

1.做个自我介绍吧。

2.那你能介绍一下你的项目里面关于通用的评测集还有情感方向的这些评测有关的工作吗?

3.那你做的那些评测集里面,指标维度也是你们做吗?

4.有从0-1设计过一个评测集,比如构建一些体系,调研。我要创新一个什么样的评测集,维度,定义数据标注方案,有去做过类似这样的设计吗?

5.嗯,那你是说相当于在清洗的过程中要去定义一些方案比如说维度标签,哪些要洗出去,哪些要留下来,类似这样的操作对吧。

6.那你之前的岗位我理解应该就是稍微偏技术一点算法一点,有做过类似数据管理的一些事情吗?数据标注管理的这样,应该不太做过吧,我感觉。

7.那比如说你们做的评测里面,有一些数据要人工来标注的,这个标注的数据是怎么清洗解决的,会有人专门给你标一些数据吗?

8.你的这些所有的关于评测的内容,项目,我看还有情感的,你不管是训模型还是做评测,你应该是要跟数据管理的部门去合作,你提需求给他们,然后定义一些维度,让他们把高质量的数据给标注出来,然后这方面的经验有吗?

9.你是为什么想投我们文本标准评测这样的岗位呢?

10.但是我听下来,你好像没有做过文本标准管理的这个事情。我不是说的在技术上给这个数据怎么管理,而是管人,管理下面一堆标注员,给你把这个数据给你标的质量很高,你自己去定义一个项目去建需求。这是要做项目管理,评测管理,更好的去跟算法部门去协作的。

11.你是需要去把他们的需求落实成文字,落实成标注指导文件,去跟标注人员讲规则讲迭代,将数据质量提升上去的,我评估下来你们应该也要写人工标注的事情,那你们是怎么去定义他们交给你的数据质量是好的,你们有没有一些指标化的方法?以及过程中标注的方案是你们来定还是有一个专门的人做培训标注的管理,那你们之前这样的事情是怎么协作的?

12.质量的话你们过往项目里有没有一些策略或者方法,能够去检查出来这个数据好或者不好?

13.那你为什么不在算法岗位深耕下去,而是转向文本标准方向呢?

14.那你个人的意愿更倾向于什么样的岗位呢?

15.嗯,不太一样啊,这个岗位会需要你密集的去跟各种人打交道,做数据质量的管控,过程的管控,技术不用接触那么多人,让别人来帮你实现质量管控。评测这边你是需要去定方案,从0到1去设计一些维度的,不是说一个简单数据清洗的事情,而是我真的要去搭一个pipeline,也包括我的评测目标是什么,我为了评测这个目标,公开评测集做到什么地步了,我的创新点在哪里,我设立一个新的体系,有了新的评测体系我还要去设定一个数据方案、方式。那看是合成,还是人工介入,还是人工+合成,有的比如你做的情感对话大模型,情感这个方向是不可能什么都靠合成的。它甚至是尽量越少合成越好,那这个方向可能就需要很多人工去标的,或者,那你怎么去定义情感大模型,那我要去定义一些好的角色扮演或者请情商评测的这些维度。怎么去设计可能就是这个岗位的一些职责。那你自己就要去定角色一致性,逻辑还有什么情绪状态、共情、对话、剧情,都可以都要定。但是你定义以后,要怎么测,以及你的题目形式是什么样的,也是需要你去设计的,完了以后还要去跟很多的标准员供应商打交道,让他们把这个数据标注出来,

16.我定一个方案或者框架,我提个需求,给别人来实现数据,可能本地跑一些测试,跟训练技术岗应该是个上游下游的关系。

17.你对数据标准的了解还不算特别多。

18.反问阶段

面试本质还是沟通交流,能聊得来最好,面试官的一些观点我不一定能接受,但是确实有很大的启发。

大厂确实牛啊,有自己的理解,但是微调人员真的能离采集数据这么远吗?不过,他们都有沟通协作,应该效果也不错,而且他们大模型做的很牛哇。

http://www.jsqmd.com/news/847453/

相关文章:

  • 终极科学文库PDF解密完整指南:永久解除CAJViewer限制的3步方案
  • 属性、构造方法、Getter)
  • 告别漫长编译!用Docker在5分钟内快速拉起一个可用的SageMath环境(Ubuntu适用)
  • 意图共鸣科技《AI记忆链商业化白皮书2.0》提出“优雅降级”:AI记忆托管如手机保号
  • 【亲测门店】新昌吊车企业哪家靠谱?真实案例分享并附带联系方式 - 花开富贵112
  • 终极指南:7步掌握FanControl,打造完美静音散热系统
  • Tauri应用自动更新实战:从GitHub Actions配置到私钥环境变量避坑全记录
  • MATLAB核心优势解析:七大理由揭秘其在工程与科学领域的不可替代性
  • ESP32 OTA升级避坑指南:用Python脚本一键搭建本地服务器,告别手动配置
  • 【Perplexity医院查询功能深度解密】:3大隐藏缺陷、5步优化方案与2024最新实测数据
  • 医疗 AI Agent 接入 EHR 前,先补齐权限表、审计链和写回状态机
  • GBFR Logs:用数据驱动在《碧蓝幻想Relink》中实现3倍效率提升
  • AI职业成长地图:软件测试从业者的精准发展路径
  • AI产品经理 VS 通用产品经理:深度解析技能差异与转行攻略!
  • 小爱音箱终极音乐播放方案:3分钟搭建个人音乐服务器
  • 亲测嵊州随车吊口碑,复盘靠谱品牌,并附带联系方式 - 花开富贵112
  • 重构生态:单商品精细化分佣与AI风控,打造千万级俱乐部接单平台与三角洲游戏电竞护航陪玩源码系统小程序 - 壹软科技
  • 3分钟掌握Typora LaTeX主题:用Markdown写出专业学术论文的终极指南
  • 商标注册怎么查有没有被注册的服务机构?2026 八大商标服务机构深度横评,避坑测评一次性说透 - 资讯速览
  • 基于Spring Boot的社区医疗服务管理小程序的设计与开发
  • 信步SV1-H312A嵌入式主板:工业智能化核心硬件选型与实战指南
  • FPGA实现插值法帧同步系统:Verilog代码详解与工程实践
  • Win11/Win10系统下,ESP32开发环境搭建:Python国内源配置与PlatformIO依赖加速全攻略
  • G-Helper:华硕笔记本用户的终极轻量级硬件控制方案
  • PX4开环控制避坑指南:为什么你的仿真无人机转圈总失败?从`setpoint_raw`话题到模式切换的深度解析
  • 明日方舟MAA智能助手完整指南:免费解放双手的终极方案
  • 破局三角洲游戏高分段生态!AI调价赋能俱乐部接单平台,游戏电竞护航陪玩源码系统小程序打造顶尖护航平台 - 壹软科技
  • 2026年戴尔官方售后维修服务中心最新地址报告 - 资讯速览
  • OpCore-Simplify:10分钟完成黑苹果配置的革命性工具
  • 用豆包AI生成的图片有水印,怎么去除(免费方法,不下载任何工具,亲测有效)