第八十四章 强化学习(1 / 2)

加入书签

喝下几口水后,尚斌感觉思路清晰了很多,继续补充道:

【在职业学院工作,每周大概要上二十节课,不过大多数课程为实操实验,在机房进行,只需要讲头二十分钟,后面学生们自己练习就可以了。】

尚斌琢磨着是不是该拉回正题,没想到对方又发来一条消息。

匿名用户:【好的老师,职业学院会有科研考核和评职称方面的压力吗?】

尚斌:【部分职业学院甚至不要求坐班,只有上课和开会的时候去就可以,大部分职业学院没有科研方面的考核,或者说形同虚设,因此与网文职业完美契合呢。

至于收入嘛,与你的职称挂钩,现在职称不好评,不过,就算是中级职称,也比帝国境内大部分大学的高级职称收入高。】

尚斌至今记得,自己刚评上正教授之后,曾在一次会议中与本地一位职业学院的讲师交流过,对方听到尚斌的工资之后,笑眯眯地问了一句尚老师你们学校是不是扣得特别多啊。

匿名用户:【哦哦,那将来确实可以考虑一下……莫老师,我还有一个问题,我在懂乎上看到您是做强化学习的,如果读研做这个方向,将来找工作容易吗?】

尚斌:【在帝国境内,除了几家头部It企业,很少有人会专门招强化学习的硕士生,总体而言,这方面的需求是很少的,就业岗位十分有限。

另外,cV领域早已是一片红海,也不推荐。

NLp领域倒是不错,尤其是大规模语言模型,现在仍处于迅猛发展阶段,企业需求十分旺盛。

另外还得补充一下,开发岗永远是刚需,虽然这两年收入水平下降了一些,但招聘机会比算法工程师和算法岗多得多。】

匿名用户:【好的老师。我还是对强化学习挺感兴趣的,本科阶段也曾经尝试用这种方法实现了几款游戏AI,如果说做这个方向,能给一些建议吗?】

尚斌:【如果你真的想找强化学习相关的工作岗位,我建议你报考与头部It企业有合作关系的课题组,因为这些课题组的毕业生很容易获得合作企业的offer。

至于其他课题组,我觉得就没什么意思了,就算你能力再强,没有好的学校和课题组背书,也很难找到强化学习对口的工作。

说直白一点,除了我说的这一类学校,去其他地方读研,哪怕是帝国一流大学,拿着强化学习找工作只能死路一条。】

匿名用户:【哦哦,难怪懂乎上有人说强化学习不好找工作,原来是这样。

那我明白了。

对了老师,您能不能推荐几个强化学习的研究方向和应用方向,我想提前准备一下,面试和联系导师的时候或许用得上。】

尚斌:【研究方向的话有这么几个,先说几个热门的。

首先是离线强化学习,研究使用固定数据集的情况下如何进行强化学习,目的是得到比产生数据集的行为策略更好的策略。目前要解决的主要问题是外推误差问题和多智能体引入的多模态问题。

由于这种方法不需要与真实环境交互,因此比较适合在采样成本较为高昂的场合。

其次是迁移强化学习,研究如何使用源任务的知识提高强化学习方法的泛化性能,目的是减少优化算法的启动时间,同时提高优化能力。

目前这个方向要解决的主要问题是如何对队友指导和先验知识进行融合,以及多智能体设定下智能体之间的知识形式不一致的问题。

↑返回顶部↑

书页/目录

>