荣耀NLP算法工程师面试题8道|含解析
10本七月在线内部电子书在文末,自取~ 公众号福利 ?回复【100题】领取《名企AI面试100题》PDF ?回复【干货资料】领取NLP、CV、ML等AI方向干货资料 问题1:讲一下transformer Transformer是一种用于自然语言处理和机...
七月在线实验室
0
快手广告算法工程师面试题15道|含解析
10本七月在线内部电子书在文末,自取~ 公众号福利 ?回复【100题】领取《名企AI面试100题》PDF ?回复【干货资料】领取NLP、CV、ML等AI方向干货资料 问题1:ReLU,LeakyReLU ReLU和LeakyReLU都是常见的激活函数。 ReL...
七月在线实验室
0
RL的分类:基于模型(Value-base/Policy-based)与不基于模型
本文接前面文章: 入门强化学习所需掌握的基本概念 MDP的前置知识:随机过程、马尔可夫过程、马尔可夫奖励 马尔可夫决策过程(MDP):马尔可夫奖励(MRP) + 智能体动作因素 动态规划法--通过动态规划法求解最优策略 蒙...
七月在线实验室
0