大数据文摘出品

作者：Christopher Dossman

编译：Luna、李雷、云舟

呜啦啦啦啦啦啦啦大家好，本周的AI Scholar Weekly栏目又和大家见面啦！
AI ScholarWeekly是AI领域的学术专栏，致力于为你带来最新潮、最全面、最深度的AI学术概览，一网打尽每周AI学术的前沿资讯。
每周更新，做AI科研，每周从这一篇开始就够啦！

本周关键词：对象识别、CNN、文本识别

本周最佳学术研究

SOLO：按位置分割对象的方法

本文提出了一种新颖且极其简单的图像实例分割方法，称为SOLO，这是一种直接实例分割框架，由澳大利亚阿德莱德大学和字节跳动 AI 实验室的研究人员合作开发。

SOLO是一种端到端的深度学习架构，可以将原始输入图像直接映射到所需的实例蒙版，无需像自底向上的方法那样进行分组后处理，也不需要像自顶向下的方法那样进行边界框检测和RoI操作，减少了处理时间。

实验结果：说明这是一个具有可靠性能且简单灵活的实例分割框架，在准确性方面与Mask R-CNN持平，并且优于最新的单阶段实例分割器。

鉴于SOLO的简单性，灵活性和强大的性能，研究人员希望SOLO可以成为实例分割和其他实例级别识别任务的基准。

Github传送门：

https://github.com/aim-uofa/AdelaiDet/

原文：

https://arxiv.org/pdf/1912.04488v3.pdf

多元假设检验Python包

hyppo的全称是HYPothesis Testing in PythOn，发音为“ Hippo”，是一个功能强大且可扩展的开源Python软件包，用于进行包括独立性、双样本和多样本等多变量假设检验。

尽管做多元独立性检验可以使用R软件包，但其大多数接口与Python不兼容，无法使用。而hyppo则包含许多最新的多元检验模块，易于使用，且可以灵活扩展。

文档及使用手册：

https://hyppo.neurodata.io/

原文：

https://arxiv.org/pdf/1907.02088v5.pdf

可进行交互式计算性能分析的深度神经网络训练工具

这篇最近发表的论文介绍了SKYLINE，一种用于DNN（深度神经网络）训练的交互式新工具，它支持编辑器内性能分析，可视化和调试等功能。

SKYLINE充分利用了DNN模型训练的特性，包括重复性，可预测性和代码结构性等，从而提供了与代码相关的交互式性能展示。本文主要阐述了：

DNN训练计算性能调试是深度学习开发人员面临的重要问题

DNN训练在计算性能上的特性可以应用于新的交互式分析

SKYLINE是开源的，可帮助深度学习开发人员提升未来研究效率。

Github传送门：

https://github.com/skylineprof/skyline。

原文：

https://arxiv.org/pdf/2008.06798v2.pdf

EASTER：一个高效且可扩展的文本识别器

这项工作提出了一种高效且可扩展的文本识别器（EASTER），可以在机器上打印的文字和手写文本上执行光学字符识别。

新模型利用了不重复的一维卷积层，从而能够以更少的数据量进行并行训练。

在对该体系结构的多个变体和最小变体之一进行评估时，该识别器的性能与基于RNN的复杂选择相当。使用20层最深变体的识别器优于RNN架构，在基准测试数据集（如IIIT-5k和SVT）上有很大的优势。

研究人员还展示了在脱机手写文本识别任务上，此识别器带来的结果相比当前最佳结果有较大提升。他们介绍了具有扩充设置的数据生成管道，这个管道可以生成手写和机器打印文本的综合数据集。

原文：

https://arxiv.org/pdf/2008.07839v2.pdf

致力于CNN的准确可视化和可解释性

为了更好地理解和使用卷积神经网络（CNN），CNN的可视化和解释近年来引起了越来越多的关注。

本文介绍了一种新颖的可视化方法，称为XGrad-CAM，该方法受敏感度和守恒原理的启发。提供了清晰的数学解释，填补了CAM可视化方法可解释性的空白。

结果表明，就保守性和敏感性而言，XGrad-CAM是Grad-CAM的增强版本。与Grad-CAM ++和Ablation-CAM相比，它可以实现比Grad-CAM更好的可视化性能，并且具有区分类和易于实现的优点。

Github传送门：

https://github.com/Fu0511/XGrad-CAM

原文：

https://arxiv.org/pdf/2008.02312v4.pdf

其他爆款论文

是否将离线RL的丰富前景带入现实应用？Google AI应对离线强化学习中的开放挑战：

https://ai.googleblog.com/2020/08/tackling-open-challenges-in-offline.html

CopyPose：一致的多视图多对象6D姿势估计：

https://www.di.ens.fr/willow/research/cosypose/

我们面临的挑战以及克服这些挑战所需的专业知识——信托与医疗AI：

https://arxiv.org/pdf/2008.07734v1.pdf

保守离线强化学习Q-Learning：

https://arxiv.org/pdf/2006.04779v3.pdf

自动化机器学习评论——挑战与机遇：

https://arxiv.org/pdf/2008.08516v1.pdf

学习资源

怎样使用机器学习驱动商业价值：

https://pages.awscloud.com/glbl-gc-450-machine-learning-journey-ebook/

AI大事件

用于机器学习应用程序的谷歌笔数字墨水识别API：

https://www.electronicsweekly.com/news/products/software-products/google-pens-digital-ink-recognition-api-machine-learning-apps-2020-08/

Socionext和大阪大学开发了新的深度学习方法，用于在弱光条件下进行目标检测：

https://www.prnewswire.com/news-releases/socionext-and-osaka-university-develop-new-deep-learning-method-for-object-detection-in-low-light-conditions-301116092.html

零售行业的机器学习：

https://thedailychronicle.in/news/335883/machine-learning-in-retail-market-top-companies-trends-and-technology-2020-2029/

黑色小圆动图分割线

免！费！

阿里大数据训练营重磅开启！

贾扬清亲自出品，阿里技术专家亲自授课

3天get阿里大数据独门绝学！

入门Flink、Spark等开源技术知识

更有实战讲解！

扫码get你的专属训练营！

专栏作者介绍

Christopher Dossman是Wonder Technologies的首席数据科学家，在北京生活5年。他是深度学习系统部署方面的专家，在开发新的AI产品方面拥有丰富的经验。除了卓越的工程经验，他还教授了1000名学生了解深度学习基础。

LinkedIn：

https：//www.linkedin.com/in/christopherdossman/

志愿者介绍

后台回复“志愿者”加入我们

点「在看」的人都变好看了哦！

CNN可解释性再受关注，人类真能理解机器的思想吗？ | 一周AI最火论文

大数据文摘出品

作者：Christopher Dossman

编译：Luna、李雷、云舟

本周关键词：对象识别、CNN、文本识别

其他爆款论文

学习资源

AI大事件

用于机器学习应用程序的谷歌笔数字墨水识别API：

https://www.electronicsweekly.com/news/products/software-products/google-pens-digital-ink-recognition-api-machine-learning-apps-2020-08/