90%人工智能公司都亏损盈利难背后的大数据门槛_新浪财经

　　90%人工智能公司都亏损盈利难背后的大数据门槛

　　邱智丽

　　[小样本学习的迫切性更在于落地过程面临的数据孤岛、数据隐私保护导致的数据割裂问题，这让AI技术很难充分发挥价值。]

　　AI（人工智能）落地场景在不断增多，但赚钱依旧艰难。

　　亿欧报告显示，2018年全年，近90%的人工智能公司处于亏损状态，而10%赚钱的企业基本是技术提供商。从谈概念、讲技术，到拼场景、抢落地，建立在大数据基础之上的人工智能，仍面临数据本身带来的挑战。

　　“我们经常提及大数据，但事实上我们并不需要那么多的数据，AI未来的一个趋势是小数据崛起。”在市北·GMIS2019全球数据智能峰会上，斯坦福大学教授、Landing.ai创始人、CEO吴恩达表示。

　　一个具体的案例是工厂手机屏幕划痕检测。目前不少是利用人眼来检测手机是否存在划痕，如果拥有100万个划痕手机，AI可以非常高效地识别手机划痕。但现实情况是没有任何工厂会有几百万不同划痕的手机，这个时候小样本学习（fewshotlearning），即利用较少的数据得出同样准确结论的人工智能，将有助于推动整个领域的发展。

　　小样本学习的迫切性更在于落地过程面临的数据孤岛、数据隐私保护导致的数据割裂问题，让AI技术很难充分发挥价值。

　　“和AI用于比赛需要上千万的图片训练不同，当AI深入行业我们看到的数据往往是小数据和细碎的数据，也就是没有联通起来的数据，再先进的AI技术也很难用上。”国际人工智能学会理事长、香港科技大学教授、微众银行首席人工智能官杨强说道。

　　今年5月，国家互联网信息办公室发布了《数据安全管理办法（征求意见稿）》，提出在中国境内利用网络开展数据、存储、传输、处理、使用等活动，以及数据安全的保护和监督管理意见。

　　杨强认为“中国版GDPR（通用数据保护条例）”即将到来，数据隐私在走向严格化、全面化，这使得企业在实际应用中可以使用的数据维度和范围并不大。数据隐私保护的趋严，为人工智能技术升级提供了契机。

　　以保险行业利用AI进行个性化定价为例，背后需要业务数据和用户互联网行为数据融合，理想的状态是可以拿到非常丰富的用户画像，与用户的ID高度匹配，但实际情况迫于隐私、安全、法规等原因，企业可以应用的数据是非常有限的。

　　再例如在小微企业贷款应用方面，AI需要引入票据数据、资产数据、舆情数据等，但由于数据的割裂，实际应用中只能使用一些政府的数据，例如央行的征信报告，但这些报告只能覆盖不到10%的人群。这一问题在医疗领域更为明显，不同医院的医疗影像数据很难汇聚到一起，形成大数据来训练一个医疗模型。

　　针对数据割裂带来的人工智能落地难问题，杨强提出了联邦学习。所谓联邦学习，是多个数据方之间组成一个联盟，共同参与到全局建模的建设中，各方之间在保护数据隐私和模型参数基础上，仅共享模型加密后的参数，让共享模型达到更优的效果。

　　据杨强介绍，联邦学习分为横向联邦和纵向联邦，横向联邦是指企业各方数据维度相同、ID维度不同，更多存在于消费者应用中；纵向联邦是指企业各方数据的ID维度相同（样本重叠）、数据维度不同，更多存在于B端应用。