90%人工智能公司都亏损 盈利难背后的大数据门槛
邱智丽
[小样本学习的迫切性更在于落地过程面临的数据孤岛、数据隐私保护导致的数据割裂问题,这让AI技术很难充分发挥价值。]
AI(人工智能)落地场景在不断增多,但赚钱依旧艰难。
亿欧报告显示,2018年全年,近90%的人工智能公司处于亏损状态,而10%赚钱的企业基本是技术提供商。从谈概念、讲技术,到拼场景、抢落地,建立在大数据基础之上的人工智能,仍面临数据本身带来的挑战。
“我们经常提及大数据,但事实上我们并不需要那么多的数据,AI未来的一个趋势是小数据崛起。”在市北·GMIS2019全球数据智能峰会上,斯坦福大学教授、Landing.ai创始人、CEO吴恩达表示。
一个具体的案例是工厂手机屏幕划痕检测。目前不少是利用人眼来检测手机是否存在划痕,如果拥有100万个划痕手机,AI可以非常高效地识别手机划痕。但现实情况是没有任何工厂会有几百万不同划痕的手机,这个时候小样本学习(fewshotlearning),即利用较少的数据得出同样准确结论的人工智能,将有助于推动整个领域的发展。
小样本学习的迫切性更在于落地过程面临的数据孤岛、数据隐私保护导致的数据割裂问题,让AI技术很难充分发挥价值。
“和AI用于比赛需要上千万的图片训练不同,当AI深入行业我们看到的数据往往是小数据和细碎的数据,也就是没有联通起来的数据,再先进的AI技术也很难用上。”国际人工智能学会理事长、香港科技大学教授、微众银行首席人工智能官杨强说道。
今年5月,国家互联网信息办公室发布了《数据安全管理办法(征求意见稿)》,提出在中国境内利用网络开展数据、存储、传输、处理、使用等活动,以及数据安全的保护和监督管理意见。
杨强认为“中国版GDPR(通用数据保护条例)”即将到来,数据隐私在走向严格化、全面化,这使得企业在实际应用中可以使用的数据维度和范围并不大。数据隐私保护的趋严,为人工智能技术升级提供了契机。
以保险行业利用AI进行个性化定价为例,背后需要业务数据和用户互联网行为数据融合,理想的状态是可以拿到非常丰富的用户画像,与用户的ID高度匹配,但实际情况迫于隐私、安全、法规等原因,企业可以应用的数据是非常有限的。
再例如在小微企业贷款应用方面,AI需要引入票据数据、资产数据、舆情数据等,但由于数据的割裂,实际应用中只能使用一些政府的数据,例如央行的征信报告,但这些报告只能覆盖不到10%的人群。这一问题在医疗领域更为明显,不同医院的医疗影像数据很难汇聚到一起,形成大数据来训练一个医疗模型。
针对数据割裂带来的人工智能落地难问题,杨强提出了联邦学习。所谓联邦学习,是多个数据方之间组成一个联盟,共同参与到全局建模的建设中,各方之间在保护数据隐私和模型参数基础上,仅共享模型加密后的参数,让共享模型达到更优的效果。
据杨强介绍,联邦学习分为横向联邦和纵向联邦,横向联邦是指企业各方数据维度相同、ID维度不同,更多存在于消费者应用中;纵向联邦是指企业各方数据的ID维度相同(样本重叠)、数据维度不同,更多存在于B端应用。
杨强认为联邦学习最大的优势是保证数据不出户,通过生态在不同行业选取合作伙伴,用群体智能不断提升模型效果。因此联邦学习一定是多方共同协作组成一个联盟,生态的建设十分重要。
面对AI落地难、盈利难问题,吴恩达则认为,在期待AI为企业带来红利之前,企业需要避免几个陷阱。首先AI技术会影响很多企业做业务的核心,所以选择项目是非常重要的,从小的项目开始,可以建立好的基础,同时帮团队获得动能。
其次团队建设不能仅依靠明星工程师,而是要建立一个完善的、跨学科、跨职能的团队。同时不要期待AI立刻产生作用,而是要多次尝试,对AI发展的回报曲线进行合理预算。不要使用传统的流程评估人工智能项目,应该为AI项目团队设立合适的KPI和目标。
“有关AI的应用越来越多了,但企业的AI转型并不是开发一个APP这么简单,不要指望AI解决所有的问题,也不要指望AI项目一次性就成功。”吴恩达表示。
责任编辑:张国帅


热门推荐
网络“大V”司马南偷税被罚超900万 收起网络“大V”司马南偷税被罚超900万
- 2025年03月21日
- 02:04
- APP专享
- 扒圈小记
9,685
香港《大公报》再发文:奉劝有关企业和人士,停止交割
- 2025年03月21日
- 01:22
- APP专享
- 扒圈小记
9,576
“千禾0”,深夜发文致歉
- 2025年03月21日
- 02:06
- APP专享
- 北京时间
7,032

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 10:30:06
亚星锚链(sh601890)(601890.SH)发布股票交易异常波动公告,经自查,公司目前生产经营活动正常,市场环境、行业政策未发生重大调整,生产成本和销售等情况未出现大幅波动,内部生产经营秩序正常。除已披露信息外,公司、公司控股股东及实际控制人不存在其他应披露而未披露的重大事项。 -
数字江恩今天 09:17:32
下周一,只要没有加速下跌,那么3350+-5个点区间,便是2-a的结束。其后,2-b反弹和2-c再次下跌便是下周的走势了,其中,2-c的时间会跨越下周到下下周,这就等下周再说了。总之下周都处于第二浪回踩之中,之上期间有一个短线2-b反弹。 -
数字江恩今天 09:17:24
5分钟图来看,3297的上涨第一浪已经结束了,内部结构看为abc结果。本周五直接跌破3376,已经确立了第二浪回踩已经开始,而第二浪内部也是abc的内部结构。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:17:12
首先看30分钟图,本人上周末给出3430+-10点区间受阻震荡,本周完全实现,实际最高点3439点。这张图主要是看一下震荡结构的底线,其中A低点3297不容许跌破,这是3140向上走势,在震荡后继续上行的底线条件。只要不跌破A点,那么震荡后,图上的红色轮谷线、蓝色轮峰线都会突破,当然,是下周以后了。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:16:56
大盘本周成交量略微缩量,冲高新高之后出现明显回踩,收盘再5周均线附近。目前5周线3371, 10周线3325,其中10周线继续上行,是下周的重要支撑线。板块上来说,本周没有持续性热点,各个板块走马灯一遍。 -
数字江恩今天 09:16:52
下周行情展望2025.03.21 -
北京红竹今天 08:05:06
2、调整的级别行情没什么可聊的,做个调查吧这一波调整,你觉得30分钟级别调整好,还是日线级别调整好。如果是三十分钟级别调整,到时能做波段操作,仓位半仓左右。如果是日线级别调整,等待的时间可能长一些,到时候长线、波段、ETF都可以布局。目前我的2个组合几乎没什么仓位,特别是长线组合,一直都没布局,短线组合还有半仓。我先说自己的预期,当然是预期,咱就是瞎聊。我的屁股现在坐在没仓位的情况下,我当然希望日线级别调整,到时候我好布局长线(一招鲜升级版个股)和ETF,不然我只能玩短线了。所以如何来交易,都是屁股决定的,坐在哪里就希望什么,只是市场会有自己的判断而已。 -
北京红竹今天 08:05:00
1、2个中枢之后的结果最近强调最多的就是2个中枢之后不做任何的追买,只考虑如何卖出的问题。这是缠论教科书式的定义,今天一根阴线跌下来,可以谈买入了吗?依然还不是不谈,缠论不是看跌了多少,而是要看结构。市场怎么走都可以,但缠论是我们能看懂的交易体系,走出我们能看明白的走势,再干活就好了。现在就是踏踏实实等待三十分钟级别回落段的出现。对于调整我们在做个分类,第一种分类,如果日线一笔调整不破3297点,后面指数还可以继续新高,这里的干活仓位半仓就好。第二种分类,如果日线一笔调整跌破3297点,那就踏踏实实等日线级别一段下跌之后,再谈买入的事。不预测,只谈分类就好。市场给什么走势,我们做什么走势就好。 -
徐小明今天 07:08:27
【盘中直播】语音课见 -
巨丰投资张翠霞今天 07:07:18
4小时运行结束,总结全天市场运行,1)沪指上周五突破3400点整数关口后,买盘衰竭,本周缩量横盘后,下半周迎来破位下挫,周五放量下跌失守3400点,春季躁动行情没有高度,只有宽度,下周月末+4月年报季,注意个股基本面,迎接年报大考,预期后市仍为结构性轮动行情,今日释放流动性后,个股机会出现;2)量能,沪深两市今日成交额15797亿元,较上个交易日14766亿元增加1031亿元;3)行业板块方面,以加权涨幅来看56家行业7家红盘,船舶、钢铁、酒店餐饮等板块涨幅居前;汽车、软件服务、半导体等板块跌幅居前;4)市场延续结构型行情,题材热点快速轮动。详细解盘,可关注《翠霞首席课》的“热点直击”和“操盘指南”~~~