陕西科技大学教授章为川:人工智能助力应对气候变化

陕西科技大学教授章为川:人工智能助力应对气候变化
2024年06月13日 10:31 市场资讯

专题:2024阿拉善SEE气候周

  2024年6月7日,阿拉善SEE气候周期间,北京市企业家环保基金会(下称:SEE基金会)主办的“可持续行动引领气候友好型未来”平行会议在京召开。会上,SEE基金会公布了应对气候变化方面的工作进展报告,同时邀请了政府、企业代表、行业专家及项目伙伴分享在加速气候行动方面的洞察与创新方法,探讨如何结合多方力量,达成环保公益合作,共同助力应对气候变化。陕西科技大学章为川教授出席会议并以《人工智能助力应对气候变化》为题发表主旨演讲。

  以下为发言实录:

  章为川:大家早上好,我今天的报告题目是“人工智能助力应对气候变化”。

  对我们来说,人工智能主要是从数据中提取特征表征,有效的一个特征信息。咱们人工智能随着的发展,随着Chat GPT出来,我们的时代已经在变化了。以前从电子信息变化成如何提取有效的特征表征,特征表征的提取对我们来说就是对数据如何进行分析。

  我们今天要讲的就是我过去三年来我们研究的内容和接下来我们正在做的跟气候相关人工智能处理相关的知识。

  我们是过去三年澳大利亚野火,我之前六年是在澳大利亚工作,还有一个是厄尔尼诺预测。我们看这个图,人工智能是通过建立数学模型对数据进行分析,是非线性的。人眼看会认为A和B是同一组棉花过来。事实上我们棉花的摘取B和C是同一组棉花摘过来。人眼还有专家无法进行区分和辨别,怎么做?我们设计一个网络架构,设计深度学习。让人工智能去进行训练学习,进行识别的过程。

  接下来讲一下人工智能包括机器学习和深度学习。随着现代的发展,大家用的是深度学习。因为深度学习咱们可以提取更多的深度学习表征。大家再记住一点,我是9月份回国,短短九个月咱们人工智能的发展就是骨干网络,现在时代又变了,这一两个月出来一个Mamber(音),就整个模型的网络架构全在变化,这变化很快很快。我们做人工智能有一个问题,我们三个月需要被淘汰,这是我们很可怕的现象,我们的竞争要很强很强才行,三个月一个周期是这样的现状。

  我们特征提取,如何从图像中提取特征表征进行分析处理,还有图像局部特征检测,图像分类,图像变化检测,还有一个野火。现在研究的一个野火问题还有厄尔尼诺现象。

  我们说一下图像特征提取,我们一个图片也好,主要特征是由边缘、角点、斑块,这是图像三要素组成。大家考虑过没有,教科书里面几十年发展,什么叫做边缘、角点、斑块说清楚了吗?咱们教科书有定义,但我接下来过去三年的理论研究表明,咱们教科书中很多知识理论都是错的,这就很可怕了,为什么出现这个问题?数学,我们数学怎么证明。

  大家看一下A图,咱们教科书认为X和Y轴两个方向变化很大的时候,它认为是角点,教科书对角点的定义,X和Y轴。也就是说教科书教大家,你只要提取X和Y轴的非度(音)变化信息,就可以拿过来检测角点。检测角点是干嘛的?后面用图像配准都用到了,三维重建大家都用到了。甚至我们现在还有很火的无人驾驶里面用的是什么,我不多讲了。我们现在整套理论架构是基于X轴和Y轴的方向导数(音)建立的。

  我们看A图的话,这是一个简单的角点,它的X和Y轴的方向导数都很大。是的,它可以把它准确检测是角点,咱们可以拿过来做配点,做目标跟踪,做无人驾驶。我把简单的角点图片旋转到一个B图,就把图片变的45度,它还是角点,什么都没变。大家再看它的X和Y轴  Filter导数等于0。如果按照现有的理论体系它是没法准确检测到了。我们人工智能无法工作了,因为人工智能是人为来设计的网络架构,怎么办?是咱们目前的数学理论架构出的问题。我们把C图对A图进行旋转、拉伸、扭曲,我们发现它对应X和Y轴的Fiter导数还是等于0。按照现有理论和现有的教科书体系,X和Y轴的两个方向导数无法准确的区别边缘和图像区别。

  为此我们建立角点的模型,这是边缘模型,这是角点模型,这里我不细说了。我们通过各向异性高斯方向导数滤波器,得到边缘跟角点一个数学解析表达式。通过解析表达式,我们得到什么是角点和边缘的连续和区别,这是我2020年的研究工作。

  接下来我们发现这个工作还是有缺陷的,我们继续做工作,我们要二阶各向异性高斯方向导数滤波器。建立什么?它对抑制噪声能力,得到它一个角点跟边缘新的数学解析表达式。通过数学解析表达式,我们目的是如何提取数据的信息,我们得到边缘的响应是0,角点的响应跟边缘是不一样的,我们得到特性。这是2021年发表在人工智能最顶级的期刊。

  我们接下来讲兴趣点,如果这个图大家看的很陌生,这是一个血斑,如果你做心脏搭桥的时候做一个血斑检测,心脏血管里有血斑。我们建立一个血斑的模型,叫一个斑块。你这个斑块模型是怎么样的?它现在最著名就是谷歌的首席科学家提出来的,他拿过来检测血斑,牛津他们建立的一整套血斑检测的理论体系。我们的数学表明它的理论体系存在缺陷和重大缺陷,这是咱们跟人疾病相关,检测血管里面有没有血斑。

  我们建立血斑的模型,现有的理论体系是用一阶导数来检测到,血斑侯选(音)角点,侯选信息点,用二阶来辨别血斑。这是我们2023年发表的文章,我们得到什么?一阶的响应是0,数学推导出来。你一阶响应是0,怎么来检测血斑?二阶的响应,谷歌首席科学家认为二阶响应两个方向X轴和Y轴,就可以拿过来检测血斑。我们发现X和Y轴的时候,血斑各向异性,两个方向无法检测到的。它是一直在变化的。只有各向同性的时候,血斑它的方向相应性质是0,是一致的。我们建立一个新的血斑的检测,提出建立一个新的理论,这是2023年发表的文章。

  我们根据数学理论,建立深度学习模型,我们提出各种各样的模型,这是图像配准的准侧,我们是全球最好的,这是三维重建指标目前也是最优的。

  接下来讲小样本细粒图像分类,这个课题是拿过来做咱们动物的识别和分类,我们小样本有个问题,咱们目前手机发展,大哥大又大又笨,手机变得很小了。网络的Chat GPT很好,但是大家想想Chat GPT的网络模型要多少?硬件要显卡要20亿美金,大家想我们陕西科技大学一年整个学校的科研经费只有10亿人民币。整个陕西科技大学不吃不喝16年才能买齐了Chat GPT。那不可能。

  我们做的研究是基于小样本,整个Chat GPT是基于大样本做的,还有大型的样本需要样本数量要很大,海量的样本。我们一个人不可能搜集到海量的样本数据,我们怎么做我们的手机从大到小,我们研究基于小样本,做小样本,小样本是从监督到有监督。我们研究定位在哪儿?我们定位在小样本,我们小样本是500、600个,不会超过1000个。我就可以得到很好的性能指标,这是我们做的。我们通过小样本训练,得到一个性能指标,这是在深度学习进行斑块的检测。

  我们怎么做的?目前从图片送到一个碱基(音)神经网络去,得到特征表征Y,对Y进行处理,目前所有主流技术都这么做。大家考虑过没?我只是对Y进行处理,那什么信息丢失了?就是I减去Y,输入的信息D,这个信息被丢失掉了。你这个信息丢失有没有用?咱们做到信息回收再利用,垃圾回收再利用,根据这么一个简单的哲学逻辑,我们提出信息回收再利用新的网络架构。

  A图就是现有的网络架构,速度图线通过深度学习网络,得到特征表征进行处理。我们怎么做?我们把第一层得到特征表征丢弃的信息捡回来送到第二层网络上,把第二层丢弃的信息捡回来送到第三层网络。我们层层把丢弃的信息全都捡回来,信息回收再利用的深度学习网络架构。我们的网络架构,性能指标目前是全球最好的,做分类。我们的研究表明它这个做小样本的时候是无效的,性能是影响的,我们当时进行理论分析,这里不讲了。我们设计一个新的信息回收再利用网络。

  这是我们后面做泥石流监测,这是变化检测,泥石流这个课题很艰难。咱们全国对泥石流要求是全国布控、布点。这个课题领导非常关注,如果泥石流来了,你没有把它检测到,领导会抓过去坐牢。这个课题很艰巨,我回来九个月,这是我遇到最难的课题。它的准确率要80%,但是泥石流我们发动人把目前泥石流都找齐泥石流图像。这是要布控的点,找到泥石流在这里进行网络训练,准确率要求,这是没有答案,这是很艰巨,做不好不是罚款的问题。我们设计一个网络架构,我们网络架构得到泥石流变化检测,这是一个参考图,这是真实的泥石流的情况。这是我们检测到的结果,我们很好的把泥石流检测到。我们也有不足,现在很多泥石流在不一样的地方我们多检测了,这也是事实,这个我们准确率达到88%,领导们很高兴。

  这个可以拿过来干什么?泥石流变化检测,我们做石油管道漏油也可以做到,这是一个图像变化,可以把变化的人检测到。如果有偷猎现象,图像变化我们可以进行预警,已经做到了,用视频做的。

  接下来做SAR图像变化检测,这是陕西省国土资源厅的课题,大家拿过来干嘛?刚才秘书长说得我们如果拿过来监测的话,真正是一个SAR图像图,我们现在看我们种植的生命,我们绿色多少,我们有多少存活率。我们拿过来,通过SAR图像,可以把它植被的分布情况检测到,我们这个课题通过SAR图像它有一个农田每年的变化,农田有没有被违建,变成一个房子,这是我们做的,我们拿过来把农田设计一个网络架构,时间关系不多讲了。

  它这有一个难点,一个SAR卫星像素,一个像素对应是25米。咱们半亩田连一个像素都没到,是这个题目课题的难点,一个像素需要进行图像的考虑。我这个PPT有300多页,为什么?这两张图,真实的一张图有20G左右。我打开这个图是很困难的,我已经压缩掉了,这是我们做的课题,我们得到的结果,它对我们要求精确度达到80%,我们达到80.14%,这是我们做的。这是我们过去三年发表的顶级刊的文章。

  讲一下澳大利亚野火监测,我们怎么做的?我的导师是得到一个澳大利亚课题接近1900多万澳元,专门对气候进行研究,这是我们过去主要做的野火课题。澳大利亚主要是农业植被和做棉花检测,还有气候对葡萄的变化,还有气候对葡萄,还有大麦、小麦行业的变化。我主要研究是对野火,澳大利亚细腻2020年出现一个野火。我住在市区里头大火快烧到我家了,这个时候它是做一个预警,资源优化和放缓措施。我们提出现在全球变化对气候的原因,整个澳大利亚变化更明显。野火现象因为温度变化很影响。

  这是团队设计的结果,好得不讲了,我们讲一下我们怎么设计的。目前它设计的结果有一个问题,已经出好的结果不讲了,这是可以看到的。烟跟雾的时候,用深度学习网络是无法区别开的。如果烟是正常的,雾很有可能是火灾。我们怎么办?两个烟是什么?深度学习得到它的特征表征是挨在一块的。两个是真实的表征在一块分不开了。我们怎么使它两个特征表征能很好的分开?我们设计特征可分离网络,我们认定就得到特征表征满足高速分布。我们做了一个非线性变化,我们得到一个新的伊塔(音)的分布区,我们的目的是干嘛?这两个分布,我们通过改变非线性变化因子,如果它是两类的话,干嘛?我们通过改变非线性变化因子使它分开。如果它是一类的话,我们可以通过改变非线性因子使它挨在一块。

  我们现在对气候变化的影响,就是数学,我们网络架构怎么设计。我们设计得到它的分布情况,得到它的分布值和分布位置。如果是两个非线性变化因子,它属于不同类的时候,我们就改变非常变化因子时它俩分开。如果这两个特征表征属于不同类的时候,我们找到它极大值,通过我们数学公式使得它俩各自往外移,通过数学的变化,我们设计这么一个深度学习,就是特征可分的网络架构。我们正是由于商业原因,后面结果不讲了。

  厄尔尼诺现象我们是怎么做的,怎么设计的过程。厄尔尼诺在国内还不是很重视,他们那边影响很大了,澳大利亚小麦的影响非常厉害。现在就是SPB,春季预测,你在三到五月的性能指标急剧下降,为什么出现这样的情况?我们在Nino3.4是一个关键区域,温度升高平均高于0.5度的时候,称为厄尔尼诺现象。如果低于负的0.5度称为拉尼娜现象。咱们现在研究都是在Nino这个地方进行布点,我们以500米为一个区域进行布点,这是深度学习网络架构。这是别人做的,我不讲了。现在看它得到的结果指标有些还不好。我们怎么做的?我讲一下。

  咱们说话的时候,我跟秘书两个人说话,咱们在空域中是分不开的。语音信号在平移(音)中才分开,空域是分不开的。那怎么办?平移中提取到一些空域提取不到的特征信息。这时候我们已经把数据变成一个二维的图像,我们采集到的数据变为图像。我们把图像通过一个DCT变换。通过一个DCT变化得到一个平移,我们得到不同的一个频谱图。然后我们把不同的频谱图送到深度学习网络中去,得到它不同的频谱图的图像,特征表征。我们不知道哪个频谱的特征表征,我们给它设权重,把它进行一个结合,对厄尔尼诺现象进行一个预测,这是我们一个方案,正在做的。

  另外一个大家看,这是更有意思的,我们把一个图片变为DCT变换,得到不同的频谱图。我们把频谱图把它结合在一起,变为一个三维空间,可以提取二维,就每一个平移的特征信息,提取平移跟平移之间的信息。我们设计一个三维的立体,我们提取空间的特征信息,除了提取它的需一块特征信息之外,它的空间信息我们全都可以提取到,我们提取它的立体特征信息。我们设计这么一个网络,这个可以拿过来对大气的预测我们全都可以做到,这是我们搜集的特征图,深度学习,这是我们设计的网络架构然后进行预测。结果达到商用价值,我不敢多说了。这说一下我们的网络架构。谢谢大家。

海量资讯、精准解读,尽在新浪财经APP

责任编辑:梁斌 SF055

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 06-17 永臻股份 603381 --
  • 06-17 爱迪特 301580 --
  • 06-11 中仑新材 301565 11.88
  • 05-31 达梦数据 688692 86.96
  • 05-28 利安科技 300784 28.3
  • 新浪首页 语音播报 相关新闻 返回顶部