最近看目标识别的文献,许多人工智能的概念诸如机器学习、深度学习、神经网络模型、深度神经网络模型把人搞得晕头转向。查了一些资料,总算明白点了。
人工智能、机器学习、神经网络、深度学习的关系见下图,人工智能>机器学习>神经网络>深度学习。
人工智能是20世纪50年代提出的,机器学习是20世纪80年提出的,深度学习是21世纪初提出的。神经网络是20世纪40年代提出的,但是一直起伏不定(见下图),21世纪初多层神经网络的提出直接引出了深度学习。因此,从发展脉络来说,人工智能、机器学习、神经网络和深度学习是随着时间逐步深化的。
深度学习泛指深度神经网络,意思就是有深度的神经网络,当然是多层,而不是单层或两层。与其说深度学习是机器学习的一种,不如说是一种进化。不过,现在机器学习与深度学习的区分已经不明显了,深度学习也用到机器学习的算法模型。
神经网络就是模拟人脑的行为,早期单层、两层模型只能简单分类,现在多层神经网络能够复杂分类。比方说,小孩子经过认狗的训练,然后他就从包含狗的图片中识别出狗来。我们无需理解大脑神经元是如何运作的,只需要将这个小孩训练好,能识别狗就行,这个能识别狗的小孩子就是我们需要的神经网络模型,就是我们平常所说的大模型。
深度学习包含卷积神经网络CNN、递归神经网络RNN、生成对抗神经网络GAN、Transformer等神经网络模型,现在Transformer模型有一统江湖的趋势,目前大部分大模型比如chatgpt、deepseek都是Transformer架构。
文生图的StableDiffusion采用的是混合卷积神经网络和Transformer架构。我们用部署StableDiffusion加载诸如“可米甜子2.5融合超大模型_v1.safetensors”、“DD.斗破苍穹萧薰儿_v1.safetensors”等风格和人物模型,再加上一些正向和方向提示词,就可轻松生成好看的人物图片。
以前chatgpt只能科学上网才能使用,而且总是掉线。现在deepseek、kimi等国内语言大模型不输于国外产品,稳定好用,爽得飞起。
如果深度学习仅是上面的娱乐功能,不能与生产结合,那么它的角色只是一个艺术家。而捞参机器人和垃圾收集机器人的出现,说明人工智能可以深度参与社会生产。下图是山东建筑大学机电工程学院于复生教授研发的捞参机器人。
捞海参机器人的关键在于海参的识别,海参的识别需要海参大模型。首先收集大量高清的海参图像,建立海参数据集,然后用YOLO来训练获取最佳的参数,相当于建立海参识别的大模型,最后将这个大模型移植到嵌入式系统(水下机器人)中,1台捞参机器人就完成了,试验证明,海参检测的平均准确率为94%。
如果在知网用“深度学习”关键词搜索,仅2025年的文献量就有1000余条,这说明各行各业都积极地与人工智能结合,从另外一个角度来说,人工智能也拯救了无数专业的大学生们,再也不用苦恼找不到选题的方向了。
参考文献
1、https://www.zhihu.com/question/35965814?sort=created
2、机器学习入门(15)— 全连接层与卷积层的区别、卷积神经网络结构、卷积运算、填充、卷积步幅、三维数据卷积、多维卷积核运算以及批处理_全连接层和卷积层的区别-CSDN博客
3、https://zhuanlan.zhihu.com/p/13491328897
4、卷积神经网络和深度神经网络的区别是什么?_深度神经网络和卷积神经网络区别-CSDN博客
5、基于深度学习的水下目标识别关键技术研究_侯成龙
6、基于深度学习的海参水下识别定位技术的研究_肖千
7、https://baijiahao.baidu.com/s?id=1690043672479648822
发表评论: