王晓华
在人工智能的浩瀚星空中,深度学习犹如一颗耀眼的明星,引领着计算机视觉技术的发展。本书带领读者领略深度学习在计算视觉领域的魅力,详解使用PyTorch2.0进行计算机视觉应用实战的技巧。本书配套示例源码、PPT课件。本书共分15章,内容包括深度学习与计算机视觉、PyTorch2.0深度学习环境搭建、从0开始PyTorch2.0、一学就会的深度学习基础算法、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型可视化、残差神经网络实战、基于OpenCV与PyTorch的人脸发现与识别实战、词映射与循环神经网络、注意力机制与注意力模型详解、基于注意力机制的图像识别实战、基于DiffusionModel的从随机到可控图像生成实战、基于注意力的单目摄像头目标检测实战、基于注意力与Unet的全画幅适配图像全景分割实战、基于预训练模型的可控零样本图像迁移合成实战。本书适合深度学习初学者、PyTorch初学者、PyTorch深度学习计算机视觉应用开发人员阅读,也可作为高等院校或高职高专计算机技术、人工智能、智能科学与技术、数据科学与大数据技术等相关专业的教材。
杨洋,王永琦
视觉系统的应用总体上较为广泛,但是现在实际能用上的确实是不太够。机器视觉非常重要,但是目前更多的是聚集在硬件数据采集和定位研究,本书更多的是聚焦于软件设计,特别是模式识别方面,系统地阐述了机器视觉的工作原理、分析方法、技术和应用,对MATLAB在图像视频处理的特点以及基本知识进行了阐述,从图形绘制层层深入MATLAB的二维和三维图像绘制功能,并介绍了科学计算可视化的相关知识;详细介绍了机器视觉的发展与当前技术的关键点,以及图像表示和描述、图像分割、增强、融合与模式识别等方面的知识,并给出机器视觉处理应用的实例。本书融入了编者多年从事视频处理的科研成果,在阐述基本理论的同时,辅以MATLAB源程序,加上详细注释,便于读者学习。
李轩涯、曹焯然、计湘婷
本书是一本基于PaddlePaddle深度学习框架的实践性计算机视觉教材,重点关注计算机视觉在实际中的应用。本书涵盖计算机视觉领域的众多方面,包含图像分类、目标检测、图像分割、视频分类以及图像生成等领域,并通过大量的实践案例向读者演示如何编写计算机视觉应用程序,从而帮助读者深入理解计算机视觉的核心概念和技术。 本书可以作为一本实用的计算机视觉实践指南,无论对于从事计算机视觉领域的专业人士,还是对计算机视觉感兴趣的初学者,本书都值得阅读和收藏。
胡钦太、朱鉴、刘冬宁
本书采用项目任务式的编写方式,介绍了计算机视觉相关的基础概念与基本知识点,并结合应用案例阐述其基本原理。全书内容丰富、涵盖面广,涉及低、中、高层视觉技术,以及视觉与文本结合的多模态技术,具体包括10 个项目:图像滤波、图像特征提取、图像识别、图像分割、目标检测与追踪、图像生成与转换、人体行为解析、图像文本生成、视觉问答系统和视频理解。 本书对每个项目涉及的知识点提供了丰富、生动的案例素材,并以Python 语言为主要工具详细讲解了核心程序。每个项目下设2 ~ 3 个应用任务,结合代码讲述具体任务实施过程,让读者全方位深刻理解任务对应知识点与基本原理。 本书结构布局紧凑,内容深入浅出,代码简洁高效,适合作为计算机、人工智能、通信和自动化等相关专业的教师与学生用书,也可作为广大从事计算机视觉工程的研发人员的参考用书。
刘松林
根据机器视觉基础的实践标准,本书内容主要分为三部分:第一部分是图像处理算法,第二部分是相机标定,第三部分是综合实验。图像处理实验系统是基于vs平台的一个实验程序,主要完成对图像二值处理、边缘检测、点特征检测算法的上机实习;相机标定主要是利用张正友方法完成对单目、双目相机的标定实验;综合实验主要是利用图像进行物体三维重建,熟悉图像处理算法的应用。通过表现手法的运用和经典案例的讲解,使学员对机器视觉基础有更加直观的认识理解,能够快速领悟和运用。
深度学习技术及应用国家工程研究中心 百度技术培训中心 组编 罗晓燕 白浩杰 党青青 杜宇宁 张宝昌 编著
本书在介绍深度学习、百度飞桨等相关知识的基础上,着重介绍了图像分类、目标检测、语义分割、人体关键点检测、图像生成、视频分类、图像文本检测和识别、图像识别等计算机视觉任务的实现原理及深度学习模型框架,并通过具体案例来详细介绍各任务的实现细节。 全书分为理论篇和实战篇。理论篇(第1~4章)梳理了计算机视觉技术的发展历程、主要任务、行业应用系统,同时简要介绍了深度学习开发框架、飞桨(PaddlePaddle)开发平台,以及深度学习的基础知识与网络模型架构。实战篇(第5~12章)结合计算机视觉的各个任务要求与技术发展,对其中经典的深度学习算法模型进行介绍。全书提供了实例代码,详解了在飞桨开发框架下各任务的模型实现过程。 本书适合作为高等院校人工智能、计算机视觉专业高年级本科生、研究生的教材,同时可作为计算机视觉相关任务实践教程,也可以作为科研工作者的参考书籍。
孙妍
计算机视觉中关于视频的运动分析目前主要关注位移的检测和计算,较少地考虑到更高阶运动的基本性质,如加速度等。因此,本书介绍了如何检测视频中的高阶运动场、高阶运动特征特性,以及相关应用场景,为研究人员和研究生在计算机视觉中分析运动带来了一个新的视角。本书展示了计算机视觉中,高阶运动特征的检测以及区分不同类型运动方面的能力,为今后的进一步研究和应用提供了理论基础。 本书的主要特点和内容是: 1. 加速估计法 2. 从加速度场得出的切向和径向加速度 3. 高阶运动的应用
王永琦,杨洋
本书系统地阐述了机器人视觉工作的原理、分析方法、技术和应用。全书内容主要分两大部分,第一部分是“基础篇”,对MATLAB在图像视频处理的特点以及基本知识进行了阐述,从图形绘制层层深入MATLAB的二维和三维图像绘制功能,并介绍了科学计算可视化的相关知识;第二部分是“机器人视觉处理技术”,详细介绍了机器人视觉的发展与当前技术的关键点,以及图像表示和描述、图像分割、增强、融合与模式识别等方面的知识,并给出机器人视觉处理应用的实例。
朱文伟,李建英
OpenCV是一个跨平台计算机视觉和机器学习软件库,也是计算机视觉领域的开发人员必须掌握的技术。本书基于Python 3.8全面、系统地介绍OpenCV 4.5的使用,并配套示例源代码、开发环境与答疑服务。 本书共分15章,主要内容包括计算机视觉概述、OpenCV的Python开发环境搭建、OpenCV基本操作、数组矩阵、图像处理模块、灰度变换和直方图修正、图像平滑、几何变换、图像边缘检测、图像分割、图像金字塔、图像形态学、视频处理,以及停车场车牌识别、物体识别、运动跟踪、人脸检测等案例。 本书既适合计算机视觉与图像处理、人工智能算法的开发人员阅读,也适合高等院校和培训机构计算机视觉与图像处理、人工智能等相关专业的师生教学参考。
李轩涯 曹焯然 计湘婷 编著
本书研究计算机对环境的表达、理解与感知相关的理论和技术,试图建立从图像或多维数据中获取“信息”的人工智能系统,是让计算机智能化的达到类似人类的双眼“看”的一门研究科学。本书兼具基础理论与编程实战,可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的实践教材或参考书,也可供从事计算机视觉和人工智能等领域研究的相关人员参考,是一本实用性极强的入门实践教辅材料。
刘国华, 主编
本书介绍机器视觉的构成、图像处理方法以及应用实例,主要包括:图像形成和处理技术、图像特征提取、基于多幅图像的立体视觉技术、深度学习等,特别强调了HALCON软件在工程应用上的应用方法,并给出了大量数字图像处理技术的HALCON实现程序。在实例中强调了如何用HALCON图像处理算子解决工程中、特别是机器人视觉控制中的实际问题、难题。本书可作为高等理工科院校智能制造、电子信息、机械电子等专业的本科生教材,也可作为研究生以及从事图像研究的科研工作者的学习参考用书。
谢经明, 周诗洋, 编著
本书作为机器视觉技术及应用的一本参考书,从机器视觉的基本原理以及常用机器视觉算法,再到视觉系统相关的硬件选型计算,详细的介绍了机器视觉技术的基本知识;在此基础上对机器视觉技术在智能制造领域中的基本应用做了详细的讲解,最后对作者所在的课题组的近20年机器视觉相关的研究成果做为应用案例讲解,系统的介绍了相关应用从需求分析、光学设计、算法研究到系统实现的全过程;该书不仅可以作为从事机器视觉技术应用的专业技术人员参考书,而且可以高等院校机械类、智能制造工程、自动化及相关专业高年级本科生及研究生教材。
袁雪
人工智能正在成为全世界产业变革的方向,处于第四次科技革命的核心地位。计算机视觉(Computer Vision)就是利用摄像机、算法和计算资源为人工智能系统按上“眼睛”,让其可以拥有人类的双眼所具有的前景与背景分割、物体识别、目标跟踪、判别决策等功能。计算机视觉系统可以让计算机看见并理解这个世界的“信息”,从而替代人类完成重复性工作。目前计算机视觉领域热门的研究方向有物体检测和识别、语义分割、目标跟踪等。本书围绕着计算机视觉的关键技术,介绍基于深度学习计算机视觉的基础理论及主要算法。本书结合常见的应用场景和项目实例,循序渐进地带领读者进入美妙的计算机视觉世界。本书共分为11章,2~5章介绍计算机视觉的几种关键技术,即图像分类、目标检测、图像分割和目标跟踪,并将这四项关键技术组合完成人工智能的实际应用。本书在6、7章介绍人工智能的两个典型应用:文字检测与识别系统及多任务深度学习系统,第8章介绍一种非常有意思的深度学习网络——对抗生成神经网络,第9章介绍制作训练和测试样本的方法,第10章介绍如何安装TensorFlow、Keras API及相关介绍,第11章介绍综合实验。本书提供了大量项目实例及代码解析,均是基于Python语言及TensorFlow、Keras API的。本教材的每章均配有微课视频,扫描每章的二维码,可观看作者的视频讲解
张德丰
《Python计算机视觉实战》以Python为平台,以“概述+案例”的方式系统地对计算机视觉进行实战分析。本书先介绍计算机视觉编程基础知识,接着介绍在各个领域利用Python解决计算机视觉问题,最后通过两个经典案例综合分析计算机视觉应用。为了帮助读者更好地掌握相关知识,各章节都是通过概述与案例相结合的方式,让读者在掌握概念的同时举一反三,掌握程序设计的方法,利用程序设计解决实际问题。 《Python计算机视觉实战》适合计算机视觉初学者以及想深入研究Python计算机视觉的开发者阅读参考。
[美] 克里斯南杜·卡尔 著 周玉兰 译
《TensorFlow2.x高级计算机视觉》详细阐述了与TensorFlow高级计算机视觉相关的基本解决方案,主要包括计算机视觉和TensorFlow基础知识,局部二值模式和内容识别,使用OpenCV和CNN进行面部检测,图像深度学习,神经网络架构和模型,迁移学习和视觉搜索,YOLO和对象检测,语义分割和神经风格迁移,使用多任务深度学习进行动作识别,使用R-CNN、SSD和R-FCN进行对象检测,通过CPU/GPU优化在边缘设备上进行深度学习,用于计算机视觉的云计算平台等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。
欧阳鹏程、任浩然
本书以Python数据处理工具和深度学习的基本原理为切入点,由浅入深介绍TensorFlow的使用方法。由原理着手到代码实践,内容从最基本的回归问题开始,到近年来大热的卷积神经网络和生成式模型。本书省去大量烦琐的数学推导,以通俗易懂的语言和示例阐述深度学习的原理。 本书共8章,第1和2章介绍TensorFlow的环境搭建与Python基本数据处理工具,为后面介绍TensorFlow做准备;第3~5章讲解TensorFlow和深度学习中的基本概念及深度学习常用数据集;第6~8章从易到难深入讲解不同的神经网络模型并配合大量的示例,进一步巩固TensorFlow代码的使用。本书配有整套代码,在重点、难点处配有讲解视频,读者可以根据自身兴趣与需求对代码进行修改并通过视频对难以理解的知识点进行巩固。 本书的难度、层次清晰,适合任何希望入门人工智能领域的学生或工作者阅读,同时也包含最新的技术,适于想要紧跟视觉研究的从业人员阅读。
更多精彩专题