• 《Z1514-优视觉-《火柴头人画法》视觉笔记/记录实用人物画法》|百度网盘下载

    视觉-《火柴头人画法》视觉笔记/记录实用人物画法官方600.0《Z1514-优视觉-《火柴头人画法》视觉笔记/记录实用人物画法》绘画动漫造型艺术设计2.0会员免费,在已购-2.0会员中学习代理、合伙人专享50%捐赠回报...

    2023-02-01

  • 《Z1516-优视觉-《视觉记录》视觉呈现核心必修栏目》|百度网盘下载

    视觉-《视觉记录》视觉呈现核心必修栏目官方1698.0《Z1516-优视觉-《视觉记录》视觉呈现核心必修栏目》绘画动漫造型艺术设计2.0会员免费,在已购-2.0会员中学习代理、合伙人专享50%捐赠回报...

    2023-02-01

  • 视觉-4月9-10日考核 欢迎加入|百度网盘下载

    课程介绍01视觉记录简介.m402视觉类型与区分.m403工具选择与使用.m404PreetatioBegiwithText.m405Image构图与基础.m406形象思维与转换.m407色彩选择与搭配.m408隐喻技巧与维度.m409版面设计与构图.m410视觉Preetatio可以识别出逻辑金字塔的第一层.m411逻辑金字塔第二层的可视化展示。Layerig.m412逻辑金字塔第三层的视觉呈现.m413...

    2023-02-01 版面设计 视觉度 版面设计 视觉中心

  • S1268贺凯:多品类综合体视觉陈列|百度网盘下载

    目录介绍看图片599《S1268贺凯:多品类综合体视觉陈列》],即可获得学习权限...

    2023-01-29

  • 视觉-《进阶模块》隐喻·图文应用·视觉核心实战

    官方3398.0《优视觉-《进阶模块》隐喻·图文应用·视觉核心实战》设计2.0会员免费,在已购-2.0会员中学习代理、合伙人专享50%捐赠回报...

    2023-01-28 视觉模块内容 视觉模块

  • 《Z4595-一目可视-生命视觉3D课程综合篇+雕刻篇》|百度网盘下载

    一目可视-生命视觉3D课程综合篇+雕刻篇官方6499.0《Z4595-一目可视-生命视觉3D课程综合篇+雕刻篇》千年中医养生文化2.0会员免费,在已购-2.0会员中学习代理、合伙人专享50%捐赠回报...

    2023-01-28

  • 视觉-《进阶模块》隐喻·图文应用·视觉核心实战|百度网盘下载

    课程介绍01《赏读®》影像阅读⑩育儿02《赏读®》影像阅读⑨社会03《赏读®》影像阅读⑧学习04《闲读会®》影像阅读⑦职场05《仙都汇®》形象阅读⑥营销06《仙都汇®》形象阅读⑤心理学07《分享阅读®》形象阅读④思考08《分享阅读®》形象阅读③管理lt09《分享阅读®》图像阅读②交流篇10《分享阅读®》图像阅读①成长篇11图像创意隐喻·视觉呈现核心必备技能12图像创意隐喻专项训练gt13-100Text-to-Image专项培训14标题字体设计...

    2023-01-18 影像阅读 字体设计图片 影像阅读 字体设计图

  • 营销策划经理案头手册》陈明星主编|(epub+azw3+mobi+pdf)电子书下载

    图书名称:《营销策划经理案头手册》【作者】陈明星主编【丛书名】现代零售连锁企业经理人案头手册系列丛书【页数】221【出版社】广州:广东经济出版社,2012.09【ISBN号】978-7-5454-1472-1【价格】30.00【分类】零售企业-连锁企业-营销策划-手册【参考文献】陈明星主编.营销策划经理案头手册.广州:广东经济出版社,2012.09.图书封面:图书目录:《营销策划经理案头手册》内容提要:《营销策划经理案头手册》内容包括营销策划部概述、营销策划部人员配置及岗位职责、营销策划部工作规范、营销策划部工作制度模板、营销策划部工作实用图表举例等等。《营销策划经理案头手册》内容试读第1章营销策划部概述营销策划部,是企业探寻市场,获得市场信息,供决策者决策参考的重要部门:营是解决企业经营方向的部门;是企业能否获得更好发展,获得更多市场份额的部门;销是最贴近市场,具有较高市场敏感度的部门。策划营销不只是经营销售,简单地说,营销就是为了满足客户的合理要求,为使公司部赢利而进行的一系列经营、销售活动。营销的核心是围绕满足客人的合理要求,最终经达到为公司赢利的目的。营销策划部是零售企业经营管理的核心部门,也是决定企业理经济效益与市场竞争实力大小的关键部门。案头市场营销不仅仅是单一的推销模式,它涉及的面广而深,包含市场营销的调查,手零售商品设计、开发和定价,产品推销,产品流通等等方面的内容。册零售企业的营销是一个现代化的、理论化的、系统化的科学,同时又是灵活、复杂和多样的。随着零售业市场竞争的加剧,每个卖场的营销意识都在迅速提高。成功的营销是企业在激烈的市场竞争中处于不败之地的有力保证。营销策划部是“内求团结,外求发展”的经营管理部门,它在经营管理的各个环节中都能够发挥作用,这对于提高企业知名度,树立与发展企业形象,提高企业管理和处理问题的能力,维系人心,提高企业整体凝聚力等都起着重要的作用。营销策划部在总经理的直接领导下,以扩大客源,增加企业收益,树立企业品牌形象为中心开展工作,既是企业对外营销和宣传的窗口,也是企业外联和广告宣传的中枢。其功能是协助总经理制定企业营销计划,分解落实营销指标,保证营销计划的正确贯彻执行。营销人员在部门经理的直接领导下,负责广告宣传,树立公众形象,收集内外相关信息,协助部门经理做好每月营销策划部市场综合分析报告,提出相应措施,供领导参考。1.规范企业的营业管理(1)制定企业营业管理的各项规范性制度,报领导审批后下发各部门、各分店,并监督执行。(2)总结营业管理的经验与教训,提出管理对策。(3)统一、规范各分店营业工作操作流程。2.营业销售管理(1)编制企业年度、季度、月度销售计划,并监督计划的完成情况。(2)调查企业主要竞争对手的情况,并提出销售策略、意见。(3)负责大客户的开发、管理和关系维护,为其提供更好的服务;组织各分店制订自己的销售目标,协助其分析优势、劣势,并给出相应工作指导。2第2章营销策划部人员配置与岗位职责2.1营销策划经理营销策划经理的岗位职责与任职资格,如表2-1所示。表2-1营销策划经理的岗位职责与任职资格表直接上级:总经理直接下级:营销策划经理助理、工程技术经理、新店拓展经理、市场策划经理、公关经理等1.负责营销策划部整体工作的把握和部署2.负责拟订本部各阶段工作计划,并使各项工作有计划地开展3.负责根据商场不同阶段的需要,组织、策划和实施各类大型社会公关活动和促销活动4.负责组织、建立企业文化,推广企业文化,组织各类文化活动5.负责研究、掌握、了解市场动态、宏观经济。定期进行市场调研和分析,并针对市场的岗变化和竞争的需要提出应对策略位6.负责开展本部门员工业务的培训,指导和帮助本部门员工的工作,不断强化和提高员工职的素质责7.负责为企业重大经营决策提供信息、方案和建议营销8.负责危机公关及重大突发事件的处理策9.负责组织全体员工树立和推广企业文化10.负责指导本部门员工建立顾客档案,积极开展各项公关活动,培养商场的忠实顾客划部11.负责组织考核和考评本部门员工,调动员工的工作积极性,加强本部门员工的凝聚力员1.具有大专以上文化程度,从事商业工作3年以上,有丰富的营销知识和商业知识配置2.有良好的职业道德和敬业精神任3.有较强的领导能力、组织能力和协调能力,善于处理各方面的关系职与岗4.深刻领会公司的经营理念、服务理念,准确把握公司的市场定位,并能真正贯彻落实位资5.熟悉商场的各项基本环节,掌握经营管理的基本要领职格6.严格履行岗位职责,敬业尽职,保守公司商业秘密(注:对工作经验年限的要求应根据所属企业实际情况而定)2.2工程技术经理工程技术经理的岗位职责与任职资格,如表2-2所示。5表2-2工程技术经理的岗位职责与任职资格表营直接上级:营销策划经理策直接下级:划部1.工程计划的编写与调整根据企业的新店开业计划,编制工程进度计划并监督实施;定期检查工程的进展情况,并理根据实际情况进行必要的调整案2.招标投标管理头手册与政府部门协调有关招标投标的各项工作;对新店面装饰工程承包单位进行初步筛选,并组织实施招标投标工作,严格审查施工单位的资质、信誉等;负责新店装修工程承包合同的谈判与签订工作岗3.施工现场管理与调度位开工前进行现场布置,及时安排工人进场作业;按照文明施工的各项规定,建立各种文明g施工的制度,设置文明施工的各类标志、标牌,落实文明施工的各项措施;参加施工现场责会议,对施工单位进行统一协调与调度,对进人现场的人员、材料、设备进行统一调配4.工程、物业的监督与管理对初选店址的物业结构、水、电、空调、消防等方面提供专业意见;负责新店筹建过程中各项政府部门相关的报批手续;负责新店装饰工程的监理工作,解决检查时发现的施工质量问题;负责完成分店物业的各项加、改建工程的设计及施工监理工作,并进行建档管理5.档案管理收集、整理分店设计、施工中存在的不足,为新店的开发提供借鉴;及时完成有关技术资料的归类、整理、汇总及存档等工作1.大学本科以上学历2.具有3年以上工程管理的相关工作经验,具有高级专业技术职务任职资格任3.具有工业与民用建筑、建筑结构、企业管理、项目管理、质量管理、成本控制及其他相职关专业知识资4.熟悉有关项目管理方面的法律、法规、国家政策,全面掌握施工项目管理方面国家预布格的质量标准及国内外工程管理的新方法、新技术、新知识5.严格履行岗位职责,敬业尽职,保守公司商业秘密(注:对工作经验年限的要求应根据所属企业实际情况而定)2.3新店拓展经理新店拓展经理的岗位职责与任职资格,如表2-3所示6···试读结束···...

    2023-01-16 epub出版物 epub编辑

  • 《计算机视觉基础》(美)韦斯利·E.斯奈德(WesleyE.Snyder),戚海蓉(HairongQi)著|(epub+azw3+mobi+pdf)电子书下载

    图书名称:《计算机视觉基础》【作者】(美)韦斯利·E.斯奈德(WeleyE.Syder),戚海蓉(HairogQi)著【丛书名】智能科学与技术丛书【出版社】北京:机械工业出版社,2020.08【ISBN号】978-7-111-66379-9【价格】89.00【分类】计算机视觉【参考文献】(美)韦斯利·E.斯奈德(WeleyE.Syder),戚海蓉(HairogQi)著.计算机视觉基础.北京:机械工业出版社,2020.08.图书封面:图书目录:《计算机视觉基础》内容提要:本书通过广泛的例子,包括面部图片、卡通图片、动物脚印和血管造影图片等,为读者提供了重要的数学和算法工具,使他们能够深入了解完整的计算机视觉系统的基本组成部分,并设计出同样的系统。书中内容涉及识别局部特征,如在存在噪声的情况下角或边的识别、保边平滑、连通分量的标记、立体视觉、阈值处理、聚类、分割,以及描述、匹配形状和场景等。本书可以作为高年级本科生和低年级研究生的教材,也可以作为从事计算机视觉技术研究的从业者和科研人员的参考用书。《计算机视觉基础》内容试读|第一部分FudametalofComuterViio导论在这一部分中,我们着手准备我们的计算机视觉(ComuterViio,CV)之旅。第1章简要介绍生物视觉和计算机视觉的生物学动因。第2章介绍如何编写计算机程序来处理图像。第3章回顾数学知识,该章的重点是线性代数,因为这是CV中使用最多的数学学科。第3章还简要介绍概率论和函数最小化。在通过预习和复习数学知识并做好准备之后,我们需要知道图像是什么。事实证明,“图像”这个词在不同的语境中有许多不同的含义,第4章对它们进行了讨论。第1章FudametalofComuterViio计算机视觉的定义及其历史没有什么东西是神秘的。神秘的只是你的眼睛。伊丽莎白·鲍恩1.1简介关于理解大脑,有两种完全不同的哲学观点。1)首先了解大脑。如果能够理解大脑是如何工作的,我们就可以构建智能机器。2)使用我们能想到的技术,制作智能机器。如果我们能够做到这一点,这也将给我们一些关于大脑是如何工作的提示。本书尽管借鉴了目前对生物计算的一些理解,但是是从第二个观点出发的。在本章中,我们定义一些术语,介绍更大的局部-全局问题,然后简要介绍哺乳动物大脑的功能。·(1.2节)从信号和系统角度,我们描述计算机视觉和其他一些密切相关的研究领域的区别,包括图像处理和模式识别。·(1.3节)由于计算机视觉中几乎所有的问题都涉及局部性与全局性的问题,因此我们简要解释“局部-全局”问题以及用于解决该问题的“一致性”原则。·(1.4节)计算机视觉起源于生物视觉。因此,在该节中,我们将讨论计算机视觉的生物学动因以及人类视觉系统研究中的一些惊人发现。1.2定义计算机视觉是指机器(通常是数字计算机)自动处理图像,并报告“图像中内容”的过程,也就是说,它能识别图像内容。例如,内容可能是加工过的零件,目标可能不仅是要定位零件,还要检查零件。1学生通常还会将计算机视觉与文献中经常出现的一些术语混淆,例如图像处理、机3器视觉、图像理解和模式识别。我们可以将图像处理的整个过程分为低级图像处理和高级图像处理。如果我们从信号与系统的角度来解释这些过程,那么从系统输入/输出格式来描述它们的差异和相似性就会变得更加清晰。在低级图像处理系统中,输入为图像,输出也仍然是图像,但图像却有所不同。例如,输出可能是去除了噪声的图像,也可能是比输入图像占用更少的第1章计算机视觉的定义及其历史3存储空间的图像,还可能是比输入图像更加清晰的图像,等等。虽然低级图像处理不提供被成像对象的详细信息,但这些处理还是必要的,因为它是更高级别算法能够正常工作的保障。机器视觉、图像理解和高级图像处理这几个术语通常用于表示计算机视觉。它们是对输入图像进行操作的过程,但输出不再是图像,而是对图像的解释。模式识别是计算机视觉系统的一个重要组成部分,输入是以结构化格式(例如,向量)对图像的描述(例如,描述图像中对象的特征),输出是基于这些输入描述的识别结果。因此,在模式识别过程中,输入和输出都不是图像。图1.1是对计算机视觉系统的一种解释。对象及其类别的定义是由模式识别(P℉)系统决定的。模式识别系统的决策基于对输入的测量,这些测量被称为特征。例如,PR系统必须决定一个对象是短斧还是长斧时,它将手柄的长度和斧头的质量作为输人。如果要从图像中确定手柄的长度,那么做出这个决策的系统就是计算机视觉系统。特征计算机模式◆决策视觉系统识别系统图1.1计算机视觉系统接受一张图像作为输入,并产生从图像中提取的许多测量值,这些测量值被称为特征,提供给模式识别系统,该模式识别系统对一个或多个被成像的对象做出决策因此,计算机视觉系统对图像进行测量,并将这些测量结果报告给模式识别系统。如果计算机视觉系统很复杂并且返回“房间中的大象数=1”,则PR系统就可能无事可做了。我们刚才介绍的定义也有例外,或许最好的例子是目前深度学习的研究。这些系统使用神经驱动的计算结构来识别图像中的特定对象。有人可能会说这些系统是模式分类4器,但它们解决的问题显然是计算机视觉问题,因此将它们归类为计算机视觉系统也是合适的1幻。1.3局部-全局问题几乎所有的计算机视觉问题都可以描述为“局部-全局”或“格式塔”问题的不同版本。我们通过两个例子来描述。第一个是盲人和大象的古老寓言:“盲人被要求通过触摸大象身体的不同部位来判第一部分导论断大象长什么样。触摸到大象腿的盲人说大象就像一根柱子;触摸到大象尾巴的盲人说大象就像一根绳子;触摸到大象鼻子的盲人说大象就像树枝;触摸到大象耳朵的人说大象就像扇子;触摸到大象腹部的人说大象就像一堵墙;触摸到象牙的人说大象就像一根坚固的管子⊙。”有一个相同的视觉例子:找一本封面有趣的杂志,然后剪一张白纸,大约是杂志高度和宽度的两倍。在纸的中心切一个小孔(直径1或2厘米),然后将它盖在杂志上。现在,找一个以前没看过这本杂志的朋友。允许他(她)以任何方式移动纸张,但只能通过小孔来观察杂志封面,最后请他(她)描述一下所看到的封面。很可能,你会得到一个完全不正确的描述。这就是我们要求计算机做的事情,在整个图像上进行局部测量(例如,梯度),并且计算机以某种方式从所有那些局部测量中推断出图像是大象的照片。这个问题的部分解决方案多种多样,本书介绍了其中一些。大多数利用了一致性。也就是说,如果计算机能够发现一些测量值在某种程度上是一致的,它就可能推断出导致这种一致性的全局图像。在阅读材料时,请记住你正在阅读的内容是如何用来解决这个复杂问题的。1.4生物视觉生物计算(神经元)和生物视觉(使用这些神经元)是计算机视觉的灵感来源。自从计算机视觉作为一门学科问世以来,人们就试图学习生物视觉,并在计算机上对其进行建模。在计算机视觉中,研究者为利用生物学驱动的模型,已经开发了许多技术。近年来,深度5□学习等一些新技术逐渐流行起来,这些方法的形成也归功于早期对生物视觉的研究。1.4.1生物动因首先,我们考虑如图1.2所示的生物神经元。树突是向神经元细胞体传递信号的微小纤维。细胞体负责(通过树突的输入和时间)整合来自这些树突的输人。这种整合过程实际上是正离子形式的电荷累积。当有足够的电荷积累时,细胞膜就会破裂,形成大量的离子流,从而影响细胞的单个输出一轴突。轴突可能很长,甚至超过10厘米。这种离子流的传播称为动作电位。信息是由动作电位的发生率编码的,典型的动作电位的振幅为几十毫伏,持续时间为几毫秒。输出/输入信号转换发生在轴突与树突或细胞体的紧密接触处,这样的连接被称为突触连接。当电荷沿轴突向下移动时,它们会导致神经递质化学物质在突触连接处释放。多达1000多个突触可以为单个神经元提供输入。⊙来自维基百科。目我们要求计算机解决格式塔问题,从大量局部分布的测量值中发现图像内容的一致性。第1章计算机视觉的定义及其历史5轴突树突细胞体突触连接另一个神经元的轴突图1.2生物神经元有多个输入(即树突),每个输入加权,有一个输出(即轴突),可能会被分发到多个地方如图1.3所示,两个轴突通过两个不同大小的突触与单个细胞体连接。神经递质是从轴突释放到突触连接处的化学物质,它们可以刺激细胞激活(兴奋性突触)或抑制细胞6激活(抑制性突触中的神经递质抑制剂)。图中,较大的突触A能够释放更多的神经递质,从而对突触后神经元产生更大的影响。突触传递信号能力的变化似乎是我们所说的记忆的一种形式。突触前神经元对突触后神经元的影响用加图1.3两个轴突通过明显不同的突法器权重的正负号来表示。据估计,成人的神触终止于同一细胞体,通过突触A的脉冲比通过突触B经系统拥有10个神经元。每个神经元有1000的脉冲更可能导致突触后神个突触,每个突触有8位存储空间(实际上,经元被激活不是那么精确,更有可能是5位),看,我们在你的大脑中找到了10TB的存储空间,所以使用吧!神经元可以用如图1.4所示的乘积之和后跟一个非线性项来进行数学建模,因此,神经元的方程可以写成:y,=S(∑xwg其中i和g分别为输人和神经元的下标,S。是非线性函数。非线性函数S,具有igmoid形式图1.4单个神经元的体系结构。在求(形如字母“S”)。常见的igmoid是逻辑函数和之前,输人被乘以权重。求1和后通过类似阈值的非线性函S(x)=1十e,其中a控制igmoid的中心斜率。数输出6第一部分导论历史上,这种数学神经网络模型中采用的第一个非线性函数是简单的阈值方式。这样做是因为在生物神经元中明显存在一个可测量的类似阈值的现象。1943年开发了第一个这样的模型一MeCulloch-Pitt神经元1.2)。这些神经元集合的应用促使了感知器[1)的发展,它们是具有阈值的简单的线性机器。通过向单层机器添加层,可以指定任意复杂的决策边界1.)。在尝试确定解决特定问题所需的权重值时,阈值的使用会造成困难。由于阈值函数是不可微的,找到多层网络的权重变得具有挑战性。可通过用可微的igmoid替换阈值来解决这个问题16,1]。这一观察结果表明,不可微函数可以用可微函数来近似,这是神经网络研究领域复兴的源泉。1.4.2视觉感知我们知道物体通过光的反射,在视网膜上可以形成图像。如图1.5所示,由光传感器产生的电信号通过视神经一外侧膝状体核(LGN),终止于大脑后侧的视觉皮层上。视觉皮层实际上可以分为几个部分:V1(或称为初级视觉皮层)、V2、V3、V4和V5。图像在不同的区域接受不同的处理。初级视觉皮层也被称为纹状皮层,因为它看起来有很长、很直的条纹(如图1.6所示)。视神经视交叉视束外侧膝状体核视辐射大脑左半球初级视觉皮层d图1.5主要视觉中心V1位于大脑图1.6染色适当时,视觉皮层看起来像被分成后侧。源自文献[1.7]长条带。源自文献[1.7]视觉皮层是视觉的高级中枢。当视网膜中的一个特定光传感器被刺激时,视觉皮层中的一个特定细胞会被激活,而且,如果视网膜中的两个点是接近的,那么视觉皮层中的对应点也将是接近的。81962年,Huel和Wieel所进行的神经元的数学建模工作触及了视觉区域1”。这两位神经生理学家将电子探针植入哺乳动物(最初是猫,后来还有猴子)的身体,这种探针小到可以检测到单个神经元的激活。凭借这种能力,他们取得了一些惊人的发现©。第一个发现是,大脑皮层的某些细胞与视网膜的边缘(不仅是光)存在对应关系。更⊙他们在1981年获得了诺贝尔奖。···试读结束···...

    2023-01-14 计算机视觉 神经元是什么 计算机视觉神经网络

  • 《计算机视觉》梁玮,裴明涛编著|(epub+azw3+mobi+pdf)电子书下载

    图书名称:《计算机视觉》【作者】梁玮,裴明涛编著【页数】174【出版社】长沙:湖南科学技术出版社,2020.03【ISBN号】7-5682-9214-6【价格】42.00【分类】计算机视觉-高等学校-教材【参考文献】梁玮,裴明涛编著.计算机视觉.长沙:湖南科学技术出版社,2020.03.图书目录:《计算机视觉》内容提要:计算机视觉是研究让计算机能够像人一样来理解图像、视频等视觉信息的科学。本书主要讲述了计算机视觉所涉及的图像的形成、基本的图像处理方法、图像特征、纹理分析、图像分割、模型拟合、三维重建以及物体的检测、跟踪、识别等内容,并对计算机视觉中深度学习的典型应用进行了介绍。《计算机视觉》内容试读第1章计算机视觉概述1.1计算机视觉简介从生物学的角度来看,计算机视觉是研究如何得到人类视觉系统的计算模型的科学;从工程学的角度来看,计算机视觉是研究如何建立可以媲美人类视觉(在某些视觉任务上超越人类视觉)的系统。通常来说,完成视觉任务需要通过图像或视频来理解场景。这两个角度是互相促进、彼此关联的。人类视觉系统的特点对于设计计算机视觉系统和算法有着很大的启发,而计算机视觉的算法也可以帮助人们来理解人类的视觉系统。本书将从工程学的角度来介绍计算机视觉。从工程学的角度来看,计算机视觉主要研究的是通过图像或视频来重建和理解场景,完成人类视觉可以完成的任务。计算机视觉与人类视觉示意如图1-1所示。人类视觉是通过眼睛看到某一场景的图像,再通过大脑对图像进行分析,最终得到对场景的理解结果,而计算机视觉则是通过摄像机等成像设备获得场景的图像,通过计算机和相应的视觉算法对图像进行分析,得到和人类类似的场景理解结果。摄像机等成像设备相当于人的眼睛,而计算机和视觉算法则相当于人类的大脑。图像/视频感知设备解释设备语义解释花园,树木,水池,楼房,蓝天,白云…图1-1计算机视觉与人类视觉示意近年来,随着计算机视觉以及其他相关学科(如认知学,心理学等学科)的发展,其目标已经从识别出场景中所包含的物体以及场景中正在发生的事件发展到推测视频中人的目的和意图,帮助人们理解视频中一些状态变化的原因以及对人的下一步行为进行预测。计算机视觉是一门交叉学科,涉及图像处理、模式识别、机器学习、人工智能、认知学以及机器人学等诸多学科。其中,图像处理是计算机视觉的基础。图像处理研究的是图像到图像的变换,其输入和输出的都是图像。常用的图像处理操作包括图像压缩、图像增强、图像恢复等。计算机视觉的输入是图像,而输出则是对图像的理解,在此过程中要用到很多图像处理的方法。模式识别研究是指使用不同的数学模型(包括统计模型、神经网络、支持001---计算机视觉向量机等)来对不同模式进行分类。模式识别的输入可以是图像、语音以及文本等数据而计算机视觉中的很多问题都可以视为分类问题。人的大脑皮层的活动约70%是在处理视觉相关的信息。视觉相当于人脑的大门,其他如听觉、触觉、味觉等都是带宽较窄的通道」如果不能处理视觉信息,整个人工智能系统就只能做符号推理。如下棋和定理证明等,既无法进入现实世界,也无法研究真实世界中的人工智能。计算机视觉的目标是填充图像像素与高层语义之间的鸿沟,如图1-2所示。计算机所见的像素中,每个像素具有一定的数值(表示该像素的灰度或颜色),而其处理的最终目标·是将这些数值综合起来,赋予图像一定的高层语义。100201541301531542072108965121多16020619910793931051321901761881211111311203617815514868811778854761431236589678666160158106503076739093165198224556546482165143(a)()图1-2计算机视觉的目标是填充图像像素与高层语义之间的鸿沟(a)人眼所见;()计算机所见计算机视觉技术可以从图像或视频中获得两类信息:第一类信息是语义信息,能够根据图像或视频得到对应场景的语义描述:第二类信息是三维的度量信息。如图1一3所示,计算机视觉可以通过两幅或多幅二维图像恢复场景的三维信息,得到场景中的物体距离摄像机的远近信息(深度信息)。图1-3()中类似灰度图的图像为深度图。其可以视为一幅图像,每个像素的值表示了该像素对应的场景中的点距离摄像机距离的远近。(a)()(c)(d)(e)(f)图1一3计算机视觉可以通过两幅或多幅二维图像恢复三维信息(a)图像1;()图像2;(©)使用立体视觉方法通过图像1和图像2得到的深度图;(d)图像3;()图像4:(f)使用运动视觉方法通过图像3和图像4得到的三维模型-·002第1章计算机视觉概述计算机视觉分为三个层次,即底层视觉、中层视觉和高层视觉。底层视觉主要研究图像底层特征的提取与表示,包括边缘检测、角点检测、纹理分析以及特征点的匹配和光流的计算等内容:中层视觉主要研究场景的几何和运动,包括立体视觉与运动视觉、图像分割以及目标跟踪等内容:高层视觉则主要研究物体的检测识别以及场景理解等具有高层语义的内容。1.2计算机视觉的发展历史1966年,麻省理工学院(MIT)人工智能实验室的MarviMiky要求他的学生GeraldJaySuma等利用一个暑假的时间完成将一个相机连接到计算机上,使计算机能够描述它所看到的场景的项目。这被视为计算机视觉研究的开端)。计算机视觉早期对于场景理解的研究主要是针对积木世界(lockworld)进行的,检测边缘和对边缘的拓扑进行分析可以得到物体三维结构2)。由马尔整理和编写的1982年出版的《视觉:从计算的视角研究人的视觉信息表达与处理》,是计算机视觉研究的一个重要的里程碑。马尔提出了视觉的三个层次[3别,即表达、算法以及实现。首先,在表达层次中,表达是指这个问题是什么以及如何把它写成一个数学问题。任务是什么,任务的约束是什么以及任务的输出是什么。表达是独立于解决问题的方法的。算法是指对这个数学问题进行求解时,应如何表示输入,如何表示输出,如何表示中间的信息以及采用什么算法得到最终的结果。实现则是指这些算法如何实现,可以并行实现或者串行实现,可以通过硬件实现或者软件实现。计算机视觉的发展历史如图1-4所示。20世纪80年代对于计算机视觉的研究有了进步的发展,图像金字塔),尺度空间6,小波分析)等理论和方法被提出,并得到了广泛的应用。从X恢复形状(ShaefromX)技术也得到了快速发展,包括从明暗恢复形状(ShaefromShadig)[8】、光度立体(PhotometricStereo)9、从纹理恢复形状(ShaefromTexture)o以及从聚焦恢复形状(ShaefromFocu))等方法。主动轮廓模型(Sake)2也在20世纪80年代被提出和应用,同时,马尔科夫随机场(MarkovRadomField,MR)[3]也被广泛应用于视觉问题的优化之中。20世纪90年代之前,由于获取图像的设备非常昂贵,不具备研究视觉这个问题的硬件条件和数据基础,因此对于视觉的研究集中在使用特征点的对应关系做射影几何、使用线条做形状分析等几何方面以及积木世界下的视觉任务。1970年1980年1990年2000年数字图像处积木世界,义圆柱体图结构模型立体匹配本征图像运动视觉图像金字塔尺度空间明暗分析纹理分析物理模型马尔科夫随卡尔曼滤波射影不变量翳子滤波予空间分析基于图像的理合成算摄影学基于特征的深度学习线标注基于能量的图像分割人脸检测与识别模和绘制爵图1-4计算机视觉的发展历史003--计算机视觉20世纪90年代,随着视觉传感器以及计算设备的发展,计算机视觉逐步开始面向真实世界进行研究。对于光流(OticalFlow)的研究,则在20世纪90年代有了较大的发展4,5),同时,立体匹配技术得到了快速发展6.,基于图割的优化方法8在立体匹配中得到了应用并取得了很好的效果。另外,目标跟踪算法也得到了快速的发展,粒子滤波方法(ParticleFilter)[]以及水平集(LevelSet)[2o]等方法被广泛地应用于目标跟踪算法中。主成分分析(PricialComoetAalyi,PCA)被应用于人脸识别中,特征脸(EigeFac)[2)也成为一个专有名词。很多图像分割的经典算法也在这段时期涌现。例如,基于最小描述长度的分割算法[2)、基于图割的分割算法[3]以及基于MeaShift的分割算法2]等。2000年后,图像拼接0,2、高动态范围图像5,1、纹理合成7,81等研究领域得到了较大的发展。基于局部特征(基于兴趣点或图像块的方法)的识别方法成为物体检测与识别的主流方法9,3.2006年后,深度学习在计算机视觉的各个领域得到了广泛应用156.158,160,16,16,10取得了远远超过常规算法的效果。1.3计算机视觉领域的学术会议和期刊从诞生以来,计算机视觉一直以来都是一个非常活跃的研究领域,拥有很多专门针对计算机视觉的学术会议和期刊,其中,发表的论文反映了计算机视觉领域的最新发展情况。计算机视觉领域的著名学术会议包括视觉的三大顶级会议:EEE国际计算机视觉会议(IteratioalCofereceoComuterViio,ICCV),IEEE国际计算机视觉与模式识别会议(CofereceoComuterViioadPatterRecogitio,CVPR)以及欧洲计算机视觉国际会议(EuroeaCofereceoComuterViio,ECCV)。其中,ICCV由美国电气与电子工程师学会(ItituteofElectricalamElectroicEgieer,IEEE)主办,由美洲、欧洲以及亚洲的一些科研实力较强的国家轮流举办。作为世界顶级的学术会议,首届ICCV于1987年在伦敦揭幕,其后每两年举办一届。值得一提的是,ICCV的最佳论文奖名为马尔奖,是以DavidMarr的名字命名的。另外,CVPR也是由美国电气与电子工程师学会主办,第一届CVPR会议1983年在华盛顿举办,此后每年都在美国本土举行一届。会议一般在每年6月举行,举办地通常是在美国的西部、中部和东部地区之间轮换。ECCV也是每两年举办一届,举办地在欧洲国家中循环。另外,计算机视觉领域其他的著名学术会议还包括亚洲计算机视觉会议(AiaCofer-eceoComuterViio,ACCV),图像处理国际会议(IteratioalCofereceoImageProceig,ICIP),模式识别国际会议(IteratioalCofereceoPatterRecogitio,ICPR),英国机器视觉会议(BritihMachieViioCoferece,BMVC)等。计算机视觉领域的顶级学术期刊包括IEEE模式分析与机器智能(TraactiooPatterAalyiadMachieItelligece,TPAMI)汇f刊,计算机视觉国际(IteratioalJouralofComuterViio,CV)期刊,IEEE图像处理事务(TraactiooImageProceig,TP)汇刊等。1.4计算机视觉的应用计算机视觉在生产和生活中具有广泛的应用。-=。004第1章计算机视觉概述三1.4.1智能机器人智能机器人是计算机视觉的一个典型应用领域。计算机视觉作为智能机器人的“眼睛”,可以帮助机器人感知周围的环境,为机器人自动完成任务提供基础数据。典型的应用包括基于视觉的机器人定位、自动避障、视觉伺服以及自动装配等。好奇号火星探测器(CurioityMarRover)是美国国家航空航天局(NASA)发射的第四个火星探测器,其上装备了17个相机(图1-5),包括两对导航相机和四对避障相机,用于为火星车提供自主导航和避障功能。图1-5,好奇号火星探测器视觉伺服是指通过光学的装置和非接触的传感器自动地接收和处理一个真实物体的图像。图像反馈的信息可以使机器的控制系统对机器做进一步控制或相应的自适应调整。图1-6所示为基于视觉伺服的机器人在工件装配和自动焊接方面的应用示例。·图1-6基于视觉伺服的机器人在工件装配和自动焊接方面的应用示例1.4.2医学图像分析医学图像分析也是计算机视觉的重要应用领域之一。医学图像中的成像方式包括X射线成像,计算机断层扫描(ComutedTomograhy,CT)成像,核磁共振(MageticReo--aceImagig,MRI)成像以及超声波检测(UltraoicTetig,.UT)成像等。计算机视觉005----计算机视觉在医学图像方面的应用主要包括对医学图像进行增强以及自动标记等处理来帮助医生进行诊断,协助医生对感兴趣区域进行测量和比较,对图像进行自动分割和解释,对各种病症图像进行分类和检索,基于所拍摄的图像进行三维器官重建以及基于视觉的机器人手术等。图1-7为医学图像应用示例。(a】((c)图1-7医学图像分析示例(a)脑损伤检测[341;()肺结节检测[46];(c)X射线图像骨骼屏蔽[141.4.3智能交通智能交通领域是计算机视觉技术的典型应用之一。计算机视觉技术可以自动检测和跟踪路面上的车辆,识别车辆的车牌信息、车辆的车型信息以及驾驶员的人脸信息等。另外,计算机视觉技术还可以自动识别驾驶员的行为,例如,是否在开车时打电话等危险行为。计算机视觉在智能交通中的典型应用如图1-8所示。这些信息可以应用于交通违章检测、不停车收费、拥堵费征收、套牌车辆检测、代替消除违章检测以及开车打电话违章行为检测等领域,可以极大程度地方便人们的出行并提高交通的安全程度。LECJ京GGU027京G22059P3H667京P3H667a()张三李四(c】(d)】图1-8计算机视觉在智能交通中的典型应用(a)车牌识别:()车型识别:(c)驾驶员识别:(d)打电话行为识别-…--。006···试读结束···...

    2023-01-14

  • 《计算机视觉》双锴编著|(epub+azw3+mobi+pdf)电子书下载

    图书名称:《计算机视觉》【作者】双锴编著【丛书名】数据科学与大数据技术专业教材丛书【页数】171【出版社】北京:北京邮电大学出版社,2020.01【ISBN号】978-7-5635-5946-6【分类】计算机视觉【参考文献】双锴编著.计算机视觉.北京:北京邮电大学出版社,2020.01.图书封面:图书目录:《计算机视觉》内容提要:本书主要探讨当前计算机视觉方面的前沿问题,特别关注于深度学习在计算机视觉领域的应用。内容包括:图像的表示特征提取神经网络物体分类与识别等。《计算机视觉》内容试读安高贤陈除草子千的项1神的南为马划“以第1章四民及情安绪论随日4只果为的四同南股在男增件本四本章思维导图作为人类,我们可以轻松感知周围的三维世界。相比之下,不管近年来计算机视觉已经取得多么令人瞩目的成果,要让计算机能像人类那样理解和解释图像,却仍然是一个遥远的梦想。为什么计算机视觉会成为如此富有挑战性的难题?它的发展历史与现状又是怎样的?本章将对计算机视觉的发展简史及应用现状进行介绍。深度学习概念的提出GPU与并行技术一深度学习和计算机视觉发展的加速器GPU成为深度学习主流选择GPU种类特点及选择图像分类简介深度学习在计算机视觉领城的发展综述物体检测简介人脸识别简介基于卷积神经网络的计算机视觉应用图像搜索简介图像分割简介视频分析简介其他应用■绪论背景介绍计算机视觉定义计算机视觉简史计算机视觉发展史计算机视觉发展近况及代表会议2012年—计算机视觉发展的新起点SVRC比赛初期情况AlexNet的出现及卷积神经网络让计算机拥有一双眼睛一计算机视觉綜述安防应用简介交通应用简介工业生产应用简介在线购物应用简介计算机视觉应用信息检索应用简介游戏娱乐应用简介摄影摄像应用简介机器人/无人机应用简介明面体育应用简介医疗应用简介1112个·1…计算机视觉COMPUTERVISION1.1计算机视觉简史都说“眼睛是心灵的窗口”,乍一听觉得只是一个很好听的比喻,但仔细想想,视觉对于人类的重要性是不言而喻的。现代的科学研究也表明,人类的学习和认知活动有80%~85%都是通过视觉完成的。也就是说,视觉是人类感受和理解这个世界的最主要的手段。在当前机器学习成为热门学科的背景下,人工智能领域自然也少不了视觉的相关研究,这即是本书将要介绍的计算机视觉。计算机视觉(ComuterViio)顾名思义是一门“教”会计算机如何去“看”世界的学科。计算机视觉与自然语言处理(NaturalLaguageProce,NLP)及语音识别(SeechRecogitio)并列为机器学习方向的三大热点方向。而计算机视觉也由诸如梯度方向直方图(HitogramofGradiet,.HOG)以及尺度不变特征变换(Scale-IvariatFeatureTraform,SIFT)等传统的手动提取特征(Had-CraftedFeature)与浅层模型的组合(如图l-1所示)逐渐转向了以卷积神经网络(CovolutioalNeuralNetwork,CNN)为代表的深度学习模型。然而计算机视觉正式成为一门学科,则要追溯到1963年美国计算机科学家拉里·罗伯茨在麻省理工大学的博士毕业论文“MachiePercetioofThree-DimeioalSolid'[山。加拿大科学家大卫·休伯尔(DavidHuel)和瑞典科学家托斯坦·维厄瑟尔(TorteWieel)从l958年起通过对猫视觉皮层的研究,提出在计算机的模式识别中,和生物的识别类似,边缘是用来描述物体形状的关键信息。拉里在论文中根据上述研究,通过对输人图像进行梯度操作,进一步提取边缘,然后在3D模型中提取出简单形状结构,之后利用这些结构像搭积木一样去描述场景中物体的关系,最后获得从另一角度看图像物体的渲染图。在拉里的论文中,从二维图像恢复图像中物体的三维模型的尝试,正是计算机视觉和传统图像处理学科思想上最大的不同:计算机视觉的目的是让计算机理解图像的内容。所以这算是与计算机视觉相关的最早的研究。特征表达学习算法如SIFT,HoG等图1-1传统的手动提取特征与浅层模型的组合20世纪70年代:从有了计算机视觉的相关研究开始,一直到20世纪70年代,人们关心的热点都偏向图像内容的建模,如三维建模、立体视觉等。比较有代表性的弹簧模型☒(PictorialStructure,如图l-2所示)和广义圆柱体模型(GeeralizedCylider,如图l-2所示)就是在这个时期被提出来的。那个时期将视觉信息处理分为三个层次:计算理论、表达和算法、硬件实现。在如今看来,或许有些不合理,但是却将计算机视觉作为了一门正式学科的研究。而且其方法论到今天仍然是表达和解决问题的好向导。。2第1章。绪论头发000m000000左边界右边界000多(a)弹簧模型6)广义圆柱图1-21弹簧模型与广义圆柱20世纪80年代:在视觉计算理论提出后,计算机视觉在20世纪80年代进人了最蓬勃发展的一个时期。主动视觉理论和定性视觉理论等都在这个时期被提出,这些理论认为人类的视觉重建过程并不是马尔理论中那样直接,而是主动的、有目的性和选择性的。同时从20世纪80年代起,这个学科开始慢慢脱胎于神经科学,更多偏重计算和数学的方法开始发展起来,相关的应用也变得更加丰富。著名的图像金字塔和Cay边缘检测算法在这个时期被提出,图像分割和立体视觉的研究在这个时期也蓬勃发展,当然还有和本书更紧密的基于人工神经网络的计算机视觉研究,尤其是模式识别的研究也伴随着人工神经网络的第一次复兴变得红火起来。20世纪90年代:进人20世纪90年代,伴随着各种机器学习算法的全面开花,机器学习开始成为计算机视觉,尤其是识别、检测和分类等应用中一个不可分割的重要工具。各种识别和检测算法迎来了大发展。尤其是人脸识别在这个时期迎来了一个研究的小高潮。各种用来描述图像特征的算子也不停地被发明出来,如耳熟能详的SFT)算法就是在20世纪90年代末被提出的。另外伴随着计算机视觉在交通和医疗等工业领域的应用越来越多,其他一些的基础视觉研究方向,如跟踪算法、图像分割等,在这个时期也有了一定的发展。21世纪:进入21世纪之后,计算机视觉已经俨然成为计算机领域的一个大学科。国际计算机视觉与模式识别会议(IEEECofereceoComuterViioadPatterRecogitio,CVPR)和ICCV等会议已经是人工智能领域,甚至是整个计算机领域内的大型盛会,甚至出现了一些新的子方向,如计算摄影学(ComutatioalPhotograhy).等。在传统的方向上基于特征的图像识别成了一个大热门,斯坦福大学的李飞飞教授牵头创立了一个非常庞大的图像数据库ImageNet。ImageNet里包含1400万张图像,超过20000个类别。基于这个数据库,自2010年开始,每年举办一次的大规模视觉识别挑战比赛(ImageNetLargeScaleViualRecogitioChallege,ILSVRC),采用了ImageNet里1Ooo个子类目的超过120万张图片作为数据,参赛者来自世界各国的大学、研究机构和公司,成为了计算机视觉领域最受关注的事件之一。图1-3为计算机视觉领域最活跃的主题时间轴。·3…计算机视觉COMPUTERVISION20世纪70年代20世纪80年代20世纪90年代21世纪图像处理保视觉对应图像物理的建模尔曼滤波距离数据投影不变量分解物理的视能量的分识别和检方法合成与修图摄影学特征的识别鲜糖条标注变焦到图像的建模和绘制图1-3计算机视觉领域最活跃的主题时间轴若想详细了解论文“MachiePercetioofThree-DimeioalSolid'”,请扫描书右侧的二维码。▣31.22012年一计算机视觉发展的新起点论文“MachiePercetioofThree-DimeioalSolid"ILSVRC举办的前两年,各种“手工设计特征+编码+SVM”框架下的算法一直是该项比赛的前几名。ILSVRC的分类错误率的标准是让算法选出最有可能的S个预测,如果有一个是正确的,则算通过,如果都没有预测对,则算错误。2010年ILSVRC的冠军是NEC的余凯带领的研究组,错误率达到了28%。2011年施乐欧洲研究中心的小组将这个成绩提高到了25.7%。20l2年,Hito的小组也参加了竞赛,主力选手是Hito的一名研究生AlexKrizhevky。在这一年的竞赛上,Alex提出了一个5卷积层+2全连接层的卷积神经网络AlexNet),并利用CUDA给出了实现,这个算法将前5类错误率从25.7%降到了15.3%。在之前的ImageNet竞赛中,哪怕只有一个百分点的提升都是很不错的成绩,而深度学习第次正式应用在图像分类竞赛就取得了10个百分点的改进,并且完胜第二名(26.2%)。这在当时对传统计算机视觉分类算法的冲击是不言而喻的。现在概括起来,当时的改进主要有以下3点:更深的网络结构、校正线性单元(RectifiedLiearUit,ReLU)、Droout等方法的应用、GPU训练网络。尽管在当年许多传统计算机视觉的学者仍然对AlexNet抱有种种质疑,如算法难以解释、参数过多(实际上比许多基于SVM的办法参数少)等,但自从2012年后,ImageNet的参赛者几乎全体转向了基于卷积神经网络的深度学习算法,或者可以说计算机视觉领域全体转向了深度学习。基于深度学习的检测和识别、基于深度学习的图像3▣分割、基于深度学习的立体视觉等如雨后春笋般发展起来。深度学习,尤其是卷积神经网络,就像一把万能的大杀器,在计算机视觉的各个领▣中域开始发挥作用。ImageNet竞赛若想详细了解ImageNet竞赛及数据集相关信息,请扫描书右侧的及数据集相关信息二维码。。4第1章。绪论出1.3计算机视觉应用尾理随是母件速德足前面已经提到过深度学习在图像分类中的亮眼表现与应用潜力,那么当今计算机视觉在人类世界中又有哪些应用的空间与可能呢?本节将举几类例子来看看现实生活中都有哪些地方用到了计算机视觉。(1)安防安防是最早应用计算机视觉的领域之一。人脸识别和指纹识别在许多国家的公共安全系统里都有应用,因为公共安全部门拥有真正意义上最大的人脸库和指纹库。常见的应用有利用人脸库和公共摄像头对犯罪嫌疑人进行识别和布控。例如,利用公共摄像头捕捉到的画面,在其中查找可能出现的犯罪嫌疑人,用超分辨率技术对图像进行修复,并自动或辅助人工进行识别以追踪犯罪嫌疑人的踪迹;将犯罪嫌疑人照片在身份库中进行检索以确定犯罪嫌疑人身份也是常见的应用之一;移动检测也是计算机视觉在安防中的重要应用,利用摄像头监控画面移动用于防盗或者劳教和监狱的监控。(2)交通提到交通方面的应用,一些开车的朋友们一定立刻就想到了违章拍照,利用计算机视觉技术对违章车辆的照片进行分析提取车牌号码并记录在案,这是大家都熟知的一项应用。此外很多停车场和收费站也用到车牌识别。除车牌识别外,还有利用摄像头分析交通拥堵状况或进行隧道桥梁监控等技术,但应用并没有那么广泛。前面说的是道路应用,针对汽车和驾驶的计算机视觉技术也有很多,如行人识别、路牌识别、车辆识别、车距识别,还有更进一步的也即是近两年突然火起来的无人驾驶等。计算机视觉技术在交通领域虽然有很多研究,但因为算法性能或实施成本等因素,目前真正能在实际应用中发挥作用的仍然不多,交通领域仍是一个有着巨大空间的领域。(3)工业生产工业领域也是最早应用计算机视觉技术的领域之一。例如,利用摄像头拍摄的图片对部件长度进行非精密测量;利用识别技术识别工业部件上的缺陷和划痕等;对生产线上的产品进行自动识别和分类用来筛选不合格产品;通过不同角度的照片重建零部件三维模型。(4)在线购物例如,淘宝和京东的拍照购物功能。事实上计算机视觉在电商领域的应用还有更多。图片信息在电商商品列表中扮演着信息传播最重要的角色,尤其是在手机上。当我们打开购物A即时,最先最快看到的信息一定是图片。而为了让每一位用户都能看到最干净、有效、赏心悦目的图片,电商背后的计算机视觉就成了非常重要的技术。几乎所有的电商都有违规图片检测的算法,用于检测一些带有违规信息的图片。在移动网络主导的时代,一个手机A的一个页面能展示图片数量非常有限,如果搜索一个商品返回的结果里有重复图片出现,则是对展示画面的巨大浪费,于是重复图片检测算法发挥了重要的作用。对于第三方商家,一些商家在商品页面发布违规或是虚假宣传的文字很容易被检测,这个时候文字识别(OticalCharacterRecogitio,OCR)就成了保护消费者利益的防火墙。除保护消费者利·5_H计算机视觉COMPUTERVISION益外,计算机视觉技术也在电商领域里保护着一些名人的利益,一些精通Photoho的商家常常把明星的脸放到自己的商品广告中,人脸识别便成了打击这些行为的一把利剑。(5)信息检索搜索引擎可以利用文字描述返回用户想要的信息,图片也可以作为输入来进行信息的检索。最早做图片搜索的是一家老牌网站Tieye,上传图片就能返回相同或相似的结果。后来随着深度学习在计算机视觉领域的崛起,G0ogle和百度等公司也推出了自己的图片搜索引擎,只要上传自己拍摄的照片,就能从返回的结果中找到相关的信息。(6)游戏娱乐在游戏娱乐领域,计算机视觉的主要应用是在体感游戏,如Kiect、Wi和PS4等。在这些游戏设备上会用到一种特殊的深度摄像头,用于返回场景到摄像头距离的信息,从而用于三维重建或辅助识别,这种办法比常见的双目视觉技术更加可靠实用。此外就是手势识别、人脸识别、人体姿态识别等技术,用来接收玩家指令或和玩家互动。(7)摄影摄像数码相机诞生后,计算机视觉技术就开始应用于消费电子领域的照相机和摄像机上。最常见的就是人脸,尤其是笑脸识别,不需要再喊“茄子”,只要露出微笑就会捕捉下美好的瞬间。新手照相也不用担心对焦不准,相机会自动识别出人脸并对焦。手抖的问题也在机械技术和视觉技术结合的手段下,得到了一定程度上的控制。近些年一个新的计算机视觉子学科—计算摄影学的崛起,也给消费电子领域带来了新玩意—“光场相机”。有了光场相机甚至不需要对焦,拍完之后回家慢慢选对焦点,聚焦到任何一个距离上的画面都能一次捕捉到。除图像获取外,图像后期处理也有很多计算机视觉技术的应用,如Photoho中的图像分割技术和抠图技术,高动态范围(HighDyamicRage,HDR)技术用于美化照片,利用图像拼接算法创建全景照片等。(8)机器人/无人机机器人和无人机中主要利用计算机视觉和环境发生互动,如教育或玩具机器人利用人脸识别和物体识别对用户和场景做出相应的反应。无人机也是近年来火热的一个领域。用于测量勘探的无人机可以在很低成本下采集海量的图片用于三维地形重建;用于自动物流的无人机利用计算机视觉识别降落地点,或者辅助进行路线规划;用于拍摄的无人机,目标追踪技术和距离判断等可以辅助飞行控制系统做出精确的动作,用于跟踪拍摄或自拍等。(9)体育高速摄像系统已经普遍用于竞技体育中。球类运动中结合时间数据和计算机视觉的进球判断、落点判断、出界判断等。基于视觉技术对人体动作进行捕捉和分析也是一个活跃的研究方向。(10)医疗医学影像是医疗领域中一个非常活跃的研究方向,各种影像和视觉技术在这个领域中至关重要。计算断层成像(ComutedTomograhy,CT)和磁共振成像(MageticReoiiaceImagig,MRI)中重建三维图像,并进行一些三维表面渲染都有涉及一些计算机视觉的基础手段。细胞识别和肿瘤识别用于辅助诊断,一些细胞或者体液中小型颗粒物的·6····试读结束···...

    2023-01-14

  • tan❤学院计算机视觉CV全套课程|百度云网盘

    价值2万元ta❤大学计算机视觉CV全课程...

    2022-12-16 cv计算机视觉卷吗 cv计算机视觉全拼

  • 地产人才官学院-房地产策划必修:地产营销策划实践30讲|百度网盘下载

    课程介绍[00001]第1讲初识篇——策划前身今世.m4[00002]第2讲能力篇——成熟策划经理的5种核心能力.m4[00003]第3讲晋升篇——专员到总监各阶段典型画像.m4[00004]第4讲转岗篇——营销岗位细分及适配原则.m4[00005]第5讲全期操盘——从土地到推售.m4[00006]第6讲进阶工具——常见定位错配.m4[00007]第7讲科学定位——产品定位创新方法论.m4...

    2022-12-07 房地产营销房地产策划 房地产的营销策划

  • 《设计元素 罗伊娜·里德·科斯塔罗与视觉构成关系》(美)盖尔·格瑞特·汉娜著;沈儒雯译|(epub+azw3+mobi+pdf)电子书下载

    图书名称:《设计元素罗伊娜·里德·科斯塔罗与视觉构成关系》【作者】(美)盖尔·格瑞特·汉娜著;沈儒雯译【页数】166【出版社】上海:上海人民美术出版社,2013.01【ISBN号】978-7-5322-8073-5【价格】48.00【分类】艺术-设计-研究【参考文献】(美)盖尔·格瑞特·汉娜著;沈儒雯译.设计元素罗伊娜·里德·科斯塔罗与视觉构成关系.上海:上海人民美术出版社,2013.01.图书封面:图书目录:《设计元素罗伊娜·里德·科斯塔罗与视觉构成关系》内容提要:本书为设计参考图书。《设计元素罗伊娜·里德·科斯塔罗与视觉构成关系》内容试读ELEMENTSOFDESIGN设计元素“纯粹的、地道的美感,应该是现代文明的目标。”一罗伊娜·里德·科斯塔罗图书在版编目(CIP)数据设计元素[美]盖尔·格瑞特·汉娜著;沈儒雯译一上海:上海人民美术出版社,2013.01书名原文:ElemetofDeig1SBN978-7-5322-8073-51.①设..‖.①盖..2沈.Ⅲ.①艺术一设计一研究V.①J06中国版本图书馆C1P数据核字(2012)第217820号ElemetofDeig.PulihedyPricetoArchitecturalPre37EatSevethStreetNewYork,NewYork10003Forafreecatalogofook,call1.800.722.6657.Viitourweiteatwww.are.com.2002PricetoArchitecturalPreAllrightreervedRightMaager:RuyJi本书简体中文版由上海人民美术出版社独家出版。版权所有,侵权必究。合同登记号:图字:09-2011-624设计元素著者:[美]盖尔·格瑞特·汉娜译者:沈儒雯策划:姚宏翔统筹:丁雯责任编辑:姚宏翔封面设计:丁雯技术编辑:朱跃良出版发行:上海人氏美街出版社(上海长乐路672弄33号邮政编码:200040)印刷:上海丽佳制版印刷有限公司开本:710×9101/12印张14版次:2013年01月第1版印次:2013年01月第1次书号:1SBN978-7-5322-8073-5定价:48.00元设计元素一罗伊娜·里德·科斯塔罗与视觉构成关系[美]盖尔·格瑞特·汉娜著沈儒雯译上海人民头树出版社目录前言6致谢1416绪论Part1:生活和时代20Part2:基础知识4Part3:高级造型研究96Pat4:空间研究118Part5:发展136Pat6:专业作品146保拉·安东内利(PAOLAANTONELLI)纽约现代艺术博物馆建筑与设计馆馆长纯正的、地道的美国式美感经过几十年来对观念的怀疑,我们终于能够再次安心自在地使用“优美”一词。这是另一种形式的美,已经成为了人们所固有的,并为数十亿双旁观者眼中所公认。罗伊娜·里德·科斯塔罗(RoweaKotellow)的座右铭使用了诸如“纯正的”、“地道的”之类的属性来强化美的至高法则,并将其视做对人类的一种责任,承载并应和了流传数世纪之久的社会使命。在她的哲学中,美是一种极高的境界,必须通过艰辛的练习并且不断去除杂质才能达到,只有极少数愿意奉献一生致力于此的人才能做到。研究罗伊娜女士的著作就如同突然置身于一个陌生的远古时期,那时精英们的任务就是去创造美,然后向芸芸众生传播。她的法则在思维与形式上都十分清晰,强调了美国设计的精髓。美国设计就像美国文化一样,永远徘徊在平民主义与精英主义之间,就像在特百惠(Tuerware)*生产的塑料制品所表现出的创新美及实用性与马歇·布劳耶(MarcelBreuer)*设计的家具所传达的那令人惊叹的独特风格之间摇摆不定。在品牌设计与一件作品细节完善的程度上,这两个极端都能体现出其设计的卓越性。这种进退维艰在追求纯正美国设计的漫长道路中时时显现,而这种困惑正是源于这个国家强大的阶级制度。后现代主义思想家雅克·德里达、贝奇·约翰逊和佩德罗·阿尔莫多瓦(JaqueDerrida,BeteyJoho,.PedroAlmod6var)等人已经让我们了解了这样一个事实:美存在于人的意向表达、新事物、创作的作品,还有人的态度中,绝不存在于那些简单绝对的概念中,例如形式单一性。从“绝对美”这一过时观点中解放出来,是本世纪最伟大的成就之一。“设计风格大众化”这一理想一直是建筑与设计领域中反复出现的主题。当代的美是合成方式与个性化的问题,在都市时尚文化、设计与建筑中都是如此。H叩ho音乐就是基于采集并整合全新的与已存在的音乐,最后再给它们加上一个令人称奇的新鲜外表,这就是赋予当代美的一个典型的处理方式。它依赖于对各种艺术的综合与个人的才特百惠:著名塑料制品厂商,塑料这种新材料正是由其创始人首次提炼得到的。*马歇·布劳耶:家具、建筑设计师,包豪斯的第一期学生,1925年设计出了世界上第一把钢管椅子,是一位真正的功能主义者和现代设计的先驱。6前言···试读结束···...

    2022-11-30 里德助手 里德尔

  • 2022年古泡人工智能P5第5期-深度学习+计算机视觉+自然语言处理

    课程介绍课程来自于2022年古泡人工智能P5第5期课程-深度学习+计算机视觉+自然语言处理内容全面覆盖深度学习算法及其项目实战,主要应用于计算机视觉与自然语言处理两大核心领域,配套实战案例与项目全部基于真实数据集与实际任务展开。大型项目完美结合当下行业趋势,培养满足企业就业需求的中高级人工智能算法工程师。网盘截图一、什么是人工智能技术:人工智能(AritificialItelligece),英文缩写AI,人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是类人行为、类人思考、理性的思考、理性的行动。人工智能的基础是哲学、数学、经济学、神经科学、心理学、计算机工程、控制论、语言学。人工智能的发展经过了孕育、诞生、早期的热情、现实的困难等数个阶段。人工智能是计算机科学的一个分支,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。二、人工智能技术的四大分支:1、模拟识别:是指对表征事物或者现象的各种形式(数值的文字的逻辑关系的等)信息进行处理分析,以及对食物或现象进行描述分析分类解释的过程,例如汽车车牌号的辨识涉及到图像处理分析等技术。2、机器学习:研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构是指不断完善自身的性能,或者达到操作者的特定要求。3、数据挖掘:知识库的知识发现,通过算法搜索挖掘出有用的信息,应用于市场分析、科学探索、疾病预测等。4、智能算法:解决某类问题的一些特定模式算法,例如,我们最熟悉的最短路径问题,以及工程预算问题等。三、人工智能的三种形态:1、弱人工智能:弱人工智能是擅长单个方面的人工智能,比如有能战胜象棋世界冠军的人工智能,但是它只会下象棋,你要问它怎样更好地在硬盘上储存数据,它就不知道怎么回答你了。2、强人工智能:人类级别的人工智能,是指在各方面都能和人类比肩的人工智能、人类能干的脑力活它都能干。创造强人工智能比弱人工智能要难的多。3、超人工智能:牛津哲学家,知名人工智能思想家NickBotrom把超级智能定义为ldquo在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能rdquo。文件目录文件目录1_直播课回放1_直播1:开班典礼1人工智能CVNLP高薪实战班.m42_Pycharm环境配置与Deug演示(没用过的同学必看)Pycharm环境配置与Deug演示(没用过的同学必看).m43_直播2:深度学习必备基础-神经网络与卷积网络1.深度学习必备基础-神经网络与卷积网络.m44_直播3:Traformer原理及其各领域应用分析Traformer原理及其各领域应用分析.m45_额外补充:时间序列预测额外补充:时间序列预测.m46_直播4:Iformer时间序列预测源码解读Iformer时间序列预测源码解读.m42_深度学习必备核心算法1_神经网络算法解读1-神经网络算法解读.m42_卷积神经网络算法解读2-卷积神经网络算法解读.m43_递归神经网络算法解读3-递归神经网络算法解读.m43_深度学习核心框架PyTorch1_PyTorch框架介绍与配置安装1-PyTorch框架与其他框架区别分析1.m4.m42-CPU与GPU版本安装方法解读1.m4.m42_使用神经网络进行分类任务1-数据集与任务概述2.m4.m42-基本模块应用测试2.m4.m43-网络结构定义方法2.m4.m44-数据源定义简介2.m4.m45-损失与训练模块分析2.m4.m46-训练一个基本的分类模型2.m4.m47-参数对结果的影响2.m4.m43_神经网络回归任务-气温预测神经网络回归任务-气温预测1.m4.m44_卷积网络参数解读分析1-输入特征通道分析2.m4.m42-卷积网络参数解读2.m4.m43-卷积网络模型训练2.m4.m45_图像识别模型与训练策略(重点)1-任务分析与图像数据基本处理2.m4.m42-数据增强模块2.m4.m43-数据集与模型选择1.m4.m44-迁移学习方法解读1.m4.m45-输出层与梯度设置1.m4.m46-输出类别个数修改1.m4.m47-优化器与学习率衰减1.m4.m48-模型训练方法1.m4.m49-重新训练全部模型1.m4.m410-测试结果演示分析1.m4.m46_DataLoader自定义数据集制作1-Dataloader要完成的任务分析1.m4.m42-图像数据与标签路径处理1.m4.m43-Dataloader中需要实现的方法分析1.m4.m44-实用Dataloader加载数据并训练模型1.m4.m47_LSTM文本分类实战1-数据集与任务目标分析1.m4.m42-文本数据处理基本流程分析1.m4.m43-命令行参数与DEBUG1.m4.m44-训练模型所需基本配置参数分析1.m4.m45-预料表与字符切分1.m4.m46-字符预处理转换ID1.m4.m47-LSTM网络结构基本定义1.m4.m48-网络模型预测结果输出1.m4.m49-模型训练任务与总结1.m4.m48_PyTorch框架Flak部署例子1-基本结构与训练好的模型加载.m4.m42-服务端处理与预测函数.m4.m43-基于Flak测试模型预测结果.m4.m44_MMLAB实战系列1_MMCV安装方法MMCV安装方法.m42_第一模块:分类任务基本操作1-准备MMCLS项目.m4MMCLS问题修正1.m42-基本参数配置解读.m43-各模块配置文件组成.m44-生成完整配置文件.m45-根据文件夹定义数据集.m46-构建自己的数据集.m47-训练自己的任务.m43_第一模块:训练结果测试与验证1-测试DEMO效果.m42-测试评估模型效果.m43-MMCLS中增加一个新的模块.m44-修改配置文件中的参数.m45-数据增强流程可视化展示.m46-Grad-Cam可视化方法.m47-可视化细节与效果分析.m48-MMCLS可视化模块应用.m49-模型分析脚本使用.m44_第一模块:模型源码DEBUG演示1-VIT任务概述.m42-数据增强模块概述分析.m43-PatchEmeddig层.m44-前向传播基本模块.m45-CLS与输出模块.m45_第二模块:使用分割模块训练自己的数据集1-项目配置基本介绍.m42-数据集标注与制作方法.m43-跟别预测类别数修改配置文件.m44-加载预训练模型开始训练.m45-预测DEMO演示.m46_第二模块:基于Uet进行各种策略修改1-配置文件解读.m42-编码层模块.m43-上采样与输出层.m44-辅助层的作用.m45-给Uet添加一个eck层.m46-如何修改参数适配网络结构.m47-将Uet特征提取模块替换成traformer.m48-VIT模块源码分析.m47_第二模块:分割任务CVPR最新Backoe设计及其应用1-注册自己的Backoe模块.m4.m42-配置文件指定.m4.m43-DEBUG解读Backoe设计.m4.m44-PatchEmeddig的作用与实现.m4.m45-卷积位置编码计算方法.m4.m46-近似Attetio模块实现.m4.m47-完成特征提取与融合模块.m4.m48-分割任务输出模块.m4.m49-全局特征的作用与实现.m4.m410-汇总多层级特征进行输出.m4.m48_第三模块:mmdet训练自己的数据任务1-数据集标注与标签获取.m4.m42-COCO数据标注格式.m4.m43-通过脚本生成COCO数据格式.m4.m44-配置文件数据增强策略分析.m4.m45-训练所需配置说明.m4.m46-模型训练与DEMO演示.m4.m47-模型测试与可视化分析模块.m4.m48-补充:评估指标.m4.m49_第三模块:DeformaleDetr物体检测源码分析1-特征提取与位置编码.m42-序列特征展开并叠加.m43-得到相对位置点编码.m44-准备Ecoder编码层所需全部输入.m45-编码层中的序列分析.m46-偏移量offet计算.m47-偏移量对齐操作.m48-Ecoder层完成特征对齐.m49-Decoder要完成的操作.m410-分类与回归输出模块.m411-预测输出结果与标签匹配模块.m410_第四模块:DBNET文字检测1-文字检测数据概述与配置文件.m4.m42-配置文件参数设置.m4.m43-Neck层特征组合.m4.m44-损失函数模块概述.m4.m45-损失计算方法.m4.m411_第四模块:ANINET文字识别1-数据集与环境概述.m4.m42-配置文件修改方法.m4.m43-Bakoe模块得到特征.m4.m44-视觉Traformer模块的作用.m4.m45-视觉模型中的编码与解码的效果.m4.m46-文本模型中的结构分析.m4.m47-迭代修正模块.m4.m48-输出层与损失计算.m4.m412_第四模块:KIE基于图模型的关键信息抽取1-配置文件以及要完成的任务解读.m4.m42-KIE数据集格式调整方法.m4.m43-配置文件与标签要进行处理操作.m4.m44-边框要计算的特征分析.m4.m45-标签数据处理与关系特征提取.m4.m46-特征合并处理.m4.m47-准备拼接边与点特征.m4.m48-整合得到图模型输入特征.m4.m412_第五模块:tylega2源码解读1-要完成的任务与基本思想概述.m4.m42-得到tyle特征编码.m4.m43-特征编码风格拼接.m4.m44-基础风格特征卷积模块.m4.m45-上采样得到输出结果.m4.m46-损失函数概述.m4.m413_第六模块:BaicVSR++视频超分辨重构源码解读1-要完成的任务分析与配置文件.m4.m42-特征基础提取模块.m43-光流估计网络模块.m44-基于光流完成对齐操作.m45-偏移量计算方法1.m4.m46-双向计算特征对齐.m47-提特征传递流程分析.m48-序列传播计算.m49-准备变形卷积模块的输入.m4.m410-传播流程整体完成一圈.m411-完成输出结果.m4.m414_第七模块:多模态3D目标检测算法源码解读1-环境配置与数据集概述.m42-数据与标注文件介绍.m43-基本流程梳理并进入deug模式.m44-数据与图像特征提取模块.m45-体素索引位置获取.m4.m46-体素特征提取方法解读.m47-体素特征计算方法分析.m48-全局体素特征提取.m49-多模态特征融合.m410-3D卷积特征融合.m411-输出层预测结果.m415_第八模块:模型蒸馏应用实例1-任务概述与工具使用.m42-Teacher与Studet网络结构定义.m43-训练T与S得到蒸馏模型.m44-开始模型训练过程与问题修正.m45-日志输出与模型分离.m46-分别得到Teacher与Studet模型.m47-实际测试效果演示.m416_第八模块:模型剪枝方法概述分析1-SuerNet网络结构分析与剪枝概述.m42-搜索匹配到符合计算量的模型并训练.m417_第九模块:mmactio行为识别创建自己的行为识别标注数据集.m418_额外补充在源码中加入各种注意力机制方法.m45_Oecv图像处理框架实战1_课程简介与环境配置0-课程简介2.m4.m42-Noteook与IDE环境.m4.m42-Pytho与Oecv配置安装.m4.m42_图像基本操作1-计算机眼中的图像.m4.m42-视频的读取与处理.m4.m43-ROI区域.m4.m44-边界填充.m4.m45-数值计算.m4.m43_阈值与平滑处理1-图像平滑处理.m4.m42-高斯与中值滤波.m4.m4图像阈值.m4.m44_图像形态学操作1-腐蚀操作.m4.m42-膨胀操作.m4.m43-开运算与闭运算.m4.m44-梯度计算.m4.m45-礼帽与黑帽.m4.m45_图像梯度计算1-Soel算子.m4.m42-梯度计算方法.m4.m43-charr与lakacia算子.m4.m46_边缘检测1-Cay边缘检测流程.m4.m42-非极大值抑制.m4.m43-边缘检测效果.m4.m47_图像金字塔与轮廓检测1-模板匹配方法.m4.m41-轮廓检测方法.m4.m41-图像金字塔定义.m4.m42-匹配效果展示.m4.m42-轮廓检测结果.m4.m42-金字塔制作方法.m4.m43-轮廓特征与近似.m4.m48_直方图与傅里叶变换1-直方图定义.m4.m41-傅里叶概述.m4.m42-频域变换结果.m4.m42-均衡化原理.m4.m43-均衡化效果.m4.m43-低通与高通滤波.m4.m49_项目实战-信用卡数字识别2-环境配置与预处理.m4.m43-模板处理方法.m4.m4总体流程与方法讲解.m4.m44-输入数据处理方法.m4.m45-模板匹配得出识别结果.m4.m410_项目实战-文档扫描OCR识别1-整体流程演示.m4.m42-文档轮廓提取.m4.m43-原始与变换坐标计算.m4.m44-透视变换结果.m4.m45-teeract-ocr安装配置.m4.m46-文档扫描识别效果.m4.m411_图像特征-harri1-角点检测基本原理.m4.m42-基本数学原理.m4.m43-求解化简.m4.m44-特征归属划分.m4.m45-oecv角点检测效果.m4.m412_图像特征-ift1-尺度空间定义.m4.m42-高斯差分金字塔.m4.m43-特征关键点定位.m4.m44-生成特征描述.m4.m45-特征向量生成.m4.m46-oecv中ift函数使用.m4.m413_案例实战-全景图像拼接1-特征匹配方法.m4.m42-图像拼接方法.m4.m42-RANSAC算法.m4.m44-流程解读.m4.m414_项目实战-停车场车位识别1-任务整体流程.m4.m42-所需数据介绍.m4.m43-图像数据预处理.m4.m44-车位直线检测.m4.m45-按列划分区域.m4.m46-车位区域划分.m4.m47-识别模型构建.m4.m48-基于视频的车位检测.m4.m415_项目实战-答题卡识别判卷1-整体流程与效果概述.m4.m42-预处理操作.m4.m43-填涂轮廓检测.m4.m44-选项判断识别.m4.m416_背景建模1-背景消除-帧差法.m4.m42-混合高斯模型.m4.m43-学习步骤.m4.m44-背景建模实战.m4.m417_光流估计1-基本概念.m4.m42-Luca-Kaade算法.m4.m43-推导求解.m4.m44-光流估计实战.m4.m418_Oecv的DNN模块1-d模块.m4.m42-模型加载结果输出.m4.m419_项目实战-目标追踪1-目标追踪概述.m4.m42-多目标追踪实战.m4.m43-深度学习检测框架加载.m4.m44-基于dli与d的追踪.m4.m45-多进程目标追踪.m4.m46-多进程效率提升对比.m4.m420_卷积原理与操作1-卷积效果演示.m4.m41-卷积神经网络的应用.m4.m42-卷积层解释.m4.m42-卷积操作流程.m4.m43-卷积计算过程.m4.m44-adig与tride.m4.m45-卷积参数共享.m4.m46-池化层原理.m4.m421_项目实战-疲劳检测1-关键点定位概述.m4.m42-获取人脸关键点.m4.m43-定位效果演示.m4.m44-闭眼检测.m4.m45-检测效果.m4.m46_综合项目-物体检测经典算法实战1_深度学习经典检测方法概述1-检测任务中阶段的意义.m4.m42-不同阶段算法优缺点分析.m4.m43-IOU指标计算.m4.m44-评估所需参数计算.m4.m45-ma指标计算.m4.m42_YOLO-V1整体思想与网络架构2-检测算法要得到的结果.m4.m43-整体网络架构解读.m4.m44-位置损失计算.m4.m4YOLO算法整体思路解读.m4.m45-置信度误差与优缺点分析.m4.m43_YOLO-V2改进细节详解V2版本细节升级概述.m4.m42-网络结构特点.m4.m43-架构细节解读.m4.m44-基于聚类来选择先验框尺寸.m4.m45-偏移量计算方法.m4.m46-坐标映射与还原.m4.m47-感受野的作用.m4.m48-特征融合改进.m4.m44_YOLO-V3核心网络模型1-V3版本改进概述.m4.m42-多cale方法改进与特征融合.m4.m43-经典变换方法对比分析.m4.m44-残差连接方法解读.m4.m45-整体网络模型架构分析.m4.m46-先验框设计改进.m4.m47-otfmax层改进.m4.m45_项目实战-基于V3版本进行源码解读1-数据与环境配置.m4.m42-训练参数设置.m4.m43-数据与标签读取.m4.m44-标签文件读取与处理.m4.m45-deug模式介绍.m4.m46-基于配置文件构建网络模型.m4.m47-路由层与hortcut层的作用.m4.m48-YOLO层定义解析.m4.m49-预测结果计算.m4.m410-网格偏移计算.m4.m411-模型要计算的损失概述.m4.m412-标签值格式修改.m4.m413-坐标相对位置计算.m4.m414-完成所有损失函数所需计算指标.m4.m415-模型训练与总结.m4.m416-预测效果展示.m4.m46_基于YOLO-V3训练自己的数据集与任务1-Laelme工具安装.m4.m42-数据信息标注.m4.m43-完成标签制作.m4.m44-生成模型所需配置文件.m4.m45-jo格式转换成yolo-v3所需输入.m4.m46-完成输入数据准备工作.m4.m47-训练代码与参数配置更改.m4.m48-训练模型并测试效果.m4.m47_YOLO-V4版本算法解读1-V4版本整体概述.m4.m42-V4版本贡献解读.m4.m43-数据增强策略分析.m4.m44-DroBlock与标签平滑方法.m4.m45-损失函数遇到的问题.m4.m46-CIOU损失函数定义.m4.m47-NMS细节改进.m4.m48-SPP与CSP网络结构.m4.m49-SAM注意力机制模块.m4.m410-PAN模块解读.m4.m411-激活函数与整体架构总结.m4.m48_V5版本项目配置1-整体项目概述.m4.m42-训练自己的数据集方法.m4.m43-训练数据参数配置.m4.m44-测试DEMO演示.m4.m49_V5项目工程源码解读1-数据源DEBUG流程解读.m4.m42-图像数据源配置.m4.m43-加载标签数据.m4.m44-Moaic数据增强方法.m4.m45-数据四合一方法与流程演示.m4.m46-getItem构建atch.m4.m47-网络架构图可视化工具安装.m4.m48-V5网络配置文件解读.m4.m49-Focu模块流程分析.m4.m410-完成配置文件解析任务.m4.m411-前向传播计算.m4.m412-BottleeckCSP层计算方法.m4.m413-Head层流程解读.m4.m413-1SPP层计算细节分析.m4.m414-上采样与拼接操作.m4.m415-输出结果分析.m4.m416-超参数解读.m4.m417-命令行参数介绍.m4.m418-训练流程解读.m4.m419-各种训练策略概述.m4.m420-模型迭代过程.m4.m410_EfficietNet网络第八课:EfficietNet网络模型.m4.m411_EfficietDet检测算法第十一章:EfficietDet检测算法.m4.m412_基于Traformer的detr目标检测算法1-DETR目标检测基本思想解读.m4.m42-整体网络架构分析.m4.m43-位置信息初始化query向量.m4.m44-注意力机制的作用方法.m4.m45-训练过程的策略.m4.m413_detr目标检测源码解读1-项目环境配置解读.m4.m42-数据处理与dataloader.m4.m43-位置编码作用分析.m4.m44-ackoe特征提取模块.m4.m45-mak与编码模块.m4.m46-编码层作用方法.m4.m47-Decoder层操作与计算.m4.m48-输出预测结果.m4.m49-损失函数与预测输出.m4.m47_图像分割实战1_图像分割及其损失函数概述1-语义分割与实例分割概述.m4.m42-分割任务中的目标函数定义.m4.m43-MIOU评估标准.m4.m42_卷积神经网络原理与参数解读1-卷积神经网络应用领域.m4.m42-卷积的作用.m4.m43-卷积特征值计算方法.m4.m44-得到特征图表示.m4.m45-步长与卷积核大小对结果的影响.m4.m46-边缘填充方法.m4.m47-特征图尺寸计算与参数共享.m4.m48-池化层的作用.m4.m49-1整体网络架构.m4.m410-VGG网络架构.m4.m411-残差网络Reet.m4.m412-感受野的作用.m4.m43_Uet系列算法讲解1-Uet网络编码与解码过程.m4.m42-网络计算流程.m4.m43-Uet升级版本改进.m4.m44-后续升级版本介绍.m4.m44_uet医学细胞分割实战1-医学细胞数据集介绍与参数配置.m4.m42-数据增强工具.m4.m43-Deug模式演示网络计算流程.m4.m44-特征融合方法演示.m4.m45-迭代完成整个模型计算任务.m4.m46-模型效果验证.m4.m45_U2NET显着性检测实战1-任务目标与网络整体介绍.m4.m42-显着性检测任务与目标概述.m4.m43-编码器模块解读.m4.m44-解码器输出结果.m4.m45-损失函数与应用效果.m4.m46_deela系列算法1-deela分割算法概述.m4.m42-空洞卷积的作用.m4.m43-感受野的意义.m4.m44-SPP层的作用.m4.m45-ASPP特征融合策略.m4.m46-deelaV3Plu版本网络架构.m4.m47_基于deelaV3+版本进行VOC分割实战1-PacalVoc数据集介绍.m4.m42-项目参数与数据集读取.m4.m43-网络前向传播流程.m4.m44-ASPP层特征融合.m4.m45-分割模型训练.m4.m48_医学心脏视频数据集分割建模实战1-数据集与任务概述.m4.m42-项目基本配置参数.m4.m43-任务流程解读.m4.m44-文献报告分析.m4.m45-补充:视频数据源特征处理方法概述.m4.m46-补充:R(2lu1)D处理方法分析.m4.m49_物体检测框架-MakRc项目介绍与配置0-开源项目数据集.m4.m40-Mak-Rc开源项目简介.m4.m40-参数配置.m4.m410_MakRc网络框架源码详解1-FPN层特征提取原理解读.m4.m42-FPN网络架构实现解读.m4.m43-生成框比例设置.m4.m44-基于不同尺度特征图生成所有框.m4.m45-RPN层的作用与实现解读.m4.m46-候选框过滤方法.m4.m47-Prooal层实现方法.m4.m48-DetectioTarget层的作用.m4.m49-正负样本选择与标签定义.m4.m410-RoiPoolig层的作用与目的.m4.m411-RorAlig操作的效果.m4.m412-整体框架回顾.m4.m411_基于MASK-RCNN框架训练自己的数据与任务1-Laelme工具安装.m4.m42-使用laelme进行数据与标签标注.m4.m43-完成训练数据准备工作.m4.m44-makrc源码修改方法.m4.m45-基于标注数据训练所需任务.m4.m46-测试与展示模块.m4.m48_行为识别实战1_lowfat算法知识点通俗解读1-lowfat核心思想解读.m4.m42-核心网络结构模块分析.m4.m43-数据采样曾的作用.m4.m44-模型网络结构设计.m4.m45-特征融合模块与总结分析.m4.m42_lowfat项目环境配置与配置文件1-环境基本配置解读.m4.m42-目录各文件分析.m4.m43-配置文件作用解读.m4.m44-测试DEMO演示1.m4.m45-训练所需标签文件说明.m4.m46-训练所需视频数据准备.m4.m47-视频数据集切分操作.m4.m48-完成视频分帧操作.m4.m43_lowfat源码详细解读1-模型所需配置文件参数读取1.m4.m42-数据处理概述1.m4.m43-dataloader数据遍历方法1.m4.m44-数据与标签读取实例1.m4.m45-图像数据所需预处理方法1.m4.m46-low与fat分别执行采样操作1.m4.m47-分别计算特征图输出结果1.m4.m48-low与fat特征图拼接操作1.m4.m49-reetBolock操作1.m4.m410-RoiAlig与输出层1.m4.m44_基于3D卷积的视频分析与动作识别1-3D卷积原理解读.m4.m42-UCF101动作识别数据集简介.m4.m43-测试效果与项目配置.m4.m44-视频数据预处理方法.m4.m45-数据Batch制作方法.m4.m46-3D卷积网络所涉及模块.m4.m47-训练网络模型.m4.m45_视频异常检测算法与元学习1-异常检测要解决的问题与数据集介绍.m4.m42-基本思想与流程分析.m4.m43-预测与常见问题.m4.m44-Meta-Lear要解决的问题.m4.m45-学习能力与参数定义.m4.m46-如何找到合适的初始化参数.m4.m47-MAML算法流程解读.m4.m46_视频异常检测CVPR2021论文及其源码解读1-论文概述与环境配置.m4.m42-数据集配置与读取.m4.m43-模型编码与解码结构.m4.m44-注意力机制模块打造.m4.m45-损失函数的目的.m4.m46-特征图生成.m4.m47-MetaLear与输出.m4.m47_基础补充-Reet模型及其应用实例1-医学疾病数据集介绍.m4.m42-Reet网络架构原理分析.m4.m43-dataloader加载数据集.m4.m44-Reet网络前向传播.m4.m45-残差网络的hortcut操作.m4.m46-特征图升维与降采样操作.m4.m47-网络整体流程与训练演示.m4.m49_2022论文必备-Traformer实战系列1_课程介绍课程介绍1.m4.m42_自然语言处理通用框架BERT原理解读1-BERT任务目标概述.m4.m42-传统解决方案遇到的问题1.m4.m43-注意力机制的作用1.m4.m44-elf-attetio计算方法1.m4.m45-特征分配与oftmax机制1.m4.m46-Multi-head的作用1.m4.m47-位置编码与多层堆叠1.m4.m48-traformer整体架构梳理.m4.m49-BERT模型训练方法.m4.m410-训练实例.m4.m43_Traformer在视觉中的应用VIT算法1-traformer发家史介绍1.m4.m42-对图像数据构建atch序列1.m4.m43-VIT整体架构解读1.m4.m44-CNN遇到的问题与窘境1.m4.m45-计算公式解读1.m4.m46-位置编码与TNT模型1.m4.m47-TNT模型细节分析1.m4.m44_VIT算法模型源码解读1-项目配置说明1.m4.m42-输入序列构建方法解读1.m4.m43-注意力机制计算1.m4.m44-输出层计算结果1.m4.m45_witraformer算法原理解析1-witraformer整体概述1.m4.m42-要解决的问题及其优势分析1.m4.m43-一个lock要完成的任务1.m4.m44-获取各窗口输入特征1.m4.m45-基于窗口的注意力机制解读1.m4.m46-窗口偏移操作的实现1.m4.m47-偏移细节分析及其计算量概述1.m4.m48-整体网络架构整合1.m4.m49-下采样操作实现方法1.m4.m410-分层计算方法1.m4.m46_witraformer源码解读1-数据与环境配置解读1.m4.m42-图像数据atch编码1.m4.m43-数据按widow进行划分计算1.m4.m44-基础attetio计算模块1.m4.m45-窗口位移模块细节分析1.m4.m46-atchmerge下采样操作1.m4.m47-各lock计算方法解读1.m4.m48-输出层概述1.m4.m47_基于Traformer的detr目标检测算法1-DETR目标检测基本思想解读1.m4.m42-整体网络架构分析1.m4.m43-位置信息初始化query向量1.m4.m44-注意力机制的作用方法1.m4.m45-训练过程的策略1.m4.m48_detr目标检测源码解读1-项目环境配置解读2.m4.m42-数据处理与dataloader2.m4.m43-位置编码作用分析2.m4.m44-ackoe特征提取模块1.m4.m45-mak与编码模块1.m4.m46-编码层作用方法1.m4.m47-Decoder层操作与计算1.m4.m48-输出预测结果1.m4.m49-损失函数与预测输出1.m4.m49_MedicalTraformer论文解读1-论文整体分析.m4.m42-核心思想分析.m4.m43-网络结构计算流程概述.m4.m44-论文公式计算分析.m4.m45-位置编码的作用与效果.m4.m46-拓展应用分析.m4.m410_MedicalTraformer源码解读1-项目环境配置1.m4.m42-医学数据介绍与分析1.m4.m43-基本处理操作1.m4.m44-AxialAttetio实现过程1.m4.m45-位置编码向量解读1.m4.m46-注意力计算过程与方法1.m4.m47-局部特征提取与计算1.m4.m411_商汤LoFTR算法解读1-特征匹配的应用场景.m4.m42-特征匹配的基本流程分析.m4.m43-整体流程梳理分析.m4.m44-CroAttetio的作用与效果.m4.m45-traformer构建匹配特征.m4.m46-粗粒度匹配过程与作用.m4.m47-特征图拆解操作.m4.m48-细粒度匹配的作用与方法.m4.m49-基于期望预测最终位置.m4.m410-总结分析.m4.m412_局部特征关键点匹配实战1-项目与参数配置解读1.m4.m42-DEMO效果演示1.m4.m43-ackoe特征提取模块1.m4.m44-注意力机制的作用与效果分析1.m4.m45-特征融合模块实现方法1.m4.m46-cro关系计算方法实例1.m4.m47-粗粒度匹配过程1.m4.m48-完成基础匹配模块1.m4.m49-精细化调整方法与实例1.m4.m410-得到精细化输出结果1.m4.m411-通过期望计算最终输出1.m4.m413_项目补充-谷歌开源项目BERT源码解读与应用实例tfrecord制作1.m4.m41-BERT开源项目简介1.m4.m42-项目参数配置1.m4.m43-数据读取模块1.m4.m44-数据预处理模块1.m4.m46-Emeddig层的作用1.m4.m47-加入额外编码特征1.m4.m48-加入位置编码特征1.m4.m49-mak机制1.m4.m410-构建QKV矩阵1.m4.m411-完成Traformer模块构建1.m4.m412-训练BERT模型1.m4.m414_项目补充-基于BERT的中文情感分析实战1-中文分类数据与任务概述1.m4.m42-读取处理自己的数据集1.m4.m43-训练BERT中文分类模型1.m4.m410_图神经网络实战1_图神经网络基础1-图神经网络应用领域分析.m4.m42-图基本模块定义.m4.m43-邻接矩阵的定义.m4.m44-GNN中常见任务.m4.m45-消息传递计算方法.m4.m46-多层GCN的作用.m4.m42_图卷积GCN模型1-GCN基本模型概述.m4.m42-图卷积的基本计算方法.m4.m43-邻接的矩阵的变换.m4.m44-GCN变换原理解读.m4.m43_图模型必备神器PyTorchGeometric安装与使用1-PyTorchGeometric工具包安装与配置方法.m4.m42-数据集与邻接矩阵格式.m4.m43-模型定义与训练方法.m4.m44-文献引用数据集分类案例实战.m4.m44_使用PyTorchGeometric构建自己的图数据集1-构建数据集基本方法.m4.m42-数据集与任务背景概述.m4.m43-数据集基本预处理.m4.m44-用户行为图结构创建.m4.m45-数据集创建函数介绍.m4.m46-网络结构定义模块.m4.m47-TokPoolig进行下采样任务.m4.m48-获取全局特征.m4.m49-模型训练与总结.m4.m45_图注意力机制与序列图模型1-图注意力机制的作用与方法.m4.m42-邻接矩阵计算图Attetio.m4.m43-序列图神经网络TGCN应用.m4.m44-序列图神经网络细节.m4.m46_图相似度论文解读1-要完成的任务分析.m4.m42-基本方法概述解读.m4.m43-图模型提取全局与局部特征.m4.m44-NTN模块的作用与效果.m4.m45-点之间的对应关系计算.m4.m46-结果输出与总结.m4.m47_图相似度计算实战1-数据集与任务概述3.m4.m42-图卷积特征提取模块3.m4.m43-分别计算不同Batch点的分布3.m4.m44-获得直方图特征结果.m4.m45-图的全局特征构建.m4.m46-NTN图相似特征提取.m4.m47-预测得到相似度结果.m4.m48_基于图模型的轨迹估计1-数据集与标注信息解读.m4.m42-整体三大模块分析.m4.m43-特征工程的作用与效果.m4.m44-传统方法与现在向量空间对比.m4.m45-输入细节分析.m4.m46-子图模块构建方法.m4.m47-特征融合模块分析.m4.m48-VectorNet输出层分析.m4.m49_图模型轨迹估计实战1-数据与环境配置4.m4.m42-训练数据准备4.m4.m43-Aget特征提取方法4.m4.m44-DataLoader构建图结构4.m4.m45-SuGrah与Attetio模型流程4.m4.m4...

    2022-11-25 模块配置文件 模块 配置文件是什么

学习考试资源网-58edu © All Rights Reserved.  湘ICP备12013312号-3 
站点地图| 免责说明| 合作请联系| 友情链接:学习乐园